注册

国家标准计划《网络安全技术 生成式人工智能数据标注安全规范 》由 TC260(全国网络安全标准化技术委员会)归口 ,主管部门为国家标准委

主要起草单位 国家计算机网络应急技术处理协调中心中国电子标准化研究院中关村实验室清华大学北京百度网讯科技有限公司北京快手科技有限公司阿里云计算有限公司北京天融信科技有限公司

目录

基础信息

计划号
20242097-T-469
制修订
制定
项目周期
18个月
下达日期
2024-06-28
申报日期
2023-08-30
公示开始日期
2024-05-20
公示截止日期
2024-06-19
标准类别
安全
国际标准分类号
35.030
35 信息技术、办公机械
归口单位
全国网络安全标准化技术委员会
执行单位
全国网络安全标准化技术委员会
主管部门
国家标准委

起草单位

目的意义

生成式人工智能已经成为人工智能领域的一个重要分支,具有广阔的应用前景和发展空间,生成式人工智能数据标注的质量和准确性对于算法的性能和结果具有重要的影响。

近年来随着生成式人工智能的爆发式发展,数据标注的产业规模迅速增长,越来越多的专业标注公司和在线平台涌现,提供音视图文等各种数据类型的标注服务,以满足生成式人工智能模型的训练需求。

目前国内外还没有针对生成式人工智能数据标注活动的相关标准进行安全指导和规范,2023年7月,中央网信办联合多部门发布《生成式人工智能服务管理暂行办法》(以下简称《办法》),亟需针对生成式人工智能产品研制中的数据标注环节制定相关配套标准,落实《办法》的相关要求,针对生成式人工智能产品研制中的数据标注环节,提供清晰、具体、可操作的数据标注规则,标注人员培训,标注内容正确性等方面的具体要求。

该标准的制定可以促进标注流程的规范和标准化,帮助标注人员理解标注任务的要求和标准,并按照标准化的流程进行标注,减少标注过程中可能出现的错误和偏差,提高标注数据的可靠性、可用性、安全性,进而提高生成式人工智能模型的帮助性、诚实性和无害性。

本标准将为生成式人工智能数据标注活动提供全面的安全指南,填补目前国内外标准中该领域的空白,有助于提升生成式人工智能标注质量和标注过程安全,促进生成式人工智能更广泛的安全应用和数据标注的多方合作。

范围和主要技术内容

本标准给出了生成式人工智能数据标注环节的标注任务流程、数据标注规则、标注评估核验要求、标注人员要求、数据标注过程安全控制要求和数据标注安全测试方法。 本标准适用于指导标注服务提供者对生成式人工智能开展数据标注,第三方机构对数据标注进行评估、检查、验收时也可参考。