国家标准计划《高质量数据集 建设指南》由 TC609(全国数据标准化技术委员会)归口 ,主管部门为国家数据局。
主要起草单位 上海赛西科技发展有限责任公司 、中国电子技术标准化研究院 、中国电子信息产业发展研究院 、国家数据发展研究院 、工业和信息化部电子第五研究所 、交通运输部公路科学研究所 、北京大学 、上海人工智能创新中心 、科大讯飞股份有限公司 、华为技术有限公司 、阿里巴巴(中国)有限公司 、北京智源人工智能研究院 、中国石油化工集团有限公司 、国家电网有限公司大数据中心 、中国南方电网有限责任公司 、煤炭科学研究总院有限公司 、中电数据产业集团有限公司 、中国联合网络通信集团有限公司 、中国质量认证中心有限公司 、中国电信集团有限公司 、北京百度网讯科技有限公司 、中国交通建设集团有限公司 、中国交通信息科技集团有限公司 、上海库帕思科技有限公司 、上海信投智能科技股份有限公司 、南京南瑞继保工程技术有限公司 、南京南瑞瑞中数据股份有限公司 、杭州数梦工场科技有限公司 、湖北数据集团有限公司 、安徽飞数信息科技有限公司 、卡奥斯工业智能研究院(青岛)有限公司 、中通服网盈科技有限公司 、北京海天瑞声科技股份有限公司 、航天科工网络信息发展有限公司 、中国邮政储蓄银行股份有限公司 、内蒙古自治区大数据中心 、中电金信软件有限公司 、国网河南省电力公司经济技术研究院 。
| 35 信息技术、办公机械 |
| 35.240 信息技术应用 |
本标准所涉及的产品包括高质量数据集本身,以及在数据集建设过程中使用的采集工具、预处理软件、标注平台、质量管理系统、数据集管理平台等相关工具与系统。
本标准规定了高质量数据集建设全生命周期各阶段的要求与指导,涵盖需求分析、规划、采集、预处理、标注(如适用)、验证及质量持续改进等核心环节。本标准为组织机构系统化、规范化地构建高质量数据集提供过程方法指南,适用于人工智能、大数据等相关技术领域的数据集建设工作。