国家标准计划《人工智能 预训练模型 第1部分:通用要求》由 TC28(全国信息技术标准化技术委员会)归口,TC28SC42(全国信息技术标准化技术委员会人工智能分会)执行 ,主管部门为国家标准委。
主要起草单位 中国电子技术标准化研究院 、上海人工智能实验室 、北京百度网讯科技有限公司 、北京航空航天大学 、华为技术有限公司 、中国科学院自动化研究所 、中关村实验室 、北京智源人工智能研究院 、腾讯云计算(北京)有限责任公司 、杭州海康威视数字技术股份有限公司 、北京旷视科技有限公司 、中国电信股份有限公司数字智能科技分公司 。
| 35 信息技术、办公机械 |
| 35.240 信息技术应用 |
2020年以来,以GPT系列和悟道、文心、盘古等为代表的预训练模型技术,为产业界带来了深刻的技术和应用变革。
在技术层面,预训练模型是“大算力+强算法”相结合的产物,是人工智能的发展趋势和未来。
目前,预训练规模的生态已初具规模。
其可以实现从“手工作坊”到“工厂模式”的转型。
在应用层面,人工智能领域的单点技术,已广泛应用于零售、金融、城市、教育等领域,带来了巨大的经济效益与社会价值。
但随着人工智能与实体经济的进一步融合,往往面临大量的低频、长尾场景,尤其是大量非互联网企业和小微企业,他们数字化程度低,数据样本少、定制化程度高,而且缺少工程化能力和二次开发能力。
本标准旨在规定预训练模型的通用要求,从基础层、模型层、平台层、数据层、服务层等多个方面,提出预训练模型需要具备的能力要求,指导后续预训练模型的研发和使用。
本文件提出了人工智能大规模预训练模型的技术参考架构,并规定了大规模预训练模型在基础软硬件功能、 性能等方面的通用要求。 本文件适用于人工智能大规模预训练模型的设计、开发、管理和评测。