国家标准计划《水泥基材料元数据》由 TC184(全国水泥标准化技术委员会)归口 ,主管部门为中国建筑材料联合会。
主要起草单位 中国建筑材料科学研究总院有限公司 、中建材中研益科技有限公司 、天山材料股份有限公司 、北京工业大学 、中存大数据科技有限公司 、济南大学 。
| 91 建筑材料和建筑物 |
| 91.100 建筑材料 |
| 91.100.10 水泥、石膏、石灰、砂浆 |
当前水泥基材料正在迈向数字化、智能化时代,基于数据的材料基因工程理念与人工智能技术在水泥行业的应用势在必行。
基于数据的DCS操作系统、APC先进过程控制系统、MAS管理会计系统、企业ERP管理系统等,已经在水泥行业广泛应用,极大提升了水泥行业的智能生产与智慧管控水平。
可以预见,在ChatGPT带来的新一代人工智能大模型技术的推动下,数智化技术将在材料创新研发、管理数字化转型、工艺智能制造提升、终端应用高质量保障、产业链配置优化等多方面更广泛应用,显著提高研发效率与生产管理效率,强力支撑水泥行业绿色低碳高质量转型发展。
鉴于数智化技术在生产管控、智能制造等领域的效率优势,中共中央、国务院在2021年发布的《关于完整准确全面贯彻新发展理念做好碳达峰碳中和工作的意见》中,明确要求“推动互联网、大数据、人工智能、第五代移动通信(5G)等新兴技术与绿色低碳产业深度融合”。
同年,工业和信息化部等四部门印发《建材行业碳达峰实施方案》,提出“以数字化转型促进行业节能降碳”、“加快推进建材行业与新一代信息技术深度融合”。
2024年5月工业和信息化部联合多个部委制定了《水泥行业节能降碳专项行动计划》,提出“鼓励企业建立数据采集和集散控制系统、专家优化智能控制系统”,“深化大数据、人工智能、区块链等数字技术在水泥行业应用”,明确支持并推动水泥企业进行数字化转型。
而数智化技术本质上是采用计算机编程语言来反映现实世界规律的技术,其准确性依赖于训练数据。
这就要求水泥行业要加快人工智能等数字化技术的开发,为数字化转型打造坚实的数据基础,建立牢固的数智技术研发底座。
元数据是规定数据内涵、格式、单位及范围等的数据,是规定数据的数据,能够为数据的搜集整理与应用提供统一的标准,是构建开发公共数据集、行业资源库等数据底座的前提与基础,也是开发应用数智化技术的底层逻辑基础。
准确、规范、格式统一的数据能够大大降低模型建立过程中对于数据处理的要求,提高人工智能模型的预测、设计、调整准确性。
以大模型为例,GPT-4有1750亿个参数,国产的Qwen2-72B有720亿参数、GLM-4-9B有90亿参数,这些参数对应的庞大训练数据都需要准确、规范、格式统一的数据集加以支撑。
因此,水泥行业要借助数据库、大模型等人工智能技术实现数字化低碳转型发展,必须建立统一的元数据标准,建立通用的数据底座。
随着数智化技术在各行各业的日渐普及应用,地理、气象、电子信息等领域已建立了相关的元数据国家标准91项,农业、交通、环境、航空等领域也建立了相应的元数据行业标准69项。
水泥行业作为我国的重点原材料行业,拥有万亿规模的GDP,1500余条水泥产线,占世界产能的50%以上,目前却尚未有元数据的通用基础标准。
这导致尽管拥有大量生产与研发数据积累的水泥行业,仍存在着数据格式不规范、数据内容缺失、结构与表征方式不统一等多方面的问题,严重制约数智化技术的开发与应用。
本标准旨在规范水泥基材料元数据的内容、格式和结构,为水泥基材料的通用数据库建立与数智化技术的研发与应用奠定坚实的数字底座,是水泥行业实现数字化、智能化转型的重中之重,并将直接支撑水泥行业“双碳”战略的实施与落地。
本文件规定了水泥基材料的原材料、生产工艺、应用产品等的元数据的数据内容结构、元数据记录、元数据内容与格式以及元数据样本等。 本文件适用于水泥基材料基础数据库的建设、更新与数字产品分发服务,其他各类水泥基材料相关数据库的建设也可参照执行。