注册

国家标准计划《科技平台 材料科学数据描述规范》由 TC486(全国科技平台标准化技术委员会)归口 ,主管部门为科技部

主要起草单位 北京科技大学中关村材料试验技术联盟中国科学院计算机网络信息中心国家材料腐蚀与防护科学数据中心中国航发北京航空材料研究院中铝材料应用研究院有限公司中国标准化研究院

目录

基础信息

计划号
20251233-T-306
制修订
制定
项目周期
18个月
下达日期
2025-04-30
公示开始日期
2025-02-13
公示截止日期
2025-03-15
标准类别
基础
国际标准分类号
35.240
35 信息技术、办公机械
35.240 信息技术应用
归口单位
全国科技平台标准化技术委员会
执行单位
全国科技平台标准化技术委员会
主管部门
科技部

起草单位

目的意义

(1)经济社会和产业发展的需求 2021年10月,国务院印发《国家标准化发展纲要》,进一步强调了标准化在推动高质量发展中的基础性和引领性作用,并提出了经济全域、国内国际相促进以及质量效益型的新发展方向。

国家标准《标准化工作指南 第 1部分: 标准化和相关活动的通用词汇》中指出,标准化的主要作用是针对一个或多个特定目的,使产品、过程或服务适合其用途,防止贸易壁垒,并促进技术合作。

标准已经成为目前各行业全球竞争的热点,更是成为国际竞争中挤掉竞争对手的工具, 拥有了制定产品标准的话语权往往就意味着对产品市场的控制权。

在全球数字化飞速发展的时代, 标准的作用远不仅限于此。

新材料是国家经济社会发展的物质基础,是高新技术发展的先导。

新能源汽车、高铁、大飞机、航空航天以及军工等领域的快速发展都离不开高性能材料的支撑,新材料产业已成为当今世界各国必争的战略高地,被视为提升国家竞争力和国家安全的基础保障。

然而,在“卡脖子”技术难题中,大部分是材料相关问题,材料形成了对各行业快速发展的障碍。

然而,卡脖子技术的突破需要全产业链的发展,取决于产业链生态系统的完整性和开放性。

同时,数字技术的迅猛发展,及其多层次交互性等特点,其高度依赖的数据资源要素可以实现跨地区、跨组织、跨领域、跨学科的无障碍流动和共享,因此,数据的标准化描述是打通全产业链数字化发展的基础。

智能制造更是离不开数据和数据标准。

智能制造以制造过程的数字化表达,即数字孪生,及数据互联互通系统来实现全流程智能化控制。

材料的智能制造以及“黑灯工厂”的建设不仅需要材料生产工序的数字化以及各工序间的信息传递,而且需要基于过程数据进行工艺参数的优化调控, 因此,一套标准化的数据体系是材料智能制造的基础设施。

由于材料学科的复杂性,并涉及物理、化学、数学等学科知识和理论,材料科技条件资源本身更显示出多样性、异构性与复杂性的特点,必须要有统一的信息描述标准规范,才能对资源进行信息化,实现资源的精准检索、快速识别和高效利用。

(2)科技平台建设和科研创新的需求 数据标准直接关乎到数据的质量和数据挖掘应用的基础, 缺乏准确、全面的科学数据,数据的应用将出现灾难性事件。

一直以来,材料科学主要研究方法是基于理论分析与实验研究,结合科学家经验的大量积累及试错的方式,探索材料的成分组成和性能优化方法,以及新材料的发现。

随着人工智能技术和“材料基因工程”研究的兴起,“逐步试错、顺序推进”的传统材料研发模式发生了变革。

材料计算、实验与数据有机结合,通过计算模拟、高通量实验与数据分析挖掘技术,形成了AI for Science数据驱动的创新研究模式,改变了已有的依靠科学家直觉和大量的“尝试法”的材料研发思路,形成在大数据时代的数据密集型的科学研究方法论,即科学研究的第四范式——数据驱动的新材料研发。

从2009年科技部国家科技基础条件平台建设项目“材料科学数据共享网”立项之初,就确立了“标准先行”的建设纲领,一系列规范草案的建设和在数据库建设中的应用,在国家材料数据库-材料科学数据共享网的建设,以及野外台站项目-材料腐蚀与防护野外台站的数据采集存储中发挥了重要作用。

自美国2011年6月提出“材料基因组计划”后,我国在同年12月在以“材料科学系统工程”为主题的香山科学会议上表达了对材料数据研究领域的关注。

2016年起,我国“十三五”重点研发计划项目中,将“材料基因工程关键技术与支撑平台”列入其中,材料科学数据统一表述规范列入项目的研究内容。

而FAIR 原 则 ( Findable, Accessible, Interoperable, Reusable, 简称 FAIR)作为科学数据管理与共享的普遍原则被提出,成为数据及管理的评价规范, 进一步成为材料数据标准建设和应用中广泛接受和认可的行为准则。

然而,材料体系日益细化、制备与检测技术不断推陈出新、材料应用范围越来越广等特点,同时国家项目成果的汇交中,数据资源相对分散,存在典型的多元异构数据的特点,因此在数据库和数据资源平台内部建设运行,以及跨库、跨平台、跨领域的多部门、多单位的汇交与共享,都必须要有统一的标准规范,保证各方工作的协同一致和有效衔接。

材料数据的表达形式、内容范畴以及质量评估机制都急需拥有详细规定,以保证数据库的稳定建设。

规范数据表达形式可以促进数据在研究人员之间分享与应用,打破“材料体系壁垒”;分级规范不同材料范畴的数据形式可以强化数据在同行内的使用效率;建设数据质量机制标准可以提高数据使用效率与准确程度。

优质的数据可以推动新的材料研发模式,实现数据智能检索、数据挖掘、分析预测。

范围和主要技术内容

1. 范围 标准的主体对象是通过计算模拟、实验表征、工业生产而产生的材料以及物理、化学等相关学科的数据。本标准对材料科学、物理、化学等领域各个体系的计算数据、实验数据和工业数据提交要求。为建设材料数据标准规范框架体系,材料数据通用标准和各层级标准,以及关键材料数据模板奠定基础。 按照数据是否进行处理,数据格式可以分为原始数据以及经加工处理的数据。 按照数据类型可以分为结构化数据与非结构化数据,其中非结构化数据中的文本数据包括原始记录的文本数据和经筛选处理后的表格数据,图片数据包括原始记录的图片和经筛选处理文本数据后所得到的新图片数据。 材料数据按照其来源可以分为数值模拟计算、实验技术表征和工业规模生产三类。数值模拟计算所产生的数据包括第一性原理计算、分子动力学计算、热动力学计算、相场模拟和宏观模拟所需要的输入数据及输出数据;实验技术表征所产生的数据包括样品的制备参数数据、样品形貌表征数据、样品测试条件数据及样品性能结果数据;工业生产数据包括生产流程技术参数、产品表征数据以及产品性能数据。不同的材料体系其所关注的目标不同,因此所涉及的计算、实验与生产数据也不尽相同。如,催化材料在第一性原理计算中更关注吸附能的大小,而结构材料更关注弹性性能,因此数据反应的科学问题也存在差异。本标准旨在建设具有泛化能力的数据提交规范,将不同结构、不同应用领域的材料以统一的描述方法建立不同来源下的数据提交格式。 本标准针对数据库技术和材料技术两个方面开展材料数据标准规范框架体系研究。基于数据库平台建设对数据管理规范的要求,针对材料数据生产和获取内容,借助数据库技术的数据编辑、审核、标引等数据处理内容,数据分类、聚类、质量、安全等数据管理内容,数据智能检索、分析预测、挖掘计算共享等数据应用内容,重点研究覆盖数据获取、数据处理、数据管理、数据应用全过程的材料数据标准规范框架体系。针对数据描述和数据质量问题,以材料数据获取的内容为主线,研究材料基本属性、材料应用属性和材料表征数据等不同维度材料数据的特点,提出数据标准规范的框架,分析材料类型、表征手段、加工工艺、数据类型差异,分类分级细化标准体系。 同时,凝练材料数据共性特点,建立约束材料数据内容和格式的指导性原则,研究对数据进行唯一性标识的方法,规范管理元数据,将不同来源不同描述方式数据进行关联的途径。研究数据类型、数据来源、数据结构特点,结合材料大数据应用和智能检索对数据质量、数据溯源性、数据完整性的要求,制定分层级的技术标准。 2. 主要技术内容 本标准应对材料科学数据从材料科学数据全生命周期管理及其完整性对数据的需求出发,将数据分为实验数据(通过物理的实验操作产生的数据,包括制备方法、制备条件、表征方法、表征条件等)与计算数据(通过模拟计算产生的数据,包括计算方法与计算条件等)两类分别进行描述说明,以数据产生方式(实验数据/计算数据)为条目单位,对每个数据类别的材料科学数据的描述进行规范。 本标准共分为七章,分别为: 第一章 范围 本章规定了材料科学数据的通用描述规范,明确了相关术语、定义和格式要求,以及适用范围等。 第二章 规范性引用文件 列出对本标准必不可少的引用文件的全部。 第三章 术语和定义 列出适用于本文件的术语和定义。 第四章 材料科学数据分类 本章约束了材料科学数据分类的模型。 第五章 材料实验科学数据 本章约束了样品信息、原材料信息及材料性能信息等三部分的实验数据描述标准。 第六章 材料计算科学数据 本章约束了材料计算任务名称、计算材料的元数据、材料计算数据信息等数据的描述标准。 第七章 数据来源数据信息 本章约束了关于每条数据的生产和审核信息、数据来源模型等。 第八章 数据共享服务信息 本章约束了材料科学数据共享的意义,及数据共享服务的格式。