国家标准计划《数字标准 标准信息模型架构》由 SWG29(全国标准数字化标准化工作组)归口 ,主管部门为国家标准委。
主要起草单位 中国航空综合技术研究所 、中国标准化研究院 。
| 35 信息技术、办公机械 |
| 35.240 信息技术应用 |
| 35.240.30 信息技术在信息、文献和出版中的应用 |
1.范围 本文件确立了标准信息模型的参考架构,以及各部分内容的定义和总体要求。 本文件适用于数字化转型条件下标准的数字化表达、以及机器可用、可读、可解析等方面的标准集成应用。 2.主要技术内容 标准的主要技术内容包括: (1)架构 标准信息模型架构是标准本身进行数字化转型的重要范式,以满足不同数字化应用场景对标准的数字化程度的需求。分为四层:管理壳层、文本层、语义层和功能层。 (2)管理壳层 管理壳层包含了标准信息单元的元数据集合,提供有关标准使用、上下文、分类等的信息,代表了标准或部分标准的服务(如功能、能力、技巧)的接口。其中:①管理壳中的元数据集合为用户终端(如机器/软件)提供了标准信息模型所包含的数据类型,以便于用户终端可以通过有效的元数据标签访问和取得所需的数据。② 索引信息模型用于描述和定义标准电子文本,支持标准数据库检索与查询。③标准化对象信息模型用于标识标准化对象。④功能信息表明标准信息模型中功能单元提供的服务能力。 (3)文本层 文本层表达了一个结构化的标准全文本信息模型,解决标准本身的技术要素提取和关联,以便于机器、软件或平台未来可以完整的识别标准各个部分,并建立起关联关系,这也是语义层和功能层的数据基础。文本层由大量结构化的文本信息单元组成,通过这些信息单元,实现对标准中的文本段落、表格、图片以及公式等信息的结构化储存。文本信息单元用于定义不同颗粒度的标准要素,其数字化表达应尽可能采用已发布的取得共识的国际标准或协会规范,保证标准数据兼容性和互操作性。在此基础上,按需补充国家标准、行业标准和企业标准专属的标准元数据。 (4)语义层 语义层通过语义信息模型为文本信息单元赋予语义信息,帮助用户终端(机器或软件)理解标准内容所表征的含义。语义层由语义信息单元的组成,每个语义信息单元的基础是标准的文本信息单元,通过将文本信息单元与标准语义模型进行映射和关联,得到语义信息单元,这个加工过程需要专家系统介入,给予确认。语义信息模型面向工程应用设计,不同行业和专业领域可以按需构建专业语义信息模型。语义信息模型可由生成式AI引擎通过机器学习训练得到,但需要经过严格的技术测试和工程验证。专业领域训练样本规模不大的情况下,宜按标准数字化集成应用角度,离散、聚合、提炼和总结形成专业技术语义库,并经行业专业评议确认。 (5)功能层 功能层包含了标准能为数字化研制环境所能够提供的服务,是标准文本层信息和语义层信息面向不同业务应用场景的组合和多样化表达,呈现出数据、模型、程序、服务、API接口等不同应用形态。与功能单元相关联的标准信息单元是唯一确定的,后者作为主数据,是功能信息单元进行标准符合性认证的重要依据。功能信息单元是面向各种工程应用设计的,这意味着功能信息单元实际上难以穷举和遍历,并随着技术发展和数字化环境的变化而更迭,要求提供匹配的标准更新管理机制。