国家标准计划《标准知识图谱 第1部分:实现指南》由 SWG29(全国标准数字化标准化工作组)归口 ,主管部门为国家标准委。
主要起草单位 中国电子技术标准化研究院 、中国标准化研究院 、中国航空综合技术研究所等 。
| 35 信息技术、办公机械 |
| 35.020 信息技术(IT)综合 |
| 编号 | 语种 | 翻译承担单位 | 国内外需求情况 |
|---|---|---|---|
| 1 | EN | 中国电子技术标准化研究院 | 本标准的研制是符合国际标准化趋势和产业发展需求的,一是助推标准数字化转型,解决当前标准的数据服务、信息服务仍处于初级阶段,机器难以读取、理解与使用现有标准文本,阻碍标准数字化进程,影响智能服务应用技术的发展的难题。二是赋能标准知识图谱,助力理解标准知识图谱是标准数字化过程中的关键技术,为构建、更新和应用标准知识图谱提供有效路径。 |
当前由于标准的数据服务、信息服务仍处于初级阶段,大部分标准均采用纸质或简单电子版形态展现,机器难以读取、理解与使用,阻碍了标准数字化进程,从而影响智能服务应用技术的发展。
标准知识图谱是标准数字化过程中的关键技术,是使用人工智能算法对标准及其生命周期全过程赋能,对标准所承载的规则知识建立完整且符合逻辑的关联体系,具备可通过数字设备读取、传输、理解以及使用的能力。
标准知识图谱采用当前主流的先进知识图谱构建技术,能够对半结构化和非结构化的标准文本数据进行知识抽取、知识融合和知识表示,构建成为机器可读的形式参与计算,以实现知识检索、知识推理等功能,具有一定的先进性和创新性。
该标准给出了标准知识图谱参与者、构建流程以及应用,能有效促进标准数字化进程,提高标准知识高效利用,有助于标准知识图谱质量效益提升,提高标准知识图谱的使用价值和效率。
1.范围 本文件提供了面向标准的知识图谱通用方法,给出了面向标准的知识图谱的构建流程、知识更新和应用服务。 本文件适用于面向标准的知识图谱构建、更新与应用。 2.主要技术内容 主要技术内容包括:标准知识图谱构建、标准知识图谱更新、标准知识图谱应用等。其中标准知识图谱构建主要包括5个部分,分别是数据收集与预处理、标准知识本体模型构建、标准知识获取、标准知识融合、标准知识存储。标准知识图谱的数据收集和预处理即获取并根据数据特性及使用需求处理数据,将数据以合适的形式存储在计算机内部或外部存储介质。主要包括数据清洗、数据标注、数据存储和数据管理4个部分。标准知识本体模型构建主要是建立标准知识图谱的数据模型,即标准知识的表达方式,构建本体模型来描述知识。在标准知识图谱本体模型中,需要构建本体的概念、属性以及概念之间的关系,包括建模方法、建模技术条件等内容。标准知识获取是从结构化数据(Graph、Jason格式的标准)、半结构化数据(word、txt格式的标准)、非结构化数据中(标准中的表格、图片)提取知识单元,并构建标准知识图谱。按照标准知识获取的对象不同,可分为实体获取,关系获取和属性获取。主要包括实体抽取、关系抽取、属性抽取、抽取技术条件等内容。标准知识融合包含本体融合、实体融合与图谱融合。知识融合方法可分为概念层的知识融合和实例层的知识融合。标准主要从融合方法和融合技术条件两方面给出了建议。标准知识存储主要给出了存储技术宜满足的条件。标准知识图谱更新旨在保持图谱中的标准数据与标准发布、修订和废止情况一致,通常包括检测标准发布、修订和废止动态,将标准变化情况映射到标准知识图谱中的实体和关系,避免有关的冲突。本标准给出了标准知识图谱的更新方法。标准知识图谱应用介绍了3种典型的应用,标准知识图谱可为标准研制、标准应用和标准数据等知识服务提供支撑。