国家标准计划《标准文档结构化 第1部分:全文结构化元模型》由 TC83(全国电子业务标准化技术委员会)归口 ,主管部门为国家标准化管理委员会。
主要起草单位 河北省标准化研究院 、中国标准化研究院 、杭州市标准化研究院 、宁波市标准化研究院等 。
35 信息技术、办公机械 |
35.240 信息技术应用 |
35.240.30 信息技术在信息、文献和出版中的应用 |
本标准旨在描述出国内各类标准通用结构化的描述元模型,元模型既可以为不同类别标准的数字化编辑和处理, 即为标准文档的形式结构化要素(全文结构化数据模型)和语义结构化要素(指标结构化数据模型)等提供技术编写和数据约束等相关规则和要求;也可以为各类标准文档的内容在结构化抽取、形成不同标准内容间的关联结构化的数据关系、标准文档内容的存储和交换、标准文档内容的重组构建专题库以及未来标准化技术服务人工智能的采用等提供技术支撑和技术依据,为数字标准化服务奠定基础。
本标准拟对国内所有各种类型标准(包括国家标准、行业标准、团体标准和企业标准等)文档内容提供结构化的描述方法和技术实现相关规则。标准为系列标准,包括三部分:1)全文结构化元模型;2)技术指标结构化元模型。 本部分标准是系列标准的第1部分。本部分规定了结构化标准文档数据模型(包括全文、术语、正文、图例、表格、公式等)、全文元数据的属性以及全文元数据的扩展原则和方法等,并采用XML Schema对标准内容的元模型进行规范化表示。 本标准适用于标准文档进行结构化的编目、归档、存储、数据库建设、标准检索、数据交换和数据共享等标准化活动。本标准是标准文档进行数字化建设和信息加工的基础标准。