注册

国家标准计划《语言资源管理 语义标注框架 第6部分:语义标注原则》由 TC62(全国语言与术语标准化技术委员会)归口 ,主管部门为国家标准委

主要起草单位 中国标准化研究院等

目录

基础信息

计划号
20221824-T-469
制修订
制定
项目周期
12个月
下达日期
2022-12-30
申报日期
2022-05-18
公示开始日期
2022-11-02
公示截止日期
2022-11-16
标准类别
基础
国际标准分类号
01.020
01 综合、术语学、标准化、文献
01.020 术语学(原则和协调配合)
归口单位
全国语言与术语标准化技术委员会
执行单位
全国语言与术语标准化技术委员会
主管部门
国家标准委

起草单位

采标情况

本标准修改采用ISO国际标准:ISO 24617-6:2016。

采标中文名称:语言资源管理 语义标注框架 第6部分:语义标注原则(SemAF Principles)。

目的意义

语义标注是计算机对自然语言深层次处理的一个重要技术之一,是对文本中的词语或句子添加可供理解的语义标签的过程。

本标准给出语义标注框架的基本原则和要求,为建立一致且连续的语义标注方案提供支持。

本标准的制定具有以下重要意义: 一、有助于提升数据资源的共享和服务能力,通过给出制定语义标注框架的基本要求,为语义标注框架提供了方法上的一致性,并有助于确保已有对时间、事件、语义角色等已有语义标注的兼容性,使得依据此标准进行语义标注的数据可以更好地实现数据的交换和共享,进一步提高数据服务能力; 二、提高数据资源的管理能力,根据本标准实现的语义标注具有通用性、完整性、可变粒度等,不局限于特定语言、领域中概念、术语的标注,可适应不同粒度级别的概念、术语的标注,可以涵盖更广范围的语义现象,有助于计算机对数据的处理能力; 三、促进标准数字化发展。

语义标注将有助于将推进标准文本内容的数字化、结构化,对语义标注方法、流程的规范化有助于提高标准解析的准确性,有效推动标准文本与信息化的融合,促进标准数字化发展。

范围和主要技术内容

本文件规定了用ISO语义标注框架进行语义标注的方法,给出了语义标注的抽象和具体语法的概念,反映ISO 语言标注框架(ISO Linguistic Annotation Framework)中标注和表示之间的区别。 主要技术内容包括:语义标注的目的和动机、语义标注原则概述、语义标注原则和要求、SemAF的方法论基础、标注方案之间重叠、跨越多个标注框架语义现象等。