国家标准计划《术语资源管理 数据类目 第1部分:规范》由 TC62(全国语言与术语标准化技术委员会)归口 ,主管部门为国家标准委。
主要起草单位 北京信息科技大学 、中国标准化研究院 。
| 01 综合、术语学、标准化、文献 |
| 01.020 术语学(原则和协调配合) |
本标准修改采用ISO国际标准:ISO 12620-1: 2022。
采标中文名称:术语资源管理 数据类目 第1部分:规范。
在当前数字化转型加速和全球信息互联深化的背景下,与语言资源相关的数据在各种环境中被识别、收集、管理和存储。
术语资源管理中的数据类目作为知识组织与数据治理的核心环节,亟需通过采标国际标准制定《术语资源管理-数据类目 第1部分:声明》推荐性国家标准,以应对行业实践中的结构性矛盾与技术发展需求。
这一标准的制定不仅是对术语资源管理理论体系的完善,更是推动我国术语标准化工作与国际接轨、服务国家战略的重要举措。
本标准立项的必要性主要体现在以下几点: 1. 经济社会和产业发展需求 术语资源的规范化管理已从传统的语言学范畴扩展至数字经济、智能制造、国际传播等多领域。
随着我国术语数据库建设规模的扩大,术语数据在分类、存储、交换等环节的标准缺失问题日益凸显。
术语资源的建设是语言服务与知识服务融合发展的基础。
无论是科技文献、专利数据,还是政务信息、企业档案,都依赖术语的一致性才能实现高质量的信息组织、语义识别和智能检索,从而支撑行业数字化转型和产业智能化发展。
开发不同种类的语言资源所采用的方法以及技术环境的差异,不可避免地导致数据类目定义和数据类目名称的差异。
在相同的语言领域(例如术语资源、词汇资源、注释文本语料库)内的资源中使用统一的数据类目名称和定义有助于提升系统一致性并提高数据的可复用性。
数据类目声明为管理和使用数据类目制定了明确的框架,将提高语言资源的互操作性。
此外,随着“一带一路”等国家重大战略的推进,术语资源的国际标准对接需求日益增强。
只有建立高质量、可持续更新的术语资源库,才能在国际交流与合作中准确传达我国技术内涵和产业话语,提升我国标准和技术的国际影响力与竞争力。
ISO 12620-1: 2022国际标准已明确术语数据类目的质量要求(如准确性、一致性)、结构化定义(如数据元素类型与关系)及交换格式(如XML/JSON),为术语资源的标准化提供了成熟框架。
采标此类标准,可系统性解决术语数据“定义不统一、结构不规范、交换不兼容”等问题,推动术语资源从“分散管理”向“互联互通”转型。
2. 相关法律法规、政策规划的要求 术语资源管理工作具有坚实的法律法规和政策依据,已被纳入国家语言文字规范体系和标准化发展战略之中。
《中华人民共和国国家通用语言文字法》明确要求在教育、出版、政务等领域使用规范术语,保障语言文字的统一性与权威性,为术语资源管理提供了法律支撑. 在标准化工作中,也对于术语资源管理、统一具有要求。
《中华人民共和国标准化法》中推动参与国际标准化活动,开展标准化对外合作与交流,参与制定国际标准,结合国情采用国际标准,推进中国标准与国外标准之间的转化运用。
这需要基础术语强制统一,保障安全与互操作。
《标准联通共建“一带一路”行动计划(2018-2020年)》明确提出加强术语翻译和语义一致性标准研究,推动我国术语资源在国际技术标准合作中的应用,提升我国标准的国际传播力与话语权。
此外,国家社科基金等项目管理制度也将术语的规范性作为评估学术研究质量和跨学科表达准确性的关键因素。
术语资源管理不仅是语言文字工作的延伸与深化,更是落实国家科技战略、知识治理体系和国际标准对接战略的重要基础支撑工程。
3. 标准实施后的重大经济、社会、生态效益分析 本标准的实施,能够显著提升语言规范使用的一致性与准确性。
在产业层面,有助于推动上下游企业之间的信息互通与协同生产,降低因术语歧义引发的沟通成本与项目风险,提升产品研发、技术转让和质量控制的效率。
特别是在高技术领域,统一数据类目声明能够促进知识的快速流转和技术的规模化应用,增强产业核心竞争力。
在社会效益方面,本标准的推广能够提升政府、科研机构、教育单位及公众在传播、理解和应用专业知识时的准确性,促进科学素养普及与社会沟通的顺畅。
统一、权威的术语资源有助于学术成果的规范表述与跨学科融合,也便于媒体、教育、政务等系统在公众信息服务中使用清晰一致的术语,减少误解和争议,提升社会治理能力与公众信任度。
在生态效益方面,标准实施后有助于减少数据冗余与资源浪费,促进生态协同创新。
共享的数据类目存储库(DCR)避免重复开发基础数据规范,节省资源。
标准化的数据结构减少数据库冗余存储(如字段合并可降低存储空间30%),间接降低数据中心能耗。
标准化的公共数据资源降低公众参与门槛,激发社会创新。
综上,采标《术语资源管理-数据类目 第1部分:规范》推荐性国家标准,是提升我国术语资源管理能力的基础。
该标准的制定与推广具有充分的可行性与必要性,将为我国术语资源管理从“经验驱动”迈向“标准驱动”提供关键支撑。
本标准规定了数据类目库中创建、记录、引用、协调、维护和管理数据类目的要求,提供了有关数据类目的技术性建议,以支持语言资源数据类目使用的有效性。本标准由9个核心模块组成,包括:范围、规范性引用文件、术语和定义、数据类目和数据类目规范的一般建议、在DCR中记录数据类目的详细要求、引用数据类目、数据类目的协调和审查和管理。 本文件修改采标ISO 12620-1: 2022《Management of terminology resources – Data categories – Part 1: Specifications》,与ISO 12620-1: 2022相比,主要结构性变化如下: ——更改了“概念域”、“数据类目”的构成形式(见3.1、3.2,ISO 12620-1:2022的3.1、3.2); ——增加了“缩略语”一章(见第4章)。 本文件与ISO 12620-1:2022相比,主要技术变化如下: ——更改了陈述“范围”的具体规定及表述形式(见第1章,ISO 12620-1:2022的第1章); ——更改了“来源”中所述的具体内容(见3.9,ISO 12620-1:2022的3.9)。 本文件与ISO 12620-1:2022相比,编辑性修改如下: ——增加了“规范性引用文件”中ISO文件对应的注(见第2章,ISO 12620-1:2022的第2章); ——修改了“特定语言的数据类目名称”中的示例(见7.1.4,ISO 12620-1:2022的6.1.4)。 本文件代替GB/T 16786-2007,与GB/T 16786-2007相比主要技术变化如下: GB/T 16786-2007规定了术语信息处理的各类系统中(计算机环境或非计算机环境;单语种或多语种;单专业领域、多专业领域或跨专业领域;单一用途或多用途等)所涉及的数据类目的名称、内容和表达法。本文件聚焦于数据类目本身的结构及其制定依据。