国家标准项目《电子文档智能校对技术要求》由 TC28(全国信息技术标准化技术委员会)归口 ,主管部门为国家标准委。
主要起草单位 中国电子技术标准化研究院 、北京金山办公软件股份有限公司 、北京方寸无忧科技发展有限公司 、科大讯飞股份有限公司 。
| 35 信息技术、办公机械 |
| 35.020 信息技术(IT)综合 |
该标准所涉及的产品包括WPS365、讯飞智检、方寸无忧智慧公文、密度校对通、Grammarly、Trinka等。
该标准规定了电子文档智能校对技术的通用要求,包括实现智能校对的数据、模型、服务以及功能的技术要求,适用于电子文档智能校对产品的设计、交付和服务能力的评估。 该标准包含算力、数据、模型、服务以及功能,为智能校对服务提供基础算力支持、数据支撑以及校对建议。 算力是电子文档智能校对的基础资源,是支撑智能校对服务的算力基础,提供高性能计算、数据处理、模型训练、资源调度、实时处理、安全保证能力,包含存储、计算和通信。 数据包含通用数据、知识数据、行业数据以及私有数据。通用数据包含字词库、标点库、数字库以及语法库,知识数据包含历史、地理、人文等多学科基础理论、通用常识的数据,行业数据包含政务、教育等多种行业的专业文档数据,私有数据包含由组织或个人拥有且未公开共享的规则数据和字词数据等。 模型基于自然语言处理技术,处理校对数据,实现针对校对文本的文本实体识别、词性分析、语义理解能力,动态调整纠错策略,提供校对建议。 服务包含输入形式、文本化处理、错误识别、错误分析以及错误纠正。服务是模型和校对应用的桥梁,通过对输入文档以及相应文本的处理,将转换后的文字内容采用模型提供的校对能力进行校对,并输出校对结果。 功能提供了智能校对技术能力,包含通用校对、知识性校对、行业属性校对以及定制校对。各功能既可独立运行又可组合应用,针对不同错误类型提供精准校对技术能力。