注册

国家标准计划《人工智能 机器翻译系统规范》由 TC28(全国信息技术标准化技术委员会)归口 ,主管部门为国家标准委

主要起草单位 科大讯飞股份有限公司中国电子技术标准化研究院安徽听见科技有限公司

目录

基础信息

制修订
制定
项目周期
24个月
公示开始日期
2020-04-26
公示截止日期
2020-05-10
标准类别
基础
国际标准分类号
35.240.01
35 信息技术、办公机械
35.240 信息技术应用
35.240.01 信息技术应用综合
归口单位
全国信息技术标准化技术委员会
执行单位
全国信息技术标准化技术委员会
主管部门
国家标准委

起草单位

目的意义

随着自然语言处理技术不断进步,机器翻译系统和相关技术也得到飞速发展。

特别是近年来,人工智能理念和技术的应用直接促进了机器翻译系统及相关产品发生了翻天覆地的变化。

总体上,机器翻译的变化源于三方面:从基于规则、到基于统计模型、到基于神经网络,从基于词、到基于短语、到基于整句,从必须使用大规模平行语料库、到可以使用单语语料库、到实现零数据翻译。

由此而诞生的智能机器翻译系统也加速了人工智能理念和技术的落地。

从单纯的文本输入、到语音输入、到OCR识别,从PC端的个人用电子辞典、到移动终端的面对面交流用翻译APP、到大型会议上“云+端”模式的实时翻译系统,从字词翻译、到自然语言意译、到满足文化、情感和专业领域需求的交流翻译。

可以说,机器翻译的智能化是当前人工智能各项技术最具代表性的应用之一。

当前,全球贸易自由化已成为世界大多数国家的共识。

随着中国“一带一路”战略的建设和习近平总书记关于“构建人类命运共同体”的倡议,不同语言之间交流的成为实现国际交流的前提、基础和重要内容,市场需求巨大。

在此背景下,集成了文本、语音、图片、视频等多语言模态与人工智能机器翻译技术的机器翻译系统,以最便捷和最快速的交互方式实现不同语种之间翻译能力,已形成了一个成熟而巨大的市场。

以出境游为例,在收入增长和旅游消费升级推动,以及签证、汇率、航班等便利因素影响下,出境旅游热依然持续。

2018上半年,中国公民出境旅游人数7131万人次,比上年同期增长15.0%。

出境旅游异国的语言沟通成为最大的瓶颈,这推动了游客对机器翻译系统的需求,据统计,市场规模预计从2016年的396亿增长到2020年的561亿元。

目前,市场上出现了各种各样的机器翻译系统,然而,由于国内缺少针对机器翻译系统的功能、性能、可靠性及其试验等技术要求的统一标准,相关产品和服务的技术、质量和能力水平参差不齐,对于消费者来说,难有对机器翻译系统功能性能的基本判别依据;对于相关应用二次开发服务的提供商,也缺少产品技术指导;此外,由于缺少机器翻译技术要求的国家标准,极易出现以机器翻译为名,而各项功能性能指标都达不到技术要求的产品和服务,难以保证其高质量要求,极易导致机器翻译市场鱼目混杂、劣币驱逐良币,阻碍机器翻译和人工智能产业的正常发展。

为解决上述问题,目前亟需制定机器翻译系统的国家和行业内统一标准,为规范市场准入、保障用户权益、提高市场整体质量,提供标准依据;为整合产学研力量、促进人工智能产业发展,提供标准引领。

范围和主要技术内容

1. 范围 本标准给出了机器翻译系统参考架构,规定了机器翻译系统的各组成模块的要求,描述了对应的测试方法。本标准适用于机器翻译系统产品和服务的设计、开发、应用、测试和维护。 2. 主要技术内容 机器翻译系统由翻译用户界面模块、语言模态处理模块、翻译处理模块组成。其中,翻译用户界面应支持自然语言输入和输出;语言模态处理应支持自然语言数据与形式化数据之间的转换;翻译处理应支持两个不同语种之间的翻译。在系统测试过程中应制作符合要求的测试语料,对系统输入输出、语言处理、翻译质量等进行测试。