注册

国家标准计划《信息技术 手语数字人技术规范》由 TC28(全国信息技术标准化技术委员会)归口,TC28SC24(全国信息技术标准化技术委员会计算机图形图像处理及环境数据表示分会)执行 ,主管部门为国家标准委

主要起草单位 之江实验室中国电子技术标准化研究院网易股份有限公司阿里巴巴达摩院浙江特殊教育职业学校等

目录

基础信息

计划号
20241980-T-469
制修订
制定
项目周期
18个月
下达日期
2024-06-28
公示开始日期
2024-04-15
公示截止日期
2024-05-14
标准类别
基础
国际标准分类号
35.240
35 信息技术、办公机械
35.240 信息技术应用
归口单位
全国信息技术标准化技术委员会
执行单位
全国信息技术标准化技术委员会计算机图形图像处理及环境数据表示分会
主管部门
国家标准委

起草单位

目的意义

为听障人士提供专业、智能、高质量的手语翻译与播报,让他们深度融入社会生活,是重大民生工程。

国家劳动和社会保障部于2008年发布手语翻译员(X4-07-99-16)职业标准,颁发《国家职业标准手语翻译员证书》,各地区相继开展相关职业培训和职业认证,为帮助听障人士获取更多数量和更高质量的信息、推动手语翻译行业的规范化发展,起到了重要作用。

但当前,合格的手语译员数量与需求不匹配、听障人士在某些场合无法全面理解手语翻译内容等现象仍然较为突出。

据统计,我国现有听障人士2054万,但专业手语翻译人员的数量与之相比极不匹配。

根据各省数据,浙江约有105万听障人士,能胜任工作的手语翻译不足300人;上海申领听障残疾人证数量约8万人,但目前从事手语翻译的人数仅几十人。

据估算,全国能胜任手语翻译工作的人数可能不足万人。

此外,即便是专业的手语翻译,也存在听障人士无法看懂的问题。

2021年,国家手语和盲文研究中心一项面向585位听障人士的调研发现,“完全能看懂”电视手语新闻的听障人士只有7.69%,大多数听障人士能看懂的不到一半,甚至完全看不懂。

原因包括有部分听障人士未学过手语,同时还有新闻手语画面太小、手语无法跟上新闻播报速度、不同地区存在手语方言等。

另有数据显示,使用过手语翻译服务的听障人士中,对服务满意的仅占36.9%,服务场合、质量和价格是听障人士期待改善的三大迫切需求。

随着计算机视觉、深度学习等技术的蓬勃发展,相关科研院所和企业开展了手语数字人的技术和产品研发,并在一些场合进行了初步应用。

手语数字人面临着重要的发展机遇——从政策支持角度,《广播电视和网络视听“十四五”科技发展规划》中提出:“推动虚拟主播、动画手语广泛应用于新闻播报、天气预报、综艺科教等节目生产,创新节目形态,提高制播效率和智能化水平”;从技术发展角度,手语数字人是三维建模、动作捕捉、渲染、自然语言处理(NLP)、计算机视觉(CV)、虚拟现实等技术的综合体,随着上述技术的逐步成熟,手语数字人的水平也越来越接近高水平手语翻译;从应用落地角度,已有许多企业拥有了自己的手语数字人产品,并在大型体育赛事播报、天气播报、大会翻译等有相关应用,产业逐步走向成熟。

但当前,众多手语数字人产品还缺乏统一的质量评价指标和评价方式,用户单位在选择手语数字人为听障人士提供手语翻译服务时,很难准确度量产品的性能是否能满足听障人士的需要。

为顺应手语数字人发展的良好形势,进一步推动手语数字人的规范化健康发展,提高听障人士的健康福祉,本标准将通过建立一套完善的技术指标和评估体系,对手语数字人产品进行规范,为社会带来更多更高质量的手语数字人产品,最大程度上填补市场上手语翻译人力资源缺口,帮助2054万听障人士更好地获取知识、适应社会、最大化地体现和发挥自身价值,为我国社会经济建设贡献一份力量。

因此,本标准的立项和发布,对听障人士深度融入社会具有重要的意义,对尊重和保障听障人士平等参与、平等发展的权利,将产生积极的影响。

范围和主要技术内容

范围:本文件规定了可提供从语音、文本或带有文本的图像进行手语翻译的手语数字人技术规范,主要包括手语数字人基本技术框架、具体技术指标及测试方法。本文件适用于手语数字人的开发以及指导第三方测评机构对手语数字人的评估、验收等工作。 主要技术内容:本标准共7章,第1章至第4章分别为范围、规范性引用文件、术语和定义、缩略语等。第5章规定手语数字人基本技术框架。第6章规定手语数字人技术要求,包括手语数字人技术要求体系、基础要求、人物形象、手语翻译等。其中,基础要求又包括支持形式、实时性等;人物形象又包括模型精度、表情丰富程度、口型匹配程度等,手语翻译又包括手语动作规范程度、流畅程度、翻译准确度、动作与表情口型配合度等。第7章规定手语数字人评估方法,给出了上述指标的具体评估方法。