国家标准项目 - 全国标准信息公共服务平台

鉴于当前行业内尚无满足应用需求的面向互联网实时音视频服务的低码率、高质量的语音编解码技术标准，因此制定本标准的意义就不仅仅在于填补行业空白，而且还将有效解决面向互联网实时音视频服务中语音服务的业务痛点：通过将编码码率降低到传统编码器的1/2甚至1/3，提供针对不同网络条件下的高质量语音传输效果，保证在理想网络下，主观音质不低于传统编码技术；在弱网情况下（例如网络拥塞时）的语音服务质量，将显著优于传统编码技术。

在保证绝对语音品质前提下，大幅降低码率，不仅可以节约成本，更重要的是可以提升抗网络损伤能力，有效提升客户体验。

范围和主要技术内容

本文件是面向互联网实时音视频服务的低码率、高质量、可扩展的语音信号编解码标准，适用于协同办公、互动娱乐、社交等互联网实时音视频服务的应用场景。本文件规定码流封装格式的语法语义、解码过程、解码深度神经网络模型结构和参数、解码码本等。本文件支持多模式实时语音编编解码方案：按声道数划分，支持单声道和双声道立体声两种编码模式；按采样率划分，支持16kHz采样16比特量化的宽带语音和32kHz采样16比特量化的超宽带语音两种模式。本标准规定在不同编码模式下的码率限制：在单通道编码模式下，宽带语音码率范围为5-10kb/s，超宽带语音码率范围为8-15kb/s；在双声道立体声编码模式下，宽带语音码率范围为8-12kb/s，超宽带语音码率范围为13-17kb/s。鉴于RTC系统的技术特点，本标准限定编解码延时不超过50ms。

信息技术面向互联网实时音视频服务的语音编码

Information technology — Speech coding for Internet real-time audio and video services

目录

基础信息

起草单位

目的意义

范围和主要技术内容

版权所有侵权必究

重要网站链接

信息技术 面向互联网实时音视频服务的语音编码

Information technology — Speech coding for Internet real-time audio and video services

目录

基础信息

起草单位

目的意义

范围和主要技术内容

版权所有 侵权必究

重要网站链接

信息技术面向互联网实时音视频服务的语音编码

版权所有侵权必究