国家标准项目《信息技术 智能媒体编码 第10部分:实时通信语音编码》由 TC28(全国信息技术标准化技术委员会)归口,TC28SC29(全国信息技术标准化技术委员会多媒体分会)执行 ,主管部门为国家标准委。
主要起草单位 中国电子技术标准化研究院 、清华大学 、腾讯科技(深圳)有限公司 、华为技术有限公司 、北京理工大学 。
| 35 信息技术、办公机械 |
| 35.040 字符集和信息编码 |
本文件是面向互联网实时音视频服务的低码率、高质量、可扩展的语音信号编解码标准,适用于协同办公、互动娱乐、社交等互联网实时音视频服务的应用场景。 本文件规定码流封装格式的语法语义、解码过程、解码深度神经网络模型结构和参数、解码码本等。 本文件支持多模式实时语音编编解码方案:按声道数划分,支持单声道和双声道立体声两种编码模式;按采样率划分,支持16kHz采样16比特量化的宽带语音和32kHz采样16比特量化的超宽带语音两种模式。本标准规定在不同编码模式下的码率限制:在单通道编码模式下,宽带语音码率范围为5-10kb/s,超宽带语音码率范围为8-15kb/s;在双声道立体声编码模式下,宽带语音码率范围为8-12kb/s,超宽带语音码率范围为13-17kb/s。鉴于RTC系统的技术特点,本标准限定编解码延时不超过50ms。