注册

国家标准计划《安全防范监控数字视音频编解码技术要求》由 TC100(全国安全防范报警系统标准化技术委员会)归口 ,主管部门为公安部

主要起草单位 公安部第一研究所北京中星微电子有限公司北京中盾安全技术开发公司中星电子股份有限公司等

目录

基础信息

计划号
20151641-T-312
制修订
修订
项目周期
12个月
下达日期
2015-08-18
申报日期
2015-04-23
公示开始日期
2015-06-05
公示截止日期
2015-06-20
标准类别
基础
国际标准分类号
13.310
13 环保、保健和安全
13.310 犯罪行为防范
归口单位
全国安全防范报警系统标准化技术委员会
执行单位
全国安全防范报警系统标准化技术委员会
主管部门
公安部

起草单位

目的意义

2015年4月13日,中共中央办公厅、国务院办公厅印发的《关于加强社会治安防控体系建设的意见》,要求“加快公共安全视频监控系统建设。

完善技术标准,强化系统联网,分级有效整合各类视频图像资源,逐步拓宽应用领域”。

其中,视音频编解码技术标准是视频监控系统建设中的技术基础。

2010年发布的GB/T 25724-2010,是针对解决安全防范监控行业的、具有我国自主知识产权的、基础性的国家技术标准。

通过近年来GB/T 25724-2010的实施,为实现公共安全视频监控系统中视音频编解码标准的统一提供了技术保障,为满足视频监控的特殊需求提供技术支撑,为我国公共安全视频监控的市场提供了技术支持。

随着技术的不断发展、公共安全视频监控事业的需要,视音频编解码技术需要满足更高的要求。

通过补充完善GB/T 25724-2010部分条款:细化监控专用信息、数据安全保护的内容;在同等质量下,压缩性能较GB/T 25724-2010提高约一倍;支持并行处理等,为加快公共安全视频监控系统建设做好支撑。

范围和主要技术内容

范围: 本文件规定了安全防范领域监控应用的数字视音频编码、解码过程的技术要求。 本文件适用于安全防范领域的视音频实时压缩、传输、播放和存储等业务,对于其他需要视音频编解码的领域也可参考采用。 主要修订的技术内容包括以下三个方面: 一、 规定监控专用信息具体内容 修订监控扩展信息中原来的报警扩展信息类型,分为信号量报警和智能分析报警;将事件扩展合并入智能分析扩展信息中,并给出智能分析的类型和携带的重要数据。增加地理位置信息等元数据。 二、 规定数据安全保护实现细节 修订与安全相关的签名、加密、摘要算法表,新增最新国家密码算法SM1、SM4、SM2、SM3等。修订安全参数集,扩充密钥版本、初始化向量、算法与模式等内容。 三、 提升压缩性能和编码效率 1. 图像分割 图像分割采用slice与tile划分,slice与tile由编码单元构成,编码单元采用基于四叉树递归划分的编码单元树结构,最大64x64,可分割为32x32/16x16/8x8。slice与tile可独立解码,有利于实现并行计算,当数据丢失后能再次解码同步。四叉树结构对高分辨率图像来说,既有利于压缩性能的提升,又能保证图像细节不丢失。 2. 像素精度 结合目前主流的显示器像素深度及摄像机传感器特点,像素精度采用8bit,10bit,12bit,14bit四种格式。 3. 图像编码类型 视频监控领域普遍采用数字视频,图像类型只需支持帧编码,编码时不区分帧和场,只在序列参数集中标明,显示时不同处理。 4. 编码图像类型 编码图像类型采用传统的I、B、P帧类型,采用扩展的P帧和B帧技术(GPB, Generalized P and B Picture)。采用GPB既能保证传统P帧低延时要求,又能提高压缩性能。适当增加连续B帧数量。 5. 帧内预测 a) 块大小 由于编码单元的尺寸调整,帧内预测块大小采用2Nx2N、NxN两种模式。 b) 预测模式 亮度帧内预测模式由现有GB/T 25724—2010的5种模式增加到33~35种。色度帧内预测模式由原来的4种模式增加到5种。更丰富的预测模式能够带来更好的编码性能。 c) 预测模式编码 最佳预测模式(MPM, Most Probable Mode)由现有的1个增加到2~3个,减小帧内预测模式表示所需代价。 d) 参考像素滤波 将帧内预测重建样本经滤波后,再作为后续编码单元的预测参考。参考像素滤波后可提高帧内预测准确度,减小残差,提高帧内预测压缩性能。 6. 帧间预测 a) 块大小 由于编码单元的尺寸调整,以及编码单元内运动物体占比不同,帧间预测块大小采用2Nx2N、2NxN、Nx2N、NxN、2Nx0.5N、2Nx1.5N、0.5Nx2N、1.5Nx2N八种模式,能够提供更高的压缩性能。 b) 参考帧数量 支持多参考帧,采用层次参考结构,修改参考帧管理,提高压缩性能。 c) 运动矢量预测 采用基于竞争的预测运动矢量选择机制,在时域、空域等预测运动矢量中选择最优预测运动矢量。扩展跳过模式(Skip/Direct),使跳过模式支持与其他已编码块共享运动信息。进一步减小编码比特流。 d) 运动补偿精度 提高子像素插值滤波器精度,亮度1/2-pixel与1/4-pexel滤波均采用8-tap,色度1/8-pixel采用bi-linear滤波器,提高帧间压缩性能。 7. 变换及量化单元 采用基于四叉树递归划分的树结构,分割为32x32/16x16/8x8/4x4。Intra4x4时,可以选择DST变换。四叉树结构对高分辨率图像来说,既有利于压缩性能的提升,又能保证图像细节不丢失。 8. 系数扫描方式 增加垂直、水平扫描方式,将幅度相近的系数尽量相近排列,提高编码效率。 9. 环路滤波 增加边界强度Bs为4时的边界滤波过程,并重新定义边界强度Bs的推导过程。针对不同类别的像素点进行环路滤波,提高了重建图像的图像质量。 10.ALF 去除块效应,提高编码性能。 11. 自适应样点补偿 从像素域入手降低振铃效应,对不同类别的像素使用不同的补偿值,有效的提高视频的主客观质量。 12. SVC 增加不同空间分辨率层的定义,并修订层间对应的空间位置计算方法,及每层图像样点插值计算方法、预测及图像重建过程。对于超高清视频提供多层图像划分,适应多种监控场景。 增加时间域SVC,提高编码的灵活度。 13. 熵编码 采用CABAC算法,进一步提高视频压缩性能。 14. 并行计算支持 增加波前并行处理支持,多行CTB可以同时进行处理,在不破坏正常相关性的前提下进行并行解码,提高运算速度的同时保证了压缩性能。

相关专利

专利持有人名称: 北京中星微电子有限公司 北京中盾安全技术开发公司 中星电子股份有限公司 清华大学 数维科技(北京)有限公司 武汉大学