MPEG-4技术的演进与在中国的应用

时间：01-10 来源：与非网点击：

活动图像专家组(MPEG)针对数字音频和视频的编码原则制定了MPEG标准，通过MPEG压缩引擎，实现了以经济的成本为消费者提供高质量的数字多媒体内容的理想，也为多媒体市场带来了无限商机。最新开发的MPEG-4，旨在为机顶盒、互联网、移动设备等应用实现更高质量的压缩和更灵活的格式，提供更加丰富的选择。
　　
MPEG-4标准目前已发展为ISO/IEC-14496第一版和第二版。随着MPEG-4 第十部分H.264/先进的视频编码(AVC)的提出，MPEG标准进一步演进。与此同时，中国自主知识产权的数字音视频编解码标准(AVS)的制定也为便携式多媒体技术开创了新的发展空间。
　　
高质量有效传输数字多媒体内容
　　
MPEG-4可同时处理各种"媒体对象(视频和音频内容的统称)"，形成视听场景，为整套工具包提供互动和个性化媒体内容的视听数据，同时，还可压缩/解压其他媒体对象，如文本、图像、语音、动画、2D和3D对象等。为实现该标准的有效实施，MPEG-4系统对子集、视频和音频工具集都进行了定义，以应用于各种特殊应用，为音频/视频对象的编码提供更丰富的工具。
　　

图1 H.264/AVC宏块视频编码层框图
　　
H.264/AVC打造MPEG-4新特性
　　
MPEG-4 第十部分H.264/AVC在本质上与MPEG-2等其他标准类似，是由时间预测和空间预测的综合体与编码转换共同组成的，但这一新标准并不会取代现有的MPEG-4 第二部分"编码解码器"，也不与其兼容。
　　
除此之外，H.264/AVC还采用了视频编码领域的最新研究成果。由于采用了帧内预测、整数转换、可变的块尺寸运动评估/补偿和去块过滤等现有先进技术，H.264/AVC与之前的标准相比又增加了新的特性，在帮助其他现有的标准在维持相同视频质量的同时，还可平均降低50%的位率。

　

　

表1 H.264/AVC与其他标准的比较
　　
帧间预测功能
　　
H.264/AVC可根据每个宏块片编码类型的不同，以几种编码类型中的一种进行传输，并且所有片编码类型可支持INTRA-4×4和INTRA-16×16两种类别的帧内编码类型。在以往的视频编码标准中，预测操作都是在转换域中进行的，而在H.264/AVC标准中，这一操作往往是根据已编码块中的相邻样本，在空间域中进行的。帧内预测不能跨越片边界，以保持片与片之间的相互独立性。
　　
P片中的活动补偿
　　
除帧内宏块编码类型外，H.264/AVC还包含多种针对P片宏块的预测性或活动补偿性的编码类型。宏块被分割在用于活动描述的大小固定的块中，每个P类宏块对应一个特定的宏块分区。活动补偿的精度为一个样本距离的四分之一。
　　
一般情况下，H.264/AVC的语法可支持无限制的活动矢量，即活动矢量可以超出画面区域，但活动矢量元件预测不能跨越片边界。
　　
整数转换
　　
此外，与以往的视频编码标准相似，H.264/AVC也采用预测剩余的转换编码，但这种转换仅应用于4×4块，而且计算中采用了与4×4离散余弦转换(DCT)特性基本相同的分离整数转换，以此取代了4×4DCT。由于整个逆转换过程由精确整数运算定义，因此避免了逆转换过程中的不错配现象。而对于转换系数的量化，H.264/AVC运用了标量化的方法。块中的量化转换系数通常按照之字形顺序进行扫描，并采用平均信息量编码的方式传输。只要16位整数值相加，并在16位整数值的基础上进行位移操作，H.264/AVC 中的所有转换就都能实现。
　　

图2 一个H.264的P片宏块的分区结构
　　

图3 多画面活动补偿预测
　　
平衡信息量编码
　　
为实现量化转换系数的传输，H.264/AVC采用了更先进的前后自适应可变长度编码(CAVLC)，与仅采用单个VLC列表的方法相比，这一技术能进一步改善平均信息量编码质量。此外H.264/AVC还支持前后自适应二进制算术编码(CABAC)，与CAVLC相比，CABAC在进行相同质量的电视信号编码时，通常能够节约10%到15% 的位率，从而进一步提升了平均信息量编码效率。
　　
多基准帧
　　
H.264/AVC 还支持多画面活动补偿预测。如图3所示，H.264/AVC可提供不止一个的预先编码画面作为活动补偿预测基准。然而，无论是编码器还是解码器都必须存储基准画面，以实现多画面缓冲器中的画面间预测。
　　
基于以上特别的先进技术，与其他现有标准相比，H.264/AVC所带来的益处显而易见。例如，与MPEG-2、MPEG-4 ASP 和H.263 HLP等现有的编码标准相比，在使用H.264/AVC播放DVD品质的电视或进行HD视频编码时，相关的位率可节省2.25 到2.5，如表1所示。
　　
AVS开创MEPG-4发展新境界
　　
随着中国数字音频/视频多媒体设备和系统市场的发展，为建立全国性的压缩、处理和数字版权管理标准，中国数字音视频编解码技术标准工作组(中国AVS工作组)开发了数字音视频编解码标准(AVS)，并于2002年6月由中国信息产业部科学技术司批准通过。2003年12月，AVS工作组针对高清和高质量数字广播、数字存储媒体及其他相关应用制定的首个AVS视频标准问世。
　　
由于采用的模块相同，AVS与H.264/AVC编码器的架构看起来比较类似。但是，考虑到目标应用与MPEG-2的向后兼容性以及解码复杂程度等因素， AVS音视频编码解码器中模块还是采用了独到的技术，实现了编码效率的进一步大幅提升。
　　
AVS需要对输入宏块进行预测，图4所示的开关S0 用于选择帧间和帧内宏块所需的正确预测方法。帧内预测源自左上方块中的相邻像素。由于采用的是8×8整数转换，因此空间预测的单元大小也是8×8。帧间预测则源自解码帧和解码场。AVS支持16×16、16×8、8×16和8×8这4种尺寸的块，但总体而言，高分辨率视频很少使用小尺寸的块。AVS帧间块的活动矢量精度为四分之一像素。
　　
在AVS中，预测剩余误差需通过8×8整数转换方法进行转换。渐进块仍然按照之字形顺序进行扫描，与MPEG-2中的扫描顺序相似。但AVS却通过自适应VLC编码技术在逐行扫描块中定义了一种新的扫描顺序，四种不同类型的Exp-Golomb密码本也分别对应不同的分配方式。此外，AVS还定义了一些映射表，可将编码符号映射到特殊编码及其成分中。
　　
预测与当前重建错误图像的总数构成了重建基准。AVS在活动补偿环路中使用了一个去块滤波器，能够根据块的工作情况与QP参数进行自动调节。
　　
由于MPEG-2编码解码器与系统在现有的广播系统中得到了广泛的运用，因此AVS的语法结构也特别采用了与MPEG-2类似的设计，因此能够直接应用于现有的MPEG-2系统。
　　
目前，AVS可支持YUV 4:2:0和YUV 4:2:2采样结构，以及8位样本精度，用于色度格式的2位无正负整数则为诸如YUV 4:4:4 或RGB 4:4:4之类的其他顺序格式保留了应用空间。
　　

图4 AVS 视频编码器框图
　　

图5 PR8185单芯片解决方案

上一篇：基于ARM处理器S3C2440和Linux系统的I2C触摸屏设计
下一篇：让机顶盒遥控电视机

AVS 视频 MPEG-4 AVC H 264 相关文章：

栏目分类