微波EDA网,见证研发工程师的成长!
首页 > 硬件设计 > 硬件工程师文库 > 国际视频编码标准mpeg简述及AVS视频关键技术

国际视频编码标准mpeg简述及AVS视频关键技术

时间:02-13 来源:3721RD 点击:

MPEG1和H.261的前身是CCITT H.261标准(始于1984年,实质性完成于1989年),它们有共同的数据结构、编码工具和语法元素。然而两者并非恰好后向兼容。MPEG1可看作是H.261的扩展集。MPEG1的发展始于1988年,实质性完成于1992年。MPEG2可被看作是MPEG2的扩展集,始于1990,实质完成于1994年。H.263始于1992年,第一版完成于1995。MPEG4(其视频是建于MPEG2和.263基础上)始于1993,第一版实质完成于1998年。由于芯片等技术的允许,2003年完成的MPEG-4 AVC/H.264比先前的视频编码标准采用了更为复杂的技术,同时也有新的技术模块,多尺寸块的帧内和帧间编码、多方向空间预测技术、4x4整数正交变换、去除块效应的环内滤波器等,可以获得更高的压缩比。由于采用了数据划分,JVT标准还具有更强的容错能力。

AVS标准及其核心技术
    AVS是我国自主制定的第二代音视频编码技术标准。AVS视频当中具有特征性的核心技术包括:8x8整数变换、量化、帧内预测、1/4精度像素插值、特殊的帧间预测运动补偿、二维熵编码、去块效应环内滤波等。
1)变换、量化
    AVS的8x8变换与量化可以在16位处理器上无失真地实现,从而克服了MPEG-4 AVC/ H.264之前所有视频压缩编码国际标准中采用的8x8 DCT变换存在失真的固有问题。而MPEG-4 AVC/ H.264所采用的4x4整数变换在高分辨率的视频图像上的去相关性能不及8x8的变换有效。AVS采用了64级量化,可以完全适应不同的应用和业务对码率和质量的要求。在解决了16位实现的问题后,目前AVS所采用的8x8变换与量化方案,既适合于16位DSP或其他软件方式的快速实现,也适合于ASIC的优化实现。
2)帧内预测
    AVS的帧内预测技术沿袭了MPEG-4 AVC/ H.264帧内预测的思路,用相邻块的像素预测当前块,采用代表空间域纹理方向的多种预测模式。但AVS亮度和色度帧内预测都是以8x8块为单位的。亮度块采用5种预测模式,色度块采用4种预测模式,而这4种模式中又有3种和亮度块的预测模式相同。在编码质量相当的前提下,AVS采用较少的预测模式,使方案更加简洁、实现的复杂度大为降低。
3)多模式帧间预测
    帧间运动补偿编码是混合编码技术框架中最重要的部分之一。AVS标准采用了16×16、16×8、8×16和8×8的块模式进行运动补偿,而去除了MPEG-4 AVC/ H.264标准中的8×4、4×8、4×4的块模式,目的是能更好地刻画物体运动,提高运动搜索的准确性。实验表明,对于高分辨率视频,AVS选用的块模式已经能足够精细地表达物体的运动。较少的块模式,能降低运动矢量和块模式传输的开销,从而提高压缩效率、降低编解码实现的复杂度。

4)1/4像素运动补偿
    AVS和MPEG-4 AVC/ H.264都采用了1/4像素精度的运动补偿技术。MPEG-4 AVC/ H.264采用6抽头滤波器进行半像素插值并采用双线性滤波器进行1/4像素插值。而AVS采用了不同的4抽头滤波器进行半像素插值和1/4像素插值,在不降低性能的情况下减少插值所需要的参考像素点,减小了数据存取带宽需求,这在高分辨率视频压缩应用中是非常有意义的。
5)参考帧
    在传统的视频编码标准(MPEG-x系列与H.26x系列)中,双向预测帧B帧都只有一个前向参考帧与一个后向参考帧,而前向预测帧P 帧则只有一个前向参考帧。而新近的MPEG-4 AVC/ H.264充分地利用图片之间的时域相关性,允许P帧和B帧有多个参考帧,最多可以有31个参考帧。多帧参考技术在提高压缩效率的同时也将极大地增加存储空间与数据存取的开销。AVS中P帧可以利用至多2帧的前向参考帧,而B帧采用前后各一个参考帧,P帧与B帧(包括后向参考帧)的参考帧数相同,其参考帧存储空间与数据存取的开销并不比传统视频编码的标准大,而恰恰充分利用了必须预留的资源。
6)1/4像素运动补偿
    AVS的B帧的双向预测使用了直接模式(direct mode)、对称模式(symmetric mode)和跳过模式(skip mode)。使用对称模式时,码流只需要传送前向运动矢量,后向运动矢量可由前向运动矢量导出,从而节省后向运动矢量的编码开销。对于直接模式,当前块的前、后向运动矢量都是由后向参考图像相应位置块的运动矢量导出,无需传输运动矢量,因此也可以节省运动矢量的编码开销。跳过模式的运动矢量的导出方法和直接模式的相同,跳过模式编码的块其运动补偿的残差也均为零,即该模式下宏块只需要传输模式信号,而不需要传输运动矢量、补偿残差等附加信息。
7)熵编码
    AVS熵编码采用自适应变长编码技术。 在AVS熵编码过程中,所有的语法元素和残差数据都是以指数哥伦布码的形式映射成二进制比特流。采用指数哥伦布码的优势在于:一方面,它的硬件复杂度比较低,可以根据闭合公式解析码字,无需查表;另一方面,它可以根据编码元素的概率分布灵活地确定以k阶指数哥伦布码编码,如果k选得恰当,则编码效率可以逼近信息熵。
    对预测残差的块变换系数,经扫描形成(level、run)对串,level、run不是独立事件,而存在着很强的相关性,在AVS中level、run采用二维联合编码,并根据当前level、run的不同概率分布趋势,自适应改变指数哥伦布码的阶数。
    AVS视频目前定义了一个档次(profile)即基准档次。该基准档次又分为6个级别(level),分别对应高清晰度、标准清晰度与CIF(1/4标清,相当于VHS或VCD质量)应用。 与MPEG-4 AVC/ H.264的baseline profile相比,AVS视频增加了B帧、interlace等技术,因此其压缩效率明显提高,而与MPEG-4 AVC/ H.264的main profile相比,又减少了CABAC等实现难度大的技术,从而增强了可实现性。
    AVS视频的主要特点是应用目标明确,技术有针对性。因此在高分辨率应用中,其压缩效率明显比现在在数字电视、光存储媒体中常用的MPEG-2视频提高一个层次。在压缩效率相当的前提下,又较MPEG-4 AVC/ H.264的 main profile的实现复杂度大为降低。

Copyright © 2017-2020 微波EDA网 版权所有

网站地图

Top