微波EDA网,见证研发工程师的成长!
首页 > 应用设计 > 消费类电子 > H.264与AVS视频标准核心技术比较

H.264与AVS视频标准核心技术比较

时间:09-11 来源:中国多媒体通信 点击:
AVS

  2002 年,中国信息产业部成立的音视频技术标准 (AVS)工作组宣布准备针对移动多媒体、广播、DVD等应用编写一份国家标准。该视频标准称为AVS [14],由两个相关部分组成针对移动视频应用的AVS-M和针对广播与DVD的AVS1.0。AVS标准与H.264相似。

 AVS1.0同时支持隔行和逐行扫描模式。AVS中P帧可以利用2帧的前向参考帧,同时允许B帧采用前后各一个帧。在隔行模式下,4个场可以用作参考。可以仅在帧级执行隔行模式中的帧/场编码,这一点与H.264不同,其中允许此选项的MB级自适应。AVS具有与H.264相似的环路滤波器,可以在帧级关闭。另外,B帧还无需环路滤波器。帧内预测是以8(8块为单位进行。MC允许对亮度块进行1/4象素补偿。ME的块大小可以是16(16、16(8、8(16或8(8。变换方式是基于16位的8(8整数变换(与WMV9相似)。VLC是基于上下文自适应2D运行/级别编码。采用4个不同的Exp-Golomb编码。用于每个已量化系数的编码自适应到相同8(8块中前面的符号。由于Exp-Golomb表是参数化的表,因此表较小。用于逐行视频序列的AVS 1.0的视频质量在相同比特率时稍逊于H.264主类。

  AVS-M主要针对移动视频应用,与H.264基本规范存在交叉。它仅支持逐行视频、I与P帧,不支持B帧。主要AVS-M编码工具包括基于4(4块的帧内预测、1/4象素运动补偿、整数变换与量化、上下文自适应VLC以及高度简化的环路滤波器。与H.264基本规范相似AVS-M中的运动矢量块大小降至4(4,因此MB可拥有多达16个运动矢量。采用多帧预测,但仅支持2个参考帧。此外,AVS-M中还定义了H.264 HRD/SEI消息的子集。AVS-M的编码频率约为0.3dB,在相同设置下稍逊于H.264基本规范,而解码器的复杂性却降低了大约20%。

  H.264和AVS的背景

  H.264/MPEG-4AVC是ITU-T的VCG(Video Coding Experts Group)和ISO/IEC的MPEG(Moving Picture Experts Group)联合开发的新一代视频编码标准。应用范围包括可视电话、视频会议等。H.264的主要特色就是极大得提高了压缩率,是MPEG-2及MPEG-4压缩效率的一倍以上。H.264核心技术与之前标准相同,仍采用基于预测变换的混合编码框架,但是在细节的实现上有很大不同,就是细节上的改进导致压缩效率极大得提高。而且新一代视频编码标准H.264具有良好的网络适应性和容错等特点。

  AVS的诞生可以说是一个历史的机遇,面对H.264以及MPEG-2等标准高额的专利费,我国数字视频产业面临严重挑战。加上我国致力于提高国内数字音视频产业的核心竞争力,由国家信息产业部科学技术司于2006年6月批准成立了"数字音视频编解码技术标准工作组",联合国内从事数字音视频编解码技术研发的科研机构和企业,针对我国音视频产业的需求,提出了我国自主知识产权的信源编码标准―――《信息技术 先进音视频编码》系列标准,简称AVS(audio video coding standard).自主的AVS标准在技术和性能上处于国际先进水平,如果抓住这次机遇,我国在技术-专利-标准-芯片-系统-产业这个产业链上,就有可能具有全面的主动权。

  H.264和AVS核心技术分析及对比

  H.264和以前的标准一样,还是采用的混合编码的框架,AVS视频标准采用了与H.264类似的技术框架,包括变换、量化、熵编码、帧内预测、帧间预测、环路滤波等模块。他们核心技术的不同包括以下几点:

 一、变换和量化

  H.264对残差数据采用基于块的变换编码,去除原始图像的空间冗余,使图像能力集中在小部分系数上,直流系数值一般来说是最大的,这样可以提高压缩比、增强抗干扰能力。先前标准一般采用DCT变换,这种变换的缺点是会出现失配现象,原始数据经过变换和反变换恢复后会有一个差值,由于是实数运算计算量也比较大。H.264采用的是基于4×4块的整数变换。

  AVS采用8×8的整数变换,可以在16位处理器上无失配地实现。对高分辨率的视频图像去相关性要比4×4变换有效,采用了64级量化,可以适应不同的应用和业务对码流和质量的要求。

  二、帧内预测

  H.264和AVS技术都采用帧内预测的方式,用相邻的像素预测当前块,采用代表空间域纹理的多种预测模式。H.264的亮度预测有4×4块和16×16块2种预测方式,对于4×4的块:从-135度到+22.5度方向加上一个直流预测一共是9种预测方向;对于16×16块:有4种预测方向。色度预测是8×8块,有4种预测模式,类似于帧内16×16预测的4种模式,其中DC为模式0、水平为模式1、垂直为模式2、平面为模式3。

  三、帧间预测

  H.264帧间预测是利用以编码视频帧和基于块的运动补偿的预测模式,与以往标准帧间预测的区别在于块尺寸范围更广、亚像素运动矢量的使用和多参考帧的运用。

  H.264有16×16、16×8、8×16、8×8、8×4、4×8和4×4一共8种宏块及子宏块划分,而AVS只有16×16、16×8、8×16和8×8一共4种宏块划分方式。

  H.264支持使用多个不同的参考帧对帧间宏块和片进行预测,AVS中P帧可以利用至多2帧的前向参考帧,B帧采用前后各一个参考帧。

  四、熵编码

  H.264制定了基于信息量的熵编码效率,一种是对所有的待编码的符号采用统一的可变长编码(UVLC),另一种是采用基于内容的自适应二进制算术编码(CABAC, Context-Adaptive Binary Arithmetic Coding),大大减少了块编码相关性冗余,提高了编码效率。UVLC计算复杂度较低,主要针对对编码时间很严格的应用,缺点就是效率低,码率较高。CABAC是一种效率很高的熵编码方法,其编码效率比UVLC编码高50%。

  AVS熵编码采用自适应变长编码技术。在AVS熵编码过程中,所有的语法元素和残差数据都是以指数哥伦布码的形式映射成二进制比特流。

  采用指数哥伦布码的优势在于:一方面,它的硬件复杂度比较低,可以根据闭合公式解析码子,无需查表;另一方面,它可以根据编码元素的概率分布灵活地确定以K阶指数哥伦布码编码,如果K选得恰当,则编码效率可以逼近信息熵。

  对预测残差的块变换系数,经扫描形成(level、run)对串,level、run不是独立事件,而存在着很强的相关性,在AVS中level、run采用二维联合编码,并根据当前level、run的不同概率分布趋势,自适应改变指数哥伦布码的阶数。

  另外,在AVS中没有SI、SP帧。可以这样说,AVS是在H.264的基础上发展起来的,吸收了H.264的精华,但为了绕过专利的困扰,又不得不放弃H.264的一些核心算法。换来的代价就是,编码效率稍微降低一点的情况下,复杂度极大得降低了。

  AVS是我国自主知识产权的标准,现在还没有大规模使用,处在起步阶段。大多数企业处于观望状态,没有资金大量投入,面临重重困难,但是它的广阔前景是不容忽视的,又有国家的大力支持,一定会发展的更加完美。

Copyright © 2017-2020 微波EDA网 版权所有

网站地图

Top