视音频、流媒体、图像编码标准综述
5) 音频编码:MPEG-4不仅支持自然声音,而且支持合成声音。它将音频的合成编码和自然声音的编码相结合,并支持音频的对象特征。
6) 场景描述:场景描述主要用于描述各AV对象在具体AV场景下,如何组织与同步等问题,同时还有AV对象与AV场景的知识产权保护等问题。
(2)MPEG-4编解码原理
a. 基本思想
MPEG-4编解码的基本思想是基于图像内容的第二代视频编解码方案,并将基于合成的编码方案也结合在标准中。它根据图像的内容将图像分割成不同的视频对象VO(Video Object),在编码过程中对前景对象和后景对象采用不同的编码策略,对于人们所关心的前景对象,则尽可能的保持对象的细节及平滑,而对不大关心的后景对象采用大压缩比的编码策略。
b. 编解码的数据结构
MPEG-4按照如下五个层次组织要编码的图像,从上至下依次为:视频段VS(Video Session)、视频对象VO(Video Object)、视频对象层VOL(Video Object Layer)、视频对象组层GOV(Group of Video Object Plane)、视频对象平面VOP(Video Object Plane)。
在MPEG-4中,VO主要被定义为画面中分割出来的不同物体,每个VO有三类信息来描述:运动信息、形状信息、纹理信息。VO的构成依赖于具体应用和系统实际所处环境,在要求超低比特率的情况下,VO可以是一个矩形帧(即传统MPEG-1中的矩形帧),从而与原来的标准兼容;对于基于内容的表示要求较高的应用来说,VO可能是场景中的某一物体或某一层面,如新闻节目中的解说员的头肩像 ;VO也可能是计算机产生的二维、三维图形等。
c. VOP编码器结构
编码器主要由两部分组成:形状编码和传统的运动纹理编码,其中形状编码是MPEG-4在编码任意形状的VOP时所必须的。
d. MPEG-4的编解码流程及框架
MPEG-4的编码流程:第一步是VO的形成(VO Formation),先要从原始视频流中分割出VO,之后由编码控制(Coding control)机制为不同的VO以及各个VO的三类信息分配码率,之后各个VO分别独立编码,最后将各个VO的码流复合成一个位流。其中,在编码控制和复合阶段可以加入用户的交互控制或由智能化的算法进行控制。现在的MPEG-4包含了基于网格模型的编码和Sprite技术。在进行图像分析后,先考察每个VO是否符合一个模型,典型的如人头肩像,如是就按模型编码;再考虑背景能否采用Sprite技术,如是则将背景生产一幅大图,为每帧产生一个仿射变换和一个位置信息即可;最后才对其余的VO按上述流程编码。MPEG-4的解码流程则基本上为编码器的反过程,这里不再赘述。
(3)MPEG-4中的Profile@Level
(4)MPEG-4的主要应用场合
从目前的情况看,MPEG-4主要被用于三个领域:数字电视、交互式的图形应用(包括内容上的合成技术)、交互式多媒体领域等。
(5)MPEG-4的特点及优势
1) MPEG-4是做为一个国际化的标准来制定研究的,因而具有很好的兼容性及开放性。
2) MPEG-4提供高压缩比的同时,对数据的损失很小,达到以最小的数据获得最佳的图像质量的目的。
3) MPEG-4是个开放标准,因其高质量的数字影像,以及允许内容创建者从MPEG-2质量一直到极低带宽的Internet流式内容全程进行品质和带宽的均衡,而被全世界的无线、电脑及娱乐公司广泛采用。
4) 正如MPEG-2将使数字电视最终完全取代现有的模拟电视那样,随着MPEG-4新标准的不断推出,数据压缩和传输技术必将趋向更加规范化。
- 高清电视音频解码的定点DSP实现(02-12)
- 基于DM642的定位视音频采集器的系统设计与实现(03-05)
- 智能小区中嵌入式MP3流媒体网络广播系统设计 (05-05)
- 基于嵌入式DSP的流媒体编解码器(04-22)
- IPTV测试流程与测试技巧(05-06)
- WebCDN流媒体多节点综合管理应用平台方案(10-06)