基于DSP的数码相机中的MPEG-4 压缩
虽然数码相机 (DSC) 投入市场仅几年时间,但已经使消费类电子成像业发生了翻天覆地的变化。目前,全球售出的相机中大约有三分之一是数码相机,而且其份额还在稳步上升。
随着多兆象素DSC生成分辨率越来越高的图像而开始挑战传统的胶卷像机,消费类DSC也正提供智能化操作模式,帮助用户在各种条件下都能拍摄出更好的照片。视频模式也已经成为消费类 DSC的标准功能,使用户能够快速拍摄多个照片,以便选择更好的快照,同时也使他们能够保存重大事件的简短剪辑。此外,DSC 也开始与手机集成在一起,实现静止图片与剪辑随时随地的快速传输。
随着瞬息万变的 DSC 市场不断分化,开发商必须不断充分利用技术创新的优势来细分其产品。当今其中一项创新就是在基于高性能数字信号处理器 (DSP|0">DSP) 的消费类 DSC 中引入MPEG-4 视频压缩技术。MPEG-4标准使 DSC 能够有效提供视频及其他操作模式,增加所存储视频剪辑的数量,并支持视频图像强大可靠的传输。DSP可以提供低价位相机产品中 MPEG-4 编码以及解码所需要的计算性能,尤其那些具备支持快速图像处理架构的DSP更是如此。可编程性使开发商在整个DSC 产品线中使用相同的 DSP 平台,从而通过软件优化不同产品的成像管道 (image pipe)。
新的压缩标准
DSC传统依赖于 JPEG 压缩标准,其设计用于存储静止图像,并且已通过互联网而广为流行。在压缩中,JPEG 采用离散余弦变换 (DCT) 与量化技术有效地从包含 8x8 象素阵列的最小编码单元 (MCU) 的数据描述中消除大部分空间冗余。然后此算法采用熵或可变长度编码 (VLC) 技术进一步减少存储与传输的图像数据。图像解压的步骤则与此相反。根据图像内容,尽管压缩比随图像的不同而不同,但是JPEG算法一般情况下可以将象素数据压缩一个数量级而不丢失视觉完整性。
用于动画与视频的各种 MPEG 标准采用与 JPEG 相同的帧内技术入手来压缩基本的静止图像或I帧,然后采用附加的帧间技术以消除随后帧中的暂时冗余。帧间技术事实上涉及将每个连续帧的 16x16 象素宏块压缩到上一个帧的宏块,然后采用运动估计与补偿技术来描述宏块的帧到帧移动。这些预测帧或P帧只需要描述其从上一帧的改变。然后以应用所决定的间隔定期对 I帧进行编码。
图1说明了一般 MPEG 视频压缩中所涉及的步骤。图像顶部从输入到输出的帧内压缩步骤(DCT、量化与VLC)足以生成 I帧。为了创建 P帧,刚编码的帧必须在本地帧缓冲器中被解码并存储,以便实现过去帧的逐块压缩到未来帧(即运动估计),从而实现帧间压缩。视频解码涉及图下部的步骤(逆量子化、反向 DCT、运动补偿)。除了图中所示之外,MPEG 标准还具有采用独立流程的音频压缩-解压算法。
图 1:MPEG 视频压缩流程图
MPEG-4:多媒体标准
MPEG 标准在不断发展,以适应新兴的视频应用。最初的 MPEG-1 标准开发用于大容量存储与系统检索,例如:交互式 CD-ROM 以及 VCD。此后,在 MPEG-2中对该标准进行了修改,以支持更高的分辨率、更广泛的格式以及与 HDTV 相关的数字编码。由于在 DVD 中的应用,MPEG-2 更受青睐。在视频数据库的要求所驱动下,MPEG-7 标准规定了用于信息搜索的内容表述。
MPEG-4 开发用于交互式多媒体应用,其中包括那些通过无线连接提供的多媒体应用。它与基本 H.263 视频压缩标准共享算法。与早期的 MPEG 标准相比,MPEG-4 为更高密度的图像提供了更好的压缩,并为更强大可靠的传输提供了更高的容错弹性 (error resilience)。另外,MPEG-4 支持在帧中引入对象类型,从而可以独立规定、压缩、传输和重新组合不同的图像及图形单元。但是,该标准的对象支持功能仍有待开发切实可行的实施方案。到那时,包括 DSC 在内的大部分 MPEG-4 应用可以继续基于通常情况下与图像的完整矩形帧对应的单个对象。
高压缩效率
特定剪辑的压缩比随主题的不同而千差万别,不过一般情况下 MPEG 压缩技术可以将 JPEG 帧的后续形式-运动 JPEG (M-JPEG) 的压缩比在相同分辨率下提高一个数量级。进一步的压缩源自帧间技术的采用。视频帧一般大约为 10万象素(352 x 288 象素,CIF 分辨率)或大约 2.5 万象素(176 x 144象素,QCIF 分辨率),而不是一般情况下与 JPEG 相关的 2~5 兆象素。尽管分辨率的这种降低在高质量照片中是不能接受的,但是对于许多消费类 DSC 产品来说却足够了,尤其是考虑到它实现了写真视频的采集。
MPEG-4 算法充分利用压缩技术中的精化功能,将早先的 MPEG 比率降低了大约20%。高级 MPEG-4 压缩可以将每秒15帧 (fps) 的 QCIF 视频图像从原始视频数据的 4.5Mbps 压缩为不到 64kbps,同时还可以保持适当的浏览质量。在DSC 中,MPEG-4 压缩使相机能够在内存中存储比 M-JEPG 大几倍的视频图像。
- 在采用FPGA设计DSP系统中仿真的重要性 (06-21)
- 基于 DSP Builder的FIR滤波器的设计与实现(06-21)
- 达芬奇数字媒体片上系统的架构和Linux启动过程(06-02)
- FPGA的DSP性能揭秘(06-16)
- 用CPLD实现DSP与PLX9054之间的连接(07-23)
- DSP+FPGA结构在雷达模拟系统中的应用(01-02)