微波EDA网,见证研发工程师的成长!
首页 > 应用设计 > 消费类电子 > 基于DSP的H.324可视电话研究与实现

基于DSP的H.324可视电话研究与实现

时间:07-23 来源:互联网 点击:
H.324标准的可视电话系统实现方法,一般有如下同种方式:软件方式、通用DSP方式及专用处理器和专用芯片方式。

以PC机为平台,利用现有的声卡、视频要集卡和调制解调器作为输入和输出设备,采和基于WINDOWS的多线程技术软件实现H.263视频器、解码/发送、接收、显示等多个任务。在实际应用系统时需要考虑到PC的处理能力、与接收端的连接和相应的图像格式等问题,可以在编码模块中采用汇编语言,提高执行速度,并引入MMX技术,进一步提高执行速度。它的特点是成本低、配置少,便于移植和升级,但对计算机的处理能力、编解码的算法速率的要求比较高,一般难于达到实时要求。

专用处理器和专用芯片是另外一种硬件处理方式,它的优点是集成度高,价格低,但扩展性差。国外许多公司都热衷于视频芯片的研究和开发。就国外来说,主要的视频会议芯片供应商是:Lucent Technology(AVP-III处理器);8×8 Inc.(VCP 处理器);Texas
Instruments(C8x系列处理器)等。专用处理器和专用芯片方式的特点是能得到高的图像质量并能满足实时图像处理的要求。

通用DSP方式是一种硬件实现方式。采用通用DSP的原因是由于它可通过编程实现多种功能,当针对硬件的软件功能升级和新的标准算法出现时,只需要局部改变DPS的微码就可以适应不同的应用。用DSP实现H.263时,首先需要估计编码、解码等处理过程所需的计算量,并且这些计算量与具体视频编码过程有关,选择时应该选用高速DSP。

从以上三种实现方式来看,DSP具有开发灵活、适应面较宽和扩展性强等优越性,且目前已经能实时处理H.263算法的高速超强处理能力的DSP芯片有AD21065L、TMS320C55x、TMS320C6x等,所以采用DSP实现可视电话等视频图像处理系统成为开发者的首选。

1 H.324可视电话基本框架

H.324是ITU的适用于公共电话交换网(PSTN)的低比特率多媒体通信终端的框架标准。它使用V.34调制解调器,可以实时传送语音、数据、视频图像或三者的组合。H.324包括甚低码率视频编码的H.263建议、音频编码G.723建议、控制协议H.245和复接与复用协议H.223等。



PSTN的视频H.324可视电话框图如图1所示。

在H.324编解码系统框图中,视频编码H.263提供低于64kbps的传输速率,是H.324的技术核心。视频编码器主要完成对源图像序列的压缩,先按块的方式采用DCT变换,后对变换的DCT系数进行量化,然后进入视频复接编码器。在编码过程中,要求对编码模式的选择和码率的大小进行必要的控制;视频复接编码主要完成将每帧图像数据编成四个层次的数据结构,以便在各层次中插入必要的辅助数据信息。同时对交流DCT系数(AC)进行VLC编码,对直流系数进行固定长度(FLC)的编码,并对压缩的编码数据与控制信息复接。由于H.263的输出码率一般非恒定的,所以在实际应用中,受传输网络带宽的限制,必须要在发送端和接收端设置缓冲区,使得编码率的码流变换为固定码率码流,防止数据的丢失和破坏。缓冲区的信息传给编码控制器,由编码控制器来控制编码器中量化器化步长,同时将步辅助信息送到视频复接编码中的各层次,以供解码器使用。解码部分可以看作为编码的逆过程,但并非完全对称。编码过程的运算量和复杂度要远大于解码过程。

2 可视电话系统的性能需求

在可视电话设计之前,先分别对可视电话的图像格式、视音频的编解码运算量和存储量进行分析。

PSTN上的可视电话,由于信道带宽较窄(传输速率最大不超过64kbits/s),故图像不宜过大。图像格式上采用QCIF(176×144)格式,帧率为15fps(帧每秒)。以下视音频编解码计算和存储量均在上述条件下估计。

H.263视频编码计算量主要集中在:运动估计与预测编码、离散余弦变换(DCT)、可变长编码(VLC),这部分的运算量估计为90MIPS(兆个指令/每秒)。同样,解码计算量主要集中在:运动补偿(MC)、离散余弦逆变换(IDCT)、可变长解码(VLD),这部分运算量估计为40MIPS。G.723.1音频编码的运算量比视频的运算量小得多,大约为30MIPS。

再加上其它一些操作如音视频混合、数据的传输、外部器件的控制等,估计大约为60MIPS。因此DSP的计算量共为220MIPS左右。
存储器包括程序存储器和数据存储器。程序存储器和一些常数(DCT系数、VLC系数等)开始存于ROM,运行之后引导至RAM中,这部分估计为400Kbytes。

数据存储器主要存放采样得来的视频数据以及待解码的数据流,也就是视音频信号的缓冲。QCIF格式的每帧采样数据约为50Kbytes,RAM中至少要存4~5帧,这部分需250Kbytes。为使视音频同步,音频数据缓冲为50Kbytes左右。

Copyright © 2017-2020 微波EDA网 版权所有

网站地图

Top