微波EDA网,见证研发工程师的成长!
首页 > 通信和网络 > 通信网络技术文库 > VoIP中语音压缩编码技术的研究与性能分析

VoIP中语音压缩编码技术的研究与性能分析

时间:07-31 来源:互联网 点击:

2.1.2 G.729协议
  
G.729协议是一个能在8 kbit/s速率上实现高质量语音编码的建议,也是H.323协议中有关音频编码的标准[2]。在IP电话网关中,G.729协议被用来实现实时语音编码处理。G.729协议采用的是CS-ACELP即共轭结构算术码激励线性预测的算法。CS- ACELP以CELP编码模型为基础,它把语音分成帧,每帧10 ms,也就是80个采样点。对于每一帧语音,编码器从中分析出CELP模型参数,其中包括线性预测系数,自适应码本和随机码本的索引值和增益。然后把这些参数传送到解码端,解码器利用这些参数构成激励源和合成滤波器,从而重现原始语音。
  
编码过程是首先将速率为64 kbit/s的PCM语音信号转化成均匀量化的PCM信号,通过高通滤波器后,把输入语 音信号的每80个样点组成一个帧,也就是10 ms的帧长。对于每个帧用线性预测法求得LP滤波器系数,为了适于矢量量化,把预测系数转化为LSP。利用合成-分析方法,使原始语音和合成语音之间的误差最小,来获得最佳激励信号。激励信号的量化是通过两个码本来实现的,即自适应码本和随机码本。自适应码本反映的是长时预测结果,也就是基音预测结果。随机码本反映的是经过长时预测和短时预测后的残留信号。
  
2.2 性能分析与比较
  
语音编码的主要问题是怎样在编码质量、编码速率、算法复杂度以及抗误码性能、编解码时延等方面求得最佳。这几个因素相互联系,密切相关。下面就这些方面对G.729与G.723.1系统进行分析与比较,并给出了实验的结果[3]。
  
2.2.1 编码质量
  
编码质量是衡量语音编码优劣的关键性能之一,对它的评价通常有客观评价与主观评价两种。信噪比是衡量语音编码质量的客观标准。其计算可采用长时信噪比和短时信噪比两种准则。由于在语音信号中小能量占信号能量的比率较小,而恰恰小信号对主观听音效果又有比较大的影响,因此长时信噪比不能反应小能量量化的质量,在语音信号处理中经常采用短时信噪比。设每段有M个语音样点,则第m段的分段信噪比定义为

  
  
其中分式的分子分母分别表示M个语音样点的总能量和量化噪声的总能量。如果输入语音共有N段,则平均分段信噪比为

  
  
此次试验分别对男声、女声、童声以及混声进行了测试,它们得到的信噪比(尤其是时域信噪比)并不很高,然而经过主观评价即MOS(mean opinion score)分评价,它们的听音质量还相对较高,其结果如表1所示,由此说明了基于参数编码与波形编码的语音编码器的不同。

表1 ITU-T语音编码标准的比较


项目 G.729 G.723.1 G.729 annex A
比特率/(kbit/s) 8 5.3/6.3 8
帧大小/ms 10 30 10
头开销/ms 5 1.5 5
MOS 4 3.7 4
出台时间 1995年 1995年 1996年

  
2.2.2 编码速率
  
就目前而言,与ITU-T的其他编码标准相比,G.723.1的码速是最低的。它的码率为5.3/6.3 kbit/s,在编码码率方面拥有优势。G.729语音编码速率为8 kbit/s,在编码速率方面仅次于G.723.1,因而它们都较好地解决了通信过程中带宽不足的矛盾,有良好的应用前景。
  
2.2.3 编解码复杂度
  
编解码的复杂度与语音编码的质量有密切的关系,在同样的码率下,采用复杂的算法将获得更好的语音质量。表2给出了G.729与G.723.1在硬件实现上所需的资源。G.729在时延方面较G.723.1有优势;在复杂度方面,G.723.1相对G.729较优,但是G.729 annex A却有更大的优势。

表2 G.723.1,G.729与G.729annex A的比较


项目 G.723.1 G.729 G.729 annex A
比特率/(kbit/s) 5.3/6.4 8.0 8.0
帧长/ms 30 10 10
头开销/ms 7.5 5 5
整个编码时延/ms 37.5 15 15
指令/(百万条/s) 16 20 10.5
RAM/byte 2 200 3 000 2 000


2.2.4 抗误码性能

  
抗误码性能是衡量语音编码质量的因素之一。测试表明,当随机误差为0.1%,G.729编码系统的性能与32 kbit/s G726 ADPCM相当,当误码率为10%,人耳虽能感觉到语音质量的下降,但仍能听懂语音含义;G.723.1抗误码性能与G.729基本相当。
  
2.2.5 编解码时延
  
增加算法的复杂度可以提高语音的编码质量。但往往也带来编解码的时延,在实时语音通信中对通话质量有很大影响。对于G.729系统而言由于码率为8kbit/s,每帧80个样点,因此帧大小为10 ms,再加上头开销5ms,整个系统的编解码时延为15ms,大大低于G.723.1的37.5 ms的时延(帧大小为30ms,再加上头开销7.5 ms)。因此在编解码时延方面G.729较G.723.1为优。
  
3、结论
  
混合编码中把激励模型和语音的时域波形结合到一起,从而改善了合成语音的质量。以上两种语音压缩编码算法的主要区别在于激励模型的不同。
  
虽然IP电话目前正处于蒸蒸日上的阶段。但它也存在这样或那样一些不尽如人意的方面。如何提高IP分组语音通信的质量,或者更一般地说,如何在IP网络上实现包括实时通信业务在内的综合业务通信,这正是我们需要进一步研究的。

Copyright © 2017-2020 微波EDA网 版权所有

网站地图

Top