基于定点DSP的MP3音频编码算法研究

时间：06-05 来源：3721RD 点击：

用相同的量化阶,也听不出声音质量的明显下降?

2.3 量化编码迭代循环的简化

量化编码迭代是两重循环过程,图3是外迭代循环流图,迭代的目的是在可用比特数的限制之内,以各频带的掩蔽值为依据,确定全局增益(体现了全局量化阶)和各频带的缩放因子(体现了局部量化阶)?内循环逐步增加量化器步长,即全局增益,直到MDCT系数量化后可被可用比特进行霍夫曼编码,即通过增加全局量化阶以降低编码比特数;外循环依据掩蔽阈值检测各缩放因子带的失真,若超过允许失真,则扩大该带的MDCT系数,即增大该带的缩放因子,以降低局部失真;最后一次迭代的结果作为最终的霍夫曼码?每一次循环都要用当前的量化阶量化并霍夫曼编码一次,运算量相当大?从外循环可以看出掩蔽阈值最终决定缩放因子,为了能省去外迭代循环,将代表帧的缩放因子作成表格,供每帧采用?

由于上述三个模块是最主要并且运算量最大的模块,通过对它们的简化和优化,程序的大小和运算量可得到极大的减少?

3 用定点DSP实现MP3压缩算法

为了实现MP3的实时编码,必须采用高速DSP芯片?采用美国德州仪器(TI)公司的主流定点DSP芯片TMS320C549,其运算速度是100MIPS,调试开发的环境是TI公司的第三方Spectrum Digital公司的EVM评估板,板上除了TMS320C549自带的32K字片上内存外,还有128K字片外内存,数模转换采用TI的TLC320AD55TLC320AD55,与PC机通过JTAG口实现数据与程序的加载和调试?

由于评估板与主机的接口速度太慢,即使能做到实时压缩,将比特流传给PC机存盘的速度也会跟不上?因此笔者采用的办法是:将原始PCM音频数据从PC机的硬盘文件加载到板上的片外内存,压缩后的数据传给PC机存盘,再加载后续文件,压缩存盘,直到整个音频文件全部压缩完,最后用C语言程序将各数据块拼成MP3文件,用软件解码程序回放?是否能达到实时要求只能通过测试每帧运行的指令数判断?

在运用快速算法计算子带分析滤波器时,考虑到DSP芯片的特点,每分解一次,要作一次如(10)式的加法,势必降低精度,另外(11)和(12)式的系数动态范围太大,精度也会受到影响,因此,只分解到16点DCT运算?

采用静态心理声学模型,心理声学模型和量化编码外循环所需的运算量就为零?代表帧的心理声学模型和缩放因子采用C语言或MATLAB语言编程计算,或者将网上下载的MP3文件中的缩放因子信息破译出来加以利用,子带分析滤波器之后的MDCT全部采用长块?表1是静态缩放因子比特数和缩放因子的一种设置方案?

另外在内循环中,首先初步选择一个全局增益使最大量化值小于码表可编码的最大值,标准推荐的作法是全局增益从小开始,每循环一次量化后,比较最大量化值,并调整一次全局增益,直到满足要求为止?本程序省去了这一循环,事先根据最大谱线值计算出应有的全局增益,作成数据表格,程序中只需根据最大谱线值查表即可?初始化全局增益确定后,要分区?量化?编码并计算编码比特数,如果比特数太大或太小都还要调整全局增益?对这一迭代循环过程,采用折半搜索的办法实现,也就是说第一次循环时全局增益取上述初始化值的一半,若编码比特数超出要求,则再取一半作为新的全局增益,否则增大一半,如此不断循环直到无法折半为止?这种折半搜索的方法比逐一搜索要快很多?

采用了这些简化?优化措施以及编程技巧,整个编码程序运算量仅需75MIPS左右,片上存储空间占用27K字左右?用标准的MP3回放软件解码,通过主观测评,音质接近CD?

由于本系统对心理声学模型进行了大量的简化,对于一般的音乐,这种简化带来的声音质量的下降并不明显,尤其是在要求不高的应用场合完全可行?但是当应用到某些编码难度较高的音频信号,例如响板时,声音质量下降较明显?因此如果采用更高运算速度的DSP,可在该编码系统中加入一个完备的或简化的动态心理声学模型,编码质量可进一步提高,至于简化的动态心理声学模型还有待进一步摸索?

上一篇：基于μC/OS-II的GPRS终端设计
下一篇：基于DSP的视频编解码器系统

DSP MP3 音频编码相关文章：

栏目分类