微波EDA网,见证研发工程师的成长!
首页 > 硬件设计 > 嵌入式设计 > DSP在音频解码中基于心理-声学的性能分析

DSP在音频解码中基于心理-声学的性能分析

时间:12-21 来源:互联网 点击:

的现象为信号中强音部分会掩蔽临近弱音部分,理想的情况下,这样的数据减少不会导致感觉到音质的损失,这样就引出“透明”音频编码或压缩的概念。

这与简单的SNR测量有根本的不同,同时更为复杂,因为它需要精确再现特殊信号中相关的可听部分。换句话说,虽然SNR是不错的确定编/解码质量的准则,但它却不合适用这个标准去判定能够产生-140dB THD+N的DSP就一定比-130dB THD+N的好。因为心理-声学压缩设计是建立在人类听觉阈值曲线基础之上,上面的结论也就变得非常明显,在这个阈值之下的信号不能被听见。

关于获得“透明”音频压缩的问题

实际的编/解码输出质量的决定因素有如下几点:


1. 使用的算法


2. 压缩的比特率


3. 分析输入信号中用到的心理-声学模型


4. 瞬时分析架构与转换滤波器组


5. 位分配策略

在实现编码/解码过程中,上述的因素均与算法精度无关,即使是使用无穷精度实现,上面的因素同样对音频质量起决定性影响。

基于上面讨论的有损压缩系统,可以得出下面的结论:传统的SNR、THD+N、瞬态误差和相位误差等测量方法,在比较不同实现方案的性能时都不再是最终的度量标准,只能在鉴定和校验系统性能时作为参考,不能用来对与心理-声学验证的约120dB性能的阈值有细微的差别的系统进行评级。

DSP增值建议

通常20位DSP已经能满足系统,而从心理-声学角度16位就已足够,对于一个给定的压缩方案而言,一旦解码器达到了一定的性能,单纯增加DSP的精度就不会进一步的提高系统性能。实际的DSP增值解决方案就变成了对解码音频程序的后期处理和它所提供的系统级特性。事实上,最终消费者还需要产品具有更多的附加特性,例如自动监测、错误屏蔽和拥有提供虚拟音效的后期处理器等。

单从市场反映来看,采用32位DSP在概念上还是很成功,因为从数字上可以直观感觉到性能的进步。实际上,从整体性能和更多功能上来考虑是一种明显的误解,这种误解就相当于对PC机只比较CPU的主频,而不考虑系统的整体性能一样。

32位的DSP并不能真正有助于提高系统最终性能,它需要更大的内存(比24位DSP多出大约33%)。同时,因为32×32MAC比24×24MAC慢,一个32位DSP核将始终比相应的24位核的解码器慢。就信噪比而言,实际应用效果证明,通过优化处理,24位DSP可以得到和32位DSP相同(甚至更高)的性能。

需要注意的是,上面讨论仅仅基于基本的解码器,32位DSP在后期处理上仍然存在某些优势。因此,如果前端使用高度优化的24位DSP解码引擎,后端处理器为一个32位DSP,这样一个优化的设计结合了两者的优势是一种不错的选择,目前已经有这样的系统级芯片方案提供。

本文小结

在现实世界中利用心理-声学来压缩编码时,SNR测试方法在比较系统性能上并不是合适的标准。而ITU PEAQ测试平台方法则更适合测量可感知音频的质量。此外,当我们在评估一个DSP解决方案时,还需要考虑到系统的错误屏蔽、自动检测和后期处理的特性,以及系统的启动响应时间和批量延迟等。

影响AV接收系统解码器质量的因素并不全是DSP精度的问题。通过较强的DSP算法技巧和优化,能使一个24位精度的性能超越32位DSP。然而,随着制造工艺的不断提高,32位的DSP将最终解决上述问题,使32位的解码器更具成本和技术上的比较优势。

Copyright © 2017-2020 微波EDA网 版权所有

网站地图

Top