微波EDA网,见证研发工程师的成长!
首页 > 硬件设计 > 嵌入式设计 > DSP在音频解码中基于心理-声学的性能分析

DSP在音频解码中基于心理-声学的性能分析

时间:12-21 来源:互联网 点击:

通常在谈到关于DSP解码与系统整体性能表现时,我们主要利用了传统的SNR、瞬时误差和相位误差等方法进行判断。本文以心理-声学压缩设计的方法来考察DSP解码的性能与表现,介绍了基于心理-声学的音频压缩解码概念,并给出了基于心理-声学的DSP性能分析。

从上个世纪90年代以来,数字信号处理技术便逐步在消费音频市场占据重要地位。数字信号处理器最初主要用于处理数字化的模拟音频信号,即PCM数据的处理。在当前的系统设计时代,基于具有灵活软件设计特性的DSP系统设计方案是传统设计的理想替代方法。

在音频系统的设计中,通常在信号源进行压缩编码时采用心理-声学模型去除信号中的冗余数据,通过选择合适位数的DSP可以保证系统的性能。实际应用中DSP的选择需要涉及到很多因素,包括精度(24位/32位)、主频、成本和内存容量等。本文就音频解码应用中,基于心理-声学模型对DSP的性能进行了分析。

DSP分贝与声压分贝的关系

本文在后面所述的数据都是在dBFS下的测量值,即满刻度分贝值。从可闻度来分析,需要将这些数值与dB SPL关联起来,即转换为声压强度的分贝数。在DSP之后的模拟信号链上包括DAC、前置放大器、功率放大器和扬声器,尽管对于不同的系统,每个元件的增益和性能可能会有显著的差异,但单纯从系统配置的角度而言,仍可能把dBFS与dB SPL以足够的准确性关联起来。

通常,数字音轨以-20dBFS电平进行录音,完全满足信号峰值所要达到的幅值,同时也拥有足够的动态范围以展现音频文件的静音部分,在CD、Dolby Digital和DTS等不同格式下也不会失真。众所周知, THX推荐的听觉配置是在85dB声压强度下再现-20dBFS声音信号,这时音量通常会很大,而正常的收听时会比该强度低很多。

从上面是的事实得出dBFS与dB SPL之间是线性映射的,具有以下关系:0dBFS的信号可在105dB SPL再现,需要注意的是这种情况下产生的声音非常高,不适合长时间收听; 0dB SPL对应与-105dBFS。

听觉与听觉阈值

人类的听觉是有极限的,通常在声压强度的设计上会把0dB设定为最低可听范围水平。声音频谱中的大部分(300Hz以下和10KHz以上)只有在10dB的声压强度之上才可以听到,正弦波的最高敏感度在3~4KHz,而且这样的声音在-3~-4的dB SPL就可以被听力极好的人感知。

从生理学上看,要达到声音听觉阈值,其能量需要大到能在人的耳鼓产生一个驻波,从而使那儿的细小毛发产生波动。没有这种波动,连接听觉皮层的神经元就不能被触发,因而声音不能被感知。从上面的讨论我们得到的关于音频系统设计的启发,即当噪音的水平低于人们的听觉阈值时,一味追求高精度的DSP实现方案并没有实际意义。

利用先前得到的听力配置关系,最低的可听声压为-4dB SPL,即-109dBFS。假设在信号链所有其它部分(DAC、前置放大器等)均为零失真,这就意味着任何能够产生好于109dB信噪比的DSP都不会成为系统性能的瓶颈,这是采用DSP实现系统设计的一个很重要的问题。实际应用中,模拟信号链是系统中噪音的最主要来源,而DSP对噪音的贡献远远低于这些模拟器件。

满足系统性能的DSP位数

上面的分析是建立在-20dBFS平均水平和THX听力配置情况下。尽管这是一个极限情况,考虑到dBFS/dB SPL转换关系的变化,在设计时还要留出一些性能余量。因此,一个考虑周全的设计应该使DSP的位数比理论位数大约多出两位,即121dB使用6dB/位的配置,对应着PCM输出的20位动态范围。

以上的分析与杜比公司的Dolby Digital设计方案的假设一致,该方案同样是采用20位的精度。同时,实际的ADC/DAC也限制在20位精度的性能(<120dB),即使是DAT录音也是采用20位的精度。所有的这些都验证了上面的分析的正确性。

上述数据是基于最坏的情况,因为在实际情况下功率放大器、前置放大器和DAC产生的噪音量比DSP的性能对系统整体的性能影响更大。最好的功率放大器也仅仅能获得109dB的信噪比,因为噪音能量在线性区域中可累加,这意味着一个输出是121dB的20位DSP,仅仅会产生放大器6.66%的噪音。而如果扬声器的性能也作为考虑因素,那么DSP产生的噪音就是1/6??扬声器失真,这是可以完全忽略的。

上面的分析甚至没有考虑编码的失真、ADC或麦克风产生的噪音,所有这些都是非常关键的。如果所有信号链都考虑到,很显然20位的DSP已经足够用。仅仅用非常态正弦波测试,人为的合成精度超过20位的信号才能得到可测量的差别,并且这种差别实际上是人类听觉不能感知的。

带有“透明”音频质量的有损压缩

心理-声学压缩设计是针对给定信号的有损压缩,进而了解在什么程度下不同的频域/时域信号是可听见或听不见,以便相应调整编码过程,使引入的噪音降到听觉阈值之下。基本

Copyright © 2017-2020 微波EDA网 版权所有

网站地图

Top