八种麦克风DIY设计方案
声源的近场是指该位置处于相关最低频信号的一个波长范围之内。假设相关语音的最低频为300Hz,如此波长λ便等于c/f 或 331.1/300 ,又或是 1.104 米,其中c代表声波于零度摄氏下的水平速度。当频率为3500Hz时,λ便等于c/f或 331.1/3500,又或是 0.0946米 (9.46公分)。因此,语音信号的典型近场范围即由声源距离约9.5公分到1.1米。
超过1米的距离,语音信号便会被考虑成语音声源的远场。对于麦克风间隔较近的数组,近场声源会呈现出一个圆球状的波阵面,并拥有很强的信号振幅、压力梯度,以及对应数组中各麦克风与声源之间的距离而出现的频率相关差别。
现在假设两个麦克风的间隔距离为3公分,而最接近声源的一个麦克风,其与声源的距离为5公分。图2表示出第一个麦克风(即最接近声源的一个),其感受到一个SPL为82dB的音频信号,而第二个麦克风(即与声源相距8公分)所感受到的信号为78dB SPL。即使两者间只有4 dB的差别,但相对于整体的信号级,这差别仍相当大。
从频谱含量的角度看,麦克风数组内的所有近场语音信号均关系密切。与最接近声源的麦克风比较,与声源距离最远的麦克风信号的振幅将会减少,并且会出现信号由最近麦克风传送到最远麦克风的时间延迟。然而,要恢复该个案中的语音信号并不困难。
在麦克风数组语音近场范围以外的声源将被看作是远场声源,并对数组中排列紧密的麦克风展现出实质平面的波阵面。数组中每一个麦克风均感受到几乎一样的声波能量及随机相位信号,但该些信号并没有对应关系,除非麦克风之间的距离非常接近。假如这些信号与麦克风的距离较远,那麦克风的绝对SPL值便会进一步下降。
现举出另一个例子,假若将相同的麦克风数组放置到与声源距离150公分(即1.5米)的位置,最近声源的麦克风的SPL值便会下降到52.5 dB,而距离声源153公分的最远麦克风的SPL值则稍微下降到52.3dB。虽然两者仅有0.2dB的差距,但从声源到最近麦克风的整体信号级将出现 30dB的下降。
麦克风输出之间的不同信号,在进行了适当的处理及滤波后,可将远场噪声消除,使两个麦克风的复合输出及处理电路能提供高清晰度的语音信号。
声音噪声的特质
这里的噪声场可分为三种,分别是相干噪声、非相干噪声及扩散噪声。
相干噪声是指当声波传到麦克风时,在该过程中没有因环境中的障碍物而出现任何形式的反射、散射或衰减。
非相干噪声是指某一位置的噪声与其它位置的噪声没有任何关系,并且被看成空间白噪音。
扩散噪声是指拥有相同能量的噪声同时轴射到所有方向。例子包括办公室内的噪音、机场候机楼及交通噪音等,换句话说就是指所有充满噪音的环境。
这里所指的声音噪声有两种,分别是稳态噪声及非稳态噪声。
稳态噪声是指噪声的能量相对地稳定,并具备已知及变化缓慢的频谱含量,并且是可预知的。例子包括由引擎发出的噪音、空调风扇、随机或 "白" 噪音等等。噪声抑制算法能有效抑制这类噪音。
非稳态噪声是指音量及声音内容会在短时间内变化,例如高声说话或叫喊、汽车经过的声音或拍手等,其发生是不可预知的。假若出现这类噪音,它们可能在被辨识及抑制前便会自动地消失掉,非稳态噪声一般都包含在稳态噪声之内。
最麻烦的情况是当噪声源与语音信号拥有相同的出现时间、频谱及相干特性,这种情况当背景噪声属于非稳态,且旁边有其它人说话时便会出现,如在餐馆和酒吧,车站及派对上等。
第二部分
麦克风数组的解决方案
根据选用的方法,麦克风数组解决方案可以成为抑制稳态及非稳态噪声的一项非常高效的技术。
配合适当的算法,数组中的个别麦克风信号经过滤波后再组合,以便达到波束成形或空间滤波的效果,进而产生一个复杂的麦克风数组极性响应模式,能够指向或远离某个声音位置。因此,可以将某个位置的声音隔离或加强,又或可将其抑制或拒绝。同样地,麦克风声道中的信号相关性可找出主要信号的方向及其正确位置。
视乎数组的复杂度及应用,该数组可经由一个配备了数字信号处理器的模拟电路,再加上适当的计算机软件和一系列方法去控制。
波束成形
波束成形分为两种技术:自适应及定向。
在自适应波束成形技术中,可通过数据相关滤波及改变对数据的时间响应去调节波束的方向,在自适应波束成形方面已有几种方法被开发出来。虽然在信号的处理上比较繁复,但好处是设计灵活度更高,包括麦克风的数量、类型及间隔距离。自适应波束成形一般需要数字信号处理器或计算机软件来实现。
至于定向波束成形
- 阵列式麦克风在电视机上的应用(05-13)
- MEMS麦克风:助听器的未来(02-25)
- 亚马逊echo音箱也能破案 语音识别如何更智能?(11-29)
- 麦克风阵列技术在汽车座舱声音增强系统中的应用(11-07)
- 麦克风阵列是什么 有哪些关键技术?(10-01)
- MEMS传感器种类及国内外生产厂商(10-02)