音乐识别锁软硬件完整方案
随机噪声和提升清音部分能量的作用。
2,端点检测
本系统采用音乐信号的短时能量和短时过零率进行端点检测。音乐信号的采样频率为8kHz,每帧数据为20ms,共计160个采样点。每隔20ms计算一次短时能量和短时过零率。通过对音乐信号的短时能量和短时过零率检测可以剔除掉静默帧、白噪声帧和清音帧,最后保留对求取基音等特征参数非常有用的浊音信号。
3,特征提取
在音乐信号预处理后,接着是特征参数的提取。特征提取的任务就是提取音乐信号中表征音乐的基本特征。特征必须能够有效地区分不同的音乐,同时要求特征参数计算简便,最好有高效快速算法,以保证识别的实时性。
(1)音乐特殊性的保证
此识别技术可以采用任何格式的音乐,这也是此系统最大的优点之一。每一段音乐记录了不同演唱者的声纹信息,以及音乐的音色、调性、节拍、音高、音长、音量、速度和持续时间等特定的信息。在此基础上,又可以进一步提取旋律、和声、节奏等复杂特征。这些信息,就像人类的声纹特征一样,有着特殊性,于是谓之为音纹。此识别技术识别音乐基本特征和复杂特征在内的音乐信息并且利用模糊分类器识别出每一个乐段所带有的密码。为了提高系统的识别率,在本系统中最好选择调子起伏较大,音色比较特别的音乐。
(2)参数提取的比较
通过线性预测分析得到的参数。包括线性预测系数(LPC)以及由线性预测导出的各种参数,如线性预测倒谱系数(LPCC)、部分相关系数、反射系数、对数面积比、LSP线谱对、线性预测残差等。根据前人的工作成果和实际测试比较,LPCC参数不但能较好地反馈声道的共振峰特性,具有较好地识别效果,而且可以用比较简单的运算和较快的速度求得。此外,人们还通过对不同特征参数量的组合来提高实际系统的性能。当各组合参量间相关性不大时,会有较好的效果,因为它们分别反映了音乐信号的不同特征。在计算机平台的仿真实验中,通过各种参数的实际比较,采用MFCC参数比采用LPCC参数有更好的识别效果。但在SPCE061A平台上做实时处理时,与LPCC系统相比,MFCC系数计算有两个缺点:一是计算时间长;二是精度难以保证。由于MFCC系统的计算需要FFT变换和对数操作,影响了计算的动态范围;要保证系统识别的实时性,就只有牺牲参数精度。而LPCC参数的计算有递推公式,速度和精度都可以保证,识别效果也满足实际需要。本系统采用了基音周期和线性预测倒谱系数(LPCC)共同作为音乐识别的特征参数。
(3)LPCC参数的提取
基于线性预测分析的倒谱参数LPCC可以通过简单的递推公式由线性预测系数求得。递推公式如下:
其中p为LPC模型的阶数,也是模型的极点个数。
(4)LPC模型阶数p的确定
为使模型假定更好地符合语音产生模型,应该使LPC模型的阶数p与共振峰个数相吻合。通常一对极点对应一个共振峰,10kHz采样的音乐信号通常有5个共振峰,取p=10,对于8kHz采样的音乐信号可取p=8。此外为了弥补音乐片段中存在的零点以及其他因素引起的偏差,通常在上述阶数的基础上再增加两个极点,即分别是p=12和p10。实验表明,选择LPC分析阶数p=12,对绝大多数音乐信号的声道模型可以足够近似地逼近。P值选得过大虽然可以略微改善逼近效果,但也带来一些负作用,一方面是加大了计算量,另一方面有可能增添一些不必要的细节。
(5)线性预测系数的求取
自相关解法主要有杜宾(Durbin)算法、格型(Lattice)算法和舒尔(Schur)算法等几种递推算法。其中在杜宾算法是目前最常用的算法,而且在求取LPC系数时计算量也量小,本系统采用该递推算法。
4,基音参数的提取
基音估计的方法很多,主要有基于短时自相关函数和基于短时平均幅度差函数(AMDF)等基音估计方法。
(1)基于短时自相关函数的基音估计
(2)短时自相关函数在基音周期的整数倍位置存在较大的峰值,只要找出第一最大峰值的位置就可以估计出基音周期。
(3)基于短时平均幅度差函数(AMDF)的基音估计
基于短时平均幅度差函数(AMDF)在基音周期的整数倍位置存在较大的谷值,找到第一最大谷值的位置就可以估计出基音周期。这种方法的缺点是当语音信号的幅度快速变化时,AMFD函数的谷值深度会减小,从而影响基音估计的精度。
实际上第一最大峰(谷)值点的位置有时并不能与基音周期吻合,第一最大峰(谷)值点的位置与短时窗的长度有关且会受到共振峰的干扰。一般窗长至少应大于两个基音周期,才可能获得较好的估计效果。音乐中最长基音周期值约为20ms,本系统在估计基音周期时窗长选择40ms。为了减小共振峰的影响,首先对语音进行频率范围为[60,900]Hz的带通滤
- LPC2292的μC/OS-II硬件抽象层构建(04-26)
- 基于WinCE6.0的LPC3250串口驱动程序开发(01-05)
- 基于DSP芯片TMS320C5409的语音实时变速系统(07-23)
- 基于ARM的低功耗语音去噪系统设计(11-13)
- 基于模型的无刷电机控制代码快速生成(01-24)
- 图解ADS+JLINK调试ARM(03-01)