微波EDA网,见证研发工程师的成长!
首页 > 硬件设计 > 嵌入式设计 > ADSP-BF531在嵌入式语音识别系统中的应用

ADSP-BF531在嵌入式语音识别系统中的应用

时间:09-02 来源:互联网 点击:

1)预处理 对声源信号进行抗混叠滤波、A/D转换、预加重及端点检测等内容,以获得比较理想的处理信息对象。
2)特征提取 从语音波形中提取出随时间变化的能够反映原始语音特征的矢量序列。
3)语音训练 建立声学模型,将获取的语音特征通过必要学习算法产生。
4)模式匹配 在识别时将输入的语音特征同声学模型进行比较,得到识别结果。
在训练阶段,用户将词汇表中的词依次读一遍,并且将其特征矢量序列存入模板库中。在识别阶段,将输入语音的特征矢量序列依次与模板库中的每一个模板进行形似度比较,相似度最高者作为识别结果输出。
在HHM算法中,语音序列被看做马尔可夫随机过程的输出。假定识别系统的词汇表共包括V个词条,那么在训练阶段需要请很多个说话人分别将这次词条说一遍并存入数据库中。利用这些训练数据可以为每一个词条建立一套HMM参数λv(1≤v≤V)。
在识别时,对于每个待识别语音,可以得到一个观察矢量序列Y=[y1,y2,…yN],其中,N为输入语音所包含的帧数。语音识别的过程就是计算每个HMM模型λv产生Y的概率P(Y|λv),并使得该概率达到最大的HMM模型,那么该模型所对应的词条即为孤立词识别的结果,即:

3.2 语音识别算法设计
本系统采用VO/DHMM(矢量量化/离散隐马尔可夫模型)算法,其主要包括预处理、特征提取、语音训练、模式匹配等几个方面。
3.2.1 预处理和特征提取
首先采用预加重、汉明窗、双门限法等完成对语音信号的预处理;然后使用Mel倒谱参数(MFCC)进行特征识别,MFCC参数提取的过程如图5所示,其中Mel滤波器组的作用是利用人耳听觉特性对语音信号的幅度平方谱进行平滑。对数操作的用途:压缩语音谱的动态范围;考虑乘性噪声,将频域中的乘性成分转换成加性成分。离散余弦变化主要是用来对不同频段的频谱成份进行解相关处理,使得各维向量之间相互独立。


3.2.2 矢量量化
矢量量化(VQ,Vector Quantization)是一种重要的信号压缩方法,其过程是:将语音信号波形的K个样点的每一帧,或在K个参数的每一参数帧,构成K维空间中的一个矢量,然后对矢量进行量化。量化时,将K维无限空间划分为M个区域边界,然后将输入矢量与这些边界进行比较,并被量化为“距离”最小的区域边界的中心矢量值。
一个VO编码器往往拥有一个或多个由具有代表意义的矢量组成的集合,称为“码本”(本系统中码本大小为256),其中每个矢量称为“码矢量”。在语音识别中,训练用的语音特征通过聚类的方法形成码书;识别时,VO编码器将待识别语音的特征矢量与码书中的每个矢量进行失真测度运算,最小的失真测度所对应的码字的标号代替输入矢量。
3.2.3 HMM模型建立及训练过程
本系统选择尤跨越的从左向有的HMM模型,状态数取6。训练过程中利用Baum-Welch算法和Viterbi算法来计算所有观察序列的输出概率,然后对其进行累加,得到总输出慨率,采用前后2次的输出概率的相对变化小于一定阈值(如:1×10-4)或超过迭代次数作为训练结束的判据。程序流程图如图6所示。

3.2.4 语音识别
语音识别的过程即是用Viterbi算法将经将输入的矢量量化后的语音与模型库中的参考模板进行匹配。
Viterbi算法是一种前向搜索算法,其可以是在给定相应的观察序列时,找出从模型λ中找出的最佳状态序列,即选择输出概率最大的模版作为输出结果。对数形式的Viterbi算法,能够避免大量的乘法运算,减少计算量,同时还可以保证有很高的动态范围,不会出现由于过多的连乘而导致溢出问题,其算法如下:


4 实验结果及分析
系统选取500字的词表,词长不大于5;在进行识别前,对每个待识别的词进行训练,参加训练人数为30,其中男性20人,女性10人。实验选取30个人,其中参加训练和未参加训练的各15人,对简单语音命令、数字串、字母串进行测试(每人反复测试5次),结果如表1所示。

通过以上数据可以看出,该系统的对非特定人(包括参加训练和未参加训练)的简单汉语词汇、数字串、字母串等的综合识别率超过了90%,识别时间在0.7 s左右;具有较高的识别率和较好的实时性。从表中可以看出,未参加训练与参加训练的识别率相差约10%,可以通过在软件中增加训练样本量以及完善有关算法等来进一步提高其识别率。

5 结束语
该嵌入式语音识别系统在以ADSP-BF531为核心的硬件基础上,成功运用DHMM算法完成了对非特定人孤立词的语音识别。该系统运行稳定、可靠,其识别率及实时性均满足使用要求,同时还具有存储容量大、运算速度快的特点,为软件运行留下了充足的裕量,系统后续的完善和升级较容易实现。该系统可应用于许多特定场合,有很好的市场前景。

Copyright © 2017-2020 微波EDA网 版权所有

网站地图

Top