微波EDA网,见证研发工程师的成长!
首页 > 硬件设计 > MCU和DSP > 嵌入式实时英语语音识别系统的设计和实现

嵌入式实时英语语音识别系统的设计和实现

时间:12-22 来源:互联网 点击:
2.4 两阶段端点检测

端点检测是嵌入式语音识别中最基本的模块。端点检测是否准确直接影响系统的运算复杂度和系统的识别性能。因此在不增加复杂运算量的前提下,希望端点检测能尽量准确,而且能适应嵌入式系统多变的应用环境。本文使用了一种有效的两阶段端点检测方法。在第一阶段使用图像分割中经常使用的边缘检测滤波器方法,得到一个能包含语音段同时又比较宽松的端点结果;在第二阶段,对第一阶段的结果进行再判决,使用直方图统计方法得到静音段的能量聚类中心,并用这个中心能量值对整句能量序列进行中心削波,对削波后的能量序列进行最终判决。通常最终的结果会在第二阶段端点检测的基础上作适当的放松,前后放松4~5帧(大约64~80ms),这些放松在求取特征的差分分量时是很有必要的。

在实验室环境下(信噪比大于25dB),以8kHz采样频率录制了20人(其中男、女各10人)的语音数据。对于12 000句原始录制语音或带噪语音,对传统的固定能量阈值方法和两阶段检测方法进行了比较测试。测试的性能如表1所示。


传统的固定阈值方法就是针对环境噪声设定一个固定的能量阈值进行端点检测。实验表明,两阶段检测方法无论在安静环境中还是在包含一定噪声的环境中,都比固定能量阈值的端点检测方法有更好的性能。此方法能够进一步改善嵌入式语音识别系统的识别性能。

2.5 束搜索

英语语音发音快、单词长、状态数多,因而搜索时间长。要实现实时识别,就不能在所有的语音数据都得到后再进行解码识别。在两级识别网络中,第一阶段要在大量的词条中搜索,而第二阶段只在N_BEST词条中搜索,相对时间占用量很少。为了满足实时要求,本系统在获取语音信号的同时进行提取特征和第一阶段识别。根据硬件的内存容量,考虑到匹配分数所占用的内存,选取每20帧(320ms)的语音完成一次搜索。由于所搜索的词条并没有结束,不能求出最终对应于词条的分数。因此,必须保留每次搜索中每个词条的每个节点的匹配分数,这带来了新的内存开销。

解决方法是在第一阶段识别网络中加入束搜索(Beam Search)快速算法。该算法假设:Viterbi解码过程中的最佳路径在任何时刻都能保证较高的似然度,在搜索过程中对网络进行剪枝,只保留匹配分数最大的有限个路径,以减少运算量和内存消耗。但是,要获得匹配分数最大的几个状态,在每次搜索过程中都要对匹配分数进行排序,这使运算负担加重,在实际中不可取。为了解决这一问题,结合本系统识别网络的特点,采用了一种滑动窗束搜索算法。对于每一个词条网络,在Viterbi解码过程中,近似地认为真实路径总是当前匹配分数最优的路径的近邻路径。因此,设置了一个固定宽度的窗,在所有时刻,窗中的路径总包含了该时刻似然度最高的路径及其相邻路径,而那些落在窗外的路径则将被剪枝。由于模型状态不可跨越,因此,下一个活跃路径的位置,只可能是上一个活跃路径的原有位置或者滑动一格。由于中间的匹配分数相同,比较滑动窗两端的匹配分数即可决定下一个滑动窗的位置。这样可大大减小比较的运算量,提高运算速度。

由于语音信号随机性较强,束搜索的这种假设并不总符合真实情况,因此,过窄的束宽很容易导致最后识别结果的错误。以三对角高斯模型为例,语音库为10个男生的命令词。窗宽与识别率的关系如表2所示。


可以看出,当窗宽为15时,识别率基本没有下降。这个结果与候选词条的长度有关,词条的状态数越多,最优结果在搜索过程中“露出”窗外的可能性也就越大。综合束搜索对系统率和识别时间两方面的影响,选定了束宽为10的滑动窗算法作为系统的束搜索算法。

3 实验结果

实验训练集采用LDC WSJ1训练库(SI_TR_S),包括200人的连续语音,共61个小时,降采样为8kHz,16位量化。测试集为由WSJ1测试集(CDTest和HSDTest)得到的525个短句(每句包含2个单词),候选词条为535个,包括637个不同的单词发音,同样降采样为8kHz,16位量化。

表3为一阶段识别和两阶段识别的识别率、识别时间和内存占用量比较。从表3可以看出,与直接进行的一阶段识别相比,两阶段识别通过采用两阶段端点检测方法、MMIC特征选择算法、特征提取和解码同步的束搜索算法,极大地提高了识别率,减少了内存占用量和识别时间。


本文提出了一种基于定点DSP的嵌入式英语孤立词识别系统,采用两阶段识别的连续HMM模型。其中第一阶段为实时识别,第二阶段为非实时识别。通过采用新颖的两阶段端点检测方法、最小互信息改变准则特征选择算法、特征提取和解码同步的束搜索算法,进一步提高了识别性能、减少了内存占用量和计算复杂度。

Copyright © 2017-2020 微波EDA网 版权所有

网站地图

Top