微波EDA网,见证研发工程师的成长!
首页 > 硬件设计 > MCU和DSP > 基于DSP的孤立词语音识别系统的设计

基于DSP的孤立词语音识别系统的设计

时间:11-26 来源:互联网 点击:
4 软件系统设计

由图1可知,软件系统的设计主要包括端点检测、特征量提取和模式匹配。

4.1 端点检测

从背景噪声中找出语音的开始和终止,这在很多语音处理领域中是基本的问题。特别是在孤立词的自动识别中,找出每个单词的语音信号范围是很重要的,确定语音信号的开始和终止的方案可以用来减少非实时系统中的大量计算,使该系统仅处理语音输入。本语音识别系统实时、精确的端点检测可以排除无声段的噪声干扰,使后面的识别性能得以较大的提高。

汉语的音节末尾都是浊音,只用短时能量就能较好地判断一个词语的末点。而汉语词语的起点检测不仅有一定的难度,而且检测是否准确对语音识别性能影响颇大,因为大多数声母都是清声母,还有送气与不送气的塞音和塞擦音,将它们与环境噪声分辨是比较困难的。这里用短时相对能频积的方法对语音信号的端点进行检测。

语音信号一般可分为无声段、清音段、浊音段。无声段的平均能量最低,浊音段的平均能量最高,清音段的平均能量居于两者之间。在有噪声环境下,语音刚开始的一段,其短时能量的大小与背景噪声的短时能量差不太多。清音段的过零率大多数情况下最高,无声段的过零率变化范围较大,一般情况下比浊音段低一点,但有时会比浊音段稍高一点或者差不多。

在系统刚启动时,正常情况下语音信号的前100ms是无声段,所以我们可以提取这段语音信号的平均能量、平均过零率、它们的乘积(称为能频积) 作为进行判断的特征参数。

4.2 特征量提取

原始语音信号不能直接用于模板训练和模式匹配,这是因为(1)原始语音信号数据量太大,系统的运算和存贮负担过重;(2)原始语音信号包含太多的随机因素,极大的影响了系统的识别率。

语音识别系统进行模板训练和模式匹配的数据是从预处理后语音信号中提取的特征参数。通过预处理和特征参数提取技术,一方面使得进行模板训练和模式匹配的数据特征明显,提高了系统的识别率;另一方面进行了信息压缩,降低了系统的运算量和存贮量。

特征参数提取就是从语音信号中提取有代表性的、合适的特征参数,进行适当的数据压缩。时域参数的优点是计算量比较少,对于区别语音段和静音段及清/浊音段比较方便,效果也比较明显。但由于人耳对声音的频域特性比较敏感,时域参数不能恰当地反映这种特征。

线性预测分析法是最有效的语音分析技术之一。线性顶测分析所包括的基本概念是,一个语音抽样能够用过去若干个语音抽样的线性组合来逼近。通过使实际语音抽样和线性预测抽样之间差值的平方和(在一个有限间隔上)达到最小值,能够决定唯一的一组预测器系数(预测器系数是线性组合中所用的加权系数)。

线性预测系数(LPC)倒谱系数其实是复倒谱。复倒谱是信号通过z变换以后取对数,再求反G变换而得到的。线性预测分析方法是一种谱估计的方法,而且其声道模型系统函数H(z)反映了声道的频率响应和原始信号的谱包络,因此用lgH(z)做反Z变换即可求出其复倒谱系数。该复倒谱系数是根据线性预测模型直接得到的,因此又称之为LPC倒谱系数。

4.3 模式匹配

模板匹配法是多维模式识别系统中最常用的一种相似度计算方法。在训练过程中,经过特征提取和特征维数的压缩,并采用聚类方法,针对每个模式类各产生一个或几个模板,识别阶段将待识别模式的特征矢量与各模板进行相似度计算,然后判别它属于哪个类。语音识别也可以用模板匹配法进行相似度计算,但它在特征维数方面存在一个时间对准问题,是通常模式识别匹配计算时不具备的一些特殊情况。孤立词识别时,每个类是一个词,每个词由一个或多个音素或类音素构成。在训练或识别过程中,每次说同一个词时,其持续时间长度和各个词的各音素或类音素的相对时长都会随机地改变。因此在匹配时如果只对特征矢量序列进行线性时间规整,其中的音素或类音素就可能对不准。而应该采用某种非线性时间对准算法。动态时间规整(DTW)就是效果最好的一种非线性时间规整模板匹配算法。

不同的人所发的语音信号,其模式有很大的差异,即使是同一个人,在不同的时间由于方法不同,其语音特征参数也有变化。在模式匹配时,由于这些变化会影响测度的估计,从而识别率降低。为了提高识别率,首先要把语音信号的起始点检测出来;其次,为了克服两次同样的语音而发音时间长短的不同,采用对标准模式的语音信号均匀地伸长或缩短直到它与未知语音信号长度相一致。这种方法能达到的识别精度完全取决于端点检测的精度。

5 结语

本系统主要工作是服务于实验室智能机器人的孤立词语音控制。实践证明,本系统能够对机器人常用的一些命令词进行识别,并且比实验室的传统机器人的控制方式方便得多,经过改进可以用到工业机器人的控制系统中去。

本文作者创新点是利用DSP对A/D采集来的语音信号进行处理,然后和计算机通信,同时将处理结果送给单片机实现LCD显示。

Copyright © 2017-2020 微波EDA网 版权所有

网站地图

Top