微波EDA网,见证研发工程师的成长!
首页 > 硬件设计 > 嵌入式设计 > C8051F040单片机在语音识别系统中的应用

C8051F040单片机在语音识别系统中的应用

时间:08-13 来源:互联网 点击:

语音识别是人机交互的一种重要技术手段。根据实际需要和应用场合的不同,语音识别可以分为孤立词识别和连续语音识别、特定人识别和非特定人识别。语音识别追求的主要指标为高识别率、实时性和大词汇量;而对于一个语音识别系统,还应考虑软硬件设计简单、价格低廉、外围控制灵活、人机交互便捷等特点。性能良好且成本低廉的语音识别系统在智能家电接口、智能玩具、智能仪器等领域提供便捷的人机交互服务,将具有广阔的应用前景。

语音识别系统构成

语音识别系统主要包括识别单元选取、预处理、特征提取、模式匹配、参考模式库等几个部分。根据模式识别的原理,对未知的语音的模板与已知语音的参考模板逐一进行比较,得到的最佳匹配的参考模板就是识别的最终结果。语音识别的系统框图如图1所示。

初步处理:语音信号首先经过话筒会变成电信号,之后进行初步处理。初步处理包括对信号进行的滤波、数字化、预加重、分帧加窗以及端点检测等一系列步骤。通过这些处理,将语音信号变成数字信号,并利用窗函数把语音数据序列分成连续的信号帧,找出信号中的语音部分。

特征提取:信号经过初步处理之后,进入特征提取单元进行特征分析和特征提取。提取特征单元的功能一般是完成基于频谱的特征矢量的计算,提取出代表信号特征的参数,形成矢量模板。语音帧的特征矢量按照一定的规则进行处理之后,作为参考模型和待识别语音的模板。

参考模型库:参考模型库就是语音信号的参考模板库,通常是对说话人进行多次重复的语音训练之后,使用平均或者聚类的分析方法,对这些语音信号进行一系列的分析和计算得到的特征矢量模板组成。

模板匹配:模板匹配单元完成特征矢量与已存语音信号模板之间的匹配计算。将输入语音形成的特征矢量模板与训练得的到语音模板库进行分析比较,根据一定的搜索和匹配原则找出与参考模板中差别最小的特征矢量模板,然后根据此模板对应的语音信号找出识别结果。

语音识别系统的设计思想

随着语音识别算法的发展以及嵌入式设备的运算能力的提高,在具有一定计算能力和存储空间的嵌入式硬件平台上实现语音识别,进而取代一些繁杂的直接操作已经成为了语音识别的重要发展方向。本系统是基于C8051F040单片机的语音识别系统,其识别框架如图2所示。

图1 语音识别系统结构图

图2 嵌入式语音识别系统框架图

嵌入式语音识别系统的工作过程:首先采集语音信号,在程序运行时,通过控制模块输入当前需要进行的模板的训练操作,输入完成后系统采集特定人的语音信号,A/D转换之后进入控制器,通过一系列的算法建立起该特定人的标准语音库,并将其存入存储电路之中;在语音识别时,首先通过控制模块输入当前需要进行的操作,然后采集用户的语音,将采集到的信号进行一系列运算处理提取出特征矢量模板,存入存储单元之中,并与标准语音库中的语音命令进行比较,在允许的误差范围内找出语音库中最接近该段音频的语音信号,并把该语音信号作为识别结果通过显示模块告知用户。

语音识别系统的硬件结构

语音识别系统的硬件部分主要由声音采集模块(拾音器以及功率放大电路)、带通滤波器、存储电路、串口通信电路、键盘控制电路、显示电路以及微控制器等几个基本单元组成。系统的硬件组成框图如图3所示。

图3 语音识别系统硬件结构图

系统的微控制器部分是整个系统的控制中心,主要完成对语音信号的存储、对外部命令的响应、算法的实现以及实验结果的输出。本系统的采样功能由单片机本身实现,选用的C8051F040型号单片机包含有A/D采样的功能,而且采样速率能够满足进行语音信号时所需要的采样频率。

进行语音实验时,语音首先要进入声音采集模块。声音采集模块由拾音器和功率放大器组成。拾音器用于将语音信号转化成电信号。当语音信号从拾音器出来之后会转换成微弱的电信号(毫伏级),因此在拾音器的后端需要将该电信号进行放大处理(放大到伏级),这就是该模块中功率放大电路的作用。

一般的语音最高频率是3.4KHz,最低频率为300Hz,而在语音信号通过输入系统之后需要对该频率段之外的频率成分滤除,以提高语音的信噪比。带通滤波器用于对语音信号进行滤波,以保留300Hz~3.4KHz的信号。为了实现对放大后信号的滤波处理,带通滤波器可由低通滤波器和高通滤波器级联而成,即设计一个下限截止频率为300Hz的高通滤波器和上限截止频率为3.4KHz的低通滤波器来级联。

语音信号的采集一般需要8KHz的采样频率,而单片机本身片上资源较少,当存储语音数据时可能会有存储空间不够的情况,此时,系统需要外

Copyright © 2017-2020 微波EDA网 版权所有

网站地图

Top