微波EDA网,见证研发工程师的成长!
首页 > 硬件设计 > 嵌入式设计 > 大热的麦克风阵列语音识别系统的设计和轻松实现,提供软硬件解决方案

大热的麦克风阵列语音识别系统的设计和轻松实现,提供软硬件解决方案

时间:06-04 来源:互联网 点击:

可达50KHz的数据采集卡,结构框图如图2.1所示,图2.2是实物拍摄照片。实验中,将六个麦克风排列成按照5.2cm的相邻阵元中心间距排列成一均匀线阵进行数据采集,如图2.3所示。

图2.1 基于PC的音频采集硬件系统框架

图2.2 音频采集硬件实物

图2.3 麦克风阵架子,架子长约65cm,宽约20cm

本实验每个人录制HMM模型库中的十个单词,分别为able、afraid、already、autumn、base、below、body、box、build、careful,录制人离麦克风阵2.5米左右,麦克风间的距离约为5cm,这样就能够近似认为,说话人说出的语音信号是由平面波的形式到达麦克风阵的。录制环境的信噪比大约为50dB。将这些录制的单词储存在PC中,然后用Matlab程序进行训练得到滤波器系数。之后采用图1.5的流程进行语音识别。经过初步的研究发现,该算法具有较好的识别效果。

下一步就是将Matlab算法移植到FPGA中,如图2.4。

图2.4 基于Nexys 3 Spartan-6 FPGA Board的音频采集硬件系统框架

首先将训练得到的滤波器系数及HMM模型存储与Nexys 3 Spartan-6 FPGA Board的外部存储器中,之后经多路低噪声放大器,AD信号采集卡将测试者的语音信号输入到FPGA。因为采集卡输入的是串行的信号,FPGA需将六路语音信号进行时分复用采集,转换为并行的信号,供后续处理。后续处理流程及算法参见图1.5及1.2 关键算法。其中滤波器、乘法、FFT等等算法可以利用现有的IP核,以提高设计效率。识别完成后将识别结果在七段译码显示器上显示。为了简便起见,可以将able、afraid、already、autumn、base、below、body、box、build、careful分别标定为1~10,然后将相应的数字显示在七段译码显示器上。

如果识别效果理想,可以将现有的十个单词的库提升到50个词、100个词,但是这都需要进一步的研究以及更高性能的硬件支持。

Copyright © 2017-2020 微波EDA网 版权所有

网站地图

Top