ISD9160语音识别代码分析
时间:10-02
整理:3721RD
点击:
## 前言
语音识别是特别酷的功能,ISD9160的核心卖点就是这个语音识别,使用了Cybron VR 算法。
很好奇这颗10块钱以内的IC是如何实现人家百来块钱的方案。且听如下分析。
本文作者twowinter,转载请注明:http://blog.csdn.net/iotisan/
## 功能分析
语音识别例程中做了21条语音识别模型,只要识别到对应的语音,就从串口输出对应模型的命令ID。
具体21条命令如下:
## 代码分析
代码主循环的逻辑特别清晰,我把主干抽出来,方便大家理解。
Wave_StartRecord开始录音,Wave_GetSample取出音频数据。
CSpotter_AddSample进行语音识别,CSpotter_GetResult识别出语音命令ID,最后DrvUART_Write吐出ID。
## 如何修改自定义语音命令
原定计划是修改自定义语音命令,但是发现这块资料很少。对于如何实现语音识别的Cybron VR算法,这块是封装成库,具体是“CSpotterSDK16k24d.lib”。这部分底层核心不开放,是可以理解。但是在具体应用时,使用什么工具来产生具体的声音模型,却一直没能找到对应工具。这块google了很久也没有收获,大联大方面是否有朋友来支持下社区的伙伴呢?
## 总结
可以看到ISD9160是可以实现本地一些预置的语音命令,基本上可以比的上一些几十块钱的模块。但是如何实现自定义的语音命令,还需要继续研究。
语音识别是特别酷的功能,ISD9160的核心卖点就是这个语音识别,使用了Cybron VR 算法。
很好奇这颗10块钱以内的IC是如何实现人家百来块钱的方案。且听如下分析。
本文作者twowinter,转载请注明:http://blog.csdn.net/iotisan/
## 功能分析
语音识别例程中做了21条语音识别模型,只要识别到对应的语音,就从串口输出对应模型的命令ID。
具体21条命令如下:
## 代码分析
代码主循环的逻辑特别清晰,我把主干抽出来,方便大家理解。
- int32_t DoVR_sep()
- {
- Wave_StartRecord();
- CSpotter_Reset(hCSpotter);
- while (1) {
- nNumSample = Wave_GetSample(&lpsSample);
-
- if (CSpotter_AddSample(hCSpotter, lpsSample, nNumSample) == CSPOTTER_SUCCESS){
- nID = CSpotter_GetResult(hCSpotter);
- DrvUART_Write(UART_PORT0,&nID,1); //confid 20150603
- }
- Wave_UnlockSample(&lpsSample);
- }
- }
Wave_StartRecord开始录音,Wave_GetSample取出音频数据。
CSpotter_AddSample进行语音识别,CSpotter_GetResult识别出语音命令ID,最后DrvUART_Write吐出ID。
## 如何修改自定义语音命令
原定计划是修改自定义语音命令,但是发现这块资料很少。对于如何实现语音识别的Cybron VR算法,这块是封装成库,具体是“CSpotterSDK16k24d.lib”。这部分底层核心不开放,是可以理解。但是在具体应用时,使用什么工具来产生具体的声音模型,却一直没能找到对应工具。这块google了很久也没有收获,大联大方面是否有朋友来支持下社区的伙伴呢?
## 总结
可以看到ISD9160是可以实现本地一些预置的语音命令,基本上可以比的上一些几十块钱的模块。但是如何实现自定义的语音命令,还需要继续研究。