微波EDA网,见证研发工程师的成长!
首页 > 硬件设计 > 硬件工程师文库 > 语音识别技术原理及实用系统设计汇总

语音识别技术原理及实用系统设计汇总

时间:11-19 来源:本站整理 点击:

   Nuance公司是自然语音接口软件的佼佼者。使用自然语音接口软件,人们可以通过电话方便安全地获取信息、服务并进行交易。每天,千千万万的人通过拨 打运行Nuance公司语音识别、语言理解和声纹鉴别软件的电话,进行出游预订、股票交易、与其它通讯媒体、企业和互联网系统进行交往等活动。 NUANCE的应用:美国航空、Bell Atlantic、Charles Schwab、家庭购物网络、Lloyds TSB、Sears、UPS 。

  3.NUANCE语音识别特点

  (1)海量词汇、独立于讲话者的健壮识别功能

  Nuance系统能可靠地对多种语言进行大词汇量的识别,并可提供识别结果的置信度。该系统对商业上使用的大量词汇提供最准确的语音识别技术。利用Nuance系统开发的应用程序,在市场上具有最高的准确率。生产中的应用程序经测试,准确性超过96%。

  (2)基于主机的客户/服务机结构

  Nuance系统基于开放式客户/服务机结构,特别为大型应用程序所需的健壮性和可伸缩性而设计。呼叫者的讲话由客户端收集,而识别和鉴别处理的负载被平均分配到网络上的多个分开的服务器上。

  (3)N-Best处理

  对于有些应用程序,可能需要识别引擎产生可能的识别结果集,而不是一个最好的结果。Nuance系统的N-best识别处理方法便有这个功能,它提供了可能的识别结果列表,并按可能性从高到低排列。

  (4)语法概率

  Nuance系统允许对呼叫者所讲的特定词语或短语的在语法中的概率进行指定。当被讲的词语或短语的概率可根据实际使用进行估计时,非常有用。对语法增加概率可提高识别的准确率和速度。

  (5)降低噪音

   当进来的呼叫包含稳定的背景噪音时,Nuance系统通过一种机制,使识别服务器更准确地进行识别。识别服务器将进来的话语进行增强,以有效地将语气、 嗡嗡声、哼叫声、嘘嘘声等噪声过滤。如果相当数量的电话均含有稳定的背景噪声,比如在汽车上免提打电话时,这个机制效果较理想。

  4.基于识别的应用

  语音短信本身业务、公司电话簿、个人电话簿、智能点歌、股票查询和交易、智能信息点播、列车时刻查询

  (1)基于语音识别的公司电话簿

  公司电话薄应用描述

  系统能支持多个接入号码,虚拟多个公司的总机。并依靠语音识别技术,智能转接到相应的用户。

  流程

  用户拨打接入码,系统根据接入码找到相应的公司数据库,同时提醒用户说出相应的用户,系统依据相应的用户查询数据库,并得到该用户的号码,并通知交换机将该号码接通。

  公司电话簿特点

  •系统支持电话接入方式

  用户可通过电话修改个人密码,个人上班电话和非上班电话

  •系统支持WEB接入方式

  • 系统管理员可修改所有信息

  • 各公司管理员可增加,删除,修改本公司的电话信息

  (2)基于语音识别的点歌功能

  功能描述

  用户接入系统,提示用户说出歌名,并依靠语音识别技术,查找到该歌名,并播放给用户。

  应用流程

   用户拨打接入码,提示用户说出歌名或歌手名,并依靠语音识别技术,查找到该歌名或歌手名,若为歌名查询数据库,得到该歌存储的路径,并播放给用户,若为 歌手名,则读出该歌手的专辑,并提醒用户选择,用户选择后,读出该专辑的歌名,并提醒用户选择,用户选择后,给用户播放该歌曲。

基于ZigBee节点的智能家居系统语音控制设计

  1 系统总体设计

  系统总体结构如图1所示,主要包括基于Samsung的S3C6410平台的网关、基于SPCE061A的语音ZigBee子节点、电器继电器控制ZigBee子节点、电器红外控制ZigBee子节点等。其中各子节点与网关之间通过星型拓扑结构进行连接。

  

   在对语音子节点进行训练之后,当语音节点采集接收到语音控制命令时,执行语音识别指令,通过CC2530收发模块发送相应的控制指令到网关的主节点上。 主节点将接收到控制指令通过串口上传到网关主机,主机在处理信息之后,再通过主节点发送相应的控制指令到控制子节点上,控制子节点在接收到相应的命令之后 就会执行相应的动作,对被控对象进行控制。

  2 系统硬件设计

  (1)网关。采用基于ARM11架构的三星S3C6410处理器,与ZigBee主节点之间通过串口方式进行通信。S3C6410是基于ARM1176JZF-S的16/

(2)语音子节点。由凌阳科技的SPCE061A单片机与ZigBec收发节点模块组成。SPCE061A是凌 阳科技推出的以μ’nSPTM为核心的16位结构的微控制器。具有8通道10位A/D转换输入功能,内置自动增益控制功能的麦克风输入方式以及双通道10 位DAC方式的音频输出功能。在使用SAC M_S240凌阳音频编码方式时,可

Copyright © 2017-2020 微波EDA网 版权所有

网站地图

Top