智能家居语音控制解决方案:让家具听懂话
在智能家居给人们带来便捷生活的同时,人们的控制习惯逐渐发生改变。语音技术的发展也为控制入口做了一个补充,在抛去了传统遥控器和手机APP之后,通过口令发送让家居环境达到舒适状态,让生活更便捷智能,这是否会成为智能家居行业下一个阶段的普遍应用?
远场语音识别、云端语义辨识、人工智能应用等等一个个技术节点得到新的突破,为智能家居提供了新的控制入口选择。本文将从技术趋势、解决方案、产品应用、项目实施等多角度为您呈现语音控制技术在智能家居产品和集成项目中的应用前景。
所谓智能语音产业,主要指通过语音合成技术和语音识别技术,为用户提供各种服务的产业。一般来说,用户只需要用说话的方式给服务终端发布命令,就能得到相应的服务。这一产业从上世纪六十年代就已出现,但并不为普通消费者所熟知,消费者对其认知度也比较低。近年来,随着苹果、谷歌、微软等公司先后推出 Siri等智能语音服务,这一服务以及相关产业也开始被普通消费者和投资界所关注。
语音控制技术
与机器进行语音交流,让机器明白你说什么,这是人们长期以来梦寐以求的事情。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的技术。
语音识别是一门交叉学科,语音识别技术与语音合成技术结合使人们能够甩掉键盘,通过语音命令进行操作,语音技术的应用已经成为一个具有竞争性的新兴高技术产业。
目前语音控制技术存在的问题
目前,对于语音控制类的智能硬件产品在很多场景下因语音交互体验不如人意而深受诟病,究其原因主要是受限于空间距离、背景噪音、其他人声干扰、回声、混响等多重复杂因素,进而导致的识别距离近、识别率低等明显痛点。
除此之外,单是中国语系、方言和口音就相当多,加上中文的多语义性,所以不同地区的人使用语音控制识别率差异较大。同时,在语义识别上,也存在上下文的关联带来识别的学习难、定位难和建立模型难等问题。
语音识别的几种控制技术
"语音识别"技术相当于给计算机系统安装上"耳朵",使其具备"能听"的功能。该技术经过语音信号处理、语音特征处理、模型训练及解码引擎等复杂步骤,使机器最终能够将语音中的内容、说话人、语种等信息识别出来。语音控制功能的实现,与用户的使用习惯高度关联。目前的语音控制功能实现方式可分为近场语音识别和远场语音识别二个大类。
近场/远场语音识别技术
近场语音识别,需要用户点击启动,并且用户与终端设备的距离比较近,如手机或其他终端设备,可直接借助这些终端设备的实现控制功能。
远场语音识别,以麦克风阵列远距离拾取的语音数据作为输入数据,通过语音识别的算法将语音信号转写成文字的技术。虽然和近场语音识别技术在原理上是相同的,但是由于音源和麦克风之间的空间距离增大,在声波传播过程中会出现信号强度的衰减和各种噪音干扰,因此需要特殊的语音数据拾取和预处理技术。不同的拾取设备和预处理技术常常会使用于语音识别的声波信号特征发生改变,因此针对不同的远场语音拾取技术,需要对语音识别引擎进行定制化适配和优化。
当语音信号在传播过程中有所衰减,影响采集信号的强度和分辨率,使用的灵敏度非常高的指向性麦克风,同时将麦克风的参数调整到适合远场语音数据的模式,可以最大限度采集清晰的远场语音信号。语音指令声波在传输过程中受到周围噪音的污染,降低声波信号的信噪比,使用定向波速成形技术,抑制方向外的噪音,从而减少噪音对语音信号的干扰。在一个房间里,麦克风拾取的声波不仅仅直接来自于音源,还有音源发出后经过墙壁反射的迟到的声波,形成声音的残留,造成混响。利用多个麦克风采集的数据,通过多通道回声消除算法,将这些不同时间达到的声音数据分离开来,从而消除了混响对声音数据的影响。
唤醒目标检测技术
在远距离用语音进行操控的时候,声音可能来自不同方向的不同人。因此首先要确定哪些是发指令的声音,哪些不是。使用的麦克风阵列波速成形算法,将360 度空间垂直划分成若干区域,每个麦克风负责检测一个指定的区域。当某个空间区域里面检测到有唤醒词出现时,对应于该空间区域的麦克风拾音功能就被增强,其他区域的麦克风拾音就被抑制。从而实现了对声音进行有方向有角度的拾取,避免了周围电视机里的说话声音、其他人交谈对语音指令的影响。
播放状态打断技术
在对音箱等设备进行语音控制时,往往该设备处于播放歌曲的状态。由于麦克风安装在音箱上,麦克风和说话
- 体验上汽推出的iVoka语音交互技术(06-19)
- 科普丨智能家居控制系统是啥(04-23)
- 类Siri语音控制技术 Android手机也能控制电视(02-21)
- 采用ISD1016制作的语音留言控制器电路设计图(02-13)
- 基于MCU的智能漏水检测系统设计(10-06)
- 远程自动控制系统在智能家居中的应用(10-16)