微波EDA网,见证研发工程师的成长!
首页 > 硬件设计 > 硬件工程师文库 > 语音识别技术及厂商解析 智能家居的另一大入口?

语音识别技术及厂商解析 智能家居的另一大入口?

时间:07-12 来源:电子发烧友网原创 点击:

  语音识别技术并不是一项新兴的技术,并且技术门槛也不算太高。在需求巨大的智能家居市场语音识别能否代替智能手机成为另一大入口?全球范围内哪些厂商在布局语音识别技术,语音是识别的技术原理和难点又在哪?

  物联网市场潜力巨大应用众多,在繁多的应用中智能家居或许能优先落地。不过,除了物联网标准和观念阻碍智能家居的发展,手机作为目前首要的入口也大大影响了体验。语音识别并不是一项新兴的技术,但在智能家居甚至人工智能领域或许能大展身手。

  物联网与智能家居市场潜力可期

  市场研究咨询公司Gartner预测,2020年全球物联网终端设备的出货量将达到66亿,而物联网设备数量总数将达到208亿,花费在物联网上的总支出将达到约2420亿美元。

  Gartner同时预测,2017年以后智能家居将成为物联网最大的用户。有机构预测2016年中国智能家居市场规模增速将达到50.1% ,并保持这一增速,到2018年中国智能家居市场规模将达到1396亿元,市场规模约占全球总规模的32%,2020年中国智能家居市场规模将达到3000多亿元。全球TOP100电信运营商中已有60%计划进军智能家居市场更让我们有理由相信智能家居将会成为最先落地的物联网应用。

  

  智能家居入口单一

  无论是在正式还是非正式场合,谈起智能家居总能听到手机作为唯一入口的抱怨。举个简单的例子,当你安装了智能灯具,但你想要打开或调整还要先找到手机打开APP。这时候可能很多人会选择直接用开关解决问题而非使用手机。

  智能家居的愿景很好,但目前的体验确实还有很大的提升空间。关于手机作为智能家居的唯一入口的问题,艾拉物联的联合创始人、大中华区总裁Phillip张南雄就表示:"手机可能不是智能家居甚至物联网的唯一入口,语音识别是一个很大的入口。"美的智慧总经理李强也表示,手机作为智能家居唯一入口的局面将被改变。

  语音识别成为争夺焦点

  据悉,全球范围人工智能公司多专攻深度学习方向,而我国人工智能方向的200家左右的创业公司有超过70%的公司主攻图像或语音识别这两个分类。全球都有哪些公司在布局语音识别?他们的发展情况又如何?

  其实,早在计算机发明之前,自动语音识别的设想就已经被提上了议事日程,早期的声码器可被视作语音识别及合成的雏形。最早的基于电子计算机的语音识别系统是由AT&T贝尔实验室开发的Audrey语音识别系统,它能够识别10个英文数字。到1950年代末,伦敦学院(Colledge of London)的Denes已经将语法概率加入语音识别中。

  1960年代,人工神经网络被引入了语音识别。这一时代的两大突破是线性预测编码Linear Predictive Coding (LPC),及动态时间规整Dynamic Time Warp技术。语音识别技术最重大的突破是隐含马尔科夫模型Hidden Markov Model的应用。从Baum提出相关数学推理,经过Rabiner等人的研究,卡内基梅隆大学的李开复最终实现了第一个基于隐马尔科夫模型的大词汇量语音识别系统Sphinx。

  

  苹果Siri

  许多人认识语音识别可能还得归功于苹果鼎鼎大名的语音助手Siri。2011年苹果将语音识别技术融入到iPhone 4S中并发布了Siri语音助理,不过Siri并不是苹果研发的技术,而是收购成立于2007年的Siri Inc.这家公司获得的技术。在iPhone4s发布以后,Siri的体验并不理想,遭到了吐槽。因此,2013年苹果又收购了Novauris Technologies。Novauris是一种可识别整个短语的语音识别技术,这种技术并非简单识别单个词句,而是试图利用超过2.45亿个短语的识别辅助理解上下文,这让Siri的功能进一步完善。

  不过Siri并没有因为收购Novauris变得完美,2016年苹果又收购了开发的人工智能软件,能够帮助计算机与用户进行更为自然的对话英国语音技术初创公司VocalIQ。随后,苹果还收购了美国圣地牙哥 AI 技术公司 Emotient,接收其脸部表情分析与情绪辨别技术。据悉,Emotient开发的情绪引擎可读取人们的面部表情并且预测其情绪状态。

  谷歌 Google Now

  与苹果Siri类似,谷歌的Google Now知名度也比较高。不过相比苹果谷歌在语音识别领域的动作稍显迟缓。2011年谷歌才出手收购语音通信公司SayNow和语音合成公司Phonetic Arts。SayNow可以把语音通信、点对点对话、以及群组通话和Facebook、Twitter、MySpace、Android和 iPhone等等应用等整合在一起,而Phonetic Arts可以把录制的语音对话转化成语音库,然后把这些声音结合到一起,从而生成听上去非常逼真的人声对话。

  2012年的Google I/O开发者大会上,Google Now第一次亮相。

  

2013年

Copyright © 2017-2020 微波EDA网 版权所有

网站地图

Top