看国内外语音交互厂商如何定位人工智能
今天要讨论的这个话题应该不少关注人工智能的朋友们都挺感兴趣的,作为人体感官的重要一部分,以及输出思想的主要渠道,它被冠以新一代的交互方式,它就是——语音交互。搜狗、四维图形、百度、出门问问、云知声给霸屏了(虽然没有AR VR刷的那么厉害,但是眼尖的我还是注意到了!)
怎么大家突然扎推搞起了语音交互?而且做的都还是智能驾驶应用?看来这里面一定有什么!所以编者决定今天给大家详细讲讲——"语音交互"。
一、语音交互是什么
语音交互其实可以分成两块:语音识别和语义识别。所谓语音识别,就是把人说的语音转化成计算机可读的输入,比如微信中的语音转文字功能。而语义识别,则要求更高。它要求机器可以听懂你说的语音,比如你问Siri今天天气怎么样,它需要听懂你说的意思,并完成相应的回答。语音识别和语义识别二者合一,就构成了语音交互,它将是未来的新一代交互模式。
二、语音交互公司
搞清楚一个行业最好的方式就是去看这个行业里有哪些公司,所以小编先扒了扒他们都在做什么。
1、国外语音交互的大佬们
Nuance
全球最大的语音技术公司,超1000项专利技术 ,一度雄霸天下。当然现在依然很牛啦。在中国,有9%的语音识别应用是采用Nuance的核心技术。它和电信、移动、联通、网通都有合作,cctv春晚的呼叫中心也应用此技术。简直不可撼动。。。
微软
提到微软在语音交互的布局,不得不说起微软两姐妹,小冰和小娜。小娜Cortana是微软发布的全球第一款个人智能助理。能够了解用户的喜好和习惯,帮助用户进行日程安排、问题回答等。小冰目前已发布第三代,听说读写技能都已解锁,从最初只能单纯的文字对话跨越至纯语音的互动聊天。
谷歌
Google一直致力于投资语音技术,此前收购多家语音识别技术公司及专利。2011年,收购语音通信技术公司 SayNow 和语音合成技术 Phonetic Arts。 2014年收购SR Tech Group的多项语音识别相关的专利,其中包括 " 搜索引擎语音界面" 和 " 修改、更新语音识别项目系统" 的专利。
今年4月份Google还开放了自己的语音识别API,即Google 语音搜索和语音输入的支持技术。Google Cloud SPeech API包括了80多种语言,适用于各种实时语音识别与翻译应用。
苹果
苹果收购过Siri、Novauris、VocalIQ等语音技术公司,且请了不少牛B的人组建基于神经网络算法的语音识别团队。最近苹果正依靠语音助手Siri构建更大的生态系统,在最新的HomeKit的合作伙伴名单中,除了国内厂商海尔,还有照明厂商飞利浦、科锐 (CREE),以及Marvell(美满电子)、Honeywell(霍尼韦尔)等全球顶级制造商。
2、国内语音交互公司
讲完国外的我们来重点讲讲国内的。据了解,目前我国语音技术厂商基本分为三类:一类是,包括像科大讯飞、捷通华声等传统语音技术厂商;第二类是互联网厂商,包括百度、腾讯、搜狗等,通过自主建设团队或者收购,掌握智能语音技术,推广语音服务;第三类是创业企业,像云知声、思必驰等,它们专注于某些行业领域,比如汽车、家电,来推广自己的语音技术和产品。
科大讯飞
成立于1999年底,依靠中科大的语音处理技术以及国家的大力扶持,很快就走上了正轨,是目前国内最有影响力的语音技术公司,08年的时候就已经挂牌上市了,目前市值接近500亿。根据2014年语音产业联盟的数据调查显示,科大讯飞占据了超过60%的市场份额,绝对是语音技术的龙头企业。
百度
语音交互其实很早就被百度确立为战略方向,2010年的时候百度就与中科院声学所合作研发语音识别技术,但是没搞好。直到14年,百度请来了人工智能领域的泰斗级大师吴恩达,正式组建了语音团队,专门研究语音相关技术,才得以咸鱼翻身。到目前为止,已斩获了近13%的市场份额,技术实力可与科大讯飞相提并论。
除了技术外,我们还看到百度积极地布局应用端,CarLife、MyCar以及在上个月CES上推出的CoDriver都是百度在车联网语音交互的生态布局。还有百度之前推出的度秘,之前也在KFC中实现了语音点餐这一功能。
搜狗
搜狗在今年的CES ASIA上有惊艳到我,现场模拟车内的交互,无论是拨打电话、发短消息各种信息查询都不在话下。并且语义理解做的挺棒,可以进行多轮式对话,小编现场试了一下。
搜狗输入法在语义理解方面的大数据积累、搜狗本身就在做的地图,再加上目前由搜狗自主开发的语音交互技术,这3者深度结合,在车联网应用领域的确是很具优势的。
思必驰
思必驰初创于07
- 基于语音的终端映射技术如何实现智能交互?(04-30)
- 高通与苹果会给远场语音交互带来什么?(05-07)
- 体验上汽推出的iVoka语音交互技术(06-19)
- 6麦环型阵列的一款音箱,根本属性究竟是啥?(05-08)
- 基于赛普拉斯CYW43438语音交互中麦克风阵列的解决方案(07-30)
- 解密英伟达Tesla P100、GP100、DRIVE PX2平台(04-26)