微波EDA网,见证研发工程师的成长!
首页 > 硬件设计 > 硬件工程师文库 > 智能语音的落地,分享智能语音的产业观察

智能语音的落地,分享智能语音的产业观察

时间:09-13 来源:全志科技 点击:

在与各种设备的交互模式上,语音显然是更好的选择,通过语音指令进行操控,提升了新时代的智能生活体验。2017年10月11日,全球最大的电子展——环球资源采购交易会,在香港亚洲国际博览馆盛大开幕,同日上午智能声控产品发展机遇高峰论坛隆重召开,中国智能家居产业联盟秘书长周军先生、联想集团副总裁姚映佳先生、全志科技智能家居事业部副总经理李震先生和科大讯飞高级副总裁杜兰博士应邀参会,李震发表了题为《智能语音的落地》的精彩演讲,分享了最新的产业观察与全志的场景化应用落地现状。

全志科技智慧家居事业部副总经理李震与参会嘉宾合影(右一李震)

李震谈到:"2017年被称为智能语音元年,典型的智能语音的应用场景有,SIRI、智能音箱、智能助手、陪伴机器人、语音家电、语音输入法等,随着技术的不断成熟和产业链的完善,智能语音的风口已经具备了基础条件,应用的领域也将进一步扩大。"

市场调研机构Strategy Analytics指出,2016年智能音箱全球出货量590万台,并将在2022年增长10倍,市场价值达到55亿美元。而Gartner 预测,到2018年30%的人机交互通过自然语言完成,或许明年才是智能音箱爆棚式发展的决定性一年。

如今,人工智能的热潮仍在蔓延,更多的机器设备被赋予感知能力,智能语音将成为人机交互的新范式。李震预测中美两国将是率先迎来智能语音爆发的两个基地,不论是资金还是技术,以及配套的产业链完善程度,世界上再也找不到第三个国家具备与之竞争的基础环境。

随后,李震讲到了智能语音的两个主要价值,第一是解放人类的双手,人类的天性是不断追求生活的舒适度,李震举了一个遥控器的例子,虽然在电视机上可以完成所有的操作,但当遥控器发明后迅速成为电视机的标配,没有人愿意放着便捷的遥控器不用,而多走几步去电视机进行操作。第二个方面在于功能入口的扁平化,由于技术本身的限制,目前的语音人机交互在简单菜单交互的便捷性上还不如触屏,但当场景变成复杂的深度菜单后,语音交互的优点已经可以体现出来,就是功能入口的扁平化。通过扁平化的入口快速实现指令的下达,也是符合上述人性的本能的。

"当AI以及语音技术本身足够强大,语音交互将会成为人机交互的主流,AI的本质在于给家庭提供了一个廉价的个性化服务助手,所以AI的交互虽然是人机交互,但本质上和人-人交互没有区别,而人-人交互的绝大数方式是通过对话,不会有人通过打字或者触摸进行人-人交互。"李震表达了自己的见解。

智能语音的应用场景非常丰富,例如智慧家庭、个人穿戴、语音输入与输出、陪伴机器人、车辆智能中控等,总结为"人、车、家"三个领域,智能语音的未来形态,短期看仍以内容为主,下一个发展机会将成为智能家居控制的入口。以智能家居为例,语音助手是最高频的应用之一,智能语音可以跟电视、音响、空调、窗帘、灯具、玩具等各种家用设备和智能家居控制中枢系统相结合,通过语音交互实现一个入口控制全部功能。

可以看到,国外巨头纷纷抢滩登陆智能音箱产品,并将其当作诸多服务和获取用户数据的最佳入口。目前,智能语音的关键技术集中在前处理->唤醒->识别->语义四个方面,对应的是语音激活VAD,语音唤醒VT,语音识别ASR,和语义分析NLP,而这些关键技术已基本具备大规模的商用基础,所存在的关键矛盾是产品的性价比与消费价值习惯之间的差异。

智能语音在落地的场景中对硬件的需求集中在四个方:更高信噪比的麦克风,更低功耗的待机,更强的计算性能,更专用的加速引擎,和上述关键技术一样,在四个产品侧方面国内也有了很成熟的方案,且当前的矛盾同样集中在成本、体验效果、以及消费者预期等。

在峰会上,李震兴奋地指出:"在芯片侧,全志已经有了五个对应不同消费层级需求的专用芯片R5,R16,R18,R40,R58,并将于明年推出专门为语音市场迭代的更高性价比的R10。全志的智能语音布局专注打造更好的硬件支撑平台,体现在提供完整的解决方案(模拟/数字+处理+连接),提供完整的交付(芯片+参考设计+系统软件),提供丰富的生态(各家算法厂商的合作),提供高品质的产品(工业级、超高良率),全志作为芯片厂家绝不仅仅局限在芯片这个硬件本身,而是希望能配合上下游产业链共同推进产业的快速发展。"

移动互联网之后,物联网正加速到来,伴随人工智能、机器学习技术的迅猛发展,智能语音交互变得更为实用,不管是音箱、空调,还是手表、汽车,都可以用自然语音跟它们进行对话。

演讲结束时

Copyright © 2017-2020 微波EDA网 版权所有

网站地图

Top