智能语音已经成为人工智能领域的鸿沟？

时间：06-24 来源：孙永杰的ICT评论点击：

提及数据，在人机大战前，DeepMind耗费了数年时间学习围棋。参加《危险边缘》问答的沃森，研发人员输入了数TB有关问答节目和自然语言实例的数据，来帮助它理解这一节目的问答模式。只有靠人类这样有针对性的密集"训练"，这些机器才能表现得如此出色。会议安排助手X.ai这类看似简单的应用程序却花费了数年时间学习与会议安排相关的事项，才达到可投入商用的水平。而它们运作的过程，更类似于基于计算力提升之下的大数据分析和输出，远没有创造性的推理。而众所周知的事实是，在数据的处理（其实就是一种高速的运算），机器的能力早已经远远超过人类。

对此，有分析称，DeepMind未来可能无法单单通过利用AI程序解决复杂问题的方式创造大量营收，但DeepMind AI软件通过分析数据所获取的有用信息已经足够让谷歌为当初的竞标所投入的巨资值回票价。看到这里，相信业内应该知道DeepMind的本质以及谷歌打着AI旗号的真实目的了吧。

亚马逊Alexa：仍属快速信息检索涉及自然语言识别折戟沉沙

最后看亚马逊。其所谓的AI是随着采用智能语音技术Alexa的Echo音箱的热销而为业内所知，某种程度上也代表了亚马逊AI的水平。但从其应用看，智能语音服务范围大都是在信息检索，帮助用户获得资讯。绝大多数的内容是不牵涉"推理"（对用户自然语言的理解）的查询类信息服务。如果用户问到在基础信息以上，一旦牵涉推理的问题，不仅是Alexa，几乎所有的智能语音识别（包括谷歌、微软）都无能为力。

从IBM、谷歌、亚马逊看当下AI的泛化

以亚马逊的Alexa为例，去年一名六岁的女孩在跟Echo内置人工智能语音助手Alexa聊天时，意外订下了价值170美元的玩具和一盒重达四磅的饼干。虽然孩子的妈妈在收到一个不知打哪来的订单确认电话后立刻进行了取消操作，但该订单却已经被处理，且一个跟孩子身高几乎相同的玩偶就在隔天送来了。最后，他们无奈地决定将这一玩偶捐赠给当地儿童医院。

又如亚马逊Alexa误听指令向孩子提供成人内容，即小孩向亚马逊Alexa下达指令："Alexa，请播放‘Digger digger（一首儿童歌曲）’。"之后，亚马逊个人助手通过算法进行识别，竟然认为孩子想听情色内容。稍后，孩子的父母才意识到发生了什么事，可惜他们已经无法阻止Alexa继续播放声音。

上述说明自然语言（真正的AI能力）的"难题"离最终的解决依然存有差距。因为不同的应用（问答、情感分析、机器翻译、部分语音标签）需要有不同的模型架构：强监督式记忆神经网络、树形长短记忆网络、双向LSTM限制随机域（CRF）、动态记忆网络等。即使在研究中出现一些非常有潜力的新想法，设计、工程合成、可扩展的对话系统与这些想法的结合依然处于非常复杂的状态，离商用还很遥远。所以，当被问及何时才能通过自然语言与数字助理交流，并得到满意的答案时，就连吴恩达这样的顶尖科学家也无法给出确切答案。即便是对最高水平的神经网络学家而言，这项技术仍然有很多谜团尚待解开。有很多工作只能通过不断试错来改进，没有人敢保证某项技术调整可能产生什么样的后果。根据现有的技术和方法，这一过程大约要耗费数年时间。

正是在这些科技大佬的鼓动下，AI正有走向泛化的趋势。据统计，到去年年底，在财富500强企业中，就有180家对外宣称自己要启动相关的人工智能项目。甚至有广告研究公司大胆预估，到了 2020 年，人工智能技术可能会出现在几乎所有的新科技产品的宣传之中。另据Gartner 在研究了 1000 家宣称自己使用了人工智能的技术供应商后发现，大部分所谓的人工智能技术，采用的依旧是基础的、基于规则的机器学习和分析技术（例如上述的IBM的沃森和谷歌的DeepMind）。这些技术，早在人工智能这个概念被热炒之前，就已经出现并被业内所使用。更为关键的是，这些技术的能力远远未达到可以被称得上"人工智能"的程度。

恰逢国务院《新一代人工智能发展规划》颁布之际，在彰显我国政府对于科技产业前瞻性和势在必得决心的同时，也应该警惕当下产业界AI泛化的趋势，尤其是在每逢大的利好的产业政策或者纲要出台，总是泥沙俱下的中国，切莫让真正的AI淹没在AI的泛化中。

上一篇：2017年人工智能的发展方向在哪里？
下一篇：艾迈斯半导体单线通信接口荣获传感器博览会“金牌创新奖”

IBM AI 谷歌亚马逊相关文章：

栏目分类