微波EDA网,见证研发工程师的成长!
首页 > 硬件设计 > 硬件工程师文库 > 阿里智能对话交互实践及范式思考

阿里智能对话交互实践及范式思考

时间:06-12 来源:人工智能头条微信号 点击:

网络不好的时候,最需要导航的时候,你要能够工作,所以我们的语音识别还有语言理解、对话引擎,就是在没有网络的情况下,要在端上能够完全工作,这里面的挑战也非常大。

现在正在把这样的对话交互平台开放出来,让合作伙伴去开发自己场景的对话交互,所以我们正在开发面向开发者的平台,这个平台背后有端上的解决方案和云上的解决方案,端上包括声音的采集、VAD、端上无网情况下完整的对话方案,服务端的能力会更加强大了。

在合作伙伴这块有两类:一类是面向设备的,比如说汽车、电视、音箱、机器人、智能玩具。另外一类就是类似于行业应用,比如说智能客服这样的一个场景。

考察一个对话交互平台的能力,其实第一需要看它背后沉淀和积累的技术,我们在这方面花了三年的时间去沉淀了一些公共场景的对话交互能力。比如像娱乐、出行、理财、美食,有了这样的能力之后,当一个新的业务方接入的时候,就不需要再去开发了,直接调用就好。用户只需要开发业务场景中特定的一些场景就可以,大大加快业务方开发对话交互的速度。

第二个能力就是提供足够强的定制能力,这种能力我们在语言理解,用户可以定制自己的时点、对话逻辑、聊天引擎、问答引擎,可以把自己积累的数据上传上来,以及对语音识别的词语定制,包括TTS声音的定制等等。

智能对话交互生态的范式思考

过去3-4年,在人机对话领域,应该说,我们还是取得了长足的进步,这样的进步来自于以声音学习为代表的算法突破。这个算法的突破带来语音识别大的改进。同时,另一方面,我们认为当前的对话交互和真正的用户期望还是有明显距离的,对话交互能覆盖的领域比较受限的,大家如果是用智能云交互的产品,你发现翻来覆去就是那几类,音乐、地图、导航、讲笑话等等,其次,有的服务能力还不够好,所以对于未来,我们是走自主研发路线还是平台路线呢?

第一类,自主研发。很多的创业公司或者是团队基本上都是自主研发的,像苹果公司它基本上就是自主研发的模式。

第二类,平台模式。典型代表就是亚马逊的Alexa,这个平台的好处是它能够发动开发者的力量快速地去扩展领域。

两者各有利弊,所以如何把这两者结合在一起,有没有第三种模式。如果有,第三种模式应该具有哪些特点呢?我总结了下,大概有以下几个特点:

第一,由于自然语言理解的门槛比较高的,门槛高指的是对于开发者来说,它比开发一个APP难多了,从无到有开发出来不难,但要做到效果好是非常难的。所以,语言理解引擎要自研。第二,对话逻辑要平台化。对于对话交互,因为它和业务比较紧,每个业务方有自己特殊的逻辑,通过平台化比较合适,让平台上的开发者针对各自场景的需求和交互过程来开发对话。第三,需要建立一套评测体系,只有符合这个评测体系的,才能引入平台当中。第四,需要商业化的机制,能够让开发者有动力去开发更多的以及体验更好的交互能力。

如果这几点能够做到,我们称之为第三种范式,这个平台能够相对快速地,并且开发的能力体验是有效果保证的。这样它开放给用户的时候,无论是对B用户还是C用户,可以有更多的价值。

总结

最后,总结下我们对于研发对话交互机器人的几点思考和体会:

坚持用户体验为先。这个话说起来很容易,但是我也知道,很多团队不是以用户为先的,是以投资者为先的。

降低产品和交互设计的不确定性。如上所说,对话交互最大的问题是不确定性,在产品的交互上,我们要想办法把这种不确定性尽量降得低一点。

打造语言理解的鲁棒性和领域扩展性。语言的理解能力尽量做到鲁棒性,才能够比较好的可扩展。

打造让机器持续学习能力。对话交互我认为非常重要的一点就是怎么样能够让机器持续不断地学习。

打造数据闭环。要能够快速地达到数字闭环,当然这个闭环当中要把数据的效能充分调动起来,结合更多数据的服务。
作者简介:孙健,博士,阿里巴巴iDST 自然语言理解和人机对话负责人,资深专家。

Copyright © 2017-2020 微波EDA网 版权所有

网站地图

Top