智能通信终端的关键技术研究
时间:09-19
来源:互联网
点击:
- 1.3自然语言理解
语音识别与合成都离不开自然语言理解。语音识别中音/字转换和语音合成中字/音转换的正确率都取决于对语言理解的深度。从智能通信终端的应用看,系统有时不仅要正确识别用户的发音,而且要理解它,然后执行相应命令。此外,系统还需产生合适的回答,比如反问、反馈信息给用户。这就会涉及自然语言生成,这是语音合成的更高一级阶段,和自然语言理解更是密不可分。
随着Internet迅速扩张,自然语言理解的任务不仅是建立一种能够像人那样理解自然语言的计算模型,还需建立模拟人脑语言感知过程的理论模式。为使智能通信终端做到对口语和文字的理解,并及时响应,必须以语法与语义相结合,解决有关知识(特别是模糊知识)的表达与利用问题。自然语言理解在智能通信终端中的应用还包括:自然语言查询处理提供各种类型的相似性及或然性匹配,并返回按等级排列的检索结果;矫正利用语音识别自动生成的脚本中的错误;影像标题生成和摘要创建(如略览版的生成)等。
目前语音识别和语音合成采用统计的方法,即通过对大量的语料统计来实现自然语言理解的方法,如二/三元语言模型等非常实用,突破了传统分析方法对不受限语句的理解。
2 智能终端与语音门户
在当今飞速发展的信息社会,人们越来越希望可以通过移动电话等通信终端设备来实现快速便捷的交流,即通过移动电话等通信终端设备接入网络,并操纵远程信息源得到信息或进行电子化交易。目前,采用拨号接入网络的过程耗时长,而语音接入仅需短短几秒,这无疑将大大提高接入速度。另外,这种语音技术不但令使用者无论在何时、何地,都可以利用手中的通信终端设备轻松接入网络,得到所需信息或购买商品及服务,还将大大提高商业自动化程度、降低企业的运营成本、改善服务质量、使商务活动更加便捷。
语音门户,是指基于互联网平台,应用语音识别、合成和转换技术,为固定和移动电话用户提供用语音访问互联网并获取网上信息的门户,是全球互联网发展的最新趋势之一。语音门户融合了语音、CTI、Web、电信、计算机及网络等技术,构筑出新一代语音上网平台,将使更多的用户能够通过各类通信终端快速接入互联网,为企业带来新的业务增长点。从技术角度看,随着自动语音识别(ASR)、文本转语音(TTS)、口语对话等人机交互技术、信息处理技术的发展,以及像语音浏览器、嵌入式语音浏览器等Voice Web技术的成熟,再加上移动用户终端种类与功能的快速增加,使语音门户在通信终端中的应用提供了可靠保证。
(1)分布式语音处理
①分布式语音识别在智能通信终端中,语音识别的首要目标是使用户不用敲击或远离键盘即可轻松访问大部分计算机服务和通信系统。分布语音识别 (DSR)技术采用客户机/服务器方法,整个处理过程分布于终端(如手机)和网络两端。终端执行语音特征参数提取任务,是语音识别系统的前端。提取的特征参数通过数据信道传输至远程的后端识别器。这样,传输信道不影响识别系统性能,信道不变性的目的得以实现。而目前基于因特网上的分布式语音识别是由呼叫中心发展而来,并已在基于包交换的VoIP网络进行了测试。
②分布式语音合成在基于网络应用,特别是客户机/服务器典型模式下,终端与服务端之间的实现之间必然存在矛盾,加上信道、处理资源与用户体验等多方面的综合影响,语音合成的分布式实现了把传统TTS的处理环节分解成为标准化的实现模块:文本分析和语音合成模块。文本分析模块涉及词典、分词、各种语言学处理,将占用较大资源,可放在服务器端实现,即经过处理后形成音韵序列再传送到终端上去;语音合成模块则可以放在终端上实现。由于音韵序列基本上由符号数据组成,与直接传送文本数据占用的信道带宽差不多,不影响传输性能,但却反而使终端摆脱了文本分析的压力,降低了成本。当然,标记语言和数据传送的格式必须标准化,才能得以推广。
(2)语音浏览器
语音浏览器通过语音的方式浏览VXML(基于XML国际标准的语音可扩展标识语言,像HTML定义图形化网页界面一样定义了语音界面)内容,并通过 Transcoder服务器直接浏览网上HTML格式的内容。它主要包括Voice XML、电话语音接入、TTS/ASR资源及Transcoder服务器。
语音浏览器是希望使普通电话作为浏览器终端,应用自然语言交互的方式取得相关的定制信息服务或Internet上发布的Web信息内容,通过电话终端与服务器端的语音接人、ASR/TTS、VXML服务器以及各种Transcoder,构成相当于IE的浏览器,实现语音上网工程的核心组成部分。应用语音浏览器可使我们轻松地用电话、电视等电子或电气设备走进互联网;在将来,它还可支持其他模式和媒体,如用笔、图像和传感器作为输入,用活动图像和激励控制作为输出;便携式语音浏览器可在任何地方使用,网上信息便随手可得,特别是那些有电话或移动电话的用户更是如此;为盲人用户提供方便的实用接口,使他们获得和正常人一样的工作空间;跨越各种平台,像电脑、电视、电话(包括移动电话)等,使人们随时随地获取所需的网上信息,并用语音表达出来。随着其中各项技术的发展、成熟和完善,语音浏览器市场将会迅速发展起来。
电子 神经网络 自动化 嵌入式 传感器 机顶盒 数字电视 相关文章:
- 变革电信网网络安全框架 (01-03)
- 浅谈IPv6技术的若干问题(01-09)
- LG电子低成本CDMA手机的设计原则剖析 (01-12)
- 专家教你做个病毒高手(04-30)
- 数据库归档要考虑的四大问题(05-26)
- 5个步骤成功加密电子邮件(07-18)