基于TI的OMAP平台为个人手持设备开发语音应用
时间:08-02
来源:互联网
点击:
I的OMAP平台为开发个人手持设备的语音应用提供完美的解决方案。这种低功耗的OMAP架构把用于语音的DSP信号处理功能与RISC处理器的通用系统性能融合在了一起。设计了开放式软件架构,以鼓励开发语音引擎、语音应用和多媒体等补充应用。包括语音识别器和原型应用等开发支持,可帮助开发商快速建立其自己的产品并缩短产品上市时间。OMAP平台可确保开发商能够通过轻松、灵活添加语音应用牢牢把握个人手持设备的增长机遇。
语音技术的应用正在不断增加,从而为应用开发商在手持设备、移动设备和无线个人设备中增加高价值的功能带来了难得的机会。今天的个人手持设备语音大多时候仅仅局限于语音拨号,但是已经出现了适用于更广泛开发语音识别和文本到语音应用的技术。打算增加语音功能的开发商需要熟知语音技术的方方面面。这些问题不但包括处理和内存要求,而且还包括特定的平台架构和支持如何促进开发过程并缩短上市时间。
利用语音应用增值可带来丰厚的潜在利益。根据各种市场研究公司的估计,未来两年个人手持设备的综合年增长率预计能达到 20%,到2004年全球的总设备交货量将达到7亿件。为了利用增值语音应用敲开这个巨大的市场,开发商必须求助于能够给他们带来高性能、低功耗的底层技术以及能够帮助他们迅速推出新产品的支持。
语音功能为用户提供自然的输入和输出方式,它比其他形式的I/O更安全,尤其是当用户在开车期间。在大多应用中,语音都是键盘和显示器的理想补充,而并不是它们的替代品。例如,在非常嘈杂的环境中,听和说可能都不现实,因此用户可能就必须依赖键盘输入和显示阅读。类似,用户通常喜欢用键盘输入某些东西,如:PIN号码和密码,而不愿意大声说出来让别人也听到。
语音拨号是当今个人无线设备中最常用的语音技术。语音拨号通常无需手和耳朵即可打电话,这是在开车时尤为重要的功能。语音拨号包括名字拨号,即按通讯簿上的名字打电话,另外还包括号码拨号,即说出电话号码。如图1所示,其他潜在的语音应用包括:
1.语音电子邮件?D?D 包括浏览邮箱、利用语音输入写电子邮件以及收听电子邮件的读出。
2.信息检索?D?D股票价格、标题新闻、航班信息、天气预报等都可通过语音从互联网收听。例如,用户不用先进入某个网址并输入股票名字或者浏览预定义的列表,便可以命令:"我的股票报价,德州仪器。"
3.个人信息管理?D?D允许用户通过语音指定预约、查看日历、添加联络信息等等。
4.语音浏览?D?D利用语音程序菜单,用户可以在网上冲浪、添加语音收藏夹并收听网页内容的读出。
5.语音导航?D?D在自动和眼不够用的条件下获取导航的完全语音输入/输出驾驶系统。
语音技术问题
语音系统必须满足某些基本使用要求。很显然,语音输出必须清晰,使用户能够听懂。在给定应用用途中,ASR还必须支持自然语音。何为自然可谓变化无常,包括从逐字发出的简单名字和指令、到说出大量词汇的连续语句。另外,各人的自然语音以及发音方式也不同,因此系统应该能够灵活接受不同说话人说话。识别引擎必须准确,否则用户不会使用这种技术。
语音的系统要求是需要进行大量处理,有可能包含巨大的内存,这取决于所支持的词库。就基于服务器的应用而言,无线带宽的使用会有所增加。这些因素也会影响其他系统考虑。应用的MIPS和传输要求越高,给定系统的功耗就越高,因此会缩短电池寿命或导致更频繁的充电。当应用需要采用处理器外置存储器时,响应时间也有可能增加。
某些应用权衡考虑有助于通过放弃手持设备不必要的功能来降低系统要求。只识别少量词语、分散语音的基于说话人的系统会比识别大型词库、连续语音的基于说话人的系统要求少很多的资源。对其他语言的支持会增加处理要求并且使应用所需要的内存加倍。抗噪音和抗干扰性是重要的特性,但是会增加复杂性和内存要求。
很显然,开发商在增加说话人依赖性、连续语音、词库规模和语言支持等功能时希望尽可能少地降低基本应用的性能。有某些选项有助于减少语音技术中的性能降低,如:分布式语音识别(DSR)。DSR把识别任务分割开,这样手持设备可以把原始语音转换成频谱特性向量,同时服务器执行识别过程。这种方法以及类似的分布式TTS方法依赖于处理方法和传输协议的标准化。尽管这些技术颇有前途,但是,开发商仍然面临个人手持设备中语音应用的有限资源。
因此,为语音等高性能应用选择适当的平台与精心设计应用的功能同样重要。这种平台必须具有强大的处理能力,同时可以实现高水平的功效,不仅仅是在内核操作中,而且在处理内存中也应如此。应该有足够的MIPS来支持多媒体、安全和其他补充应用。提供集成新算法能力的可编程性也很重要。最后,这种平台必须包含为支持模块化应用开发所设计的软件架构,以帮助开发商快速把产品推向市场。
语音技术的应用正在不断增加,从而为应用开发商在手持设备、移动设备和无线个人设备中增加高价值的功能带来了难得的机会。今天的个人手持设备语音大多时候仅仅局限于语音拨号,但是已经出现了适用于更广泛开发语音识别和文本到语音应用的技术。打算增加语音功能的开发商需要熟知语音技术的方方面面。这些问题不但包括处理和内存要求,而且还包括特定的平台架构和支持如何促进开发过程并缩短上市时间。
利用语音应用增值可带来丰厚的潜在利益。根据各种市场研究公司的估计,未来两年个人手持设备的综合年增长率预计能达到 20%,到2004年全球的总设备交货量将达到7亿件。为了利用增值语音应用敲开这个巨大的市场,开发商必须求助于能够给他们带来高性能、低功耗的底层技术以及能够帮助他们迅速推出新产品的支持。
语音功能为用户提供自然的输入和输出方式,它比其他形式的I/O更安全,尤其是当用户在开车期间。在大多应用中,语音都是键盘和显示器的理想补充,而并不是它们的替代品。例如,在非常嘈杂的环境中,听和说可能都不现实,因此用户可能就必须依赖键盘输入和显示阅读。类似,用户通常喜欢用键盘输入某些东西,如:PIN号码和密码,而不愿意大声说出来让别人也听到。
语音拨号是当今个人无线设备中最常用的语音技术。语音拨号通常无需手和耳朵即可打电话,这是在开车时尤为重要的功能。语音拨号包括名字拨号,即按通讯簿上的名字打电话,另外还包括号码拨号,即说出电话号码。如图1所示,其他潜在的语音应用包括:
1.语音电子邮件?D?D 包括浏览邮箱、利用语音输入写电子邮件以及收听电子邮件的读出。
2.信息检索?D?D股票价格、标题新闻、航班信息、天气预报等都可通过语音从互联网收听。例如,用户不用先进入某个网址并输入股票名字或者浏览预定义的列表,便可以命令:"我的股票报价,德州仪器。"
3.个人信息管理?D?D允许用户通过语音指定预约、查看日历、添加联络信息等等。
4.语音浏览?D?D利用语音程序菜单,用户可以在网上冲浪、添加语音收藏夹并收听网页内容的读出。
5.语音导航?D?D在自动和眼不够用的条件下获取导航的完全语音输入/输出驾驶系统。
语音技术问题
语音系统必须满足某些基本使用要求。很显然,语音输出必须清晰,使用户能够听懂。在给定应用用途中,ASR还必须支持自然语音。何为自然可谓变化无常,包括从逐字发出的简单名字和指令、到说出大量词汇的连续语句。另外,各人的自然语音以及发音方式也不同,因此系统应该能够灵活接受不同说话人说话。识别引擎必须准确,否则用户不会使用这种技术。
语音的系统要求是需要进行大量处理,有可能包含巨大的内存,这取决于所支持的词库。就基于服务器的应用而言,无线带宽的使用会有所增加。这些因素也会影响其他系统考虑。应用的MIPS和传输要求越高,给定系统的功耗就越高,因此会缩短电池寿命或导致更频繁的充电。当应用需要采用处理器外置存储器时,响应时间也有可能增加。
某些应用权衡考虑有助于通过放弃手持设备不必要的功能来降低系统要求。只识别少量词语、分散语音的基于说话人的系统会比识别大型词库、连续语音的基于说话人的系统要求少很多的资源。对其他语言的支持会增加处理要求并且使应用所需要的内存加倍。抗噪音和抗干扰性是重要的特性,但是会增加复杂性和内存要求。
很显然,开发商在增加说话人依赖性、连续语音、词库规模和语言支持等功能时希望尽可能少地降低基本应用的性能。有某些选项有助于减少语音技术中的性能降低,如:分布式语音识别(DSR)。DSR把识别任务分割开,这样手持设备可以把原始语音转换成频谱特性向量,同时服务器执行识别过程。这种方法以及类似的分布式TTS方法依赖于处理方法和传输协议的标准化。尽管这些技术颇有前途,但是,开发商仍然面临个人手持设备中语音应用的有限资源。
因此,为语音等高性能应用选择适当的平台与精心设计应用的功能同样重要。这种平台必须具有强大的处理能力,同时可以实现高水平的功效,不仅仅是在内核操作中,而且在处理内存中也应如此。应该有足够的MIPS来支持多媒体、安全和其他补充应用。提供集成新算法能力的可编程性也很重要。最后,这种平台必须包含为支持模块化应用开发所设计的软件架构,以帮助开发商快速把产品推向市场。
DSP 显示器 电子 德州仪器 MIPS ARM LCD USB 嵌入式 相关文章:
- 全面解读 嵌入式DSP上的视频编解码(08-19)
- 基于ADSP-TS201S的图像采集处理系统(08-12)
- 基于Blackfin533的H.264编码(08-18)
- 图形液晶显示模块在嵌入式系统中的应用(09-02)
- 基于DSP和FPGA的电视观瞄系统设计(09-02)
- TI手提多媒体设备解决方案(09-23)