高质量语音处理技术的实现
家庭网络已经从个人计算机联网逐渐演化成包括高级安全和自动化应用在内的更为复杂的系统。家庭网络一度曾是高端豪华住宅的专利,但现在已经开始更多地应用于普通家庭。这些网络将暖气、空调、灯光、家电、娱乐、内部通信、电信、安全和监控系统整合为一个易于操作的统一网络。
基于语音识别的交互式应用(例如综合门禁安全系统以及家电控制功能)是家庭自动化网络的主要特点。此类交互式功能依赖于高质量的语音处理技术,包括声学回声消除、低信号失真和噪声抑制技术。一个设计良好的家庭自动化系统还必须具备扩展能力、为未来发展预留空间、能够灵活地支持现场升级、支持交互式应用、易于使用、成本经济并且非常可靠。
本文介绍了一些家庭自动化系统面对的独特的语音质量性能问题和设计挑战。文中将讨论基于语音处理的家庭自动化网络应用,研究有助于降低设计复杂性的一些关键特性和功能,并分析增强性能对成本的影响。
家庭自动化应用中的语音处理
家庭自动化市场正在从高端豪华家庭进入主流消费群体。尽管目前这一市场仍然处于初期,研究人员依然估计其市场将超过10亿美元。在亚洲、欧洲和北美洲,家庭自动化市场正在以每年10%的平均速度迅速发展。仅欧洲市场,2009年对家庭自动化系统的需求就会翻一翻,达到5亿美元。随着市场的发展,家庭自动化系统本身也不断演化,涉及蓝牙、Wi-Fi、X10、ZigBee和TCP/IP等多种技术。
随着市场和技术的不断成熟,高质量语音处理性能对家庭自动化和安全应用变得越来越重要。语音交互是统一家庭网络的支撑性技术,广泛用于控制家电、通信、安全和娱乐设备。与其它交互方式相比,利用人类语音控制设备让最终用户感觉更舒服更自然。
声学回声消除功能不够好、环境噪声和信号失真使家庭自动化系统可靠工作变得越来越困难。如果语音处理性能达不到要求,语音识别功能就无法正确检测到命令并相应地开/关家电,而语音认证功能也可能失灵,导致用户无法方便地进入自己的家。
电话和内部通信集成
家庭自动化系统越来越多地将电话通信和内部通信功能集成起来。在有些系统设计中,内部通信面板成为主要的通信工具,可用于住房访问监控和免提电话。因此,语音通信技术成为整个系统的重要方面。
高质量免提电话的一个重要特点就是全双工操作和良好的双方同时通话性能。全双工系统支持双向语音信号同时传输,因此交谈更为自然。而半双工系统在双方同时讲话时,只允许功率水平高的一方信号通过,另一方信号被切断。因此同一时间只能有一方的讲话被对方听到,并且通话是断续的,不够自然。
在全双工系统中,如果算法在双方同时讲话的情况下能够连续会聚,就能够获得良好的声学回声消除性能。当算法连续会聚时,随着信号源的移动,算法会跟踪回声路径中的变化。如果算法在双方同时讲话时停止会聚,当双方同时讲话停止时又恢复会聚,那么在算法重新适应新的回声环境时用户会听到猝发回声。
对于数字免提电话来说,获得高质量通话的另一个方面是编码/解码器(CODEC)的选择。正是编码解码器完成信号从数字到模拟的变换,以及反向变换。传统的中等质量数字电话采用窄带编码解码器和8kHz的采样频率。宽带编码解码器采样频率加倍(16kHz),能够采集更多人声分量,从而支持更高的话音质量。
设计高性能系统
1. 克服塑料外壳带来的物理限制
小型内部通信面板由于不占用额外空间,因此越来越多地在家庭设计中得到应用。但受限的面板尺寸会对塑料外壳的设计、麦克风和扬声器的选择、布局和隔离作出很多限制。
在理想系统中,扬声器和麦克风间的隔离应当尽可能好,才能达到最优的性能。但在小型塑料外壳中,两者之间隔离较差带来额外的声学耦合,也意味着更大的回声。
设计人员面临的挑战是既要选择较小的扬声器来适应塑料外壳中的有限空间,同时又要满足大输出音量要求。因此设计人员被迫将小型扬声器驱动到非线性范围。这将导致塑料外壳中的总谐波失真增加。
为解决这一问题,设计人员需要语音处理解决方案能够处理回声路径中的更多失真,从而补偿较差的扬声器性能。能够消除线性和非线性回声的算法允许设计人员驱动更大的扬声器音量,同时还可将失真降到最小。非线性回声消除器将线性回声消除器残留的回声信号与参考信号进行比较,然后减去估算的频率成份。
图1显示的是线性和非线性回声消除的功能框图。该电路能够消除线性回声和非线性失真成份。这样系统就能够避免由于回声路径中的失真而导致声学回声消除性能变差。
图1:线性和非线性回声消除框图。
如果
- 架设家庭网络的四种办法(03-02)
- 家庭网络:技术融合试验田(03-19)
- 融合:家庭网络业务平台与NGN业务(04-15)
- Entropic全新EN3230宽带接入芯片面向CPE设备(03-01)
- IPv6家庭网关的集中控制技术(07-30)
- 卓联为其语音处理解决方案推出ZL38005平台(03-13)