Amazon Echo拆解,引以为豪的语音控制都有啥猫腻?
Erickson补充说,"连接能力至关重要,因为它涉及哪些资料可被撷娶传送与接收云端资料的速度与可靠度等。由于速度/响应的可用性因素,它直接影响到与扬声器之间的互动有多么"即时"。因此,Wi-Fi的吞吐量、服务品质(QoS)与范围的改善,都将有所帮助。"
所有的"本地"(local)智慧功能是由TI DM3725进行处理。Hackenberg指出,"这是一款专为STB、TV、显示器、视讯游戏系统等各种多媒体应用而设计的系统单晶片(SoC)。"
DM3725是一款以ARM Cortex A8为基础打造的元件,并整合TI的C64x+DSP与3D绘图加速引擎。"Cortex A8是一款成熟且经济型的应用处理器,但又完全足够用于本地执行简单的任务,"Hackenberg表示。
然而,"如果应用变得复杂,而不只是一款扬声器这么单纯,可能就会有所变化。"
Amazon Echo Dot主板
整合DSP
根据Hackenberg,这颗SoC的关键就在于整合了DSP,甚至可能是GPU。
"在一个典型的设计中,存在多个输入感测器(主要是麦克风)。整个音讯输入首先经DSP高度滤波,使系统快速地理解用户的语音和环境杂讯之间的差异,"他说。
"它甚至能够解读相对于该装置的位置或甚至发话者是谁;它还建立了一种模式,能够经过处理以匹配该模式(通常发送至云端),"他补充说。
但是,GPU做什么呢?
Hackenberg认为,"对于本地智慧,GPU可以用于更简单、但快速且高效的本地模式匹配。"
这可以让装置仍然回应所储存的控制模式,例如"降低音量"、"切换频道"或其他简单的控制,而无需网路连接,他解释说。 "接着,应用核心根据所需提供的回应、启动/关闭所需的输入或控制以及必须显示的内容等条件来执行应用程式。"
麦克风阵列
Amazon Echo和Dot之所以吸引人之处在于它使用了7麦克风阵列。Amazon声称,Echo和Dot由于使用了多支麦克风和波束成型技术,因而"能在整个室内都听到你的声音--即使是正在播放音乐的环境下。"该公司还表示,Echo是一款专业级的调音扬声器,能以360°沉浸式音效充满在整个房间中。
根据IHS Markit负责MEMS和感测器的资深分析师Marwan Boustany表示,Echo采用了楼氏电子(Knowles)的MEMS麦克风。
Dot采用7支麦克风阵列
Boustany指出,为声音频率提升其讯号杂讯比(SNR)、匹配和性能,将有助于远场音讯撷取,同时改善语音辨识。
但最终,"演算法才是实现更优质语音辨识的真正关键,"他说,"所谓的『智慧』就在于云端可能持续作为关键应用,而本地处理则可以提高对于简单/预定义片语(如Hey Siri等)的辨识能力。"
他以Cypheras为例表示,"这一类的软体供应商将有利于智慧家庭系统(如Alexa)中的语音辨识功能。"
Amazon Echo Dot
竞争日益加剧
以供应商来看,目前有几家提供微控制器(MCU)和连接用ASSP的供应商可能在此领域展开竞争,包括Apple、博通(Broadcom)、赛普拉斯(Cypress)、微芯科技(Microchip)、恩智浦(NXP)、瑞萨(Renesas)、意法半导体(STMicroelectronics)以及芯科科技(Silicon Labs)等。Boustany表示,"802.11n与BT 4.0的组合并不常见,但有些设计针对较低成本的解决方案或许将会只用蓝牙。
媒体处理器较为棘手。虽然多家行动装置应用处理器供应商都可提供,但对于简单的应用来说成本太高。根据Hackenberg的观察,供应商们可能会选择不提供性能相当的DSP或模式匹配功能。
"我可能会考虑采用Apple Ax、Broadcom BCM7xxxx、海思(Hisilicon) Hi3xxx、NXP i.MX、联发科MT8xxx、意法STiHxxx、高通(Qualcomm)Snapdragon等。当然,TI或许在成本方面具有最佳DSP支援(对于语音辨识至关重要)的优势,但其他的这几家供应商也在不断地缩小差距中。"
XMOS相信该公司将在这个市场上获得动能。对于诸如Echo这一类的语音助理产品,提高性能的关键在于远场语音撷取能力、波束成型与处理速度等。Neil认为,"凭藉着大量的处理能力和嵌入式DSP,我们的XMOS单晶片元件提供了可扩展和差异化的解决方案。"
XMOS xCore语音介面案例
- AMAZON WEB SERVICES 在亚太地区推出其云计算平台 (04-01)
- IBM软件欲融入Amazon EC2云计算平台(01-17)
- 宣言风波看开放云计算(03-03)
- 开放云计算宣言已正式发布 各方观点不同(03-07)
- 亚马逊推出弹性计算云新特性(04-20)
- Urban Airship引领可操作的互动推送通知新时代(07-28)