通过语音接口技术，让你的产品与AI挂钩

时间：08-01 来源：德州仪器点击：

驱动Alexa的许多"智能设备"都具备云计算功能，该功能由开发商提供，可以利用Alexa的语音处理能力将驱动输入至现有的云应用。例如，如果你告诉Alexa需要订一个披萨，你最喜爱的披萨店则需要为Alexa编制一项"技能"。该项技能是一个可以在你订披萨时定义工作内容的代码。当你每次订披萨时，Alexa都会调用该技能。该技能嵌入了可以为你下单的在线订购系统。同样，智能家居设备制造商必须执行Alexa如何与本地设备和在线服务相互作用的技能。亚马逊自带许多这样的技能，加上第三方开发者提供的技能，即便你没有开发任何技能，Alexa设备仍然可以非常有用。

混合：互联自动调温器

有时，即使没有连接互联网，我们也有保证设备的某些基础功能可以正常使用的需求。例如：在连不上网的时候，如果自动调温器不会自主调节温度，这就会是一个很麻烦的问题。为避免这种问题的发生，一个好的产品设计师会设计一些本地的声音处理功能，在功能上实现无缝衔接。为了实现此功能，系统必须具有DSP，例如用于本地语音处理的C55XX和用于将已连网的接口连接至云端的ARM处理器。

什么是语音触发？

你也许已经注意到了，直到现在我们还没有提及新一代语音助手真正神奇的地方：那就是始终关注"触发词汇"。它们将如何追踪你在房间内任意位置所发出的声音，或是当设备播放音频时，又如何听到你的声音？实现这些其实并没有什么特别神奇的地方，只需要一些智能化软件。这类软件独立于云端的语音接口，也能在系统离线的状态下运行。

这个系统最易理解的部分就是"唤醒词汇"。唤醒词汇是一个简单的本地语音识别程序，通过持续性采样，在接收的音频信号中寻找单个词汇。由于大多数语音服务均乐意接受不含唤醒词汇的音频，因此该词汇不需要指定任何特殊的语音平台。因为实现这种功能的要求相对较低，所以通过利用Sphinx或KITT.AI等开源数据库在ARM处理器上即可完成操作。

为了听到你在房间内任意位置发出的声音，语音识别设备采用一个叫波束成型的流程。最重要的是，通过对比不同声音的到达时间和麦克风间的距离来确定声音的来源。一旦确认了目标声音的位置，设备就会采用如空间滤波等音频处理技术来进一步减少噪音并增强信号质量。波束成型的实现取决于麦克风的布局。真正实现360度识别则需要一个非线性麦克风阵列（通常是圆形）。对于壁挂式设备而言，仅需两个麦克风就能启用180度的空间辨别。

语音助手的最后一招是采用自动回波消除（AEC）。AEC在某种程度上类似于噪音消除耳机，但应用恰好相反。该算法是利用已知的音乐等输出音频信号来实现的。在噪音消除耳机利用这点来消除外部杂音，AEC消除了输出信号对输入信号在麦克风上的影响，该设备能忽略自身产生的音频，且无论扬声器播放何种内容，其都仍然能接收。实现AEC需要大量的计算，其中在DSP中效果最佳。

为了实施唤醒识别、波束成型和AEC等以上提及的所有功能，则要求ARM处理器配合DSP共同工作：DSP增强了所有的信号处理功能，而ARM处理器控制设备逻辑和接口。DSP可在执行输入数据管路方面发挥重要的作用，由此最大限度地减少处理的延迟，从而提供更好的用户体验。ARM可以自由运行，如Linux等高级操作系统以控制其它设备。这样高级的功能全部发生在本地，若使用云服务，将只接收包含最终处理结果的单个语音文件。

上一篇：影响CAN总线节点数的因素：为何考虑CAN接口负载？
下一篇：周立功手把手教你学C语言编程：用数组，构造一个双重指针

AI 语音接口 ti 相关文章：

栏目分类