用Data Fusion IP Subsystem提高物联网应用的速度
物联网边界设备的迅速推广,越来越需要低功耗、实时响应的功能,例如传感器融合、图像和语音检测、手势识别以及音频回放。要支持数据资源的融合,就要把RISC和DSP处理高效结合起来。
本文阐述了如何利用那些针对高效DSP性能和超低功耗特性进行过优化和验证的高度集成化数据融合子系统来帮助客户加速开发性能好、成本优化的物联网系统,并加快其推向市场的速度。
传感器融合到数据融合
把多个基础传感器原件结合起来以获取更高维度数据的功能,称为传感器融合。例如,把加速计、指南针和陀螺仪的输入结合起来跟踪3D运动,这种功能在现代智能手机中司空见惯。由于半导体供应商推行把传感器接口集成到很多系统级芯片(SoC)里,有传感器融合技术的系统数量持续暴增。
除了基础的传感器数据处理外,现今的物联网应用需要集成越来越多的功能,比如需要支持语音和手势识别、音频回放和基本的图像检测。实现这些功能需要较高的DSP处理能力,但是同时又必须尽可能降低功耗。数据融合已经成为对诸如可穿戴个人健康与健身设备、无线耳机与音箱之类的物联网边界设备的标准要求。
集成化子系统的优势
集成化水平提高的优势在于可以把芯片厂商的产品区分开来。现在典型的"集成化"解决方案涉及到把各种数据资源的接口合并到一个类似微控制器的架构里。如图1所示,该架构一般包括一个CPU,它通过片上总线连接到外设接口(ADC、SPI、I2C)和片上存储器(ROM、RAM、eFlash)。处理器与标准总线(一般是基于AMBA的总线)相连,所有外部设备则连接到总线上。由于总线延迟和总线上要进行数据通信,处理器与外部设备的数据传输要用三至七个或者更多个时钟。从性能和功耗的角度来看,效率就很低。
图1:独立实现系统与集成化子系统
与基于总线的一般系统相比,配备DesignWare® ARC® EM处理器的集成化IP子系统优势很明显,它既能简化集成,又能减少片上延迟,降低功耗。
ARC EM处理器具备业界领先的功耗/性能效率比--延长对物联网边界设备至关重要的电池使用寿命。ARC EM DSP处理器在基础RISC处理器基础上添加了DSP指令和MUL/MAC硬件,使其具备语音或手势识别和音频回放等实时响应功能。此外客户可以选配FPU、MPU、microDMA,做到灵活的产品实现。
基于ARC处理器的子系统实现用寄存器传输指令替换了对I/O外设的访存类指令,从而可以不使用片上总线接口。外设寄存器复用ARC处理器辅助寄存器的总线映射,把I/O外部设备接口的功能有效地植入CPU内部,就可以淘汰各种总线和桥接器。指令存储器和数据存储器也都可以通过类似的方式与处理器紧密集成,从而淘汰外部总线,减少访问延迟。
ARC处理器和子系统还支持向内核添加任意硬件扩展的组合:CPU扩展寄存器、辅助扩展寄存器或内存映射块。设计人员还可以添加32位自定义指令。
终端用户利用这些高级配置和扩展理念可以创造出高度优化的产品实现。
紧密集成的DMA改善了功耗和性能
诸多子系统可配置选项中有一个紧密集成的mircorDMA引擎。该DMA控制器可以使外设和其它系统资源不经过CPU独立访问内存,甚至在处理器处于休眠模式下。这样可以真正做到节省CPU时钟周期和动态功耗。
为了量化它的价值,我们对比了使用ARC EM处理器的两个基础子系统:其中一个有紧密集成的DMA,一个没有。用一个集成在子系统上的SPI外部设备把一条1800字节的信息传送到环回模式(主发射机Tx -> 主接收机Rx)。两个子系统的CPU时钟频率均设为10MHz,指令和数据存储器(ICCM & DCCM)都是32 KB,测量两种情况的有效时钟周期和动态功耗。
图2显示的是没有microDMA引擎的子系统。图3显示的是紧密集成microDMA引擎的子系统。
测试结果见后面的表1。在稍许损失硅面积(添加microDMA逻辑单元,增加了约10K逻辑门栅和一些存储开销)的情况下,所需的CPU周期数大为减少(符合预期),而动态功耗降低了8倍。
图2:有ARC EM处理器而没有集成DMA的子系统
图3:有ARC EM处理器并紧密集成DMA的子系统
表1:有无紧密集成DMA的子系统的硅面积和功耗的对比
优化的数据融合子系统
新思科技利用上述基础子系统开发出一套IP子系统,面向快速增长的物联网边缘设备市场--尤其是"实时响应"型应用,这一市场要求系统的DSP性能的稳定程度达到能处理复杂的传感器融合、语音和手势识别、图像检测和音频回放等功能的水平,同时又不会受到电池供电设备电量有限的影响。
DesignWare Smart Data Fusion IP Subsystem(见图4)是为处理大量数字模拟传感器数据设计的,他不仅可以作为MCU中的主要处理单元,还可以作为大型SOC中的辅助单元从而降低主处理器的计算负荷。完整的可配置的IP子系统包含ARC EM5D、EM7D、EM9D或EM11D处理器。这个系列的低功耗处理器把RISC和DSP指令与硬件结合起来,满足了高级数据融合算法对大量数据处理的要求,提高包括MP3、SBC、OPUS和AAC LC在内的很多音频格式的性能。
子系统集成的microDMA控制器可以在处理器休眠模式下访问内存和外部设备。此外,子系统还集成了高度优化的I/O外部设备,包括多个SPI、I2C和模数转换接口,进一步减少逻辑门数,降低能耗。
子系统为了简化软件开发而加入了软件驱动程序和丰富的现成DSP函数库,支持滤波器、校准、矩阵或向量、抽取或插值,以及复数运算。设计人员可以在硬件上使用这些传感器专用DSP函数,即把自有的DSP指令和紧密集成的硬件加速器结合起来,提高运行效率,降低功耗。
- 商业智能发动机—数据仓库引擎(05-25)
- Oracle数据库中备份、恢复的概念及其关系(10-26)
- 家乐福选用Teradata数据仓库平台支持零售营销(11-22)
- 打造数据业务链,迎接MobileData2.0时代(04-14)
- 利用SmartFusion2的SoC的数据采集与交互系统应用设计(03-14)