基于多DSP系统互连方案分析
器接口,DSP通过EMIF接外部存储器如SDRAM、SRAM、ROM等。
目前DSP的处理速度越来越高,TMS320C6203的峰值处理能力可达2400MIPS,C641X的处理能力更是高达 4800~8800MIPS。然而在通过HPI连接的多DSP系统中,由于HPI为异步接口,数据传输速率有限,各个传输速率之和 ≤50Mbytes/s,数据传输有时会成为系统处理能力提高的瓶颈,使得CPU或系统输入输出模块产生的大量数据流无法及时送到多个DSP。在多DSP 分布式处理系统中,DSP相互之间需进行大量的数据传输,然而TI的DSP没有高速的片间无缝传输机制,使得相关的任务因等待数据而被延迟,造成系统整体效率的降低。
通过EMIF可实现多DSP全互连系统。目前较实用的有以下几种方案。
共享存储器方案
共享存储器是最简单的互连方案。异步SRAM作为全局存储器由所有DSP、CPU共享,DSP访问SRAM的总线是EMIF。DSP片间通信是通过向共享SRAM中写入和读取数据两个过程完成。但EMIF访问SRAM的带宽有限,这个带宽还是多片DSP、主机分时共享。随着互连DSP数量的增加,每个DSP的平均传输带宽就要降低,总线仲裁也将变得更为复杂。
通过FIFO直接互连方案
在多个DSP组成的全互连方案中,两两DSP之间专用的BiFIFO(双向先进先出存储器)通过EMIF接口互连,DSP各自通过BiFIFO 与主机或外设互连。此方案的优点是能够实现DSP相互之间或DSP与主机之间数据的高速传输,但缺点是DSP需查询多个FIFO的状态,同时,每两个 DSP固定的连接有时是不需要的,使用BiFIFO资源浪费,系统的扩展也比较困难。
通过专用互连芯片(Crossbar)实现多DSP互连方案
可以设计一个专用互连芯片(Crossbar)来实现多个DSP、CPU、I/O器件之间的高速互连。图4所示的互连方案提供了一个按照包路由协议进行寻址交换的机制。专用互连芯片(Crossbar)提供多个异步读写FIFO接口,完成到外部器件的连接和数据包的路由转发功能。DSP通过 EMIF总线访问对应端口的BiFIFO,数据由Crossbar传输到指定DSP,Crossbar同时也给主机和外部I/O模块一个通路。主机通过 HPI访问和控制DSP,也可以通过Crossbar访问DSP。BiFIFO为两个芯片之间数据的突发传输提供了一个双向缓冲区。
图4中Crossbar提供6个高速互连通道,每个通道的数据总线宽度为32bit/16bit/8bit;每个通道的数据吞吐带宽可达 200MBytes/s,每个通道都提供与异步FIFO的无缝接口;Crossbar可以同时提供3对端口到端口的数据传输通道,也可以提供一个端口到多个端口的数据分发;任何具有FIFO接口的CPU、DSP及高速并行I/O都可以通过Crossbar及双向FIFO实现互连。
在本方案中需自定义互连路由协议,互连和路由模块(Crossbar&Router)可以由FPGA实现,每个端口上的BiFIFO可以根据实际需要选用FPGA内部逻辑实现或用专用外部器件实现。多个Crossbar进行互连可实现大规模的DSP阵列。此方案的优点是能够实现多个 DSP、CPU、外部并行I/O等器件之间的数据高速传输,且扩展容易;缺点是FPGA逻辑十分复杂,实现难度较大。
下面是在3G WCDMA基站中使用Crossbar的一个例子。在这个例子中,把上下行链路码片速率级处理和符号速率级处理、编码和译码处理放在一块单板上。码片速率级处理包括上行解扩和下行扩频,由FPGA/ASIC实现;符号速率级处理包括上行链路信道估值、信道译码协议、下行链路信道编码协议等,由DSP实现。
系统构成如图5所示。对下行链路来说,从网络过来的数据通过UTOPIA接口进入Crossbar,然后由Crossbar中转到编码DSP, 在DSP内完成信道编码协议处理,接着通过Crossbar把编码后的数据送入FPGA/ASIC完成扩频,最后输出信号经过上变频并通过天线发送出去。对上行链路来说,经过射频接收和下变频后的数据首先被送入FPGA/ASIC进行码片速率级处理,如匹配滤波、解扩/解扰等,同时一片DSP辅助进行多径搜索和信道估值。在此过程中这片DSP需要和FPGA/ASIC通过Crossbar进行数据的相互传递,经过信道估值和解扩处理的数据再通过 Crossbar送入另外一片DSP进行信道译码协议处理,处理结果通过Crossbar送入UTOPIA接口,接着送到基站控制器(RNC)进行处理。
4 利用TMS320C5X/C6X的McBSP组成多DSP互连系统
McBSP称为多通道缓冲串口,它有一个发送端口和一个接收端口。多个DSP可通过McBSP连接到一个串行时隙交换芯片,采用时隙交换的方式进行数据交换。数据的收发以帧为单位进行。每个发送帧分成n个发送时隙,不同的发送时隙对应不同的接收DSP,例如SP0的发送端口在时隙1给 DSP1发送数据,在时隙2给DSP2发送数据,在时隙n给DSPn发送数据;每个接收帧分成n个接收时隙,不同的接收时隙对应不同的发送DSP。例如SP1的接收端口
- MIMO-OFDMA无线基站的DSP-FPGA系统划分(06-30)
- 基于DSP的3G LTE应用实现(08-02)
- 3G系统中Turbo译码改进及DSP实现(01-26)
- 基于嵌入式Linux的3G无线视频终端的设计与实现(07-10)
- 3G LTE的DSP应用实现(01-21)
- 基于Android的车载监控管理系统设计(02-09)