如何为多种无线标准设计可编程基带设备
SIMT架构利用多重复数SIMD执行簇,如4路复数乘加器(MAC)和4路复数算术逻辑单元(ALU)。每个SIMD簇能够独立于其它的执行单元处理一个任务。
为了能协同各向量的操作,一个分布式内存被使用。系统的内存被分割成若干个具有独立的地址产生单元的内存段,与片上网络一起提高了内存部分的功率效率。
片上的网络由受限的四通开关来实现,直接受软件的控制。因为允许软件工具使用静态调度算法,所以无需仲裁器且其性能是可以充分预期的。
所述处理器是由RISC内核控制的,它包含指令分发逻辑和支持多上下文的功能。RISC内核执行所有的控制流功能以及整数型指令。
SIMT处理器管理所有的复数型处理函数,这些函数介于ADC/DAC和FEC单元之间。处理器在RISC内核和一个数字前端加速器外增加了两个SIMD单元,一个是4路CMAC,另一个是4路CALU。
SIMT架构的处理器已经在实验室的环境中得以实现。这个开发出的芯片总共包含1.5M比特内存,被分配为43k word用于复数存储器,4k word用于整数存储器,2k word用于程序存储器。当单个的向量指令执行计算时,程序存储器的利用率是非常高的,如执行一个向量的复数点乘,或一个完整的FFT运算层。
本架构合适于在典型的仅有2k word的程序存储空间和少于8k word的但完整的WiMAX协议栈内执行完整的DVB-T/H协议。
可编程能力
可编程能力赋予了硬件的重利用不仅仅在于不同的无线通讯标准之间,还包括不同的处理流程部分之间。通过硬件的复用,可编程的解决方案比硬件连线的方案减小了硅片面积,甚至比只需实现单一标准的硬件连线方案更小。更小的硅片也导致了更低的功耗,这是因为减少了漏电及片上通讯的功耗。
使用本文所述的SIMT架构的面向移动WiMAX和 DVB-T/H所开发的处理器已经在一个完整的接收器上得到了实现。结果是 - 相比于尖端的硬件方案,用于运行31.67Mb/s的DVB-T业务的基于SIMT的处理器估计少了18%的硅片面积和21%的功耗,当与可编程方案比较,典型的差异在尺寸的50%和70%之间。
通过算法映射,调度算法,以及在实际硬件上进行的模拟和测试,可以实现对WiMAX的支持。与其他可称得算是尖端的解决方案相比较,基于SIMT架构的方案被证明具有更高效的面积和功率利用率。
除了借助于现代合成技术和后端工具的低功率物理材料设计工艺之外,低功耗是通过结构级的设计而不是通过使用特殊的低功耗工艺(器件)获得的。
通过使用向量指令和分散的内存系统,增强了数据和控制的局部性,因此SIMT架构减少了控制的开销。内存访问功耗由于仅使用小型单端口存储器和减少了内存访问量而减少。
不采用任何优化和现代功率控制技术,在实验室中,完全可编程的DVB-T/H 基带处理器原型机被实现在11平方毫米,0.12微米的CMOS芯片上,它包括1.5M比特的单端口内存和200k逻辑门电路。
DVB-T/H基带原型机当承载最大数据流,31.67Mb/s时所测出的功耗为70毫瓦,运行频率为70MHz。在原型机上所作的工作说明本架构在尺寸和功耗上都强于以往的非可编程 DVB-T/H解决方案,甚至可以忽略相当程度的在结构设计上所做的优化。
SIMT付诸实现
SIMT描述的架构和图示过去一直是实验室工作的一部分。现在可用于完全硬件的方案中,这些方案被用于无线半导体制造业中,使用Coresonic公司的LeoCore工艺把完整的WiMAX基带功能整合到WiMAX个人可携式设备中(见图2)。

图2:Coresonic公司所提供完整解决方案的WiMAX个人便携式设备,从RF接口直到CPU中运行的MAC层接口。
此设备支持移动WiMAX802.16e-2005,移动系统概要1.4版, 此版本也支持其他的模式,如802.16d和802.16j.
设备执行所有从ADC/DAC接口到FEC的工作,包括数字前端信号调节,同步,MIMO信道估计/补偿,纠错和卷积码。
图中所有的构建方块实现了从RF接口至CPU上运行的MAC层完整的解决方案;这个密集处理阵列由硬件完成用以把MAC CPU的负荷减到最小。除了硬件之外,也提供了固件来支持多种不同的标准,更进一步减少了开发的时间和风险。
结论
综合地说,本文所述新的SIMT架构为整合出高效的复合基带处理器提供了一个方法。作为这个方法的一个部分,有着大量核心构建块,围绕它们补充有额外的加速器,接口和存储块来构建所需要的方案。
本架构克服了数据处理,数据流和易编程性的挑战,展示了一个极精炼的4G基带解决方案。其效果可使一个完整的解决方案尺寸达到其它方案中高速指令缓存器一样小,且只需很低的时钟速率,但提供了更高的功率效率。
通过使用这样一种经过特别优化的用于多模无线基带处理的架构,可编程解决方案将能支持4G等多种无线标准,如WiMAX,而功率和空间利用率相当于或优于硬件解决方案。
基于SIMT架构的处理器可以单指令流并行处理 - 消除了为支持多标准而产生的对多个DSP的需要 - 且能与设计者自己独有的产品设计结合在一起来提供一个高附加值的组件。
- 应用于手持设备的无线调制解调器电源(02-20)
- CMOS低噪声放大器中的输入匹配研究与设计(08-19)
- 无线音频转发器(10-14)
- 用音频信号实现无线传感器网络节点间距测量(10-01)
- 双电机无线遥控电路(06-01)
- 单片机无线串行接口电路设计(07-02)
