量身订制的DSP元件设计方案
静态电压调整
若应用的效能需求较低,元件也可在较低电压下操作。举例来说,若DSP是在1.2V电压下以720 MHz速率工作,它也能使用1.1V电压并以600MHz频率操作。由于功耗与电压平方成正比,在1.1V电压下以600MHz速率操作的功耗只有720MHz功耗的(1.1V/1.2V)2,大约是84%左右。另外,操作功耗也会因为时脉频率降低而减少两成。
动态电压/频率调整
这种技术让电压随着频率而减少以进一步节省功耗。频率的切换同样必须非常小心,元件应先将时脉切断,然后才改变操作电压。动态电压
/频率调整技术非常适合可携式应用。
电压域
多域的观念同样适用于电压,设计人员可以根据效能需求将晶片分成多个部份,而每个部份使用不同的电压。由于不同的电压域必须以隔离电路分开,保护它们不受其它电压域的损害,因此这种技术用于设计时必须相当谨慎。它们还必须提供转换电路,用来转换跨越不同电压域的讯号。多电压域需要多组电源,然而晶片内建稳压器的效率通常都比不上电路板层级的电源供应器,因此这类设计多半需要由电路板供应多组电源,这正是多电压域技术的缺点之一:因为电路板需要增加多个电源层,使得设计复杂性大幅提升。
电源闸控(power supply gating)
电源闸控又比时脉闸控技术更进一步,它会直接切断晶片闲置电路的电源。由于这种技术更复杂,又需要隔离电路,因此通常会用于比时脉闸控技术(以个别电路为单位)还大的范围(多半以模组为单位)。这种技术和多电压域技术也有所不同,其隔离电路会内建于晶片,避免增加电路板设计的复杂性。
操作点技术的应用范围
上述技术是否有用,端赖使用者是根据电池寿命或最大功耗来评断应用系统的优劣。某些技术几乎对所有应用都有帮助,例如多时脉域和多电压域技术只需用到时脉频率和电压,所以任何应用系统都可以採用这两种技术。域的数目只会受到这些技术所带来的设计复杂性限制,多电压域还可能受到电路板复杂性的影响。同样地,多数元件的电路并非都是在最大负载条件下操作,因此时脉闸控技术(尤其採用自动控制方式的技术)在许多应用都能发挥作用。静态电压调整对所有应用都有好处,因为元件只会在提供所需效能的必要电压下操作。
应用系统若以电池为电源,并提供多种操作模式,那么频率调整和动态电压/频率调整技术就能发挥最大作用;另一方面,这些方法对于重视最大功耗的应用却没有太大用处。除此之外,电源闸控对于这些类似于基础设施的应用可能也没有帮助,因为这类应用的元件很少会有大片电路处于闲置状态。
选择适当架构
调整应用功耗的另一种做法是选择最适当的功能整合度、运算处理单元和记忆体架构。
週边和记忆体的整合
元件和外部零件需要透过电路板互传讯号,有可能是系统功耗的主要来源,因为经由电路板传送讯号需要比晶片功能整合还高的电压,电路板讯号线的寄生电容也会造成功耗。
运算处理单元的调整
以系统单晶片为主的现代元件可以选择不同类型的运算处理单元:
DSP
专门执行讯号和影像处理演算法的处理器,内建多组应用最佳化硬体运算逻辑单元和乘法器,能以极高效率执行标准讯号处理演算法。这类元件具备完整的可程式能力,可以轻松支援未来出现的新标准。
通用处理器
ARM处理器就是例子,其主要用来执行一般性功能,例如图形化使用者界面、网路堆叠(network stack)和整体系统控制。由于它们不必整合DSP功能所需的运算处理单元,所以执行一般性功能时功耗就比较小。
特殊用途硬体协同处理器
只包含特定功能所需的算术单元和控制电路。如果应用功能的定义很明确,又不太可能改变,即可将该功能整合到硬体协同处理器。举例来说,整合了Viterbi和Turbo处理器的DSP,便可专门执行3G基地台标准所要求的前向错误更正(FEC)。
今日的系统单晶片多半会整合前述多种运算处理单元。有些架构会採用多种不同类型的运算处理单元,然后将不同的功能交给最适当的核心执行。DSP可以高效率执行讯号处理,RISC则适合处理系统控制和使用者界面等工作。由于每个运算处理单元都以实际所需的速度执行最擅长的工作,故能将功耗减至最小;相形之下,若只用一个运算处理单元执行所有功能,其时脉频率就必须更高,同时还要包含更多硬体,其中有些部份可能经常处于闲置状态。换言之,这类设计的工作效率必然较低,而在工作效率就等于电源效率的情形下,其功耗必然更高。
记忆体系统的选择
元件若想避免存取外部记忆体,也可将应用所需的记忆体全部整合至晶片内。然而视讯或影像系统之类的应用却需要极为庞大的记忆体,将它们全部整合至晶片所需的成本可能远超过直接在电路板上增加DRAM的费用。这类应用可以利用快取架构来减少外部记忆体的存取次数,进行降低系统总功耗。
就算元件包含全部所需的记忆体,快取也能帮助它们降低功耗。这类元件可以将少量的第一层快取记忆体直接连线到处理器,使其储存主记忆体中最常用的内容。主记忆体则是第二层记忆体,其速度通常较慢,所用的记忆体方块也比第一层快取更省电。由于处理器的多数存取动作都会命中第一层快取记忆体,这些记忆体又採用电容值较小的结构,所以每次存取动作的功耗就变得更低。
- 在采用FPGA设计DSP系统中仿真的重要性 (06-21)
- 基于 DSP Builder的FIR滤波器的设计与实现(06-21)
- 达芬奇数字媒体片上系统的架构和Linux启动过程(06-02)
- FPGA的DSP性能揭秘(06-16)
- 用CPLD实现DSP与PLX9054之间的连接(07-23)
- DSP+FPGA结构在雷达模拟系统中的应用(01-02)