微波EDA网,见证研发工程师的成长!
首页 > 硬件设计 > 嵌入式设计 > 基于TalusVortexFX的32/28纳米节点设计方案

基于TalusVortexFX的32/28纳米节点设计方案

时间:12-16 来源:互联网 点击:

入PVT(工艺、电压和温度)项目范围。

对于以更早期技术节点所创建的器件来说,晶粒间与晶粒内PVT差异可以忽略不计。先做假设,然后基于整个芯片表面具有一致的工艺变异这一事实、基于整个晶粒上具有稳定的核心电压和温度等环境条件这一事实来简化工作是有可能的。基于这些假设,通过采用一系列bese-case条件(最高允许电压、最低允许温度等),确定每条路径bese-case(最小)延时会相对容易;同样的,通过采用一系列worst-case条件(最低允许电压、最高允许温度等),确定每条路径worst-case(最大)延时也会相对容易。

图6.在32/28纳米节点需要解决大量模式和角点。

如worst-case和best-casePVT等特定系列条件就是我们俗称的“角点”。在32/28纳米技术节点,晶粒间与晶粒内PVT差异十分明显,解决大量模式和角点的工作是必不可少的。而且,前文提过的低功耗设计技术还会让这一问题进一步复杂化。例如:在多电源多电压(MSMV)技术情况下,可能一个电压岛的电压值为其允许电压范围内最低电压,另一个电压岛的电压值为其允许电压范围内最高电压,而其余电压岛的电压值则会在这两者之间。又如:有的芯片具有不同操作模式、拥有的一个或多个电路模块位于在电源切断的晶粒中心都将导致所需分析的角点情况显著增加。

目前工具的问题在于:实现期间,芯片必须可在MMMC前景下进行优化。许多现有系统通过先考量已假设的worst-case情景、然后对别的条件进行优化的方式来着手处理优化问题。遗憾的是,这可能导致过度悲观主义,造成次优性能。甚至更糟的是,如果这些关于哪些是worst-case情景的假设是错误的,那么结果可能是得到完全不管用的芯片。Talus1.2内置有自带MMMC处理功能,这意味着优化过程不会漏掉任何情景。此外,Talus1.2的高速度和大容量还意味着,它能够考虑到的不只是较小子集的实现情景,而是这款工具需要处理的整个系列的签核情景。因此,Talus1.2可提供更好的性能和更短的实现周期。

以DistributedSmartSync技术增强TalusVortex的性能

前文所提及的物理实现流程每个步骤都是属于计算密集型问题。而且为了解决伴随技术节点而增加的复杂性,每个节点必须执行的计算量也在提高。此外,当器件中所集成的功能越来越多时,设计的规模和复杂性会随着每个节点而提高,物理实现相关的计算需求也会相应增加。

再有一个因素就是:功能模块的尺寸(为实现模块功能所需的单元数量)也会随着每项功能中包装进越来越多特性而不断增加。一些物理实现团队偏爱层次化方案,而另外一些团队则更喜欢使用“扁平化”方案,因为他们感觉在使用层次化方案时放弃了太多东西。

如果工具具有处理更大型电路模块的能力,那么生产率就可得到即时的提升。例如:定义和微调层次化模块间约束是极为耗时的资源密集型工作。如果这些工具具有处理更大型电路模块的能力,那么就不需要定义子模块间约束,因为不会有任何子模块存在。这会大大提高生产率。

问题在于:多数布局布线解决方案都局限于只能处理几百万个单元。这常迫使物理实现工程师由于工具的局限性而不得不人工将电路模块进行分割。而这也对工程师生产率造成了影响。

除非通过某些方式进行增强,不然的话即便目前最先进的Talus1.2布局布线解决方案的实际容量也只在200万到500万个单元之间,所提供的生产率为每天100-150万单元。结果会造成一种由容量驱动的生产率差距。为了处理32/28纳米节点设计,实现包括1000万以上个单元的扁平电路模块是必不可少的,如图7所示(另见侧边栏)。

图7.物理实现工具对扁平容量需求永不满足。

在过去,一直是通过提供多线程功能来增强物理实现工具的容量和性能。在有些情况下,这些功能是被“生搬硬套”到的传统工具上,效果有限。相较之下,Talus1.2中所有工具均完全内置有自带的多线程功能。

前文已说过,多线程对工具的作用十分有限;基于阿姆达尔定律(Amdahl’slaw)等计算机科学定律,(伴随在其核心运行的每个线程)线程的数量越来越多所起到的效果却越来越小。简单来说,就是告诉我们,任何程序的加速均会受到并行数量的限制(也就是说,程序的最长序列片断关系到程序的其它部分),如图8所示。

图8.阿姆达尔定律反映了多线程的局限性。

对于被用来创建ASIC/ASSP/SoC器件的物理实现工具来说,这些工具的并行部分约占到了50%到75%。就如我们从图8中所看到的“甜蜜点(sweetspot)”,而在best-case情景下,使用8-10个处理核心,只可获得约3倍的加速。

幸运的是,通过将物理实现任务分发到多台机器上就可

Copyright © 2017-2020 微波EDA网 版权所有

网站地图

Top