Synopsys or Cadence的数字后端布局布线能用CUDA加速吗?
目前肯定不行吧。 EDA tool哪有针对gpu优化代码的呀,各种算法要从cpu移植到gpu,没那么容易,关键eda公司没动力啊
据说有在做,第一个做出来CUDA加速的EDA应该是mentor还是magma的一个验证工具,好几年前了,验证类应该比实现类算法更容易分割一些
不过问题是,要规模足够大才有意义啊,小芯片一天跑完个验证或者设计,直接用一台普通x86服务器把所有任务都对付了,谁愿意额外买GPU服务器。所以只有几家大公司才可能成为这种加速的客户,这个市场还不如云服务器市场大
如果换个牛逼的显卡,顶的上几个CPU也不错呀。
利益。
要看到会损害谁的利益。
损害谁啊? Intel吗? 就算上 CUDA一样要用 CPU啊?
cuda要求每个线程上计算独立,目前的routing算法支持的不好
这需要算法支持啊,EDA公司都很保守的,不会投入太大精力去开发算法,只能等
学校和教授了,只要客户没有人催着要,都不是问题。Torlies说的也是一个重要
方面,现在大家都在观望gpu,实际客户都不是很上心。。。EDA也没动力
哎。 其实仔细想想, 这是提高全人类的效率啊。
route并行算法可不好做,规则之间太多关联了
前面做的决定会影响后面,这样的流程很难并行
.74
让cpu干分配任务的活, 让 GPU 干苦力呗,。。。现在一跑routing就一天, 真是等不了了。
浪费绳命啊。。。。关键要跑好几十遍。。。。
问题就是基于目前的算法没啥办法让GPU干苦力
没啥不可能, 就是那群 title所谓 scientists 的偷懒呗。 弄个 fft 啥的变换下运算域说不定就行了。
可以multi core multi host
你design多大?大了为啥不走hierarchical?
也不是太大, 但有严格的面积要求, 东西摆不开了,都8层了。。。
那你说个屁。。。
人为的给tool增加困难,然后再说tool不够快。最恶心的一类用户
靠, 多出的面积你给出钱呀? 明明是客观要求好不好。 照你这么说,那所有的客户都是人为增加困难, 面积足够大的话, 用手都连好线了, 要你tools干P用啊。。。
客观要求怎么了,你确定你的客观要求就合理了么。我看到过无数次pm都傻逼兮兮的把utilization搞到fix hold之前就88、89%的。metal还不舍得多加。
你要是已经出现hot spot的话,tool需要的时间就是几何级数增加的。
要cost down,还要fast runtime,一个license才卖你1-2个M USD,x1000还差不多
不然别的design house怎么活?
说白了还是计算能力受限, 应该去骂造 cpu 的才是, 至于人类的欲望, 那是无止境的, 你控制不了。。。
这种沉没成本太大的事情,换谁谁也不会去做吧
这个说的是正经的
GPU说白了是一堆简单但是数量庞大的小CPU拼起来的
彼此之间共享数据非常困难
用来处理3D的顶点和像素等数量庞大但彼此无关联的数据很适合
但处理routing这种需要全局考虑的数据就很困难了
你要知道,如果不是一直在GPU上跑,光是内存到显存的数据交换就累死你
GPU计算不能用内存数据的哦,全都要装进显存算完再拿出来呦
进进出出很费力哦。。。