微波EDA网,见证研发工程师的成长!
首页 > 硬件设计 > 行业新闻动态 > e世绘 | 谁会成为英特尔数据中心业务的掘墓者?谷歌TPU算一个!

e世绘 | 谁会成为英特尔数据中心业务的掘墓者?谷歌TPU算一个!

时间:03-11 来源:3721RD 点击:
云端增长正在加速成长,英特尔还在享受着在服务器芯片领域的垄断地位; 然而,随着摩尔定律放缓,云计算向更加复杂的应用进行转移,因此英特尔的领导地位会受到威胁; 其它解决方案,如GPU和FPGA,现在的谷歌TPU可以更有效地解决云计算不断变化的需求;

摩尔定律的放缓可能会产生重要影响,尤其是对英特尔来说。其在手机领域已经失手,PC销量在不断下滑,但是迄今为止,这些大部分已经从服务器领域获得拯救,因为在该领域它还处于垄断地位。

后者已经受到了来自英伟达的GPU的攻击,这些GPU执行了一些任务,尤其是并行处理了与人工智能相关的大数据任务。

英伟达在数据中心行业的发展可圈可点,去年的增长率高达126%。

英特尔正在进行反击。如今数据中心的芯片优先采用新的处理器平台(节点),并且它已经收购了Altera,可以提供FPGA技术以加速云计算。赛灵思是这条路线的另一个玩家。

FPGA是摩尔定律放缓打击通用CPU的一个手段,因为它是"现场可编程",也就是可以在生产后根据用户需求重新配置。

英特尔FPGA能够用于加速大型数据系统的性能。英特尔FPGA通过提供定制化高带宽、低延迟连接到网络和存储系统,实现高速数据处理。另外,英特尔FPGA提供压缩、数据过滤和算法加速。通过带有OpenCL的英特尔FPGA SDK,你可以为计算和存储系统快速研发加速方案。带有OpenCL的英特尔FPGA SDK能够让软件开发者很容易通过FPGA进行设计,它允许工程师利用高级语言进行快速开发。

谷歌似乎找到另一种解决这个问题的方法。所采用的方案不是像CPU和GPU这样的通用芯片,也不是FPGA等可编程芯片,而是专用芯片,如专用加速器。

Google正在做这件事,介绍(见文件)Tensor处理单元(TPU):

"谷歌的TPU在机器学习测试中超过英特尔的Xeon和英伟达的GPU一个数量级。TPU和基准测试表明,它的速度比商业芯片快了15倍,性能提升30倍。"

令人印象深刻的是,所使用的基准并不是最前沿的(本文认为,2015年的测试,英特尔已经提供了14纳米CPU,而Nvidia拥有新的16纳米GPU),因为测试是在2015年进行的,但是再一次,TPU本身也不是特别尖端的(在频率和处理器节点方面):

"40-W TPU是运行在700 MHz的28 nm芯片,旨在加速Google的TensorFlow算法。 其主要逻辑单元包含65,536个8位乘法累加单元和24 MB缓存,提供每秒92个tera操作。"


把产品迁移到更小的节点上会提高性能,还有其它技巧:

"如果我们比较更新的芯片,显示,我们可以通过使用K80的GDDR5内存将28nm、0.7GHZ、40W的TPU性能提升三倍。(成本增加10W)"

如果不这样的话,随着TPU的成熟,它的性能可能会超过竞争对手扩大自身优势:

"该TPU的数量级性能优势很少,这可能导致它会成为某些特定领域架构的原型。我预计很多会构建继承者,它们的水平会提高很多。谷歌表示,关于短至15个月的设计周期表阻止了TPU中的许多节能功能。

TPU已经应用于谷歌的数据中心,但是公司没有提供任何关于广泛应用的信息,也没有说升级方式以及是否会将TPU卖给第三方。"

这对英特尔有明显的警告,对英伟达属于小幅度的:

TPU项目从2013年随着从FPGA实验开始。"当我们看到FPGA的性能无法和GPU相比的时候,我们抛弃了它,并且运行速度加快TPU功耗会比GPU更低。"报告指出。

总结

不久前,英特尔还沉迷于快速增长的服务器市场的垄断地位。但是随着摩尔定律的放缓,尤其是不管是存储、简单应用还是复杂AI开始向云端转移,英特尔的GPU无法有效地做这些工作,并且寻找有效的解决方案。

早期的替代者是英伟达的GPU或者Altera和赛灵思的FPGA。它们对英特尔没有造成威胁,因为服务器仍然在跑CPU,几乎全部来自英特尔,但是即使这样,一些来自AMD、IBM和ARM基础设计的新兴竞争出现了。

但是GPU和FPGA的处理能力越来越强,英特尔来自数据中心的增长收益开始变少。

如今在复杂加速器似乎出现了一种新的模块,如谷歌的TPU。这会造成多大的威胁?

对于初学者,你必须认识到就像GPU和FPGA一样,TPU无法在服务器中取代CPU。它通过有效地执行一些任务就可以提供附加的处理能力。

或者,有人会死或它可能会威胁到GPU和FPGA,但是似乎他们根据用户的需求有各自的优势。但是,像GPU和GPGA,TPU会从英特尔占主导地位的CPU转移处理能力。

因此,对英特尔来说,最好的方案是它的使用仍然局限于谷歌云自身。目前还没有迹象表明谷歌是否计划将TPU给第三方。它可能应用TPU去加强自身的云应用的性能优势,或者限制其对第三方供应商的依赖。

但是高级芯片业务受益于巨大的经济规模,所以我们认为谷歌不太可能将其作为专有解决方案。

更重要的是,谷歌似乎开启了一扇数据中心全新解决方案之门,而且是在15个月内研发出来的。其它厂商跟了多久了?

Copyright © 2017-2020 微波EDA网 版权所有

网站地图

Top