NVIDIA/英特尔公布AI专用芯片计划,人工智能的舞台有多大?
且还可以通过重配置对目标应用进行最大限度的优化。除了FPGA和GPU之外,也有不少公司在做服务器端的深度学习加速芯片,例如Google的TPU、Intel的Nervana System以及Wave Computing等等。 移动端的AI芯片和服务器端的AI芯片在设计思路上有着本质的区别。首先,移动端的AI芯片必须满足低延迟要求。这里的延迟是指移动终端与云端或服务器端的通信延迟。以大家熟悉的siri应用为例,移动终端把语音数据上传至云端,云端执行算法并把结果送回移动端,这当然要求网络延迟尽可能小以提升用户体验。而在驾驶辅助、安防监控等对实时性要求极为严苛的应用场景下,低延迟的重要性更是无需赘言;其次,移动端AI芯片必须保证功耗控制在一定范围内,换言之,必须保证很高的计算能效(完成一次计算所需要的能量,Energy Efficiency);最后,移动端AI应用对算法的性能要求不如服务器端苛刻,允许一些计算精度损失,因此可以使用一些定点数运算以及网络压缩的办法来加速运算。而如果从另一个角度看,把所有数据传回云端一方面有可能造成网络的拥堵,另一方面存在数据安全问题,一旦数据在传输过程中被恶意劫持,后果将无法想象。因此,一个必然的趋势是在移动端本地分担部分快速反应的AI算法,从而尽量避免上述问题。 四、AI专用芯片,业界巨头们的蓝海 正如20年前多媒体应用及3D游戏蓬勃发展倒逼显卡硬件升级一样,互联网大数据的兴起对超算芯片提出了新的需求。如前所述,GPU和FPGA是目前软件企业采取的主流方案。百度的机器学习硬件系统就是用FPGA搭建了一款AI专用芯片,并已大规模部署在语音识别、广告点击率预估模型等应用中;而语音识别领域的科大讯飞,则将几乎所有深度学习训练方面的运算都放在GPU加速卡上运行。不过业界也有消息,科大讯飞计划在语音识别业务中启用FPGA平台。 作为GPU和FPGA领域的巨头,Nvidia和Intel已相继公布了开发AI专用芯片的计划。2016年上半年,NVIDIA为深度神经网络推出了Tesla P100 GPU,并基于此开发了深度学习超级计算机NVIDIA DGX-1。与此同时,IBM已与NVIDIA推出了几款专门针对人工智能领域的服务器产品。而收购了FPGA巨头Altera公司的Intel也不甘落后,结合FPGA在大数据运算处理方面的优势,全力打造新的专注大数据高性能运算以及AI应用的至强融合(Xeon Phi)系列处理器。此外,Intel还于2016年8月宣布收购深度学习芯片初创公司Nervana,以增强Intel在AI方面的业务能力。目前,芯片层面最大的变数来自于Google的TPU芯片。这款芯片是Google专门为其深度神经网络的软件驱动引擎TensorFlow量身打造的。谷歌表示,按照摩尔定律的发展轨迹,现在的TPU的计算能力相当于未来七年才能达到的计算水平。目前,TPU已经服务于Google的AI系统RankBrain、街景Street View、AlphaGO等应用服务。 TPU的高效能来自于Google专门为AI应用做出的针对性优化。在效能与功耗上TPU能够更紧密地适配机器学习算法,这一点要远胜于GPU及FPGA等通用芯片。从性能角度而言,目前针对某个算法优化的专用AI芯片能比GPU在性能上提升多少还未有定论,这也要结合具体算法来看。如果GPU刚好卡到某个瓶颈,那么AI芯片在运算速度上提升几十倍也是有可能的。AI算法始终保持着快速演进的趋势,因此专用AI芯片的发展一定与软件是并行互补的。从成本角度来看,任何芯片一旦量产,成本都会迅速下降。就服务器端的AI芯片而言,首先量肯定不如移动市场大;其次由于强调运算性能,导致其技术壁垒较高,新的竞争者难以快速切入。目前来看AI芯片基本没有创业机会。流片在千万美元级别,全世界的玩家屈指可数。而所有巨头又都盯着AI这块巨大的蛋糕,因此在该领域基本不可能有搅局者的出现。AI虽然是蓝海,但只是大公司的蓝海。
- 大尺寸面板价格不涨反跌 市场供需失衡难落幕(07-29)
- Fairchild推出全新品牌,标志着公司的重大转型(03-19)
- 飞兆半导体附属公司崇贸科技荣获发明创作奖(05-14)
- Fairchild通过收购Xsens将战略步伐跨入 快速增长的3D运动追踪市场(05-15)
- Fairchild宣布2014年度北美洲和亚洲功率技术研讨会时间表(04-15)
- Fairchild与Xsens的结合水到渠成(06-09)