NVIDIA/英特尔公布AI专用芯片计划，人工智能的舞台有多大？

时间：10-02 来源：赛迪顾问点击：

且还可以通过重配置对目标应用进行最大限度的优化。除了FPGA和GPU之外，也有不少公司在做服务器端的深度学习加速芯片，例如Google的TPU、Intel的Nervana System以及Wave Computing等等。

移动端的AI芯片和服务器端的AI芯片在设计思路上有着本质的区别。首先，移动端的AI芯片必须满足低延迟要求。这里的延迟是指移动终端与云端或服务器端的通信延迟。以大家熟悉的siri应用为例，移动终端把语音数据上传至云端，云端执行算法并把结果送回移动端，这当然要求网络延迟尽可能小以提升用户体验。而在驾驶辅助、安防监控等对实时性要求极为严苛的应用场景下，低延迟的重要性更是无需赘言；其次，移动端AI芯片必须保证功耗控制在一定范围内，换言之，必须保证很高的计算能效（完成一次计算所需要的能量，Energy Efficiency）；最后，移动端AI应用对算法的性能要求不如服务器端苛刻，允许一些计算精度损失，因此可以使用一些定点数运算以及网络压缩的办法来加速运算。而如果从另一个角度看，把所有数据传回云端一方面有可能造成网络的拥堵，另一方面存在数据安全问题，一旦数据在传输过程中被恶意劫持，后果将无法想象。因此，一个必然的趋势是在移动端本地分担部分快速反应的AI算法，从而尽量避免上述问题。

四、AI专用芯片，业界巨头们的蓝海

正如20年前多媒体应用及3D游戏蓬勃发展倒逼显卡硬件升级一样，互联网大数据的兴起对超算芯片提出了新的需求。如前所述，GPU和FPGA是目前软件企业采取的主流方案。百度的机器学习硬件系统就是用FPGA搭建了一款AI专用芯片，并已大规模部署在语音识别、广告点击率预估模型等应用中；而语音识别领域的科大讯飞，则将几乎所有深度学习训练方面的运算都放在GPU加速卡上运行。不过业界也有消息，科大讯飞计划在语音识别业务中启用FPGA平台。

作为GPU和FPGA领域的巨头，Nvidia和Intel已相继公布了开发AI专用芯片的计划。2016年上半年，NVIDIA为深度神经网络推出了Tesla P100 GPU，并基于此开发了深度学习超级计算机NVIDIA DGX-1。与此同时，IBM已与NVIDIA推出了几款专门针对人工智能领域的服务器产品。而收购了FPGA巨头Altera公司的Intel也不甘落后，结合FPGA在大数据运算处理方面的优势，全力打造新的专注大数据高性能运算以及AI应用的至强融合（Xeon Phi）系列处理器。此外，Intel还于2016年8月宣布收购深度学习芯片初创公司Nervana，以增强Intel在AI方面的业务能力。目前，芯片层面最大的变数来自于Google的TPU芯片。这款芯片是Google专门为其深度神经网络的软件驱动引擎TensorFlow量身打造的。谷歌表示，按照摩尔定律的发展轨迹，现在的TPU的计算能力相当于未来七年才能达到的计算水平。目前，TPU已经服务于Google的AI系统RankBrain、街景Street View、AlphaGO等应用服务。

TPU的高效能来自于Google专门为AI应用做出的针对性优化。在效能与功耗上TPU能够更紧密地适配机器学习算法，这一点要远胜于GPU及FPGA等通用芯片。从性能角度而言，目前针对某个算法优化的专用AI芯片能比GPU在性能上提升多少还未有定论，这也要结合具体算法来看。如果GPU刚好卡到某个瓶颈，那么AI芯片在运算速度上提升几十倍也是有可能的。AI算法始终保持着快速演进的趋势，因此专用AI芯片的发展一定与软件是并行互补的。从成本角度来看，任何芯片一旦量产，成本都会迅速下降。就服务器端的AI芯片而言，首先量肯定不如移动市场大；其次由于强调运算性能，导致其技术壁垒较高，新的竞争者难以快速切入。目前来看AI芯片基本没有创业机会。流片在千万美元级别，全世界的玩家屈指可数。而所有巨头又都盯着AI这块巨大的蛋糕，因此在该领域基本不可能有搅局者的出现。AI虽然是蓝海，但只是大公司的蓝海。

上一篇：上海兆芯的前世今生，民用市场也能与英特尔/AMD拼“刺刀”？
下一篇：大陆In-Cell面板大规模量产，集创北方显示驱动一体化芯片发力

AI NVIDIA 硬件相关文章：

栏目分类