中国CPU/GPU/DSP先天不足，靠啥在深度学习上赶超美国？

时间：08-02 来源：智客点击：

中国和美国的深度学习处理器，哪一款产品能在商业上取得成功，很大程度上取决于技术以外的因素。就现在情况来看，大家基本处于同一起跑线，鹿死谁手，还未可知。

归功于阿法狗与韩国李世石对弈掀起的波澜，人工智能和深度学习已经深入人心。而中科院、英特尔、谷歌、IBM、英伟达等中美两国的科研机构和商业公司，不满足于当吃瓜群众，也纷纷推出了用于深度学习的处理器。

所有这些机构和公司的产品中，既有CPU、GPU、DSP这样的传统芯片，也有专门为深度学习而生的NPU（嵌入式神经网络处理器）。毫无疑问，就像PC时代一样，在人工智能时代，这些芯片也将成为未来深度学习人工智能的核心，可以说是走向智能世界的重要根基。

这么重要的技术，自然也是国家科技竞赛的必争之地，那么，中美两国推出的这些CPU、GPU、DSP、TPU、NPU深度学习处理器，各有什么特点，在深度学习处理器方面，中美谁更有希望率先突破呢？

美国：CPU、GPU、DSP、TPU、NPU一应俱全

由于在美国在半导体产业上拥有的雄厚技术底蕴，使美国不少公司都开发出了针对深度学习的芯片，这其中以英特尔的众核芯片，英伟达的GPU，Cadence公司和Synopsys公司的DSP，以及IBM的真北和谷歌的TPU为代表。

一直以来，英伟达着力于将自己的GPU用于深度学习，并为深度神经网络推出了Tesla P100 GPU，并且发布了基于该GPU的深度学习超级计算机 DGX-1，随后DGX-1被交给了人工智能项目OpenAI。

深度学习处理器中美谁更有希望率先突破？

图：英伟达为人工智能开发的超级计算机DGX-1

在英伟达开发出针对人工智能的定制GPU，并坚持DGX-1 系统之后，英特尔也不甘落后，在收购深度学习创业公司Nervana Systems之后，英特尔又公布了用于深度学习的Xeon Phi家族新成员，在深度学习处理器领域开辟新战场。

美国Cadence公司的Tensilica Vision P5处理器和Synopsys公司的EV处理器本质上也是在现有的成熟技术上做改进，将传统的面向数字信号处理的DSP处理器架构用于处理神经网络。

在今年年初，谷歌公开一款叫做Tensor Processing Unit的处理器，根据TPU团队主要负责人介绍，TPU专为Google机器学习应用TensorFlow打造，能够在相同时间内处理更复杂、更强大的机器学习模型并将其更快地投入使用。

谷歌数据中心早在一年前就开始使用TPU，之前打败李世石的AlphaGo就是采用了TPU做了运算加速。不过，谷歌也表示，TPU只在特定应用中辅助CPU和GPU使用。由于谷歌没有公开TPU的细节信息，而且只供内部使用，以及只能配合CPU和GPU起辅助作用。因此，下文对TPU不再论述。

相对于只起到辅助作用的TPU，IBM的真北则是能独立完成深度学习的芯片，IBM宣称处理能力相当于1600万个神经元和40亿个神经键。

可以说，由于美国在相关技术上的深厚积累，使其可以实现遍地开花，既可以运用现有成熟技术开发出针对深度学习的CPU、GPU和DSP，也可以开发出专门针对深度学习的专业芯片NPU和TPU。

中国：在NPU上成果斐然

由于中国在CPU和GPU方面相对美国有相当大的技术差距，导致国内企业没有能力像英特尔和英伟达那样以现有的成熟技术为基础开发出适合深度学习的产品。不过，在没有任何历史包袱的NPU领域，由于中国和美国基本处于同一起跑线的情况下，反而取得了不凡的技术成果。

中国科学院计算技术研究所是国际上最早研究深度神经网络处理器的单位之一。2014年，中科院计算所和法国Inria合作发表的相关学术论文先后获得了计算机硬件领域顶级会议ASPLOS’14和MICRO’14的最佳论文奖。这也是亚洲首次在此领域顶级会议上获得最佳论文奖。

随后，国际计算机学会（Association for Computing Machinery）通讯也将这一系列工作列为计算机领域的研究焦点。这标志着我国在智能芯片领域已经进入了国际领先行列。

此后中科院计算所独立研制了世界首个深度学习处理器芯片--寒武纪，发布了世界首个神经网络处理器指令集，后者于2016年被计算机体系结构领域顶级国际会议ISCA2016（International Symposiumon Computer Architecture）所接收，其评分排名所有近300篇投稿的第一名。目前，中科院计算所已成立寒武纪公司，对神经网络处理器进行产业化，明年就能听到好消息。

深度学习处理器中美谁更有希望率先突破？

图：寒武纪板卡

传统CPU、GPU、DSP存在先天不足

想要看出谁能突破，就得从最底层的技术特点来分析。

首先来看看美国众多公司的CPU、GPU和DSP。无论是针对人工智能的众核芯片还是定制版的GPU，本质上都不是

上一篇：大疆精灵4的芯片供应商，就这么被英特尔收购了？
下一篇：AMD最后一代28nm APU完美亮相，性能提高这么多？

CPU 深度学习处理器相关文章：

栏目分类