微波EDA网,见证研发工程师的成长!
首页 > 硬件设计 > 行业新闻动态 > 微出口 | 解析:人工智能芯片蓝海争夺战的几大势力

微出口 | 解析:人工智能芯片蓝海争夺战的几大势力

时间:11-26 来源:半导体行业观察 点击:

CEA也正在思考把神经网络架构调整到边缘计算的潜在可能。Duranton指出,现在人们正在推动使用‘SqueezeNet取替AlexNet。据报道,为达到同等精度,使用前者比后者少花50倍的参数。这类的简单配置对于边缘计算、拓扑学和降低Mac的数量来说,都是很重要的。

Duranton认为,从经典的DNN转向嵌入式网络是一种自发的行为。

P-Neuro,一个临时的芯片

CEA的野心是去开发一个神经形态的电路。研究机构认为,在深度学习中,这样的一个芯片是推动把数据提取放在传感器端的一个有效补充。

但在达到这个目标之前,CEA相处了很多权宜之计。例如开发出D2N2这样的工具,帮助芯片开发者开发出高TOPS的DNN解决方案。

而对于那些想把DNN转移到边缘计算的玩家来说,他们也有相对应的硬件去实现。这就是CEA提供的低功耗可编程加速器--P-Neuro。现行的P-Neuro芯片是基于FPGA开发的。但Duranton表示,他们已经把这个FPAG变成了一个ASIC。

和嵌入式CPU对比的P-Neuro demo

在CEA的实验室,Duranton他们已经在这个基于FPAG的P-Neuro搭建了一个面部识别的卷积神经网络(CNN)。这个基于 P-Neuro的Demo和嵌入式CPU做了对比。(树莓派、带有三星Exynos处理器的安卓设备)。他们同样都运行相同的CNN应用。他们都安排去从18000个图片的数据库中去执行"人脸特征提取"。

根据示例展示,P-Neuro的速度是6942张图片每秒,而功耗也只是2776张图每瓦。

P-Neuro和GPU、CPU的对比

如图所示,和Tegra K1相比,基于FPGA的P-Neuro在100Mhz工作频率的时候,工作更快,且功耗更低。

P-Neuro是基于集群的SIMD架构打造,这个架构是以优化的分级存储器体系和内部连接被大家熟知的。

P-Neuro的框图

对于CEA的研究者来说 ,P-Neuro 只是一个短期方案。现行的 P-Neuro 是在一个CMOS设备上打造的,使用的是二进制编码。他们团队正在打造一个全CMOS方案,并打算用spike coding。

为了充分利用先进设备的优势,并且打破密度和功率的问题,他们团队设立了一个更高的目标。他们考虑过把RRAM当做突触元素,还考虑过FDSOI和纳米线这样的制程。

在一个"EU Horizon 2020"的计划里面,他们希望做出一个神经形态架构的芯片,能够支持最先进的机器学习。同时还是一个基于spike的学习机制。

Neuromorphic处理器

这就是一个叫做NeuRAM3的项目。届时,他们的芯片会拥有超低功耗、尺寸和高度可配置的神经架构。他们的目标是较之传统方案,打造一个能将功耗降低50倍的产品。

Neuromorphic处理器

Neuromorphic处理器的基本参数

据介绍,这个方案包含了基于FD-SOI工艺的整体集成的3D技术,另外还用到的RRAM来做突触元素。在NeuRAM3项目之下,这个新型的混合信号多核神经形态芯片设备较之IBM的TrueNorth,能明显降低功耗。

与IBM的TrueNorth对比

而NeuRAM3项目的参与者包括了IMEC, IBM Zurich, ST Microelectronics, CNR (The National Research Council in Italy), IMSE (El Instituto de Microelectrónica de Sevilla in Spain), 苏黎世大学和德国的雅各布大学。

更多AI芯片角逐

其实AI芯片这个市场,已经吸引了很多玩家,无论是传统的半导体业者,还是所谓的初创企业,都开始投奔这个下一个金矿。除了上面说的CEA这个。我们不妨来看一下市场上还有哪些AI芯片。

一、传统厂商的跟进

(1)Nvidia

英伟达是GPU霸主,虽然错过了移动时代,但他们似乎在AI时代,重获荣光,从其过去一年内的股票走势,就可以看到市场对他们的信心。我们来看一下他有什么计划,在这个领域。

在今年四月,Nvidia发布了一个先进的机器学习芯片--Tesla P100 GPU。按照英伟达CEO黄仁勋所说,这个产品较之英伟达的前代产品,任务处理速度提高了12倍。这个耗费了20亿美元开发的芯片上面集成了1500亿个晶体管。

据介绍,全新的 NVIDIA Pascal™ 架构让 Tesla P100 能够为 HPC 和超大规模工作负载提供超高的性能。凭借每秒超过 20 万亿次的 FP16 浮点运算性能,经过优化的 Pascal 为深度学习应用程序带来了令人兴奋的新可能。

而通过加入采用 HBM2 的 CoWoS(晶圆基底芯片)技术,Tesla P100 将计算和数据紧密集成在同一个程序包内,其内存性能是上一代解决方案的 3 倍以上。这让数据密集型应用程序的问题解决时间实现了跨时代的飞跃。

再者,因为搭载了 NVIDIA NVLink™ 技术, Tesla P100的快速节点可以显著缩短为具备强扩展能力的应用程序提供解决方案的时间。采用 NVLink 技术的服务器节

Copyright © 2017-2020 微波EDA网 版权所有

网站地图

Top