微波EDA网,见证研发工程师的成长!
首页 > 硬件设计 > 硬件工程师文库 > 人工智能(AI)芯片产业生态梳理

人工智能(AI)芯片产业生态梳理

时间:08-28 来源:ittbank 点击:

PU(寒武纪IP)。麒麟970采用了TSMC 10nm工艺制程,拥有55亿个晶体管,功耗相比上一代芯片降低20%。CPU架构方面为4核A73+4核A53组成8核心,能耗同比上一代芯片得到20%的提升;GPU方面采用了12核Mali G72 MP12GPU,在图形处理以及能效两项关键指标方面分别提升20%和50%;NPU采用HiAI移动计算架构,在FP16下提供的运算性能可以达到1.92 TFLOPs,相比四个Cortex-A73核心,处理同样的AI任务,有大约50倍能效和25倍性能优势。

苹果最新发布的A11仿生芯片也搭载了神经网络单元。据介绍,A11仿生芯片有43亿个晶体管,采用TSMC 10纳米FinFET工艺制程。CPU采用了六核心设计,由2个高性能核心与4个高能效核心组成。相比A10 Fusion,其中两个性能核心的速度提升了25%,四个能效核心的速度提升了70%;GPU采用了苹果自主设计的三核心 GPU 图形处理单元,图形处理速度与上一代相比最高提升可达 30% 之多;神经网络引擎NPU采用双核设计,每秒运算次数最高可达 6000 亿次,主要用于胜任机器学习任务,能够识别人物、地点和物体等,能够分担 CPU 和 GPU 的任务,大幅提升芯片的运算效率。

另外,高通从 2014 年开始也公开了NPU的研发,并且在最新两代骁龙 8xx 芯片上都有所体现,例如骁龙 835 就集成了"骁龙神经处理引擎软件框架",提供对定制神经网络层的支持,OEM 厂商和软件开发商都可以基于此打造自己的神经网络单元。ARM在今年所发布的 Cortex-A75 和 Cortex-A55中也融入了自家的AI 神经网络DynamIQ技术,据介绍,DynamIQ技术在未来 3-5 年内可实现比当前设备高50倍的AI性能,可将特定硬件加速器的反应速度提升10倍。总体来看,智能手机未来AI芯片的生态基本可以断定仍会掌握在传统SoC商手中。

2)自动驾驶

NVIDIA去年发布自动驾驶开发平台DRIVE PX2,基于16nm FinFET工艺,功耗高达250W,采用水冷散热设计;支持12路摄像头输入、激光定位、雷达和超声波传感器;CPU采用两颗新一代NVIDIA Tegra处理器,当中包括了8个A57核心和4个Denver核心;GPU采用新一代Pascal架构,单精度计算能力达到8TFlops,超越TITAN X,有后者10倍以上的深度学习计算能力。Intel收购的Mobileye、高通收购的NXP、英飞凌、瑞萨等汽车电子巨头也提供ADAS芯片和算法。初创公司中,地平线的深度学习处理器(BPU,BrainProcessor Unit)IP及其自研雨果(Hugo)平台也是重点面向自动驾驶领域。

3)计算机视觉领域

Intel收购的Movidius是主要的芯片提供商,大疆无人机、海康威视和大华股份的智能监控摄像头均使用了Movidius的Myriad系列芯片。目前国内做计算机视觉技术的公司中,商汤科技、Face++、云从、依图等,未来有可能随着其自身计算机视觉技术的积累渐深,部分公司向上游延伸去做CV芯片研发。另外,国内还有如人人智能、智芯原动等创业公司提供摄像头端的AI加速IP及芯片解决方案。

4)其他

VR设备芯片的代表为微软为自身VR设备Hololens而研发的HPU芯片,这颗由台积电代工的芯片能同时处理来自5个摄像头、一个深度传感器以及运动传感器的数据,并具备计算机视觉的矩阵运算和CNN运算的加速功能;语音交互设备芯片方面,国内有启英泰伦以及云知声两家公司,其提供的芯片方案均内置了为语音识别而优化的深度神经网络加速方案,实现设备的语音离线识别;在泛IOT领域,NovuMind设计了一种仅使用3×3卷积过滤器的AI芯片,第一款芯片原型预计今年底推出,预计可实现耗能不超过5瓦进行15万亿次浮点运算,可以广泛应用于各类小型的互联网"边缘"设备。

(四)新架构 - 类脑计算芯片

"类脑芯片"是指参考人脑神经元结构和人脑感知认知方式来设计的芯片,其目标是开发出打破冯·诺依曼架构体系的芯片。这一领域目前仍处于探索阶段,如欧盟支持的SpiNNaker和BrainScaleS、斯坦福大学的Neurogrid、IBM公司的TrueNorth以及高通公司的Zeroth等;国内Westwell、清华大学、浙江大学、电子科技大学等也有相关研究。

IBM的TrueNorth,2014年公布。在一颗芯片上集成了4096个内核,100万个神经元、2.56亿个可编程突触,使用了三星的28nm的工艺,共540万个晶体管;每秒可执行460亿次突触运算,总功耗为70mW,每平方厘米功耗20mW。IBM的最终目标就是希望建立一台包含100亿个神经元和100万亿个突触的计算机,这样的计算机要比人类大脑的功都强大10 倍,而功耗只有一千瓦,而且重量不到两升。

国内AI初创公司西井科技Westwell是用FPGA模拟神经元以实现SNN的工作方式,有两款产品:

1、仿生类

Copyright © 2017-2020 微波EDA网 版权所有

网站地图

Top