微波EDA网,见证研发工程师的成长!
首页 > 硬件设计 > 硬件工程师文库 > AI进入爆发期,千亿芯片市场空间

AI进入爆发期,千亿芯片市场空间

时间:08-23 来源:EETOP 点击:

成稳定的客户群体,牢牢占据市场空间。各大科技公司为了占据生态优势也陆续推出各自的开源平台系统,之前较流行的两大开源平台是Tensorflow与Caffe,近来Caffe2和mxnet也逐步兴起,江湖尚未一统。对AI芯片厂商而言,目前需要选择开源平台进行支持。

开源平台生态支持方面,GPU相对完善,FPGA与ASIC加速跟进。以英伟达GPU为例,其支持包括Tensorflow,Caffe,Caffe2,CNTK,Torch等几乎所有的开源平台,完善的生态优势使得GPU目前具备极强竞争力。FPGA与ASIC相关厂商也纷纷注意到生态的重要性,陆续推出支持主流开源平台的产品。2016年,谷歌发布的TPU2代支持其自家的Tensorflow框架。2017年3月,Xilinx推出基于FPGA的reVISION堆栈解决方案,支持Caffe框架,并计划未来拓展到更多的框架比如TensorFlow等框架上。开源平台是支撑相关开发的基础,目前尚处于群雄逐鹿阶段。未来平台生态之争将是各家AI芯片能否占据市场的一大关键点。AI芯片厂商都会尽可能支持尽可能多的主流平台,但相应的,也会带来更多的开发任务量,需要折衷考虑。

在AI硬件开发环境方面,同样是GPU占据优势,FPGA厂商加速完善。AI硬件开发环境是指专门针对AI硬件推出的适应于硬件计算的开发环境,用户能利用如C,C++等软件语言更方便的基于AI芯片进行顶层应用开发,并且能起到硬件加速的效果。英伟达推出的CUDA是目前最流行的AI硬件开发环境,几乎所有英伟达主流GPU都支持CUDA开发。FPGA方面,为了减少FPGA设计的复杂度,Altera推出了 OpenCL SDK开发环境,Xilinx推出了SDAccel开发环境,这两种FPGA开发环境都大大减轻开发者利用FPGA开发的难度。但目前基于FPGA的开发环境开发灵活度与推广度依然不如CUDA。此外,由于ASIC直接采用底层硬件语言开发,目前不能用C语言等软件语言,因此不存在开发环境问题。

未来有望在统一的软件框架下,实现各类芯片在云端的融合共存。我们判断各种芯片在云端将竞争并长期共存,云端上层会提供统一的软件平台对各类芯片进行支持。换句话说,上层的开发者未来不需要关心底层的硬件是哪种,可以使用统一的、支持各类底层硬件的开源平台进行开发。云端具体采用哪种芯片架构,将根据云端实际应用需求确定。通过CPU+GPU/TPU+FPGA(可选)的灵活配置,更好地满足和实现各种应用场景下不断升级更新的AI算法的需求,使云端人工智能保持长期的灵活性。未来主流框架可能不止一种,类似TensorFlow、Caffe2等都有可能成为主流的Frame框架。

终端场景:按需求逐步落地,未来集成是趋势

AI"下沉"终端,芯片负责推断

云端受限于延时和安全性,催生AI向终端下沉。云端AI应用主要依靠网络将云端计算结果与终端执行结果数据和增量环境参数进行交换。这个过程存在两个问题:第一,使用网络传输数据到云端会产生延迟,很可能数据计算的结果会需要等待数秒甚至数十秒才能传回终端;第二,使用网络传送数据,传输过程中数据有被劫持的风险。因此,在某些对延迟和安全性要求较高的场景就有了将AI下沉到终端的需求。

下沉到终端的AI主要是"推断"部分。由于模型更新快,计算更为复杂,且基于大数据,"训练"一般在云端进行。由于数据和算力限制,未来在终端场景下,处理器主要负责执行人工智能的"推断"过程。"推断"下沉终端优势在于实时性,可以在终端进行的操作不需要回传云端处理,更有效满足AI运算的实时性需求场景。终端可定期从云端下载训练好的参数用于推断参数更新,同时可选择上传云端需要的"训练"信息。通俗来说,未来终端人工智能"大脑"的进化仍在云端进行。

需求决定硬件,场景逐渐落地

采用硬件实现终端人工智能是必然。理论上,智能终端利用原有CPU大脑,运行纯软件的AI算法,也可实现相关应用。但实时性要求高的场景(如安防、辅助驾驶等),对"最差情况下的最大延时"容忍度很低,如果只用CPU运算不能满足实时性要求,必须有专属硬件加速;而在手机、音箱、AR/VR眼镜、机器人等使用电池、对功耗敏感的终端场景,采用纯软件运算功耗很大,不能满足用户对功耗的苛刻要求,同样需要采用专属芯片加速。

终端AI推断需要硬件支持的需求场景有三种:(1)低延时;(2)低功耗;(3)高算力。按照需求落地先后顺序,我们判断AI芯片落地的终端子行业分别是:(1)智能安防;(2)辅助驾驶;(3)手机/音箱/无人机/机器人等其他消费终端。三个领域对终端AI硬件的要求各有侧重:(1)智能安防、智能驾驶由于视频信号的数据量较大,对数据流计算速度要求较高;(2

Copyright © 2017-2020 微波EDA网 版权所有

网站地图

Top