微波EDA网,见证研发工程师的成长!
首页 > 硬件设计 > MCU和DSP > 都想吞下人工智能这个蛋糕,CPU/GPU/FPGA有何高招?

都想吞下人工智能这个蛋糕,CPU/GPU/FPGA有何高招?

时间:03-14 来源:行业报告研究院 点击:

进行运算,但是普通级别的GPU就包含了成百上千个处理单元,高端的甚至更多,这对于多媒体计算中大量的重复处理过程有着天生的优势。

  

举个常见的例子,一个向量相加的程序,可以让CPU跑一个循环,每个循环对一个分量做加法,也可以让GPU同时开大量线程,每个并行的线程对应一个分量的相加。CPU跑循环的时候每条指令所需时间一般低于GPU,但GPU因为可以同时开启大量的线程并行地跑,具有SIMD的优势。

4.GPU行业的佼佼者

Nvidia目前全球GPU行业的市场份额有超过70%被英伟达公司占据,而应用在人工智能领域的可进行通用计算的GPU市场则基本被英伟达公司垄断。

  

2016年三季度英伟达营收为20.04亿美元,较上年同期的13.05亿美元增长54%;净利润为5.42亿美元,较上年同期的2.46亿美元增长120%,营收的超预期增长推动其盘后股价大幅上涨约16%。以面向的市场平台来划分,游戏业务营收12.4亿美元,同比增长63%,是创造利润的核心部门;数据中心业务营收2.4亿美元,同比增长193%,成为增长最快的部门;自动驾驶业务营收1.27亿美元,同比增长61%,正在逐步打开市场。

这样的业绩创下了英伟达的历史最好季度收入,但这并非是其股票暴涨的理由,事实上,在过去的六年里,英伟达的业绩基本一直呈现上升趋势。从2012年财年至2016财年,英伟达的营业收入实现了从40亿美元到50亿美元的跨越,而其净利润也从2012财年的5.8亿美元逐步上升到了2016财年的6.14亿美元。但在此期间,英伟达的股价并未出现翻番式的增长。

真正促成英伟达股价飙升的是人工智能的新市场。在刚刚过去的2016年,英伟达的股价上涨了228%,过去的5年内累计上涨500%。500亿美元的市值将会持续给英伟达带来40倍的市场收入,这几乎是业内拥有最高收益的公司。

  

5.Nvidia的市场定位:人工智能计算公司

自1999年发布第一款GPU以来,GPU就成为了英伟达最为核心的产品,占到了英伟达总营业收入的八成,而英伟达也以显卡厂商的身份进入人们的视线。这些芯片最初是以板卡的形式出售给游戏玩家的,游戏玩家需要自己动手将芯片装到PC主板上,从而拥有更快的3D图形处理速度。他们的产品命名也很有讲究,用"GeForce"这样具有超能力的字眼来开辟市场。

  

今日的英伟达,已经不再是一家单纯的显卡技术厂商,他现在很赶时髦地称自己为"人工智能计算公司"。据英伟达官网数据显示,2016年,有近两万家机构将英伟达产品用于深度学习加速计算,相比2014年翻了13倍。医疗、生命科学、教育、能源、金融、汽车、制造业以及娱乐业等诸多行业均将得益于海量数据的分析。

谷歌、微软、Facebook 和亚马逊等技术巨头大量购买英伟达的芯片来扩充自己数据中心的处理能力;Massachusetts General Hospital等医疗研究机构用英伟达的芯片来标记CT扫描图片上的病变点;特斯拉将在所有的汽车上安装英伟达的芯片来实现无人驾驶; June等家电公司用英伟达的芯片制造人工智能驱动的家用电器。在人工智能到来之前,英伟达从来都没有处于一个如此巨大的市场的中心,这也充分表明了一个事实,那就是英伟达在GPU的计算处理技术上无人能及。

  

同时,英伟达还在投资不同领域里新兴的、需要借助深度学习来构建业务的公司,使这些公司能够更好地借助其提供的人工智能平台起步,这类似于以前一些初创公司通过微软Windows来构建服务以及最近通过iTunes来发布应用。

6.Nvidia的核心产品:Pascal家族

英伟达的传统强项是桌面和移动终端的GPU,但是坚定地向着人工智能大步迈进的英伟达显然已经不满足于仅仅在单一领域做提高GPU性能的事了。相比于传统的计算密集型GPU产品来说,英伟达努力的方向是使得GPU芯片不仅仅只针对训练算法这一项起到作用,更是能处理人工智能服务的推理工作负载,从而加速整个人工智能的开发流程。目前该公司的核心产品包括基于Pascal架构的TeslaP4与Tesla P40深度学习芯片,这两款芯片均已于2016年第四季度开始投入量产。

  

Tesla P4为资料中心带来最高的能源效率

其小尺寸及最小50瓦特的低功率设计可安装于任何服务器内,让生产作业负载推论的能源效率达CPU的40倍。在进行视频推论作业负载时,单一服务器裡安装单颗Tesla P4即可取代13台仅采用CPU的服务器,而包含服务器及用电量的总持有成本则能节省达8倍。

  

Tesla P40为深度学习作业负载带来最大的处理量

一台搭载8颗Tesla P40加速器的服务器拥有每秒47兆次运算的推论性能及INT8指令,可取代140台以上的CPU服务器的

Copyright © 2017-2020 微波EDA网 版权所有

网站地图

Top