微波EDA网,见证研发工程师的成长!
首页 > 硬件设计 > 硬件工程师文库 > 兼容多种运算核心 HSA架构提高处理器能源效率

兼容多种运算核心 HSA架构提高处理器能源效率

时间:08-25 来源:集微网 点击:

进一步整合系统组件等做法,提升APU矽智财(IP)效率。

  Tirias Research指出,将降低闲置耗电及智能化电源管理所达成的节电功效,同时与异质运算效能提升和程序改善相结合。超微半导体应能达成在2014?2020年之间实现二十五倍标准使用能源效率改善的目标。

  超微半导体目前已将笔记型电脑中的GPU、记忆体控制器、输入/输出(I/O)控制器及周边汇流排等系统组件全部都整合于单一晶粒中,可实现同时监控CPU 与GPU的精密化电源管理。这项技术能够有效平衡两种单元之间的电力最佳化,将散热能力集中在最须要散热的单元。除此之外,将GPU移至CPU晶粒,可以减少所需要之记忆体介面数量,同时还可以达到省电之效果。

  超微半导体的智能电源管理以专用晶粒控制器追踪功耗、温度及各主要组件活动情形,使APU进一步提升效率。这种功率微控制器就像是"APU交响曲"的指挥,在正确的时间将处理重点导向正确的位置,其可快速回应热事件,控制器能够快速分配电力到CPU的特定部位,以发挥最大效能与效率。另外,也能判断各单元何时最无活动现象,并将其运作降低至最小状态或将之完全关闭。

  处理元件若能以最短时间完成工作,然后进入最深休眠状态,即达到其最大能源效率。这种"加速进入闲置模式"行为对于网页浏览、文件编辑和相片编辑等多数消费者导向任务都很有助益。协调GPU与CPU的使用能够使APU更快完成任务,然后降低功率、减少总耗能(能量=功率×时间)。此一耗电状态过渡时间应极短,使单元尽快降低功率,让处理器能够在使用者进行按键输入或影片讯框之间,就可进入闲置状态。

  借重HSA编程架构 处理器达成高效能/低功耗

  超微半导体现正着手设计与1.0版HSA相容的新款APU,而HSA规格的目的在于协助软体利用GPU及其他处理元件的功率与效能。以GPU而非CPU来执行高度平行码时,APU能够利用其GPU核心的能源效率,以及巨量平行运算来处理工作负载,更快完成任务。HSA编程架构可将工作负载导向最佳芯片资源,例如专为特定演算法所设计的加速器,其设计宗旨在于减少完成固定工作负载所需周期数量及电力消耗,并在行动装置的功率限制内执行高阶运算密集式应用程式,转由GPU而非CPU处理之后,高阶行动应用程式(如语音辨识、手势辨识、脸部辨识等次世代使用者介面和相片索引)都能获得次方程度的效能改善。

  个人电脑处理器的效能随时间而成长,但步调相对较慢。另一方面,由于设计者将更多芯片空间留给图形处理,以支援4K解析度的显示设备,GPU效能得以快速攀升。藉由HSA架构,超微半导体就能善用这种GPU效能成长。将GPU用于一般任务的优点,展现于个人电脑应用程式和基准测试中(图1)。

  

  图1 标准35W行动处理器的GPU运算趋势

  OpenCL 是首批支援以GPU执行平行运算的业界标准编程语言之一,可供C程式发挥语言扩充的功效,为代码的运算密集部分带来次方程度的效能提升。采用OpenCL 1.x(以OpenCL 2.x全面启用HSA的前身)加速时,PCMark 8 v2.0基准测试展现多达25%的增益(图2)。

  

  图2 现有平台经由GPU卸载所达成的PCMark 8 v2.0加速

  回头参考图1所示,异质架构利用GPU效能的快速成长,而GPU效能远胜近代CPU效能,GPU仍会是让未来处理器实现更高效能与能源效率的关键。每一个 GPU都有多个"着色器"核心(超微半导体将其称之为"串流处理单元"),每个核心都能处理整数或浮点运算,同时维持小于标准CPU核心的体积与耗电量。而且,由于每一个着色器核心都很小,所以单一晶粒可以整合数十甚至数百个着色器核心与个位数的通用CPU核心。因此,GPU可以对运用这么多处理核心的工作负载,产生次方以上程度的运算提升。上述所提及的每一种高阶应用程式,都可利用GPU固有的平行运算能力,来达成如此惊人的效能增益,而且耗电量极低。

  图3显示超微半导体从2008年"Puma"CPU处理器,到2020年预测APU的标准使用耗电降低趋势。虚线表示至2015年的耗电趋势,Tirias Research预测超越此点后至2020年之间降低速度会相对减缓,因为耗电已趋近于0瓦(W)。但Tirias Research预测2015年,异质运算将大幅提升,驱动与GPU能力相称的更高效能水准。

  

  图3 APU的能源使用与运算趋势

闲置耗电量降低,将可以帮助标准使用耗电,得以从相邻的2008年平台"Puma"CPU的近4W,降低至2014年"Kaveri"APU的1.6W,将会产生2.5倍的基准耗电量改善(两种产品都适用于相同的35W笔记型电脑热功率封包)。数量更多的CPU核心、更快的时脉速度,以及GPU运算协助,使得处理器效能得以改善,让"Kaveri"的

Copyright © 2017-2020 微波EDA网 版权所有

网站地图

Top