微波EDA网,见证研发工程师的成长!
首页 > 硬件设计 > 行业新闻动态 > 通过创新架构和电源技术提升处理器能效

通过创新架构和电源技术提升处理器能效

时间:08-05 来源:互联网 点击:

AMD 加速处理器(APU)将CPU和GPU集成配置到同一硅片上。这样做会带来许多优势,比如可以通过共享内存接口、供电和散热基础架构来提高效率。GPU并 行执行提高了自然用户界面和模式识别等许多工作负载的处理效率,并且在GPU与CPU协同使用时,这些工作负载的执行效率能够提高数倍。优化GPU和 CPU并行操作可以最大限度地提高设备的性能,缩短任务用时,并且提高进入节能模式的频率。

一个长期面临的挑战是软件开发人 员难于编写充分利用CPU和GPU的应用程序。传统上,这两种处理器分别具备独立的内存系统。这就是说无论何时CPU想利用GPU,它都得将数据从它的内 存中复制到GPU的内存中。这使应用程序的编写不仅效率低下而且困难,因此GPU一般只能用于大数据集的应用中。此外,独立内存还会增加用电量,因为处理 器会经常将缓存数据在CPU和GPU之间转移。

通过AMD最新开发的异构统一内存访问(hUMA),CPU和GPU可以共享 同一个内存。二者可以访问所有的平台内存,并且还可以将数据分配到系统内存空间的任意位置。这种共享内存架构大大降低了编程的复杂性,其原因是软件开发人 员不用再指出数据的缓存位置,而这个操作容易出现错误,进而会导致很难检测和修复的漏洞。

统一内存架构的优势显而易见,这使 软件开发人员可以流畅运用Java、C++ AMP和Python等高级语言来利用GPU的并行处理功能,从而提高性能和效率。最近的一个主流视频和图片编辑程序的运行结果表明,若将GPU的并行处 理与CPU相呼应,最高可将某些功能的性能提高17倍。然而,由于GPU和CPU共享电源/热基础架构,电源需求与单独使用CPU时相等。

hUMA 是AMD 异构系统架构(HSA)实现的一部分。当按照HSA架构设计和编程时,这样的电源和性能提升可以扩展到其他的固定功能设备,比如数字信号处理器(DSP)或安全处理器。

代号为"Carrizo"的AMD处理器是行业内第一款符合异构系统架构基金会(HSA Foundation)HSA 1.0规范的处理器。该架构大大降低了编程难度,同时提高了低功耗下的应用性能。

高电源效率硅技术 计算机工作负载的变化,将会对微处理器的用电量产生影响。工作负载(比如复杂的服务器事务或视频渲染)需求越大,处理器吸取的电流越大,然后当需求减少 时,电流则会降低。电流突变会导致芯片供电电压发生严重波动。为了解决电压下降的问题,微处理器设计人员一般会提供大约10%~15%的额外电压,以确保 处理器电压始终充足。但过电压又会以能耗为代价,因为其浪费的电力与电压增长的平方成正比(即10%的过电压会造成20%的电力浪费)。

AMD 研发了多项技术来优化电压。其最新的处理器配置了电压跟踪电路,以纳秒级的精度对平均电压与电压下降进行比较。通过在平均电压下运行,然后短暂地快速降频 来抵消供电电压的骤降,它可以恢复大部分被浪费的电力。由于频率调整可以以纳秒级的水平完成, 计算性能几乎不会受到影响, 而功耗则会减少10%~20%。从"Carrizo"APU开始,CPU和GPU就都采用了自适应电压运算功能。

Carrizo 首创的另一项电源技术名为自适应电压与频率调节。除了传统的温度和功率传感器,该技术实现了独特的专利硅片速度性能传感器与电压传感器。行业内大多数人都 了解,硅片速度性能和电压控制会因器件和平台的不同而存在明显差异。这些差异传统上是通过对硅片工作增加裕量或"保护带"来应对的,因为无法提前得知准确 的运行情况。相对理论上最优系统所能实现的效率,这种保护带将会引起显著的效率损失。得益于AMD首次引入的最新自适应传感器和相关的控制算法,大部分的 效率损失可以得到减轻。速度与电压传感器能够让每个APU适应于其硅特性、平台运行和工作环境。通过实时适配这些参数,APU可以对运算进行动态优化,最 大限度地提高效率,并且在给定性能水平上最多可节电20%。

最后,为了降低CPU的耗电量,AMD利用了与GPU设计方式更 接近的高密度库。AMD借助这一方案可以在更小的面积内集成更多的标准单元(处理器的组成部分),从而能够减少面积及单元之间的布线距离,并大幅降低功 耗。使用高密度库通常意味着在相同的电压下速度会稍有些慢,但如果配置合理,可以将功耗和面积减少30%。这就是说,在功率受限的条件下(绝大部分都是这 种情况),实际的频率和性能要高于传统的高性能库配置。此外,它还能够释放出更多芯片空间,因此AMD可以在同一个芯片上同时搭载GPU(多媒体处理器) 和系统控制器。

电源管理大部分运算平台仅在一小段时间内以峰值功率运行。为了最大限度地降低功耗,同时又最大 限度地提高性能,AMD设计了电源管理算法,对典型应用而非峰值计算周期进行优化,因为只有需求最大的工作负载才会(短暂)达到峰值计算。因 此,race-to-idle技术可以使计算机尽可能频繁地进入休眠模式,从而降低平均能耗。

Copyright © 2017-2020 微波EDA网 版权所有

网站地图

Top