微波EDA网,见证研发工程师的成长!
首页 > 通信和网络 > 通信网络业界新闻 > 高性能计算:性能与效能 孰重孰轻?

高性能计算:性能与效能 孰重孰轻?

时间:09-09 来源:51CTO 点击:

全球高效能计算机技术研究现状

  高效能计算机研究领域主要包括高带宽/低延迟分级存储系统;平衡好处理器、存储器、网络带宽、系统软件与开发语言的均衡系统结构;健壮性策略;新的度量准则和基准测试程序;系统自适应性;节能以及简化管理复杂性等诸多内容。当前HPCS项目已从大规模研究阶段转向最后阶段-2010年前基于IBM PERCS系统和Cray的"适应性超级计算"(Adaptive Supercomputing) Cascade 系统完成两台千万亿次高生产率超级计算机系统研制开发。

  IBM PERCS系统基于Power7微处理器、AIX操作系统、通用并行文件系统(GPFS)、IBM并行计算环境及互联和存储子系统进行开发。当前 IBM PERCS 项目已经公布的几个研究方向有:片上多处理器(CMP);智能内存:在每个DIMM内存条上增加一个智能Hub芯片,实现预取、Scatter/Gather、重排序、缓存等功能;全局名字空间支持;混合型DSM:通过X10编程语言实现,支持OpenMP程序;异步SMP:简化目前SMP硬件一致性协议,使之更接近软件的应用模式;片上FIFO:将同步和数据传送结合,减少应用中的延迟;基于目录的cache一致性协议等。PERCS的存储系统实现了巨大的UMA结构的SMP系统,同时在该系统中IBM计划开发高效用软件和开发工具以提高开发人员的生产率。

  Cray Cascade 系统联合了Stanford、Caltech/JPL和Notre Dame学院的研究人员共同进行开发,具有独特的处理器设计,单节点处理器有机地结合了向量处理器、流处理器、多线程处理器设计;轻量级处理器采用了PIM技术和多线程技术。存储系统采用UMA+NUMA共享内存方式,并提供了灵活的地址变换和分布。Cray Cascade 系统本质上是一个能在单系统中提供包括标量、FPGA和混合矢量/超级多线程(MMT)处理器板卡的机箱内集群(Cluster-in-a-box)。在该系统中Cray将设计一款基于其XD1系统的FPGA加速板卡,采用统一的高带宽光互联网络,节点(Locale)包含向量部件、粗粒度的多线程处理器、与DRAM结合支持细粒度并行的PIM部件等,提供分布式共享内存、多层次多线程执行模型、硬件支持的分析和调试功能。Cascade系统将开发编译器软件Chapel以处理多种涉及标量、矢量或MMT应用的混合UMA/NUMA编程模型。除上述两家获  HPCS最终支持的企业外,SUN也在第一、二阶段获得了支持,SUN HERO计划主要采用的技术有Sea of Memory技术、Proximity Interconnect 技术、Guarded Pointer技术和Interval Arithmetic(IA)技术。

  当前除了上述IBM、Cray、SUN等企业及学术机构以外,基于可重构计算、专用加速部件、混合异构结构、芯片级、系统级以及基础架构级节能等相关技术,学术界和企业界也已经展开了高效能计算机关联技术研究。当前以FPGA、专用加速部件、通用商品化基于多核处理器(Many-Core)为主体的混合异构结构已成为高效能计算机发展的主流,在这其中,包括节能、PIM、流式计算、光互联、高效编译器、并行计算环境等等诸多方面的创新和整合;在应用加速方面,由于FPGA可以根据不同的应用实现可重构计算,适应高性能计算机面临的不同的计算模型,同时FPGA在内存带宽、并行处理和低功耗方面有突出的优势,因此与主处理器配合,可实现提高特定应用性能和降低系统功耗的双重目标,应用前景广阔,是实现高效能计算的有效途径之一;在提高存储器性能方面,基于多层次Cache、加大处理器和存储器之间的带宽、多线程、预取、PIM等诸多技术以消除内存墙(Memory Wall);
  在系统可靠性研究方面,国内外研究主要在硬件可靠性、操作系统可靠性和应用可靠性三个方面。硬件可靠性主要沿用60年代大型机系统发展起来的一系列基础技术框架,如N模冗余、专用组件或模块等,通过冗余硬件达到提高系统硬件可靠性的目的。操作系统可靠性研究主要有操作系统隔离技术(如Nooks)、故障忽略技术等,通过将故障忽略或隔离从而减少对应用的影响。针对科学计算应用,多采用检查点技术对应用运行的阶段性结果进行保存,以备在出错时进行恢复;在解决管理的复杂性方面,包括自动监控全局资源,对监控数据进行深度挖掘、关联分析预测系统行为,根据应用特征动态构造虚拟计算环境,实现应用间性能隔离和安全隔离,对应用软件的可靠性和扩展性提供支持,提供验证、模拟、评价工具,并在保证系统性能的情况下,实施自适应功耗管理及可靠性管理;

  在解决功耗方面,除采用FPGA、液体冷却、低功耗专用芯片、芯片级冷却等技术以外,一些系统级节能技术也有望解决高效能计算机能耗问题,包括:基于负载情况动态调整系统状态、实施部分节点或部件的休眠;根据各进程能耗的不同对CPU任务队列进行调整,如将一些产生较多热量的任务从温度较高的CPU上迁移到温度较低的CPU上从而实现能耗的均衡;在海量存储和文件系统方面,包括聚合一组存储设备的容量和I/O带宽,为高效能计算机提供全局名字空间和高I/O性能,以及采用面向对象存储技术,将存储设备与文件系统的接口由原来过于简单的块访问接口变成对象访问接口等以开发高性能并行文件系统和相应支持大规模共享文件系统的存储系统;在并行编程模型方面,当前并行程序设计语言主要有OpenMP、MPI、X10、PGAS、HPF等。基于共享存储的OpenMP语言的主要问题是没有数据局部性的支持,Clustered OpenMP也只能适应粗粒度并行的程序。MPI模型的问题在于短消息性能不好和可编程性差, HPF由于适应面窄也面临淘汰。近年来,分割全局地址空间模型(Partitioned Global Address Space Model,简称PGAS)广受关注。PGAS既有共享内存编程模型的易编程性,又能让程序员控制数据的分布以达到和消息传递编程模型媲美的性能。

  可以说当前学术界和工业界在高效能计算机研究领域已取得了长足的进展,2008年6月IBM Roadrunner 千万亿次超级计算机的提前发布让我们看到了高效能计算机平民化应用的希望,也更让我们对未来千万亿次计算时代的提前到来充满信心。

  

Copyright © 2017-2020 微波EDA网 版权所有

网站地图

Top