神威太湖之光只能靠跑分“作秀”?其实有大作用
构的超算在运算中既使用处理器,又使用GPU或众核芯片等加速器。以中国天河2号和神威太湖之光为例,天河2号有16000个计算节点,每个节点由2片Intel-E5-2692和3片Xeon-Phi组成,共使用了32000片Intel-E5-2692和48000片Xeon-Phi。神威太湖之光虽然只采用了申威26010众核处理器,看起来像同构超算,但由于申威26010集成了4个管理核心和256个运算核心,一片申威26010就是一个计算节点,管理核心执行类似于天河计算节点中E5的功能,而256个运算核心则发挥了类似于Xeon-Phi的加速作用,因此也属于异构超算。
由于异构编程需要提前预知模型并做特殊优化,而且很多应用未必适合异构模型,使得采用异构计算的超算对于编程和优化的要求更高--一位业内人士就评价,"异构编程太劳心劳力了,高端人才的精力应该用在关注自己的专业上来,而不是当代码狗......年纪大一点的科研人员就不愿自己编代码了,一些年青但不愿劳思费神的科研人员也不愿意编写异构代码......"。因此,采用异构计算的超算在Linpack效率上天然低于采用同构计算的超算。
那么既然同构超算在编程方便和效率上具有优势,为何全球超算都转向异构计算呢?原因就在于,这样超算可以获得更高的性能,之前抱怨异构编程太劳心劳力的业内朋友就表示,"超算方面众核是近些年的趋势,虽然编程劳心费力,但是在性能面前我们还是得忍,相同成本谁不想性能更好,科研对性能的需求可以用饥渴来形容"。
唠唠叨叨说这么多,主要是为了打一个补丁,防止别有用心之徒用美国同构超算和中国异构超算比Linpack效率,进而抹黑中国超算Linpack效率低下,何况前者的规模远远小于后者。
什么是HPCG
目前,评价超算的指标有不少,除了测试Linpack的TOP500,还有强调的是内存带宽和延迟的Graph500,Graph500对全系统的内存带宽和内存延迟有很高的要求,而计算能力本身已经不影响测试结果了,这种测试偏向于访存密集型运算,在大数据分析等场景下比较有意义。
除Graph500之外,还有强调节能环保的Green500。那么,在Graph500和Green500排行榜上,神威太湖之光的表现如何呢?Graph500名列第二,Green500名列第三。
不过,也有工程师认为无论是TOP500,还是Graph500都过于极端--TOP500过于强调计算性能,Graph500过于强调带宽和延迟等因素,因此采用了新的标准HPCG。
HPCG是美国正在推的一个新测试标准,目前还没有被业界广泛接受,HPCG代表了共轭梯度迭代法的一类应用的计算和通信特征,仅仅代表了某一个方面的特征,并不能涵盖超算的所以特征。HPCG比较重视计算性能和通信的平衡,如果计算性能和通信不是一个量级的,即便两项指标分开看都很强,但也会导致HPCG偏低的结果。
另外,HPCG也存在一些缺陷,据业内人士介绍,"由于针对具体硬件结构修改共轭梯度算法很容易得到高得多的成绩,为了避免这一点,HPCG代码目前还在锁定状态,不准修改算法本身。但在使用中,用户是会修改算法的,这使得这一测试会脱离实际"。
在某媒体的报道中,"但在更具实战意义的HPCG性能(高性能共轭梯度基准测试)中,太湖之光只有0.371PFLOPS,效率则只有0.3%,这比天河2号的1.1%还要低",0.3%和1.1%的数据和该媒体的这种表述很容易让人误认为,天河2号和神威太湖之光的HPCG测试结果非常差,但实际上,在HPCG测试排行榜中,天河2号位列第一,而神威太湖之光为列第三,这其实是很不错的成绩。而且一位业内人士猜测,"也许神威还没有好好进行优化"。
必须指出的是,神威太湖之光的HPCG低于天河2号,并非是因为计算性能或在通信上不如天河2号,恰恰相反,在计算性能上神威太湖之光大幅领先于天河2号,而在互联网络方面,神威太湖之光也不逊色于天河2号--虽然在带宽上有差距,但在实际应用中,带宽指标比较延迟等指标而言并不太重要(延时指的是1个CPU把自己的计算结果交给其他CPU,如及时送到,其他CPU就能继续计算,否则就要等待了,芯片、链路、协议等都会影响延时)。因此,神威太湖之光在HPCG上逊色于天河2号,原因就在于计算性能实在是过于强悍,以至于产生了计算和通信上的不平衡,并最终导致自HPCG上逊色于天河2号。
神威太湖之光能否用得起来?
对于神威太湖之光根本用不起来的说法,其实只要关注新闻,就能明白这是彻头彻尾的谎言。凭借"神威?太湖之光"强悍的计算性能,国内科研单位在天气气候、航空航天、海洋科学、新药创制、先进制造、新材料等重1要领域取得了一批应用成果--由中科院软件所、清华大学和北京师范大学申报的"全球大气非
- 内幕:天河二号被禁购英特尔芯片,美国嫉妒的要死了?(03-20)
- 技术封锁没见效,“天河二号”再夺冠(06-14)
- 好饭不怕晚,国产新超算性能大逆袭,英特尔我们不再需要你(06-14)
- 史上最全,龙芯家史大起底(08-24)
- 惊天内幕:“天河二号”超算已经闲置到令人发指的地步?(01-01)
- 探秘“神威·太湖之光”,中国欲成超算强国(07-30)