微波EDA网,见证研发工程师的成长!
首页 > 硬件设计 > 行业新闻动态 > ARM构架优势可不是盖的,超算都离不开它

ARM构架优势可不是盖的,超算都离不开它

时间:06-21 来源:技术在线 点击:

软银集团斥资约3.3万亿日元收购了英国ARM公司。将ARM最大的优势看作是"省电的半导体设计技术"未免过于片面。

ARM提供的CPU核心的电路无疑具有优良的省电性能,但如果只追求省电,还有其他方法可寻,例如采用功能更少的CPU核心等。苹果和高通只采用ARM的指令集架构(ISA),而不是ARM的半导体电路,包括省电化在内的CPU核心的设计则是自己完成。

作为一家企业,ARM最大的优势是从智能手机到平板电脑、IoT、车载产品、服务器,都与支撑ARM架构的伙伴企业和技术人员构建了良好的生态系统,能够根据伙伴的需求,先行获取相应的硬件及软件技术。

例如在IoT领域,ARM于2015年收购了两家开发蓝牙软件及硬件的美国企业,以及一家从事IoT安全相关开发的以色列企业。ARM实施中长期技术投资、获取知识产权的姿态,赢得了许多企业的信赖,积累了基于ARM架构的软件资产。这就是ARM的制胜模式。

富士通非常关注ARM"交朋友"的这个优点。该公司正在预定2020年建成的超级计算机"后京"(PostKei,暂定名)的处理器时,将会把指令集从过去的SPARC换成ARM。

富士通为什么要采用ARM的指令集?该公司新一代技术计算开发本部长新庄直树、新一代技术计算开发本部第一系统开发统括部长清水俊幸就此接受了记者采访(采访时软银尚未宣布收购ARM)。

--为什么富士通在设计"后京"时要将指令集从SPARC换成ARM?

富士通新一代技术计算开发本部长新庄直树(左)与新一代技术计算开发本部第一系统开发统括部长清水俊幸(右)

这是出于对2012年开始运营的超级计算机"京"的反省。

我们之所以为"京"、FX10、FX100等超级计算机的处理器采用SPARC,是因为SPARC是开放式标准,扩展指令集也比较容易。

但采用SPARC之后,使用哪种OS成了一个问题。SPARC有采用"Solaris"的先例。但是商用的Solaris如果作为大规模并行超级计算机使用,处理的负担会比较重。于是,我们决定将曾经应用于PC集群式超级计算机的Linux移植到SPARC。

但是,使用SPARC版Linux的只有我们自己。既没有提供商用软件的供应商,也没有支持这一平台的"伙伴"。

SPARC版Linux也不是完全支持Linux原本具有的所有软件库。虽然大部分软件库在经过重新编译后都能正常运行,但其中也有例外。

所以我们决定,开发"后京"的时候换成有伙伴参与的平台。

平台换了,要选择哪种指令集呢?如果采用英特尔的x86架构,我们自己不能设计处理器,无法与其他厂商形成差异。在我们能设计处理器,而且伙伴多的架构中,ARM是最优秀的选择。

采用ARM与SPARC一样,也需要扩展向量运算等HPC(high performance computing)专用的指令集。

正好ARM也在研究为HPC扩展ARM架构,于是富士通与ARM进行了深入的讨论。在2014年富士通决定采用ARM架构的时候,扩展指令集也大致确定了下来。

在2016年8月下旬举办的半导体芯片国际会议"Hot Chips"上,ARM将会以"ARMv8-A Next Generation Vector Architecture for HPC"为题,介绍ARM的HPC扩展指令集的详细情况。除了富士通,ARM也会向其他企业提供扩展指令集的授权。

--芯片供应商不能像过去的SPARC一样,自主扩展指令集吗?

ARM的指令集包括扩展命令在内,都归ARM所有。我们这样的授权对象不可以自由扩展。

特别是对于64位ARM架构"AArch64",ARM几乎不允许授权对象扩展指令集。

过去的32位版ARM的指令集曾经出现过许多种"方言"。这给开发支持ARM的软件堆栈造成了麻烦。因为使用某家企业的处理器可以运行的软件,在使用其他处理器时有可能无法运行。

--将指令集变更为ARM之后,富士通的处理器会发生怎样的变化?比如说,对功耗性能会不会产生影响?

决定功耗性能的不是指令集。CPU微架构(从软件角度看不到的管线、寄存器配置等CPU内部设计)的贡献要大得多。

指令集与微架构之间的关系并不算太密切。如果是(RISC型等)特性相似的指令集,除了解析指令的解码器电路,其他的结构都基本一样。

虽然指令集将从SPARC换为ARM,但我们要保留在使用"京"、FX10、FX100的SPARC处理器时有效的所有微架构上的功能。

--采用ARM的"后京"将会成为怎样的超级计算机?

详细情况不能透露,但我们想要沿袭"京"、FX10、FX100"使用通用CPU,最大限度提高实际应用性能"的基本思路。还要尽可能提高制作高执行效率应用的难易度指标,即B/F比(主内存带宽与浮点运算性能的比值)。

日本开发超级计算机程序代码的人才不如美国和中国丰富,因此很难用"通过调整程序代码来改善处理器性能平衡"之类的

Copyright © 2017-2020 微波EDA网 版权所有

网站地图

Top