微波EDA网,见证研发工程师的成长!
首页 > 硬件设计 > 行业新闻动态 > 麒麟960全面深度测试,华为这颗“芯”果然不是盖的

麒麟960全面深度测试,华为这颗“芯”果然不是盖的

时间:02-20 来源:驱动之家 点击:

对于智能手机来说,SoC的重要性不言而喻,而作为国产唯一自研的海思麒麟处理器,一直以来备受关注,发展至今,逐渐跻身于移动处理器中的领先水平,在麒麟960这款产品上,做到了"留长补短",被称作麒麟历史上具有突破性的产品,在随后的实际体验上,搭载麒麟960的产品都有着不错的表现。因此,而我们今天就来测试一下麒麟960在深层次上的性能。(注:测试数据编译自ANANDTECH)

注:ANANDTECH将麒麟960的工艺写成TSMC 16nm FFC,而实际上麒麟960的工艺为TSMC 16nm FF+。

从麒麟960、麒麟955、麒麟950三款(两代)产品参数表来看,相比于上代产品,麒麟960是全球首款采用ARM最新的A73架构的SoC,相比麒麟950,大核主频由2.3GHz提升至2.36GHz,小核主频从1.81升至1.84GHz,但略低于麒麟955的2.52GHz。可以看到,麒麟处理器对于CPU主频的还是做了一定的限制、以赋予GPU可以做到更高的性能。

麒麟960采用的A73架构出自于ARM在欧洲的设计团队,而非设计出A15/A57/A72系列的德克萨斯奥斯丁团队,因此尽管A72与A73在编号上只差了1个数,但在CPU的性能设计上则截然不同。A57、A72则是偏重高性能,承担着高端处理器上应付复杂数据的处理。A73则更加着重于对性能与功耗的平衡。


▲A73采用双发射L/S

值得一提的是,A73与A72比较明显的区别在于解码器的宽度,A73采用双发射L/S单元,在发射宽度上小于A72的三发射。虽然从纸面上有所降低,但根据资料显示,A73架构的11级核心流水线深度比A72的15级核心流水线深度更精简,因此发射宽度并没有决定性的影响到A73的性能。另外,A73更短的流水线减少了前端延迟,包括1-2个更少的解码器周期,它可以解码单个周期中的大多数指令,以及1个更少的周期用于读取层面。

电源管理:

这张图显示了A73相比于A72,在相同的进程和相同的主频下,A73能够比A72减少20-30%的功耗。并且A73号称目前处理器中面积最小的高端核心,每颗核心的面积在0.65mm,相比于A72上1.15mm的面积整整小了43%。

▲G71架构图

一直以来,麒麟处理器的GPU性能相比于骁龙被人诟病,因此在麒麟960上,GPU则最大限度的保持了性能。在麒麟960上,同样配备了ARM最新的G71处理器:Mali-G71 MP8,主频最高为1037MHz。G71采用ARM最新的Bifrost架构。与之前midgrad架构相比,Bifrost最大的创新在于使用指令组着色器(ClausedShader)。在G71上重新设计了执行单元,更好的利用着色器核心,增加吞吐量和性能。另外Bifrost架构还采用Quad based vectorization技术,相比于之前SIMD矢量化技术一次只能执行单一线程,Quad矢量化技术最高支持四线程执行,共享控制逻辑,使用率接近100%。

通过解读麒麟960的架构,我们了解了麒麟960的设计思路:注重CPU性能与功耗的平衡,以及GPU的极限性能,整个麒麟960没有哪部分成为明显的短板为人诟病。

CPU跑分测试:


▲SPECint2000单项测试


▲麒麟960 IPC

通过SPECint2000可以看到,麒麟960在CPU整数运算性能上相比麒麟950有了比较大的进步,A73的IPC比A72的高出11%、比A57增加29%。值得一提的是,竟然比骁龙821的kryo高出30%,比8890的Mongoose高15%。在这里,我们也只能说一句公版大法好了。


▲单线程整数IPC

GeekBench4的整数运算单线程跑分,可以看到,麒麟960总体来说也是有好有坏。相比麒麟950,在边缘检测(Canny)和直方图均衡(HE)项目中,麒麟960输给了其它三位对手,而在HTML5 Parse和HTML5 DOM的测试中,麒麟960则有上佳的表现。而在IPC的计算中,A73略优与A72 4%,但在SPECint2000的整数运算中,A73的优势则为11%,二者差距比较大,并且在单项测试中的起伏不定,因此比较A73与A72之间的好坏,则 是一个非常困难的事情。

另外,可以看到,A73的整数运算IPC大概是A53的1.7-2倍,这也是为什么那些只配备A53的中低端SoC性能表现不好的原因之一。


▲浮点单项测试

GeekBench4浮点运算,麒麟960的表现并不能算好。与麒麟950相比也不算优秀,而对比骁龙821则全面落败(当然,骁龙的浮点运算一直都不错)。考虑到A73的NEON执行单元与A72相比并没有改变,而降低了特殊指令的延迟,使得NEON的性能还提升了5%。因此这样的结果还是有些意外,只能猜测为有些测试项目受到A73解码器宽度的变化。但最终的原因,也只能在之后测试其它采用A73的SoC上的表现在下结论。


▲浮点测试IPC结果

在浮点IPC的结论中,麒麟960不出意外的只能排在中游水准,比骁龙821、麒麟950、三星8890都落后。而这也意味着麒麟96

Copyright © 2017-2020 微波EDA网 版权所有

网站地图

Top