微波EDA网,见证研发工程师的成长!
首页 > 硬件设计 > 行业新闻动态 > 异构多核还有多少潜力,手机处理器厂商的“道”与“术”

异构多核还有多少潜力,手机处理器厂商的“道”与“术”

时间:03-08 来源:华强电子网 点击:

众所周知,手机处理器正在以摩尔定律的速度向前演进,由此前的单双核已经发展到当前的八核十核,而芯片核数的变化也一直受到了下游终端厂商和用户的青睐。而对于单双核已满足手机运行所需来说,多核的累加究竟是性能升级还是嘘头?

"多核并不是一种噱头,而是智能手机的应用环境决定了其应该往多核方向发展,多核正在取得上下游厂商的一致认可。自big.LITTLE后,现在ARM也正在研究新架构,这种新架构也是针对多核。我们与上游厂商的战略方向是一致的,相信有了上下游厂商的通力合作,多核应该能发挥出它最大的优势。"联发科如是说。

ARM处理器部门市场营销总监Ian Smythe告诉记者,big.LITTLE技术现已演进成为手机领域常见的标准,将高性能的CPU与高能效的CPU整合到一个相干的子系统中。这最终将形成一个能保持高性能和较低平均功耗的异构处理系统,赋予用户更好的移动体验。

"通常而言,多核的趋势与移动设备上运行的软件工作量相匹配。许多应用程序的线程运行状态包含一个,两个,或者三个高性能的线程以及为数众多的背景线程。我们注意到六和八核系统能很好地应对通用的工作量,尤其是当其中2到4个CPU是高能效的‘小’核CPU能以非常低功耗处理较轻的线程。我们还发现,当‘大’核不必顾及背景线程时,可以充分专注于主要的软件线程,使净性能得到提升。"Ian Smythe如是说。

"我们关注的不只是‘核数’,更多的是‘核术’。无论核多核少,最重要的是要有优秀的战术来调度各个核心,实现效能最大化。比如我们的Helio X20采用全新的Tri-cluster十核独特架构,专为处理移动设备的各种高度、中度及轻度负载工作项目所设计,包含两颗ARM Cortex-A72所组成的单架构;以及二个内含四颗ARM Cortex-A53的架构。"联发科说到,442是一种很经典的足球阵型,现在国际上很多流行的阵型都是由442演变而来,这种阵型的优势是攻守兼备,而X20的十核也是442阵型。

Ian Smythe告诉记者,在典型的big.LITTLE系统中有很多使用案例,4个"小"核很有效,并配合2个、3个甚至4个"大"核。基于我们测试big.LITTLE系统时的观察发现,在超过四核的情况下,核的类型比核的数量更重要。我们注意到使用8个相同类型的"小"核确实有一定优势,但是将1或2个"大"核与2或4个"小"核搭配的优势要更明显,形成2+2或2+4的组合。所以,在我们看来,2+4 big.LITTLE系统有明显的优势,例如采用2个Cortex-A72的2+4 big.LITTLE设计比8个核全使用Cortex-A53和更有优势。

Ian Smythe表示,ARM所有的IP授权都支持芯片厂商通过物理实施,核数量,不同IP搭配等途径实现设计的差异化。一些合作伙伴基于ARM架构定制自己的微处理架构,我们允许架构合作伙伴对设计进行调整和优化,当然这需要更多投资和强大的CPU设计团队。

Ian Smythe告诉记者,最新十核设计有个有趣的设计,就是能实现三个层次的性能表现,一个"大"核簇,一个"小"核簇用于推动更高性能,以及一个针对最高能效的"小"核簇。big.LITTLE技术的这一创新方法取决于ARM的商业模式,它为我们的芯片合作伙伴在尝试的过程中提供了不同选择。

此外,联发科再次强调,如今移动设备被要求能够处理功能更加多样、运算更加复杂的移动应用,每种应用对于手机的运算性能与功耗需求皆不同。手机芯片能否灵活地根据不同轻重的任务配备最适当的运算性能,而多核多丛集架构可以很好地解决4G产业链发展对智能终端带来的应用瓶颈。

而对于Helio X20十核心的处理器而言,十核被分为3个Cluster(簇),分别是四个低频A53+四个高频A53+两个A72的组合,如何能让这样的三簇处理器正常运行,令它们各自做适合自己的事情,把功耗做到最优的平衡,这需要一个好的调度系统。

联发科为此研发了一个定制的互联IP,联发科将之称为"联发科连贯系统互联"(MCSI)。它是联发科根据实际场景、实际应用而得出来的调度算法。具体而言,联发科告诉记者,Helio X20十核采用的三丛集架构,可更有效地分配工作,达到更理想的性能表现,同时延长电池寿命。同时,内建联发科技全新CorePilot? 3.0异构运算技术。CorePilot? 3.0为所有系统单芯片解决方案上的CPU和GPU调配工作,能同时管理处理器性能及功耗,可以在产生更低热力的情况下,追求极致性能表现。

相较之下,骁龙820并不追求核数,而是在异构中沉侵性能与体验。

高通市场行销副总Tim McDonough称,骁龙820采用自主四核Kryo CPU并集成Adreno 530 GPU 和Hexagon 680 DSP,在820处理器中的子系统中异构是关键,而对于异构而言,计算又是关键中的关键,骁龙820通过异构计算调度组合SoC不同的功能性内核,例如CPU、GPU和DSP内核,对比起使用同一内核处理不同任务,实现前所未有的性能和功耗表现。

从技术角度来看,异构计算是高通致胜移动行业的实力支柱之一。可以发现,高通正在打造一流的组件,这些组件包括CPU、GPU、DSP、多种连接引擎、多种多媒体引擎、摄像头引擎、显示器引擎、导航和传感器核心,高通的战略不仅涉及这些单独的模块,还将这些模块合理有效地结合在一起,为搭载骁龙820处理器的终端带来更好的用户体验。

"最新的big.LITTLE软件就是在‘异构’下,所有的核都可以同时运行,软件将占用不同的CPU内核性能。若系统要完全实现多核异构,那么就需要不同类型的搭配,比如Cortex-A72搭配Cortex-A53,或者全新的Cortex-A35。这种性能搭配将进一步提升用户体验,确保使用时的高性能并延长电池寿命。这就是为什么‘异构’被广泛采用。"Ian Smythe说到,值得一提的是,异构通常指的是同一个系统下运行的CPU和GPU。ARM研发多核异构从而实现Cortex-A CPU和Mali GPU的组合。一些特定情况下,例如图像处理和计算机视觉也可以放到GPU上,加快运行效率。我们正积极研发一些技术。一个例子就是全系统一致性,CPU和GPU可以拥有统一的存储,并能够在相同内存中运行,避免中间数据复制和缓存维护,这可以提升性能,减少带宽,进而减少能耗。

Ian Smythe强调,核的数量不仅仅包括应用处理器。多核芯片通常是指应用处理器中的核数量,然而这需要指明的是大多数的SoC都是异构计算,包含用于支持众多OS的Cortex-A 处理器,用于调制解码器的Cortex-R 处理器 以及用于外围I/O、系统控制的Cortex-M 处理器等。ARM核被广泛应用于典型的移动SoC。比如,LTE调制解码器通常采用Cortex-R处理器。

Tim McDonough进一步称,为更好地实现异构计算特性,与骁龙820和Kryo一起,Qualcomm还推出了Qualcomm Symphony System Manager,当竞品处理器将系统管理完全交给CPU核心处理时,Symphony则可以管理整个SoC的不同配置,从而选取最高效和最有效的处理器与专用大小核组合、并以最低功耗,最快地完成任务。

Ian Smythe表示,采用大小核技术实现异构处理可以带来更高的峰值性能,big.LITTLE能够帮助SoC设计者进一步发挥"大"核的性能表现,而由"小"核负责只需较低频率运行,而能耗更重要的部分;提升软件性能,big.LITTLE支持应用程序线程并行,可以同时运行多个核;减少功率消耗,通过将不需要最高CPU能力的应用程序任务交由高能效的 "小" 核来处理,节省能耗;易于集成,Big.LITTLE的软件机制可集成到Linux内核和Android堆栈,因此使用big.LITTLE异构非常便捷。

据了解,骁龙820支持最高达2.2GHz的处理速度,与前代产品相比实现了图形性能和计算能力上最高达40%的提升。而Helio X20主频为2.5 GHz,处理速度也将更快。

Ian Smythe告诉记者,在big.LITTLE架构中,通常会有一组CPU针对最高频率,另一组针对高能效。确保设立的目标正确非常重要。强迫"小"核实现任意频率会影响功耗,因此最好还是让"小"核为整个CPU执行最佳能效点和无缝的频率调节(DVFS)曲线。这最后一点对调度软件而言尤为重要。一组顺畅的DVFS操作点使得调度软件能更有效地在运行的应用程序中响应变化的性能需求。

而对于多核与主频的处理速度,联发科告诉记者,Android手机上很多应用是Multi-thread(多线程), 而且并不是每个thread(线程)都需要很高的性能, 所以我们的多核架构可以根据每个thread实际的性能需求来调用最适合的CPU来执行, 这样功耗可以节省很多,此外我们多丛集/多核心的架构对应目前在手机上的应用, 能同时兼顾高性能和低功耗。

华强电子产业研究所副所长潘九堂对此表示认同,并称,主频的处理速度跟多核架构的多线程设定有关,处理速度过快就会带来发热、功耗大的问题,所以多核架构的多线程的调动和平衡尤为重要。

Copyright © 2017-2020 微波EDA网 版权所有

网站地图

Top