微波EDA网,见证研发工程师的成长!
首页 > 硬件设计 > 硬件工程师文库 > 意法爱立信移动平台多核处理技术

意法爱立信移动平台多核处理技术

时间:02-03 来源:互联网 点击:

性(不同处理过程中的多个标签)的原因,浏览器引入了并行活动。但是,因为缺少充足的均衡的软件并行技术,浏览器无法满足双核以上数理器的运行需求,测试结果显示,处理器从双核进化到四核,浏览器性能提升很小或根本没有提升。

图4 所示是在同一四核处理器硬件/软件平台上运行的两款主流浏览器的测试成绩,通过软件设置(热插拨)可以选择不同的处理器数量,因此,测量结果完全是同一硬件/软件环境的真实数据。在所有的配置中,工作频率完全相同。相对分数是指在多次重复测量中若干个主流网站上的网页加载时间的平均值,因此,这个用例代表了真实的网站浏览体验,而不是人为的基准测试。当从单核切换到双核时,速度提升30%是一个较好的成绩,符合预期。然而,从双核切换到四核时,处理速度只取得0-11%的提升。在双核处理器上进行相似的测试,从单核切换到双核时,处理速度提升高达50%。

另一方面,如前文分析PC 处理器时提到的,不论处理器有多少个内核,频率提高总是有益于提升软件性能。当对多核处理器方案进行比较时,这一点很重要,因为处理器内核增加会对频率产生负面影响。互连线和存储器等共享资源冲突,高速缓存、一致性电路的扩展受限,这些因素都会限制多核处理器的频率提升。为提升多核处理器的总体频率,需要使用软件多核处理方法补偿多核处理器降低的频率。例如,我们在以前的折衷分析 [5]中提到,四核处理器的频率比双核处理器降低约27%,软件必须有70%的代码实现并行化,才能使四核处理器的性能优于双核处理器,这是一个很大的比例,几乎没有应用软件能够达到这个水平,当然不是通过原生并行,因为取得如此高的平行化,需要特殊的专门的并行化工作。

前文提到软件并行化程度很低,所以速度较快的双核处理器可轻松战胜速度较慢的四核处理器,这种现象在网络浏览器中特别明显,如图5 所示,为了与1.4GHz 的双核处理器比较,我们人为的将四核处理器的配置降至1.2GHz,从图中可以看出,即便两者频率相差很小,低于20%,速度较快的双核处理器始终优于速度较慢的四核处理器。

我们对手机的其它重要应用软件进行了类似的测试,例如,视频游戏、程序启动时间和多媒体功能,每次都取得相似的结果:在频率相同的条件下,CPU 从双核进化到四核,性能提升很小或根本没有提升;当速度相差15-20%时,速度较快的双核总能击败速度较慢的四核。

从正面看,智能手机搭载四核处理器应当会刺激软件开发人员更有效地利用四核处理器,希望比PC 业在最近10 年做得更成功。智能手机的可用资源比PC 机的可用资源更敏感,即使移动处理器无限接近PC 处理器,两者之间还有很大差距。在软件方面,在移动移动平台上运行级的应用软件还有很大的压力,综合以上,再加上更低的功耗限制和更激烈的市场竞争环境,这些应该给软件开发人员足够的动机,投入更多的资源提高多核处理器的利用率。

多媒体是一个令人关注的领域,这个领域通常对处理性能要求严格,多媒体软件自然适合并行化。扩增实境、计算摄影学、手势识别等令人兴奋的新应用领域都将应用并行处理技术,因为这些功能的稳定性不适合硬件加速。在这些应用领域,多核处理器也有竞争技术,通用图形处理器(GPGPU)同样是可编程多核处理器解决方案,不同的是,GPGPU 将代码映射到GPU 而不是CPU。目前,GPGPU 的编程难度比多核CPU 更大,但是GPU 硬件发展速度很快,编程模型和工具也取得很大进展,因此,目前发展趋势还不明朗。

异构多核处理技术

移动异构多核处理器的设计原理是,使用高性能但功耗高的处理器执行要求严格的应用任务,使用速度慢但高能效的处理器运行要求不高的任务。目前市场上已经有异构四核处理器平台,例如,NVIDIA 的 Tegra 3 采用的Variable SMP [6]技术,采用 ARM big.LITTLE[7]解决方案的异构多核处理器预计不久就会上市。这个想法当然很好,但是成功还需要一些时间;像比较双核与四核处理器一样,简单的解决方案只要可行,总是被优先选用,特别是涉及复杂的软件修改时,简单的解决方案总是胜出。我们稍后将分析如何利用 FD-SOI 硅技术以更简单、更有效的方式达到同样的效果。

异构多核处理器使软硬件都变得十分复杂,图6 所示是ARM big.LITTLE 硬件解决方案。

硬件变复杂的主要原因是,处理器高速缓存只有保持一致性,才能用于智能手机操作系统假设的共享存储器系统,为此,AMR 在互联线上引入了ARM ACE 接口技术,但这却提高了硬件复杂程度,导致缓存一致性流量增加。

Copyright © 2017-2020 微波EDA网 版权所有

网站地图

Top