微波EDA网,见证研发工程师的成长!
首页 > 研发问答 > 嵌入式设计讨论 > 嵌入式系统设计讨论 > 从移动到桌面—ARM挑战X86

从移动到桌面—ARM挑战X86

时间:10-02 整理:3721RD 点击:
ARM这一缩写至少有两个来源可考:一是来源于它的特性,“Advanced RISC Machine”,也就是高级精简指令集机器;另一个则是来源于它的发明者Acorn公司所命名的“Acorn RISC Machine”。1983年,Acorn公司着手开发一种结构简单和实用的处理器,1985年,研发团队拿出了ARM1,次年又推出了量产的ARM2。ARM2是最简单的32位处理器之一,它一共包含3万个左右晶体管。此后到了1991年,尽管此时已经升级到ARM6,但晶体管数目也仅有3.5万个。直到近年来,随着内核数目的增加,ARM内核的晶体管数目才出现了较大增长。
  较少的晶体管数目并不意味着ARM处理器的性能落后,实际上,ARM内核以适应性高和节能著称。ARM并不像英特尔和AMD那样自产自销处理器,也不像英伟达那样把设计好的产品交给芯片厂商生产,而是采用出售知识产权核的方式对其他公司进行授权,并根据内核的先进程度、可集成程度等特性不同而收取不同的费用。一些有实力的公司也可以在这些授权的基础上对ARM内核进行改进,或者加入其他功能模块,比如GPU、高清编解码、音频处理等等。因此智能手机中的处理器尽管使用了相同的ARM内核,但使用的GPU等部分却完全不同,这使得ARM处理器的组成和配置相当灵活。
  在手机的智能化浪潮中,ARM处理器可谓功不可没。正是它出色的性能,低廉的成本和更低的耗电,配合iOS和Android这样的操作系统,才使得智能手机广受用户的欢迎,ARM架构也从寂寂无名变得广为人知。此外,在平板电脑市场中,ARM处理器也占据着绝对的优势,上至数千元的iPad2,下到数百元的山寨平板电脑,都把ARM处理器作为第一选择。目前,ARM架构处理器已经占据了32位微处理器市场的75%。不过,如今ARM已经不再满足于在嵌入式系统、智能手机和平板电脑等领域大显身手,随着性能的不断提高,ARM的目光已经投向笔记本电脑、服务器等x86处理器的传统领域。与此同时,以Atom平台为代表的x86低能耗处理器也在不断向ARM处理器的领地发起挑战,双雄相争,IT业界将会再添加一个火爆的看点。
  自2010年以来,超节能处理器正在进入一个空前强大的时代:随着Cortex A15、Krait等新一代内核的出现,超节能处理器的性能已经达到了前所未有的水平,同时依然保持着低能耗和低成本的特性;在高通、三星和英伟达等公司的努力下,64位、多内核等全新的特性也开始逐渐变为现实。就连业界的巨鳄微软、Adobe和苹果也纷纷向ARM大送秋波:微软在Windows 8里加入了对ARM处理器的支持;Adobe开发了针对ARM处理器的Flash插件;苹果除了在热卖的iPhone和iPad中引入ARM处理器之外,还在探询将ARM处理器引入超便携笔记本电脑中的可行性。ARM的“胳膊”正变得越来越粗壮,看起来,非x86架构的超节能处理器和x86处理器正式掰手腕的时刻已经越来越近了……
更多技术交流欢迎咨询技术姜老师
  内核:数量与性能齐增
  超节能处理器近年来获得了业界的青睐,并进而威胁到x86处理器的传统领地,这与它的技术进步是分不开的,而技术进步的核心则毫无疑问是内核的进步。如果超节能处理器的内核能够在功率没有多少增加的情况下超越x86内核,那么整个IT业界的游戏规则都将被颠覆,不过,目前看来出现这一幕还需要一段时间。
  从双内核到多内核
  随着智能手机和平板电脑技术的发展,此前单内核ARM处理器面对越来越复杂的应用已经显得力不从心。如果单纯提高处理器内核的频率,那么难免会走上Pentium 4的老路。在系统中设计多个并行的内核,已经被x86处理器证明是行之有效的技术路线,况且不对称的多内核在ARM架构处理器中是常见的设计。早在数年前,双核超节能处理器架构已经出现,进入2011年以来,双核处理器已经成为高端手机和平板电脑的标配,尤以NVIDIA Tegra 2处理器风头最劲。
  随着双核处理器的成功应用,超节能处理器内核数目的进一步提升也提上了日程。Marvell公司在2010年年初的CES展会上就宣布,他们将会设计和推出一款基于Cortex A9的四核ARM处理器,这就是同年10月份发布的ARMADA XP,也是全球首款四内核ARM处理器。这款处理器主要面向企业级应用,它拥有4个最高运行频率达到1.6GHz的ARM内核,拥有2MB二级缓存,运算性能可达16600MIPS,功耗则低于10W。同时,处理器提供最高频率800MHz并支持ECC 的64bit DDR2/DDR3/DDR3L内存接口,四条PCI-E 2.0通道、4路千兆以太网接口以及最高16条Marvell SERDES多功能通道(可定义为PCI-E、SATA、SGMII、QSGMII等),另外还可提供多个USB接口。三星、德州仪器、创新和飞斯卡尔等公司也有自己的四核处理器计划,比如三星的产品开发代号为“天鹰座”,主要面向上网本应用,将在2012年后面世;飞斯卡尔的产品i.MX 6Quad已经在CES2011上披露,它将拥有4颗最高运行频率为1.2GHz的Cortex A9内核,并支持1080p编解码、3D图形和大量外部接口,共拥有96个Stemcell媒体处理核心,目前正在开发中。同样规格的产品还有创新Zii Labs的ZMS-40,也拥有96个Stemcell媒体处理核心。当然,我们也不能忘记Tegra 3,它拥有4个运行频率高达1.5GHz的Cortex A9内核,这款处理器在今年的台北电脑展上亮相,强大的3D处理能力依然是它的卖点。从它能够流畅运行DirectX 11游戏的DEMO来看,明年平板电脑和手机又有好戏看了。高通方面的多内核处理器则要等到Krait架构的出现,具体时间将是明年年初或第二季度。
  向x86发起挑战
  在众厂商纷纷推出多内核处理器的同时,ARM方面也启动了新一代内核的开发计划。这全新一代的内核被命名为Cortex A15,一年多以前,ARM正式宣布了它的诞生。Cortex A15处理器的一个内核集群可以有1~4个内核,彼此通过AMBA 4技术互联,单个内核运行频率高达2.5GHz,最多可以拥有8个内核。Cortex A15内核支持一些全新或者改进的特性,比如 Thumb2,它可以为传统的ARM指令提供优化的管理,使所需内存减少30%;改进的NEON技术可以对视频和多媒体处理加速;浮点引擎提供了更加强劲的浮点处理能力;支持1TB的大内存;提高了传统虚拟机的处理速度等等。通过这些改进,Cortex A15内核的性能将在Cortex A9的基础上提高50%。
  ARM方面认为,Cortex A15内核可以与x86内核处理器一争高下,在能耗方面,尽管Cortex A15可能将会比Cortex A8/9的能耗更大,但性能更强,与Atom相比,它的能耗依旧占优势。如果在内核数目、运行频率和搭载的功能模块上进一步优化,那么ARM处理器可望在服务器领域和超便携笔记本电脑领域取得新的突破——Cortex A15内核完全能满足一般的服务器以及家庭电脑应用需求。而此前不久,苹果还声称,将会在笔记本电脑平台上考虑使用ARM处理器,而英特尔的反应则值得玩味——他们的表态是,将会加强节能型处理器的研发以满足苹果的需求。或许ARM的强势发展令英特尔感受到了威胁。
  高通方面推出了Krait内核来替代自己的上一代产品Scorpion,它的最高运行频率也达到了2.5GHz。同样,Krait架构也支持每周期3指令解码、乱序执行等特性,但整数流水线深度小于Cortex A15。不过根据高通方面的宣传,Krait将比Cortex A15的性能高1.5倍,同时功耗下降60%,听起来非常令人期待。如果Krait真能如高通所言那样强大,那么Cortex A15可能将会碰上一个强劲的对手,不过,图形系统可能成为它的一个短板。
  英伟达方面则采用了两条腿走路的策略,一方面,基于ARM核心的Tegra3和Tegra4的发展正在紧锣密鼓地进行,后者将拥有4~8个Cortex A15内核,3D处理性能也非常出色,已经初步具备了挑战x86处理器的实力。另一方面,今年年初披露的“丹佛计划”处理器则是面向桌面和服务器应用的自主设计产品,仅采用ARM v7指令集。据称,它将最多拥有8个内核、256个CUDA核心,这样的规格已经完全可以与x86处理器相提并论。
  视觉处理能力:成倍提升
  超节能处理器在视觉处理能力方面主要依赖第三方的3D引擎和视频核心,除了内核的进步之外,视觉处理能力对超节能处理器也非常重要。在这一方面,它们的发展可以用日新月异来形容,也许只有当年3D技术革命的时候才能与之相媲美。
  GPU的争霸时代
  超节能处理器GPU部分的开发设计厂商中,最主要的一家是Imagination Technologies,它们的PowerVR系列是ARM内核的出色搭档,目前的PowerVR 5/SGX系列GPU占有了这一市场相当大的一部分份额,大名鼎鼎的Apple A4/A5处理器分别集成了PowerVR SGX535和SGX543MP2。2011年2月,Imagination Technologies推出了最新的PowerVR 6图形处理器,6月份已经开放授权。该公司并未公开PowerVR 6的具体细节,仅仅表示PowerVR 6在性能和能效比方面“无可匹敌”。不过,意法爱立信今年2月在MWC大会上公布的Nova A9600搭载的PowerVR 6 GPU每秒钟可生成3.5亿个真实多边形,以及每秒5000万像素的填充率,或许可以作为PowerVR性能的一个参考。
  ARM自己的Mali图形内核此前显得不大给力,不过今年9月份,Mali-400MP在AnandTech网站的一次横向测评中取得了不错的成绩,尽管还大幅度落后于SGX543MP2,但比SGX540要好不少。ARM方面也表示,他们的新Mali GPU Mali-T604速度已经可以和Playstation3、Xbox 360相对抗,但与PowerVR相比,Mali依然没有太多的亮点。高通方面的Adreno GPU也在不断发展中,目前路线图中给出的最先进图形内核是与四内核Krait搭配的Adreno 320,它也将采用四核设计,效能比“以往产品”高4~15倍。
  另一个我们可以期待的厂商自然是图形芯片大厂英伟达,它的Tegra 3处理器GPU有12个流处理器,而Tegra4处理器将会有24~60个支持DirectX 11的CUDA流处理器。更值得期待的是“丹佛计划”处理器,它可能将拥有256个CUDA流处理器,相当于GeForce 6级别的GPU,这比现在台式机处理器集成的图形内核还要强劲。不过这一处理器很有可能更多面向超便携笔记本电脑等平台,对手机和平板电脑而言,它的能耗恐怕是个很大的问题。
  尽管在手机和平板电脑上玩3D游戏的体验可能不如台式机,但作为一个新的增长点,未来一段时间内,GPU性能很可能将成为消费者购买随身设备的重要考虑因素。不过,如同20世纪90年代的3D芯片和游戏市场一样,目前不同的3D游戏开发商会对不同厂商的GPU进行优化,因此推演测试中的数据并不能和游戏体验完全划等号。
  高清视频处理的进步
  除了3D性能,高清视频处理能力也是超节能处理器关注的重要问题,在某种意义上,这一能力甚至会被置于更加重要的位置。目前的超节能处理器已经拥有不错的高清视频回放能力,而在新一代超节能处理器中,高清视频处理能力则得到了进一步加强。具体表现在能以更高的速度编解码高清视频、超高清视频回放、拥有高清3D视频的编解码能力等。
  在平板电脑和智能手机平台上,高清3D视频编解码将会成为最热的特性之一。2011年伊始,LG、HTC、华硕、三星等厂商都迫不及待地发布了各自的3D平板电脑或3D智能手机,但它们的处理器依旧停留在Tegra 2或OMAP 4这样的级别上,消费者体验也差强人意。不过这种情形不会持续太久,在新一代集成GPU上,3D高清视频编解码能力将得到进一步加强。此外,考虑到某些机型可能会采用超高清分辨率的屏幕(比如传说中的iPad3和三星Galaxy 3D),4K4K级别超高清内容编解码能力也将被未来的超节能处理器引入。
  值得期待的新产品
  伴随着新内核和新GPU的发布,下一代超节能处理器的细节也逐渐明晰。让我们来预览一下将在2012年出现的几款最新超节能处理器。
  ARM Cortex A15内核
  ARM方面预计Cortex A15将在2012~2013年左右供货,目前已经有多家公司宣称将推出基于Cortex A15内核设计的产品。德州仪器是第一个获得Cortex A15核心授权的企业,它已经于今年2月宣布了OMAP5处理器,预计该处理器将在2012年交付给下游厂商。OMAP5处理器的设计相当新颖,它包含两个运行频率高达2GHz的Cortex A15核心以及另外两个Cortex M4内核,后者用于提高系统的反应速度。OMAP5内置PowerVR SGX 544图形处理器,拥有2MB缓存并支持最大8GB内存。目前OMAP5已知型号为OMAP5430/5432。除了德州仪器之外,还有至少10家以上公司得到了Cortex A15的授权,它们的产品也将在2012~2013年上市。
  高通Krait内核
  此前有消息称,高通Krait内核处理器将会推出单核的MSM8930、双核的MSM8960以及四核的MSM8974。其中规格最高的MSM8974运行频率为2GHz~2.5GHz,拥有2MB二级缓存,支持双通道667/800MHz DDR3内存,并集成Adreno 320图形芯片。Krait内核处理器被命名为Snapdragon S4系列,MSM8960可能将作为最早出现的新内核处理器,在2011年年底或者2012年年初就能够交付使用,它们将采用28nm工艺制造。基于此前高通和HTC等厂商良好的合作关系以及Krait内核高调的性能宣传,我们期待它们可以为国产手机和平板电脑带来强劲的动力。
  Tegra4与丹佛计划
  目前风头正劲的NVIDIA Tegra3处理器已经快要量产,而代号为“Wayne”的Tegra4处理器则已接近流片。Tegra4处理器第一版将拥有4个Cortex A15内核,运行频率为1.5GHz,集成至少24个CUDA DirectX11流处理器,浮点运算能力达到100Gflops,是Tegra2的10倍。Tegra4第二版则将拥有8个Cortex A15内核,32~64个CUDA DirectX11流处理器,面向平板电脑、上网本和超便携笔记本电脑市场,也可以与x86处理器一较高下。
  此外2011年年初,英伟达方面宣布了“丹佛计划”,也就是利用ARM指令集,独立设计架构的自主型处理器。根据目前泄露的信息,丹佛处理器最多将拥有8个处理器内核和256个CUDA流处理器,是一款64位的高性能产品,但运行频率不会很高。从丹佛处理器的规格来看,它似乎是以平板电脑和超便携笔记本电脑市场为目标的产品。今年12月,丹佛处理器将首次完成流片,但上市时间可能要等到2013年。
  苹果与ARM
  乔布斯的去世令许多人都缅怀他重建苹果帝国的伟大功绩,不可否认,苹果成长为世界上市值最高的公司与乔布斯的领导以及它本身的创新能力是分不开的,但同样需要指出的是,苹果的成功有着ARM的一份重要贡献。
  苹果最受欢迎的产品——iPhone手机和iPad平板电脑都采用了ARM架构的处理器,特别是Apple A4和Apple A5处理器,它们分别基于Cortex A8和A9内核,前者是iPhone4和iPad的“心脏”,后者则被iPad 2所采用,同样也搭载在刚刚发布的iPhone 4S上。ARM处理器出色的性能,超低的能耗,与苹果高效易用的iOS相配合,谱写了近年来IT史上的新传奇。
  苹果对ARM处理器的爱好还在进一步向笔记本电脑平台延伸。此前不久有传言称,由于不满英特尔超低电压处理器的耗电,苹果有意在笔记本电脑平台产品中采用ARM处理器。英特尔回应了这种说法,表示会拿出更具竞争力的产品。ARM有望染指x86的传统领域吗?目前看来还没有到最佳时机。首先,x86这类高性能处理器的设计已经历经多年积淀,英特尔的酷睿微架构经过多次改良,在性能和耗能上取得了不错的平衡,而即使是性能最高的Cortex A15,也最多与Atom处理器旗鼓相当,与Core处理器的性能尚不在一个数量级上。其次,英特尔和苹果在个人电脑市场上的目标一致性更强,二者目前依然是相互依存的关系,并且在Thunderbolt接口等领域有着不错的合作,而笔记本电脑也是苹果最主要的盈利业务之一,现在完全没有必要与英特尔发生正面冲突。
  当然从长远来看,苹果转向ARM并非没有好处:首先,在iPhone和iPad平台上针对ARM丰富的开发经验将会帮助苹果更好地用iOS来统一各个平台;其次,在ARM处理器方面,苹果的自主性更强,可以按照自己的需求进行定制和优化。此外,ARM处理器出色的节能性也有较大的吸引力。
  Cortex A15的新特性
  与前一代Cortex A9相比,Cortex A15使用了超长的24级流水线结构,前12级用于指令预取、译码与分发,这部分指令流水是顺序执行的,后面指令执行阶段则支持乱序执行。这种超长的流水线结构有利于处理器主频的提高,但是与Cortex A8相比,在使用相同的工艺时Cortex A15的主频仅仅提高了10%,因此工艺的进步也有贡献。由于采用较长的流水线,Cortex A15必须增强分支指令的预测命中率,这方面的前车之鉴正是Pentium4。Cortex A15分支预测部件在Cortex A8/9基础上进行了加强,但与酷睿微架构相比就显得过于简单,毕竟二者不是竞争对手。
  Cortex A15的指令预取总线的宽度为128b,一次可以预取4~8条指令,与Cortex A9相比,提高了1倍。Cortex A15引入了Micro-Ops(微指令)的概念,解码器每次可以译码3条指令,并将这3条指令转化为5个Micro-Ops,而Cortex A9每次只能译码2条指令。Cortex A15 Interger Issue(整数部件)的指令装载能力也从Cortex A9的3条提高到4条,并具有独立的读入和存储部件,流水线则使用128位宽的数据总线。Cortex A15还使用了32个Entry的Loop Buffer,当处理器执行一段较长的循环指令时,指令流水线可直接从Loop Buffer中获得Micro-Ops,而无需使用Fetch和Decode部件,从而减少能耗,酷睿微架构中也有类似的设计。
  流水线的增长和复杂程度的提高使得Cortex A15的性能更强,但能耗也会相应提高。目前我们尚不知该内核的具体能耗如何,但从宣传的“相同能耗下性能提高5倍”来看,这颗核心的确值得我们期待。
  超节能处理器改变游戏规则
更多技术交流欢迎咨询技术姜老师
  仅仅在5年前,英特尔放弃Xscale之时,x86普及到手持终端的豪言仍在耳边;今天ARM已不再仅仅拥有低功耗这一张王牌,多种架构并行、产品百花齐放,其勃勃生机已令微软这样的巨头侧目。未来ARM在手机、平板电脑之外,还有多少向上发展的空间,会否威胁到已成体系30年的PC市场、超越摩尔定律、打破IT界的游戏规则,这一切改变,两三年内即见分晓

牛*

Copyright © 2017-2020 微波EDA网 版权所有

网站地图

Top