微波EDA网,见证研发工程师的成长!
首页 > 硬件设计 > MCU和DSP > 突破应用樊篱,移动GPU市场方兴未艾

突破应用樊篱,移动GPU市场方兴未艾

时间:10-14 来源:互联网 点击:
  在智能移动终端产业一派繁荣的景象之下,CPU处理器的发展已几近极限,而移动端对于 GPU图形处理器的性能需求却远远没有停止。根据市调机构Jon Peddie Research针对2013年上半年个人移动设备(智能手机、平板电脑以及掌上游戏机等)GPU出货量情况的统计,由于获得苹果与三星等应用处理器的采用,Imagination Technologies公司以37.6%的市场占有率位居IP供应商的第一位;高通以及IP授权商ARM、Vivante则紧随其后。


各移动GPU供应商的市占率统计


  与此同时,近一年来,移动GPU市场正处于飞速发展之中,特别是从去年下半年开始,各大厂商纷纷加大了对移动GPU市场的布局力度:去年年底,ARM同时推出了两款分别针对高端市场和入门级应用的移动GPU(Mali-T760与T720);今年初,Imagination则推出了高端系列PowerVR Series6XT GPU和入门级Series6XE GPU;Vivante发布了基于Vega技术、可有效处理4K媒体的GPU IP内核(GC7000);高通大力宣传自己的下一代移动GPU Adreno 420,并已用于骁龙805上;NVIDIA发布的Tagra K1首次把PC级的GPU搭载到了移动处理器上。所有迹象表明,在不同公司的企业经营策略之下,移动GPU市场正呈现出日益激烈的市场竞争态势,更多具有鲜明个性化特色的芯片方案将不断涌现在市场之上。

  克服移动运行环境的局限
  对比应用在PC上的GPU性能,ARM公司多媒体处理器事业部市场营销副总裁Dennis Laudick认为,GPU在移动设备运作环境中与在PC中是全然不同的。例如,应用在PC上的GPU可以通过一个AC电源获取到大量的电力,并通过非常高功耗PCI等接口连接到大量的内存带宽,这样的例子不胜枚举。因此,在PC环境中开发的技术并不会去考虑功率/面积/热/带宽等限制,而是更加直接地藉由越来越多的电力和资源来提高性能。

  “但在移动环境中的GPU则正好相反,它必须要面对各种不同的约束。在移动的环境下,电源供电是一个巨大的问题,从最初设计开始,GPU(或处理器)就需要考虑功耗问题,这需要充足的专业技能,才能从运行环境中获得最大化的性能。另外,移动设备的环境也存在带宽的限制,必须在设计出令人难以置信的轻巧电源的同时,还要能为用户提供良好的产品性能和应用体验。”因而从根本上讲,在PC与移动设备上的GPU是完全不同的运作形式,PC中的GPU一般采用简单、全屏、“立即模式”的渲染方式;而移动设备的GPU则采取分块渲染等更节能的技术,让庞大的任务处理更加智能化,以确保用尽每一“滴”能效。

  从工作模式上,Imagination Technologies公司PowerVR多媒体业务总监Peter McGuinness更为详细的介绍道,PC机GPU在传统上纯粹以性能为导向,而移动GPU则是为高效率和低功耗所设计的。桌面GPU是典型的提前Z(early-Z buffer)运行模式,通过冷却机制来解决功耗问题;移动GPU大多基于分块渲染模式,将内存流量和功耗保持在最低水平。一些移动GPU主要依靠运行提前Z模式来筛选出可见目标,但这种方式可能会占用大量的面积和功耗。Imagination推出的 PowerVR则采用延迟分块渲染的模式,仅计算并呈现可见的目标、而省略被遮挡的不可见目标元素,从而拥有独特的性能优势。

  低功耗、小面积设计至关重要

  谈到移动GPU最引人关注的低功耗问题,Laudick说道:“低功耗并非只是一种方法或应用到产品以及设计的一些技巧,它必须在产品设计之初就深植于设计人员与产品规划的思考核心。这意味着,很多设计准则与基本架构有关,然而,有些设计准则却是通过外部接口来实现、又或是一些在设计上特定的先进技术上去节省功耗。”为了克服移动设备对GPU先天上的限制,ARM一直在寻找在小面积和有限的功耗内提升处理能力更有效而智能的方式。其中,ASTC纹理压缩技术就是一项源自ARM图像质量方面先进的技术,能减少内存带宽和功耗,这项技术已经被主要的移动GPU芯片供货商所采用。

  另外,ARM还开发出一系列先进技术,进一步提升产品性能。如:智能合成技术用于减少带宽,可同时在帧结构中读取纹理;智能消除技术可实现关键的节省带宽功能,在SoC层级达到显着的低能耗效果,而GPU在渲染的过程中,在帧与帧之间只会就不同的部分进行渲染;帧缓冲压缩格式是一种无损图像的压缩技术,允许通过减少SoC内部IP模块之间传输的数据量,大幅减少带宽的消耗;像素本地存储技术是最近在SIGGRAPH世界图形图像学术大会上所展示的另一种技术,能藉由减少对先进图形算法的带宽需求,达到低功耗的效果。

  得益于专为真实世界应用案例所设计的低功耗特性集,Imagination新推出的PowerVR Series6XT和Series6XE系列均基于PowerVR Rogue图形架构所带来的大量独特特性,以改进整体系统性能,降低功耗,并减少内存带宽。McGuinness分析道:“首先,PowerVR Rogue GPU采用标量处理,实现ALU的最高利用率并简化图形编程,这一架构效率对于优化图像处理算法十分必要,很多算法拒绝将色彩信息作为第一步,并只处理强度信息,而这在标量架构中完全不是问题。其次,我们增加了新的PVR3C三倍压缩技术,结合了有损纹理压缩、无损图像压缩和无损几何压缩技术,降低内存带宽,且反过来更加显着地影响了系统范围的功耗。第三,系统增加的PowerGearing功能可动态管理不同的功耗水平,并平衡整体SoC功耗,所有的Rogue GPU结合使用FP32和FP16 ALU,实现了高精度和低功耗运算,与上一代GPU相比,PowerVR Series6XT和6XE GPU拥有高达50%的更多低能耗GFLOPS(每秒执行浮点运算次数)。”

Copyright © 2017-2020 微波EDA网 版权所有

网站地图

Top