微波EDA网,见证研发工程师的成长!
首页 > 硬件设计 > MCU和DSP > 解读ARM GPU的三个发展趋势

解读ARM GPU的三个发展趋势

时间:12-19 来源:互联网 点击:
作者 张国斌

随着智能手机平板电脑进入视网膜屏高清时代,GPU的重要性日益凸显,用户在使用这些电子设备时,首先关注的是高清视频、3D游戏以及flash动画的体验,而这些体验和GPU性能有直接联系,一款性能出色的GPU不但可以给用户以最佳体验,更兼顾低功耗特性,在CPU核战已无悬念的情况下,未来GPU将如何发展?近日,电子创新网总编张国斌独家采访了ARM公司媒体处理部门战略营销副总裁Kevin Smith,就ARM GPU未来发展进行了交流,归纳为ARM GPU的三个发展趋势。

趋势一:关注可扩展性,GPU核战爆发在即

在PC领域,曾经爆发过有关CPU与GPU谁更重要的口水大战,现在看来,两者都重要,因为它们架构不同、侧重不同,CPU和GPU都是具有高速运算能力的芯片,CPU更像“通才”——指令运算+数值运算,GPU更像“专才”——图形计算,不同类型的运算速度决定了它们的能力。因此CPU更擅长像操作系统、系统软件和通用应用程序这类拥有复杂指令调度、循环、分支、逻辑判断的程序任务,而GPU则擅长图形类和非图形类的高度并行数值计算。因此,在一部手机或者平板中,两者需要均衡搭配才能发挥出最大效能。

到目前为止,ARM共发布了人Mali100、Mali300、Mali400、Mali450和Mali T600等五个系列的GPU,在MaliT600以后,ARM GPU在结构上发上了很大改变,以桌面应用看齐,在性能上有很大提升。


Mali400结构功能图


Mali-t604功能图

Kevin Smith介绍说实际上在发布T600系列时,ARM已经考虑到了与未来64位处理器的兼容问题,所以Mali-T600的第二代支持64位双精度,可以与ARM最新的A50系列64位处理器紧密关联。“另外,T600系列采用了这色器内核架构和三管道体系,更容易实现多核,这比其他架构GPU更有优势。” Kevin Smith强调。“未来ARM会重点优化T600系列产品,例如我们最新发布的T624\T628\T678就比T604在同等裸片面积性能提升50%!”

他解释说性能的提升源自对架构的增强,例如这三款系列GPU可在同样的内核面积下提供更高的时钟频率、更高的IPC(每时钟周期指令数)、更高的能效,所以每个型号的性能都可以提升50%。

另外,这三款GPU也首次次支持ASTC(适应性可扩展纹理压缩):这是一种由ARM开发、Khronos Group已将其纳入OpenGL ES规范的纹理压缩技术,能在系统级别提高效率,并改进纹理质量和弹性,“而且,ARM GPU也是率先支持OpenGL ES 3.0版新标准的处理器。”他指出,“我们的GPU支持OpenGL Full Profile的GPU计算,不但支持OpenGL ES 1.1/2.0/3.0、DX 11/11 FL 9_3,此外还支持Google RenderScript计算语言。实际上已经向桌面应用看齐。也向GPGPU更迈进了一步。当然,这也是增强兼容性的举措,我们的策略是就是支持公开的各类标准和API。”


Mali-T678功能框图

由于GPU的并行架构更适合实现多核,因此为未来多核GPU将是一大亮点,Kevin表示依托ARM的独特优势,未来不管是16核还是24核均可以轻易实现。


ARM GPU的扩展性示意图

在我采访Imagination时,他们也勾勒了一幅未来处理器发展的蓝图,显然,多核GPU是亮点。


未来处理器发展的蓝图

那么2013年,主流的GPU产品将是多是核心?Kevin认为8核GPU会出现但将是高端市场,主流市场仍将是四核为主,不过他认为明年市场上GPU跨度较大,从单核到双核到四核到8核都有出现,满足市场从低到高的需求。

近日,谷歌Nexus 10平板电脑已经面市,它的真实面貌。该机采用一块10英寸屏幕,分辨率高达2560×1600像素,像素密度为300ppi,超过了iPad4和新iPad,它采用了1.7GHz主频的三星Exynos 5250双核处理器,配备2GB RAM,集成Mali T604四核GPU,Kevin强调这样高端机型足以说明ARM GPU可以支持高端应用。

在GPU的发展策略上,Kevin介绍说ARM会坚持以较小的面积实现更高的性能,即坚持高能效的策略,同时,会考虑高性能方向,向桌面GPU看齐。
以下是各类GPU的功耗对比,可以看出,ARM GPU在单位功耗方面的性能突出,能达到每瓦48GFLOPS的特性,原高于桌面GPU的能效。

处理器

类型

GFLOPS (32bit)

GFLOPS (64bit)

Watt (TDP)

GFLOPS/Watt (32bit)

FLOPS/Watt (64bit)

Adapteva Epiphany-IV

Epiphany

100

N/A

2

50

N/A

Movidius Myriad

ARM SoC: LEON3+SHAVE

15.28

N/A

0.32

48

N/A

ZiiLabs

ARM SoC

58

N/A

?

20?

N/A

Nvidia Tesla K10

X86 GPU

4577

190

225

20.34

?

ARM + MALI T604

ARM SoC

8 + 68

N/A

4?

19?

N/A

NVidia GTX 690

X86 GPU x 2

5621

234?

300

18.74

0.78

GeForce GTX 680

X86 GPU

3090

128

195

15.85

0.65

AMD Radeon HD 7970 GHz

X86 GPU

4300

1075

3

Copyright © 2017-2020 微波EDA网 版权所有

网站地图

Top