微波EDA网,见证研发工程师的成长!
首页 > 硬件设计 > 模拟电路设计 > 不只有CPU,细数移动GPU的那些事(二)

不只有CPU,细数移动GPU的那些事(二)

时间:12-05 来源:互联网 点击:

目前ARM已经将精力几乎都放在全新的Mali-T600系列上,在官方宣传中,Mali-450MP以及以前的产品被称为“图形硬件”,而Mali-T600系列则被称为拥有GPU通用计算能力的图形核心。Mali-T600系列的研发代号是“Midgard”,这是北欧神话中人类国度的名称,可以看出ARM官方对新的Mali-T600系列寄予厚望。Mali-T600全系列支持OpenGL ES 2.0/1.1,OpenCL 1.1,DirectX 11,其中Mali-T622、Mali-T624、Mali-T628、Mali-T678还能够支持OpenGLES3.0。性能方面目前尚没有特别详细的参数出现,不过一些资料表明,Mali-604在四核心配置下最高可达68GFLOPS的浮点性能,Mali-T658八核心配置最高可达272GFLOPS。不过Mali-T600系列目前的问题在于尚没有太多产品使用,只有三星Exynos 5系列的Exynos 5250和Exynos5450使用了Mali-T604和Mali-T658,前者被使用在Chromebook和Nexus 10中,后者还没有具体产品出现。

GeForceULP—来自NVIDIA的“杀器”?

  发展历史:

  NVIDIA做显卡、关注移动图形计算也不是一天两天了。2004年10月,NVIDIA就发布了自己旗下首款专为移动计算设计的产品—GoForce 2150,这是NVIDIA收购了专门针对移动技术进行研发和投资的公司MediaQ后首款产品。随后NVIDIA还发布了GoForce 3000、GoForce 4000、GoForce5300、GoForce 6100等一系列产品。不过事实证明,在移动计算产品中,独立的GPU芯片几乎没有立足之地。因此NVIDIA转而开发SOC芯片,开始将ARM CPU集成进入SOC芯片中。

  首款NVIDIAARMSOC芯片是TegraAPX,集成基于GeForce6GPU的图形芯片,也就是目前GeForceULP的鼻祖。实际上更可靠的消息是NVIDIA之前也收购一家专门关注移动GPU的厂商Hybrid Graphics,GeForceULP架构实际上和GeForce6系列差异性颇大,反而更为接近Hybrid Graphics的设计。在NV IDIA正式推出Tegra系列产品后,第一代应用于Windows Mobile设备中,实际上几乎没有太多产品使用,最终沉沙折戟,第二代产品Tegra 600和Tegra 650,前者用于微软Zune HD中,随着这款产品的失败也消失在历史长河,后者始终没有实际产品面试,也不太成功。

  

  THD游戏目前是NVIDIA推广的重头戏

  

  NVIDIA的游戏掌机Shield,使用了最高规格的Tegra 4芯片,跑分比在平板和手机上使用的Tegra 4芯片强很多。

  Tegra和GeForceULP首次成功是Tegra 2产品,Tegra 2中的GeForce ULP集成了8个计算核心,支持OpenGL2.0/1.1以及OpenVG 1.1EGL1.4。性能方面GeForce ULP在200MHz下性能为3.2GFLOPS,而实际产品最高可达40 0MHz,性能为6.4GFLOPS—这个数据仅能勉强赶上同期的PowerVR SGX 543(200MHz下拥有的6.4 GFLOPS),面对随后上市的iPad 2和iPhone 4S中使用的PowerVR SGX543MP2在200MHz下拥有的12.8GFLOPS性能完全不够看。后来Tegra 3上市后,NVIDIA将GeForce ULP核心升级到12个,性能在500MHz下也只达到了12GFLOPS,不但在当时不算出色,在今天更是远远落后。

  做为图形技术大厂,NVIDIA在图形性能上的弱势似乎有些说不过去。好在NVIDIA将桌面游戏的“NVIDIA游戏之道”那一套搬到了移动市场来,扶持帮助游戏厂商开发基于NVIDIA Tegra系列芯片的THD游戏,THD游戏一般专门为NVIDIA芯片优化,在图形呈现上往往有比普通版本游戏更为优秀的效果,比如最早的《水果忍者》的水果是圆形而不是明显多边形、《暗影枪神》中更为优秀的光影效果等,这也从一个侧面说明了理论参数只是理论,更好的图形效果还是需要厂商更为精心的优化才能得到。

  当前主流产品:

  由于Tegra 4和Tegra 4i还没上市,因此目前NVIDIA的主流产品依旧是Tegra 3。不过Tegra 3发布时间已接近2年,无论是性能还是实际的新品已经没有太多意义,下面内容还是主要针对即将上市的Tegra 4系列。

从架构来看,在其实无论是Tegra 3还是Tegra 4,其图形模块也就是GeForce ULP部分都只是在Tegra 2甚至更老的Tegra 600上直接扩大而来,基本规格没有任何变化。GeForce ULP家族和之前介绍所有产品都不同的是,GeForce ULP依旧是分离式渲染架构的产物,顶点和像素渲染引擎分别处理顶点数据和像素数据。这种处理方式不够灵活但相对来说每瓦特性能和每平方毫米性能都会比较出色。因此在新的Tegra 4上,NVIDIA在保持核心面积在80~100平方毫米的同时,将之前Tegra3的12个GeForce ULP计算核心扩大到了72个,整整是前代的6倍之多,Tegra 4的图形部分性能也一跃达到了最高(在672MHz下)74.8GFLOPS,相比目前最强大的图形核心iPad 4上使用的PowerVRSGX554 MP4的71.6GFLOPS理论性能还要更高一些,而Tegra4i则集

Copyright © 2017-2020 微波EDA网 版权所有

网站地图

Top