微波EDA网,见证研发工程师的成长!
首页 > 硬件设计 > MCU和DSP > ARM Mali-G71 详细解读

ARM Mali-G71 详细解读

时间:06-14 来源:与非网 点击:

Mali-G71图形处理器(GPU)是Mali 高性能GPU家族最新推出的顶级产品。Mali-G71基于全新Bifrost架构,代表了高端移动图像处理性能的最高水平,进一步奠定了Mali在竞争激烈GPU市场的主导地位。

Mali-G71研发期间充分参考了包括虚拟现实(VR)、增强现实(AR)、以及3D游戏在内等高端移动应用核心需求,这些应用场景将继续快速发展;同时,包括Vulkan及OpenCL 2.0在内的现代API也是研发要点。"贪吃蛇"的时代早已成为历史,移动游戏行业的飞速发展令人目不暇接,即便是高端设备也越来越无法满足下一代移动游戏的要求。针对这一问题,Mali-G71着眼于下一代移动图像处理技术,让搭载Mali-G71的设备更强劲、更高效、更出色。使用Mali-G71 GPU的设备,其图像处理性能甚至可与中端笔记本相媲美。

关于Bifrost架构

Mali的全新Bifrost架构标志着GPU领域的飞跃以及移动图像处理技术的未来。Bifrost架构设计蕴含大量创新和优化,下面将对此做简要说明。

指令组着色器(Claused Shader)将指令集分组到预先设置好的程序块,使指令组可以自动执行且不会中断。基于此,我们可以确保所有外部依赖在子句执行前便已就绪;通过设计执行单元,临时结果也无需访问寄存器组。这便缓解了对寄存器文件的压力,显著降低功耗;通过简化执行单元的控制逻辑,GPU的面积也得以缩小。

指令组着色器显著降低功耗

Bifrost架构的另一创新在于其采用基于Quad的矢量化技术。Midgard GPU采用单指令多数据结构(SIMD )矢量化技术,管道阶段一次只执行单一线程;且非常依赖着色器代码执行向量指令。Quad矢量化技术最高支持四线程同步执行,共享控制逻辑,降低执行单元的填充难度,使用率将近100%,深度匹配开发人员编写着色器代码的最新方法。

高可拓展性

前代高性能移动GPU只支持1到16核扩展。为了满足移动设备不断提高的性能需求,全新Mali-G71支持1到32核拓展。利用Mali-G71的高可扩展性,无论DTV设备、高性能智能手机,还是最新的VR设备;无论是移动版本还是单机版本,均可实现强劲的图像处理性能。Mali-G71的可拓展性及40% 的面积效率提升,助力合作伙伴更能随心所欲地按照目标要求开发系统,在功耗、效率和成本间实现平衡,更精准地实现产品在目标市场的定位。

适用于高端游戏

移动游戏正迅速成为世界各地游戏玩家的首选游戏平台。2017年,移动游戏市场规模超过400亿美元,较2016年增加100亿美元。移动设备性能的不断提高,为移动游戏市场的持续增长奠定了基础;随着复杂性逐年上升,移动游戏市场的增长也面临挑战。数年前发布的游戏演示程序,其顶点数量只有现在的一半,因此对功耗和效率的要求更高。如果应用程序继续以这一速率发展,32核可拓展性将成为高端移动设备的标准配置。此外,Mali-G71 在相似条件下的能效比Mali-T880高出20%,受散热限制的高端设备也可以拥有更持久的性能。

支持Vulkan和OpenCL2.0

我们必须充分关注API的发展,毕竟,API定义了开发人员与底层硬件的交互方式。作为一家GPU和CPU技术公司,我们需要不断满足开发人员的需求,才能保证终端用户获得最佳设备体验。近年来,发展的一大趋势就是允许开发人员以低级别权限访问硬件;因此,Khronos公司应势推出全新Vulkan 1.0 API。类似地,OpenCL2.0提升了异构计算对开发人员的友好度;将来,随着OpenCL2.0设备投放市场,更为典型的使用案例将会逐渐涌现。得益于完整硬件一致性,Mali-G71不仅支持Vulkan 1.0和OpenCL 2.0 Full Profile,还支持细纹理缓冲及共享虚拟内存;同时,还可降低软件开发难度,优化终端用户体验。

转为虚拟现实(VR)量身打造

虚拟现实是图像处理领域的热门话题,包括虚拟现实如何实现,需要什么条件,如何为用户提供最佳的VR体验等三个方面。Mali-G71 GPU正是基于这类需求量身打造。VR技术全面的性能需求,意味着高端设备的GPU技术必须具有更高能效。另外,摄像头和屏幕等手机组件也正以前所未有的速度发展,并且设备的受热性能也面临严峻挑战。因此,GPU必须全力降低能耗。

Mali GPU系列产品支持多项先进VR优化功能,营造最佳移动VR体验。利用前置缓冲技术,无需离屏缓冲区便可直接向前置缓存区提交数据,节约时间,降低延迟;Mali同时支持API"多视角"拓展,应用程序每次可向驱动提交单帧绘画指令,驱动可为每只眼睛分配具体任务,显著降低应用和驱动CPU的处理时间。针对基于Midgard和Bifrost的Mali GPU,我们进一步优化了顶点处理技术,单次顶点处理,双眼共享结果

Copyright © 2017-2020 微波EDA网 版权所有

网站地图

Top