微波EDA网,见证研发工程师的成长!
首页 > 硬件设计 > 行业新闻动态 > 麒麟970的AI功能是突破不是领先,苹果“神经引擎”单元蓄谋已久

麒麟970的AI功能是突破不是领先,苹果“神经引擎”单元蓄谋已久

时间:08-07 来源: 威锋网 点击:

众所周知,苹果是手机行业最早踏入 AI 人工智能领域厂商之一,早在2011年就已经在 iPhone 当中首度集成 Siri 智能助理。尽管后期行业大多分析认为,苹果几乎已经掉队,但苹果内部关于人工智能技术的研发从未停止。今年5月份的时候,彭博社就曾爆料了苹果的在人工智能领域的大动作,即苹果正计划将 AI 人工智能引入移动芯片中。

当时消息称,苹果内部已经开始测试一种独立专用于执行人工智能相关任务的处理芯片,该芯片在内部被称为"苹果神经引擎(Apple Neural Engine)"。据称,苹果这一人工智能处理芯片将提升苹果相关设备处理智能任务的能力,例如在面部识别和语音识别等方面。当然了,苹果并未对此置评。

很显然,苹果正持续在 AI 人工智能领域努力中,积极研发相关技术,以帮助自家的设备大幅提升效率。目前苹果设备的 A 系列芯片可以通过用两个不同的单元处理密集型或复杂的任务,分别是 CPU 主处理单元和 GPU 图形处理单元。如果这两个处理单元的部分任务可以转移到一个 AI 人工智能专用单元上,必然能够提升计算效率,同时帮苹果提升电池续航。

伴随着"苹果神经引擎"的消息出炉,很多人希望在6月份的 WWDC 全球开发者大会上,苹果能够透露一些相关 AI 处理芯片的进展或动态,不过事与愿违,直到现在也没有人清楚所谓的"苹果神经引擎"究竟是什么玩意。那么,在移动 AI 芯片的开发方面,苹果是否落后了呢?

华为比苹果领先了一步?
国内最大的智能手机厂商华为,作为狂喊"三年超越苹果"口号的主要竞争对手,也为自家的旗舰智能手机开发了定制 AI 单元的 SoC 芯片,即最近最新发布的麒麟970处理器。华为方面宣称,麒麟970是全球首个集成独立 AI 人工智能专用 NPU 神经网络处理单元的移动芯片。

NPU 神经网络处理单元是麒麟970的最大亮点。按照华为的说法, AI 性能密度大幅由于 CPU 和 GPU,能够用更少的能耗更快的完成更多任务,大幅提升芯片的运算效率。在 16 位浮点数(即FP16)时 NPU 运算能力达到 1.92 TFLOPs,有了 NPU 的加成,在图像识别任务上,对比 Cortex-A73 的性能提升 25 倍,能效提升 50 倍之多,图像识别速度可达到约 2000 张/分钟,拍摄 1000 张照片仅消耗 4000mAh 电池 0.19% 的电量。

尽管所谓的 AI 加持目前并没有统一标准进行衡量,只能听华为官方举例来解释,但不可否认,有了独立的 AI 单元之后,至少在拍照和图像处理上比之前单纯依赖 CPU 和 GPU 要快得多,保持高效率的同时更加的省电。而这些 AI 人工智能的理念,其实与 5 月份被爆料的"苹果神经引擎"如出一辙,说明未来 AI 独立单元内置于芯片一定是趋势,苹果也在做,只是华为抢先开了个头而已。

现在多数人已经知道,华为这枚 NPU 单元主要技术贡献来源于国家重点实验室中科院寒武纪,正是因为拿到了该实验室的神经网络指令集授权加速开发,才让麒麟 970 成为了首款集成寒武纪芯片的商用产品。而与华为相比,"苹果神经引擎"的具体细节和性能特点依然不为人知,不过可以预见的是,苹果的 AI 芯片与华为相比其中必有大量异曲同工之处。

移动芯片包含 AI 单元将成为主流
在发布麒麟 970 移动芯片之后,余承东预告了新一代旗舰智能手机 mate 10,并在接受采访时对外媒吹嘘称,华为 mate 10 的速度、续航以及功能性方面将远超今年苹果未发布的旗舰手机 iPhone 8,这主要归功于华为新处理器麒麟 970,而负责人工智能的 NUP 单元功不可没。

这是否表示意味着 iPhone 8 没有专门的 AI 单元了呢?目前还很难说。虽然"苹果神经引擎"遭到爆料之后,还有小道消息称苹果已经开始测试配备 AI 芯片的 iPhone 原型机,实现了硬件性能大幅改善,只等后续将此芯片整合到更多设备中,但是至今没有更多细节放出。不过,苹果并不着急,至少苹果的举动也预示着,在移动芯片在保持低功耗的情况下,塞进更强大计算性能的 AI 人工智能单元会成为主流趋势。

相信很多对处理芯片有所了解的人都知道,如今一枚芯片已经不再单纯特指 CPU 中央处理单元了,因为 CPU 在做 3D 图形渲染的性能上显然力不从心。因此,在 CPU 之后又于诞生了 GPU 图形处理单元。然而有了 CPU 和 GPU,信号处理能力还是不够,于是就又有了 DSP。而在智能手机上,由于有摄像头,需要处理图像信号,不得不加入 ISP 图像信号处理器。其余负责不同任务的单元也还不少,例如负责蜂窝网络的 LTE 调制解调器,负责一大波传感器的协处理单元。

不难看出,为了不同任务或专门针对某些任务而提高性能和效率,无数不同的计算单元组成了一枚一体

Copyright © 2017-2020 微波EDA网 版权所有

网站地图

Top