微波EDA网,见证研发工程师的成长!
首页 > 硬件设计 > 行业新闻动态 > 英伟达市值飙升,这事要从GPU说起

英伟达市值飙升,这事要从GPU说起

时间:08-30 来源: ZD至顶网 点击:

接受采访时所说,无论如何,Tesla V100也只是一个硬件,在计算过程中要达到性能的调优还必须进行编译,因此,要做人工智能推理还需要软件。

现下,AI 推理工作负载呈指数级增长。在视频领域,每日运行的推理计算估计有 3,000 亿次;在语音领域,每日运行的推理计算估计在500 亿次以上;在语言翻译领域,每日运行的推理计算更是达到约 7,000 亿次以上。

▲ 黄仁勋在GTC CHINA上 宣布推出TensorRT 3

为此,英伟达从三年前开始推出了TensorRT平台,又在GTC CHINA上发布了TensorRT 3,与GPU一起打"组合拳"。据称,该组合能够"在一切架构中为AI支持型服务提供超快速与高效的推理解决方案。"

TensorRT 3是全球首款可编程AI推理加速器,能够在生产环境中运行经过训练的神经网络,允许服务供应商选取任何已经过训练的深度学习架构,并选择其希望使用的特定GPU运行。说白了,它更像是一个能够让机器快速理解这个复杂世界的"翻译",能够从神经网络中获取描述性文件,并将其编译为可以在目标GPU上运行的格式,从而快速优化、验证和部署神经网络,然后被引入到大型的数据中心、嵌入式或车载GPU平台。

运行英伟达加速计算的集团产品营销经理Paresh Kharya称,采用TensorRT将确保GPU以多层及跨流的方式执行,使得数据中心能够有效并行处理多种请求。除此之外,TensorRT还可以确定每个目标GPU的最佳策略,对数值精度、网络层和张量的去除和融合、快速内核以及内存管理进行优化。

据黄仁勋介绍,在图片识别方面,搭配 Tesla V100 GPU 加速器的 TensorRT 每秒能够识别多达 5,700 张图片,比最快的CPU 快了40倍。而在语言翻译领域,速度甚至快出了140倍。此外,在处理图像时可实现7ms的延时,在处理语音时延时不到200ms。

为了展示TensorTR 3在语音推理方面的性能,黄仁勋在大会中演示了如何通过对《权力的游戏》的影片中的台词进行语音搜索,快速找到对应场景。首先对视频进行解码,转换成文字,然后根据解码进行搜索,快速跳到那一帧,语音到文字的转换几乎没有延迟。

当然,这还不够。

还缺"两样东西":自主机器处理器及机器人虚拟训练环境

黄仁勋认为,要让AI足够"聪明"还缺少"两样东西",一是自主机器处理器,二是针对于机器人的虚拟训练环境。在这两方面,英伟达也做了大量工作。

据黄仁勋所说,英伟达正在设计许多类型的自主机器,它们能感知周围的环境,理解自己的处境并做出合理响应。他还介绍,英伟达设计了全球首款自主机器的处理器,并命名为Xavier。这是迄今为止最为复杂的片上系统,将于2018年第一季度早期接触合作伙伴提供,在第四季度全面推出。

▲ 黄仁勋宣布京东 X 选择英伟达实现其自主机器

目前,京东X已经成为 英伟达实现其自主机器,采用Jetson平台的首批"尝鲜者"。而Xavier也将成为下一代Jetson的片上系统(SOC)。

当被问及这样的自主机器什么时候能够进行商用和普及时, 黄仁勋说,目前自主机器的研发还有三个关键的问题需要解决。首先,要为自主机器打造一个人工智能平台,类似于增强学习等等;另外,是提供一个能够让自主机器进行自主学习的虚拟环境;在此基础上,第三步再将人工智能的"大脑"放到自主机器的框架中。

尤其是第二步,在机器人理解了这个复杂世界的"语言"后,还要进行相应的交互和执行,这需要很长的训练周期。"因此,我们需要创建一个可供机器人学习的虚拟世界,并且是遵守现实世界的物理学定律的世界,让机器人可以在其中不断训练和学习。"

对此,英伟达发布了称之为Isaac的虚拟机器人训练环境,通过将VR与AI进行融合,能够实现在部署前模拟现实条件对机器进行训练和测试。

在其构建的虚拟环境中,开发人员可通过虚拟现实技术来搭建各类测试场景,然后在几分钟内对其进行模拟,从而快速得到大量训练数据,然后再利用AI技术从这些数据中训练得到知识。

"但如果要让人进入到虚拟环境去对机器人进行训练,还需要用到很多其它的技术的配合。"黄仁勋坦言,"坦率说,目前这三个问题还没有完全解决,但是三项工作在英伟达正在并行中。明年,我们会将这三方面的基础都打好,之后就可以进行自主机器的生产。"

看重三个AI应用行业,每个都离不开GPU

在英伟达看来,深度学习的应用将彻底改变各行各业。

"未来我们会看到经过训练的神经网络得以部署,并给互联网服务带来很多惊喜。如今,交通运输领域变革已经走在面前,电动能源汽车、电动车,加上人工智能正在彻底改变交通行业,让自动驾驶成为可能

Copyright © 2017-2020 微波EDA网 版权所有

网站地图

Top