(黄仁勋在2017台北Computex上)
2017年5月,传出软银悄悄购入40亿美元的NVIDIA股票,成为了NVIDIA的第四大股东。众所周知,孙正义为了“釜底抽薪”下一代技术浪潮,已经组建了1000亿美元的科技基金,专门用于收购或购买下一代技术公司,人工智能就是这类型的关键型技术,而NVIDIA无疑正处于人工智能的风口浪尖。
在6月的台北Computex电脑展上,NVIDIA创始人、CEO黄仁勋这样评价孙正义本人,“孙正义是我所知道的唯一能准确预知每一次科技浪潮的人”。这包括PC、互联网、移动互联网,而现在AI人工智能时代即将来临,孙正义又出手了。当然,黄仁勋也说孙正义对NVIDIA的持股快赶上他本人了。“也许我应该对此做点什么”,黄仁勋笑说。
继2017年5月的GTC大会之后,在6月的Computex台北电脑展上,黄仁勋系统总结了NVIDIA到目前为止的人工智能观点与布局。
黄仁勋观点:机器在第一波工业革命中实现了人类体力劳动的自动化,人工智能将实现人类智力劳动的自动化。黄仁勋认为AI是对人类智力的自动化。过去,人们用机器和蒸汽引擎来复制人类的肌肉,现在人们用AI来复制人类的智力,“这个能力(AI)可能用于创造其它的一切”。
黄仁勋认为,尽管今天的AI产业就像20多年前的GPU产业那样从零开始,但未来的AI产业将成为一个巨大的市场,将影响每一个国家、产业以及每一台电脑的制造方式。数以亿计的智能手机和PC、汽车、物联网设备等,还有无数的机器人、无人机、机器等都将具有AI。越多的公司具有AI能力,AI就会发展的越快。“今天AI产业为0,明天AI就是整个世界!”
NVIDIA的AI策略:加速推动端到端的人工智能革命,包括:以光速提升GPU计算;打造完整的软件堆栈;优化各种深度学习工具与框架;把NVIDIA GPU计算整合到每台电脑与云端;从云端到终端,扩展NVIDIA的架构;使用AI解决如无人驾驶系统以及机器人等巨大挑战。
NVIDIA下一代GPU架构(第七代)、也是全新的TensorFlow深度学习算法计算核心Volta,耗资30亿美元、三年时间研发,可同时处理4x4矩阵(深度学习的基础算法),实现了100TFlops(每秒1万亿次浮点运算),其能力是上一代NVIDIA Pascal GPU的5倍以上,并推出了首款基于Volta的处理器——NVIDIA Tesla V100数据中心GPU,V100配备640个Tensor内核,可提供120万亿次浮点运算的深度学习性能,相当于100个CPU的性能。
Volta GPU是第一步,配合HGX工业标准超大规模加速器,可让8块Volta GPU通过NVLink组成混合立方网络,所有GPU与所有GPU同时高速沟通,可实现1 PTflops(每秒千万亿次浮点计算能力)。超大规模HGX-1加速器为可扩展GPU架构,适用于现有的云计算数据中心机架,可以轻松为现有云服务“安装”AI云能力,富士康、英业达、广达与纬创四家服务器制造商宣布加入HGX架构服务器开发。
经过优化后的NVIDIA人工智能软件堆栈体系,包括深度学习框架、深度学习类库(包括TensorRT、NCCL、cuBLAS等各类深度学习算法)、CUDA驱动软件、操作系统、GPU以及相应的硬件系统。为了方便开发者掌握和使用这些软件和系统工具,NVIDIA推出了NVDocker的CUDA加速容器,从操作系统、驱动程序、CUDA、cuDNN、NVIDIA深度学习函数库以及相关软件等进行了虚拟化集成。
NVIDIA GPU Cloud,测试版将于2017年7月份开放,可以让AI开发人员方便的存取深度学习软件算法、数据与相关软件。NVIDIA称,NVIDIA GPU Cloud面向全球开放,在任何地区都能够随时随需接入。NVIDIA GPU Cloud含有以NVDocker方式容器化的深度学习软件堆栈,保持更新并由NVIDIA负责维护。
Jetson是NVIDIA推出的面向无人机、自动驾驶汽车、机器人等嵌入式系统,Jetson参考平台与Teal、GM EnRoute、丰田汽车与Racecar/J等合作伙伴共同创造的开发者平台,针对消费型无人机、工业无人机、服务型机器人、无人水面及地面载体和遥控车等。Jetson TX2专为深度学习算法和并行计算而设计,相当于两台高性能PC,却可运行在电池供电环境下。
NVIDIA认为机器人是终极AI,通过深度学习,NVIDIA具备了让机器人学习和自我编程的关键技术。NVIDIA推出了ISAAC机器人虚拟平台,这相当于是一个训练机器人“大脑”的虚拟工厂,训练出来的“大脑”被安装到Jetson机器人身上,就能批量生产有智能的机器人,包括自动驾驶汽车、无人机、仓库机器人、农业机器人等。
在下一场AI大潮中,黄仁勋认为NVIDIA具有超大规模的AI工程能力,R&D研发投入也相当宽裕,更擅长制造关键的GPU芯片,“我们的目标就是要‘平民化’AI”,黄仁勋强调,“我们创造AI,就是为了让每一个人都能使用它”。在谈到AI威胁论时,黄仁勋说只有让AI平民化,让每一个国家、企业和个人都有AI能力的时候,才能够制约AI的威胁。
NVIDIA宣布,2017年将通过NVIDIA深度学习学院(NVIDIA Deep Learning Institute)培训10万名开发人员,以满足人工智能领域对专业技能飞速增长的需求。NVIDIA正在进一步丰富深度学习学院的课程安排,以涵盖无人驾驶汽车、医疗保健、网络服务、机器人、视频分析和金融服务领域的深度学习应用。
针对亚洲、欧洲和美洲的开发人员,NVIDIA不仅提供通过Amazon Web Services和谷歌Qwiklabs在云端使用NVIDIA GPU进行的在线培训,也提供有讲师指导的研讨会、讨论会和课程。NVIDIA还与Udacity达成了合作,来为无人驾驶汽车的开发提供深度学习学院的课程内容。
深度学习学院的实践实验室由NVIDIA、合作伙伴和大学的认证专家负责授课。每个实验室都体现深度学习的一个基本宗旨,例如,使用人工智能进行对象检测或图像分类;通过人工智能确定治疗癌症的最佳方法;最高级的课程将传授如何利用NVIDIA DRIVE PX 2 和 DriveWorks等技术开发无人驾驶汽车。
NVIDIA现在其实还在把高性能GPU带入轻薄笔记本,来大规模普及高性能GPU。本次台北Computex推出的NVIDIA Max-Q精益工程设计笔记本电脑,可以在18毫米厚度的轻薄笔记本中引入高端GPU。高性能GPU一旦在消费者中普及开来,就是为无处不在的AI计算提前铺路。更不用说,消费类业务已经是NVIDIA的现金“奶牛”,源源不断地支撑了NVIDIA的AI研发投入。
在本次台北Computex上,黄仁勋展示了NVIDIA对人工智能的全局性思考以及产品线布局。正如黄仁勋的判断,今天的人工智能产业就是20多年前的GPU产业,将经历从零到1再从1到N的爆发性增长。也难怪孙正义在NVIDIA股票高点的时候,也依然要出手40亿美元成为NVIDIA的大股东。