2002年3月英伟达发布核弹GPU与大算力自动驾驶芯片
英伟达核弹级GPU:800亿晶体管,20块承载全球互联网流量
2022年3 月 22 日,在英伟达 GTC2022 上,英伟达介绍了 Hopper 架构、H100 GPU、元宇宙、新型超级计算机、软件、数据中心等方面的最新进展。
英伟达公司创始人兼 CEO 黄仁勋在本届英伟达 GTC 大会的开幕仪式上,盛赞 AI 技术已经取得“惊人”进展,展望了 AI 与 Omniverse 将如何把真实世界与虚拟世界合二为一。
黄仁勋做出承诺,意欲改造总值达万亿美元规模的多个行业,应对人类社会当前时代下的“重大挑战”。分享了新的时代愿景:希望立足产业规模实现智能创造,并真正将现实与虚拟世界融合起来。
在本届英伟达 GTC 大会上,黄仁勋还介绍了新一代芯片——包括新的 Hopper GPU 架构与 H100 GPU,外加新的 AI 与加速计算软件、以及强大的新型数据中心规模系统。
这一次,由英伟达 Omniverse 实时 3D 协作与模拟平台生成的虚拟环境成了黄仁勋的新舞台,表示“企业客户正积极处理、提炼数据,开发 AI 软件,逐步转化为智能制造商。”当前,AI 科技正“朝着各个方向飞速向前。”
Omniverse 能够将这一切整合起来,加速人与 AI 间的协作、更好地理解现实世界并加以建模,成为新型机器人、即“下一波 AI”的试验场。
在主题演讲开头,画面以飞行视角引领穿越英伟达的全新园区。这段场景完全由 Omniverse 渲染成,在画面中能看到正在研究先进机器人项目各处实验室。
黄仁勋分享了英伟达公司如何与广泛生态系统开展合作,通过助力医疗保健与药物发现来拯救生命、甚至拯救这颗赖以生存的星球。
黄仁勋表示,“科学家们预测,要想有效模拟特定区域内的气候变化,需要一台 10 亿倍于当前水平的超级计算机才能实现。”
“但英伟达决定通过「地球 2 号」(Earth-2,全球第一台 AI 数字孪生超级计算机)向这一挑战发起冲击。发明了新的 AI 与计算技术,希望抢在气候发生不可逆转的破坏之前阻止这一切。”
重磅发布基于 Hopper 架构的新芯片
为了推动这些雄心勃勃的目标,黄仁勋介绍了基于 Hopper 架构的英伟达 H100,号称是“为全球 AI 基础设施打造的新引擎”。
语音、对话、客户服务及推荐系统等 AI 应用,正在推动数据中心设计迎来一波根本性的变化。
黄仁勋表示,“AI 数据中心负责处理大量连续数据,用以训练并改进 AI 模型。输入的原始数据经过提炼,可逐步转化为输出的智能成果,企业利用这些成果建设运营大型人工智能工厂。”
这样的工厂将 24/7 全天候高强度运行。质量层面的任何一点微小提升都将显著改善客户参与度、大大拉升企业利润。
H100 将帮助这些工厂加快发展的脚步。这款采用台积电 4 纳米制程工艺的芯片将容纳有 800 亿个“海量”晶体管。英伟达表示这是目前性能最为强大的 GPU。黄仁勋表示,20 块 H100 GPU 就可承托全球互联网的流量。
黄仁勋表示,“Hopper H100 将实现有史以来幅度最大的代际性能飞跃,大规模训练性能可达 A100 的 9 倍,大型语言模型推理吞吐量更将达到 A100 的 30 倍。”
Hopper 的技术突破,包含新的 Transformer 引擎、能够在不损失准确性的前提下实现 6 倍网络加速性能。
黄仁勋指出,“transformer 模型的训练周期将由几周缩短至数天。” H100 目前已经投入生产,预计从第三季度起正式供货。
黄仁勋公布了 Grace CPU Superchip,这是英伟达首款用于高性能计算的离散数据中心 CPU。包含两个 CPU 芯片,通过每秒 900 GB 的 NVLink 芯片到芯片互连将 144 个计算核心彼此连通,内存带宽则为每秒 1 TB。
“Grace 是一款专为全球 AI 基础设施打造的理想 CPU。”
黄仁勋公布了基于 Hopper GPU 的多款新型 AI 超级计算机,分别为 DGX H100、H100 DGX POD 以及 DGX SuperPOD。
为了将这一切连接起来,英伟达研发的全新 NVLink 高速互连技术将全面覆盖后续推出的所有英伟达芯片,包括 CPU、GPU、DPU 与 SOC。
黄仁勋谈到,英伟达将面向客户与合作伙伴提供 NVLink 以构建配套芯片。“NVLink 将为客户们开启一个充满可能性的新世界,帮助客户利用英伟达平台与生态系统构建起各种半定制化芯片与系统。”
新软件:AI 已经“彻底改变”了软件的面貌
加速计算的成熟为 AI 带来了“惊人”的发展轨迹。
“AI 已经从根本上改变了软件所能实现的效果、以及软件开发的基本方式。”
transformers 开启了自监督学习的大门,消除了传统 AI 对于人工标记数据的高度依赖。结果就是,如今 transformers 开始在各个领域遍地开花。
“Transformers 让自监督学习成为可能,由此推动着 AI 技术飞速发展。”
无论是用于语言理解的 Google BERT、用于药物研发的英伟达 MegaMilBART,还是用于预测蛋白质结构的 DeepMind AlphaFold2,根源都能追溯至 transformers 带来的这一波技术突破。
新型深度学习模型已经在自然语言理解、物理、创意设计、角色动画乃至 NVCell 芯片布局等领域有所建树。
“AI 正朝着各个方向飞速向前,新架构、新学习策略、更大更强的模型、新科学、新应用、新行业等等,各个领域已经迎来一波并行发展。”
英伟达“全力以赴”加速 AI 领域的新突破,希望助力 AI 和机器学习技术在各个行业的实践应用。
英伟达 AI 平台正经历一轮重大更新,包括 Triton 推理服务器、用于训练大型语言模型的 NeMo Megatron 0.9 框架、以及用于音频和视频质量增强的 Maxine 框架等。
平台中还包含英伟达 AI Enterprise 2.0,这是一款端到端、云原生的 AI 与数据分析工具和框架套件,已经由英伟达进行过优化与认证,现可支持所有主要数据中心及云平台。
黄仁勋指出,“在本届 GTC 上公布了 60 项 SDK 更新。所以英伟达可以向 300 万开发者、科学家、AI 研究人员以及数以万计的初创企业宣布,现在运行英伟达系统的速度更快了。”
英伟达 AI 软件与加速计算 SDK 目前已经在全球多家企业中落地应用。微软 Translator 借助英伟达 Triton 支持的实时翻译功能提升全球沟通效率。
AT&T 采用英伟达 RAPIDS 软件加速内部数据科学团队,得以轻松处理数万亿条消息记录。“英伟达 SDK 目前已经服务于医疗保健、能源、交通运输、零售、金融、媒体及娱乐等总值高达 100 万亿美元的多个行业。”
下一个进化方向:为虚拟世界元宇宙
半个世纪之前,阿波罗 13 号登月计划遭遇意外。为了拯救机组人员,NASA 的工程师们决定在地球上建造一个乘员舱模型、探索可行的救援办法。
“数字孪生的思路相当于对此进行规模扩展,创造出一个与物理世界连通的虚拟世界。结合当前的互联网背景,这无疑就是下一波进化的方向。”
英伟达 Omniverse 软件专为构建数字孪生而生,新的数据中心规模英伟达 OVX 系统则将成为“面向行动的 AI”当中不可或缺的组成部分。
黄仁勋在本次大会上带来了 Omniverse 的新版本,在介绍更新内容时表示“Omniverse 是机器人平台的核心所在。与 NASA 和 Amazon 一样,来自机器人 / 工业自动化领域的英伟达客户都深切意识到数字孪生与 Omniverse 的重要意义。”
OVX 系统将成为 Omniverse 数字孪生的运行载体,负责在同一时空内为多个自主系统运行大规模模拟。
OVX 的骨干在于其网络结构,这一结构的实现源自此次公布的英伟达 Spectrum-4 高性能数据网络基础设施平台。
作为全球首个 400 Gbps 端到端网络平台,英伟达 Spectrum-4 由 Spectrum-4 系列交换机、英伟达 ConnectX-7 SmartNIC、英伟达 BlueField-3 DPU 以及英伟达 DOCA 数据中心基础设施软件共同组成。
为了让更多用户能够访问 Omniverse,英仁勋还在会上公布了 Omniverse Cloud。现在只需点击几下,协作方就能接入云端、参与到 Omniverse 当中。
黄仁勋还通过四位设计师(包括一位 AI「设计师」),展示了如何协同构建虚拟世界。
介绍了 Amazon 如何利用 Omniverse Enterprise“设计优化极端复杂的物流中心运营体系”。
“现代物流中心本身就是一大技术奇迹,设施的运营需要由人类和机器人协同完成。”
机器人与自动驾驶将掀起下一波 AI 浪潮
新的芯片、新的软件与新的模拟功能融合在一起,必将掀起“下一波 AI”的浑然天成巨浪。由此孕育而成的机器人将具备“设计、规划与行动”能力。
英伟达 Avatar、DRIVE、Metropolis、Isaac 以及 Holoscan 正是围绕“四大支柱”构建成的端到端、全堆栈机器人平台,这里的四大支柱是指:真实数据生成、AI 模型训练、机器人堆栈与 Omniverse 数字孪生。
其中英伟达 DRIVE 自动驾驶汽车系统在本质上就属于“AI 司机”。
至于英伟达用于构建英伟达 DRIVE 自动驾驶汽车硬件架构的 Hyperion 8,能够通过 360 度摄像头、雷达、激光雷达及超声波传感器套件实现完全自动驾驶。Hyperion 8 将从 2024 年起登陆梅赛德斯 - 奔驰汽车,在一年后入驻捷豹路虎产品线。
黄仁勋还宣布,作为新一代电动汽车、机器人出租车、穿梭巴士与货运卡车自动驾驶引擎的集中式 AV 与 AI 计算机英伟达 Orin,将在本月内开始发货。
此次公布的还有 Hyperion 9,搭载即将推出的 DRIVE Atlan SoC,其性能达到基于 DRIVE Orin 架构的前代 Hyperion 8 的两倍。这套方案将于 2026 年正式推出。
全球第二大电动汽车制造商比亚迪将在 2023 年上半年起,在出厂的汽车上采用 DRIVE Orin 计算设备。Lucid Motors 公司透露,DreamDrive Pro 高级驾驶辅助系统正是基于英伟达 DRIVE 打造成。
总体而言,未来六年之内,英伟达公司的汽车产品线将增长至超 110 亿美元。
Clara Holoscan 将 DRIVE 中的大部分实时计算功能引入医疗食品与实时传感器,用以实现射频超声、4K 手术视频、高能量摄像头与激光导引等用例。
黄仁勋还展示了一段全息扫描加速图像的视频,画面中来自激光显微镜的图像被转化成了关于细胞移动与分裂活动的“影片”。
这类仪器在一小时之内产生的 3 TB 数据,相应处理周期往往需要一整天时间。
但在加州大学伯克利分校的高级生物成像中心,Holoscan 得以帮助研究人员实时处理这些数据,确保实验过程中显微镜能够持续实现自动对焦。
Holoscan 开发平台目前已经向早期用户开放,计划将在2022年 5 月正式上市,医疗级应用则暂定在 2023 年第一季度。
英伟达还与客户和开发人员合作,共同为制造业、零售业、医疗保健、农业、建筑业、机场及市政治理等领域构建机器人方案。
英伟达的机器人平台由 Metropolis 与 Isaac 共同构成,Metropolis 是一台能够跟踪移动物体的固定机器人,Isaac 是承载物体移动的平台。
为了帮助机器人在室内空间(例如厂房和仓库)中导航,英伟达发布了基于 Jetson AGX Orin 的 Isaac Nova Orin。这是一种先进的计算与传感器参考平台,能够加快自主移动机器人的开发与部署速度。
在一段视频中,黄仁勋展示了百事公司如何同时使用 Metropolis 与 Omniverse 数字孪生。
四层堆栈,五大动力
在演讲的最后,黄仁勋将所有技术成果、产品发布与演示内容,跟英伟达公司的下一代计算发展战略联系了起来。
英伟达为其四层堆栈公布了新产品:硬件,系统软件和库,英伟达 HPC、英伟达 AI 和英伟达 Omniverse 等软件平台,加上 AI 与机器人应用框架。
黄仁勋介绍了重塑行业面貌的五大动力:百万倍计算提速、transformers 加速 AI、数据中心转 AI 工厂、对于机器人系统的指数级需求增长,以及 AI 次世代下的数字孪生。
“将在未来十年继续努力,争取在整体堆栈与数据中心规模之上实现百万倍加速。迫不及待想看到下一波百万倍提速又能带来哪些新的可能性。”
演讲的最后,黄仁勋提到“大家在这里看到的每一段渲染、每项模拟”均由 Omniverse 生成。英伟达卓越的创意团队邀请各位观众“再一次体验 Omniverse”,英伟达园区内的设备竟“活了过来”,共同演奏了一曲美妙的爵士乐。当然,黄仁勋的数字虚拟人化身 Toy Jensen 也有登场,老黄还跟这个萌小版进行了一段问答对话。
英伟达自动驾驶芯片:Orin提前量产,Hyperion 9黄雀在后
英伟达给车企们吃了颗定心丸,不但没有跳票Orin芯片,还推出了性能翻倍的新一代自动驾驶平台DRIVE Hyperion 9。
3月22日晚间,英伟达创始人黄仁勋在GTC 2022大会上宣布,其自动驾驶芯片Orin于本月正式投产销售。英伟达推出了基于Atlan芯片的新一代自动驾驶平台DRIVE Hyperion 9,计划于2026年量产。
英伟达还宣布两家新增的新车企合作伙伴:比亚迪和Lucid Group。目前,已有超过25家车企及自动驾驶公司选择了英伟达。这些合作伙伴将在未来6年内,为英伟达贡献超过110亿美元的营收。
01 Orin提前量产,Hyperion 9黄雀在后
英伟达,既掌控自动驾驶的大脑,又掌控自动驾驶的神经。
自动驾驶芯片、平台与车型三者之间的关系并不容易理解,英伟达给出一个形象的比喻:汽车是躯体,自动驾驶平台是神经,自动驾驶芯片是大脑。
本次GTC 2022大会上,黄仁勋所发布的Hyperion 9自动驾驶平台就归属于“神经”一类,与该平台相配套的“大脑”——自动驾驶芯片,是Atlan。
英伟达Hyperion 9
Hyperion 9自动驾驶平台方面,相比目前的第8代平台,最明显的改变是支持感知硬件数量大幅度提升,最多可达50个。其中包括,车外部分14个摄像头、9个毫米波雷达、3个激光雷达以及20个超声波雷达;车内部分,可支持3个摄像头以及1个毫米波雷达。
Hyperion 9的感知硬件数量多了17个,但产生的数据量将会是8代平台的2倍以上。这意味着Hyperion 9的性能两倍于第8代平台。
Hyperion 9将支持L3级自动驾驶和停车场L4级泊车功能。
Atlan芯片
Hyperion 9所采用的是Atlan芯片。Atlan芯片在GTC 2021大会上推出,在现有Orin芯片基础上对整体芯片架构进行了大变革,将集成Grace-Next CPU、Ampere-Next GPU单元,首次集成Bluefield 数据处理单元(DPU),起到协助AI运算、加强自动驾驶能力的作用。
虽然英伟达还没有公布各模块具体的核心参数,但在算力方面,Atlan芯片的目标算力是1000TOPS,Orin芯片的算力水平是254TOPS。Atlan提升了3倍左右。
在交付时间方面,英伟达Atlan芯片的交付时间预计在2025年,Hyperion 9自动驾驶平台的交付时间预计在2026年。
自动驾驶所需的“神经”与“大脑”之外,黄仁勋还在本次大会上宣布推出DRIVE Map多模态地图引擎,这是一个供“大脑”决策所需的地图数据平台。虽然黄仁勋没有明确表示地图的层级,但从精度和功能来看,该地图平台就是高精地图采集、制作、更新平台。
DRIVE Map
DRIVE Map包括摄像头、雷达和激光雷达的数据,分别用于不同的自动驾驶感知层级。
摄像头数据对应于视觉感知层级,DRIVE Map将提供车道分隔符、道路标记、道路边界、交通灯、标志和标杆等数据。
在毫米波雷达层级,将提供雷达回波的聚合点云数据,令自动驾驶在恶劣气象环境下更安全。激光雷达层级,提供精度达5厘米的精确可靠3D环境数据。
DRIVE Map将拥有两个地图引擎,分别对应真值测绘地图(DeepMap)引擎与众包车队地图引擎。两个地图引擎能满足不同功能所需,在数据精度与数据新鲜度、规模程度上取得两全其美的效果。
英伟达计划在2024年底前,对北美、西欧、亚洲的主要道路完成DRIVE Map的创建,公路总里程将达到50万公里。
DRIVE Map所生成的数据,将导入到NVIDIA Omniverse中,在虚拟世界中构建数字孪生体,用于训练自动驾驶引擎。
02拿下比亚迪、Lucid,市场地位绝对领先
“今天,很高兴地宣布,全球第二大电动汽车制造商比亚迪于2023年上半年开始投产搭载DRIVE Orin计算平台的汽车。”伴随着新技术的发布,黄仁勋也宣布了与车企新的合作关系。
比亚迪之外,在这次大会上,与英伟达达成合作的企业还有Lucid、文远知行、元戎启行、云骥智行、Outrider和悠跑科技。
英伟达定位服务L3及以上的智能驾驶,作为GPU的发明者,在汽车主控芯片的GPU市场处于垄断地位,常年保持70%的市场占有率。
英伟达客户
英伟达在汽车圈客户大致可以分为三类:
一是造车新势力,包括蔚来(ET5、ET7)、小鹏(P5、P7、G9)、理想(X01)、威马(M7)、上汽智己、R汽车、FF、Lucid Group等;
二是传统车企,包括比亚迪、奔驰、捷豹路虎、沃尔沃、现代、奥迪、路特斯等;
三是自动驾驶公司,包括通用Cruise、亚马逊 Zoox、滴滴、沃尔沃商用车、Kodiak、图森未来、智加科技、AutoX、小马智行、文远知行、元戎启行等。
英伟达之所以能够快速拿到大量客户,很大程度在于,对于要进行L3及以上级别智能驾驶开发的企业,市面上还没有更多可选择的芯片。
早在2015年,英伟达即推出了NVIDIA Drive系列平台,赋能自动驾驶生态。
英伟达在CES 2015上推出了基于英伟达Maxwell GPU架构的第一代平台:搭载1颗Tegra X1的DRIVE CX,主要面向数字座舱;以及搭载2颗Tegra X1的DRIVE PX,主要面向自动驾驶。
此后几乎是每年英伟达都要更新一至两次Drive 平台,每隔两年发布一款车规级SoC芯片,不断拉升算力水平。
2020年,Xavier芯片算力为30 TOPS,2022年量产上车的Orin算力一跃至254 TOPS。
2021年“蔚来日”,蔚来ET7正式亮相,并宣布成为Orin系列的首发量产车。
随后,包括蔚来ET7在内,IM智己汽车、威马M7均表示搭载四颗Orin芯片,总算力超过1000TOPS。随着蔚来ET7在本月底交付,量产车将首次迈入1000TOPS算力时代。
蔚来ET7
英伟达Orin芯片的交付,对电动车来说将是一个里程碑事件,自动驾驶芯片算力将替代传统燃油车马力指标,成为汽车行业一个全新竞争点。
对手无论是Mobileye、华为、地平线可量产落地芯片单颗基本都在数十TOPS,差距较大。能与之匹敌的,算力覆盖范围为10TOPS至700TOPS的高通骁龙Ride要在2023年才能上市。
不仅如此,英伟达还在拉大距离。
在2021年的GTC大会上,英伟达发布了Atlan,单颗算力达到1000TOPS。按照英伟达规划,Atlan将于2023年向开发者提供样品,并于 2025年大规模量产上车。
除了算力外,车企及自动驾驶企业选择英伟达,还因为其开放、高效的研发生态。具体的生态优势包括以下五个方面:
1、软硬件解耦,可独立升级,支持硬件升级路线和软件升级路线;
2、英伟达作为GPU领导者,硬件优势明显;
3、英伟达拥有业界最完善的官方开发套件;
4、软件层面开放程度较高,可在 DriveWorks(功能软件层)开放 API,也可在 Drive AV 和 Drive IX(应用软件层)开放 API;
5、研发捆绑,其深度学习算法加速全部基于英伟达自身CUDA和TensorRT进行,使其软件开发和软件研发体系不可脱离英伟达平台。
这些优势的叠加,让英伟达成为追求高级别自动驾驶企业的最佳选择。
03英伟达时代?
2022年,随着蔚来ET7的量产交付,自动驾驶芯片市场开始进入高算力的英伟达时代。
对于竞争对手来讲,可怕的不仅是英伟达领先的市场份额,更可怕的是,正在成为高端可靠的代名词。
但在摘得王冠后,英伟达也将持续面临着两大挑战。
其一,暂时排在英伟达身后的竞争者们,将继续奋力追击,寻找任何能够突破的市场。例如,国产自动驾驶芯片黑马地平线,已经与多家国产汽车厂商达成合作,从中低端市场切入,试图从下向上击穿市场。
其二,车企的自我革命,一部分车企以特斯拉和苹果公司为榜样,已经把自研芯片提上日程。理想汽车总裁沈亚楠就曾谈到车企布局芯片的逻辑,他表示,车企首要先掌握域控制器的硬件能力、再掌握操作系统的能力,进而去开发一颗好的芯片。
因此,自动驾驶芯片的战争更像是一场力量角逐,英伟达的领先,可以被理解是一个阶段较量的胜利,但这场较量还远远没有结束。
参考链接:
https://blogs.nvidia.com/blog/2022/03/22/ai-factories-hopper-h100-nvidia-ceo-jensen-huang/
https://mp.weixin.qq.com/s/FbWBYn6SLRkeLdgTIwJL-w