英伟达发大招 黄仁勋:生成式AI唯一限制是人类想象力

3ec334daed46c2dfbb92500be50b29fb.jpeg

雷递网 雷建平 3月22日

ChatGPT仅是一个起点。

英伟达(NVIDIA)创始人兼首席执行官黄仁勋说,计算正在以“光速”发展。黄仁勋于今日宣布与谷歌、微软、Oracle等一众领军企业开展广泛的合作,为各行各业带来新的AI、模拟和协作能力。

黄仁勋在NVIDIA GTC大会主题演讲中表示:“如果把加速计算比作曲速引擎,那么AI就是动力来源。生成式AI的非凡能力,使得公司产生了紧迫感,他们需要重新构思产品和商业模式。”

作为这场为期四天活动的主题演讲,黄仁勋在长达78分钟的演讲中概述NVIDIA及其合作伙伴如何提供训练和部署AI服务所需的各种技术。

黄仁勋宣布NVIDIA和微软将把数亿Microsoft 365和Azure用户连接到一个用于构建和操作超现实虚拟世界的平台。他还谈到ChatGPT等最近大火的新一代生成式AI服务的兴起。

黄仁勋表示,加速计算和AI的出现恰逢其时。摩尔定律正在放缓,各个行业正在应对可持续发展,生成式AI以及数字化等强大的动态挑战。“各个行业的企业正在竞相进行数字化转型,希望成为软件驱动的技术公司,成为行业颠覆者而不是被颠覆者。”

加速计算可助力企业应对这些挑战。黄仁勋表示:“加速是重获优势、实现可持续发展,以及达到净零排放的最佳途径。”

AI的iPhone时刻

NVIDIA技术是AI的基础,黄仁勋讲述了NVIDIA如何在生成式AI变革初期就已参与进来。早在2016年,他就向OpenAI亲手交付了第一台NVIDIA DGX AI超级计算机——支持 ChatGPT 的大型语言模型突破背后的引擎。

2022年年底推出的ChatGPT几乎在一夜之间爆火,吸引了超过1亿用户,成为有史以来增长最快的应用。黄仁勋认为 “我们正处于AI的 iPhone时刻 ”。

黄仁勋表示,最初作为AI研究仪器使用的NVIDIA DGX超级计算机现已在世界各地的企业中全天候运行,用于完善数据和处理AI。《财富》100强企业中有一半都安装了DGX AI超级计算机。

黄仁勋表示,类似ChatGPT大型语言模型(LLM)的部署是一个重要的全新推理工作负载。为了支持像ChatGPT这样的大型语言模型推理,英伟达发布了一款新的GPU——带有双GPU NVLink的H100 NVL。

基于NVIDIA Hopper架构的H100配有一个Transformer引擎,旨在处理驱动ChatGPT的类似GPT模型。与用于GPT-3处理的HGX A100相比,配备四对H100与双GPU NVLink的标准服务器的速度最高可达10倍。

黄仁勋表示:“H100可以将大型语言模型的处理成本降低一个数量级。”

生成式AI唯一限制是人类想象力

ef1169b4de80f6b05879d6c32bc099bc.jpeg

据介绍,英伟达(NVIDIA)日前推出四款推理平台。这些平台针对各种快速兴起的生成式AI应用进行优化,能够帮助开发人员快速构建用于提供新服务和洞察的AI驱动的专业应用。

这些平台将NVIDIA全栈推理软件与最新的NVIDIA Ada、Hopper和Grace Hopper处理器相结合,包括今天推出的NVIDI AL4 Tensor Core GPU和NVIDIA H100 NVL GPU。各平台针对AI视频、图像生成、大型语言模型部署、推荐系统推理等需求激增的工作负载进行优化。

黄仁勋表示:“生成式AI的兴起需要更加强大的推理计算平台。生成式AI应用的数量是无限的,它唯一的限制就是人类的想象力。为开发人员提供最强大、灵活的推理计算平台将加快新服务的创造速度,这些新服务将以前所未有的方式改善我们的生活。”

每个平台都包含一个为特定生成式AI推理工作负载而优化的NVIDIAGPU和专用的软件:

适用于AI视频的NVIDIAL4可提供比CPU高出120倍的AI视频性能,同时能效提高了99%。这款适用于几乎所有工作负载的通用GPU提供更加强大的视频解码和转码能力、视频流式传输、增强现实、生成式AI视频等。

适用于图像生成的NVIDIAL40针对图形以及AI支持的2D、视频和3D图像生成进行了优化。L40平台是NVIDIAOmniverse™(一个用于在数据中心构建和运行元宇宙应用的平台)的引擎,与上一代产品相比,其StableDiffusion推理性能提高了7倍,Omniverse性能提高了12倍。

适用于大型语言模型部署的NVIDIAH100NVL是规模化部署像ChatGPT这样的大型语言模型(LLMs)的理想平台。这款新的H100NVL拥有94GB内存和Transformer引擎加速,在数据中心规模,与上一代A100相比,GPT-3上的推理性能提高了多达12倍。

适用于推荐模型的NVIDIAGraceHopper是图形推荐模型、矢量数据库和图神经网络的理想平台。通过NVLink-C2C以900GB/s的速度连接CPU和GPU,GraceHopper的数据传输和查询速度比PCIe5.0快了7倍。

这些平台的软件层采用NVIDIAAIEnterprise软件套件,包括用于高性能深度学习推理的软件开发套件NVIDIATensorRT™,以及帮助实现模型部署标准化的开源推理服务软件NVIDIATritonInferenceServer™。

谷歌云是NVIDIA推理平台的重要云合作伙伴和早期客户。谷歌云正在将L4平台整合到其机器学习平台VertexAI中,并且是第一家提供L4实例的云服务提供商,其G2虚拟机的私人预览版已于今天推出。

NVIDIA和谷歌今天分别宣布了首批在谷歌云上使用L4的两家机构——Descript和WOMBO,前者使用生成式AI帮助创作者制作视频和播客,后者提供”Dream”这一AI驱动的文本–数字艺术转换应用程序。

6cb53132127a602a0e60979d8d4aa214.jpeg

在过去十年中,云计算每年增长20%并已发展成为一个万亿美元的产业。NVIDIA为这个AI和云优先的世界设计了Grace CPU,其中AI工作负载由GPU加速。Grace正在进行样品调测。

通过900GB/s高速芯片对芯片的接口,NVIDIA Grace Hopper超级芯片可连接Grace CPU和Hopper GPU。黄仁勋解释说,“ Grace Hopper是处理超大型数据集的理想选择,比如用于推荐系统的AI数据库和大型语言模型。”

“客户希望构建规模大几个数量级AI数据库,Grace Hopper是最理想引擎。”

赋能生成式AI

为加速企业使用生成式AI的工作,黄仁勋发布了NVIDIA AI Foundations云服务系列,为需要构建、完善和运行自定义大型语言模型及生成式AI的客户提供服务,他们通常使用专有数据进行训练并完成特定领域的任务。

AI Foundations服务包括NVIDIA NeMo,用于构建自定义语言文本-文本转换生成模型;Picasso视觉语言模型制作服务,适用于想要构建使用授权或专有内容训练而成的自定义模型的客户;以及BioNeMo,助力2万亿美元规模的药物研发行业的研究人员。

Adobe正与NVIDIA一起构建一整套用于未来创作工作的新一代AI。

Getty Images正在与NVIDIA一起训练负责任的生成式文本-图像,以及文本-视频转换基础模型。Shutterstock正在与NVIDIA一起训练一个生成式文本-3D转换基础模型,以简化详细3D资产的创建。

DGX是构建AI基础设施的蓝图

最新版本的DGX搭载8个NVIDIA H100 GPU,它们连接成为一个巨大的GPU。黄仁勋表示:“NVIDIA DGX H100是全球客户构建AI基础设施的蓝图”,现已全面投入生产。

a57760e6070f0db0b17f8ab23427c1a2.jpeg

H100 AI超级计算机现已开始上线。Oracle Cloud Infrastructure宣布配备 H100 GPU 的新 OCI Compute 裸机 GPU 实例在一定条件可用。

此外,亚马逊云科技发布了将推出的P5实例 EC2 UltraClusters,其规模可扩展到2万个互连的H100 GPU。

上周,微软 Azure 发布了其 H100 虚拟机 ND H100 v5 的私人预览版。Meta 现已为其内部的 AI 生产和研究团队部署了由 H100 驱动的 Grand Teton AI 超级计算机。

OpenAI将在其 Azure 超级计算机上使用 H100来支持其持续进行的AI研究。

DGX Cloud:随时随地将AI带给每家公司

c4768c7ad0a704b66f0283b3c37da9a7.jpeg

为了加快把DGX能力带给初创企业和其他各类企业,以助力其快速打造新产品和制定AI战略,黄仁勋发布了NVIDIA DGX Cloud。

通过与微软Azure、Google Cloud和Oracle Cloud Infrastructure合作,“从浏览器上” 即可实现将NVIDIA DGX AI超级计算机 “带给每家公司”。

DGX Cloud经过优化可以运行NVIDIA AI Enterprise,这款全球领先的加速软件套件将推动AI端到端开发和部署。黄仁勋表示:“DGX Cloud为客户提供 NVIDIA AI和世界领先云服务提供商的出色服务。”

NVIDIA正与领先的云服务提供商一起托管DGX Cloud基础设施,Oracle Cloud Infrastructure是最早合作的云服务提供商。微软Azure预计将在下个季度开始托管DGX Cloud,该服务将很快扩展到Google Cloud等。

黄仁勋表示,此次合作将NVIDIA的生态系统带给云服务提供商,同时扩大了NVIDIA的规模和影响力。企业将能够按月租用DGX Cloud集群以便快速、轻松地扩展大型多节点训练工作负载的开发。

微软与NVIDIA一起将Omniverse带给数亿用户

黄仁勋宣布,NVIDIA 正在与微软合作,将 NVIDIA Omniverse Cloud 这一完全托管的云服务引入全球各行各业,并推出又一项云服务以加速企业实现前所未有的模拟和协作能力。

86c71af3dc9b91ab7808dd78b576b68f.jpeg

黄仁勋表示:“微软和NVIDIA将为数亿Microsoft 365和Azure用户提供Omniverse” 。他同时还发布了最新NVIDIA OVX服务器、搭载NVIDIA RTX Ada Generation GPU的新一代工作站,以及英特尔为NVIDIA Omniverse优化的最新CPU。

为了展示为3D设计协作及数字孪生模拟而构建的开放平台NVIDIA Omniverse的强大功能,黄仁勋分享了一段视频,展示了NVIDIA Isaac Sim如何通过完全保真的数字孪生帮助亚马逊节省时间和金钱。NVIDIA Isaac Sim是在Omniverse基础上构建的机器人模拟和合成生成平台。

该视频展示亚马逊如何为其第一个完全自主的仓库机器人Proteus编排动作,使其能在亚马逊的巨大仓库中与人类和其他机器人一起搬运装有产品的箱子。

助力3万亿美元规模汽车产业的数字化

为了展示Omniverse的能力,黄仁勋深入介绍了Omniverse在3万亿美元汽车产业数字化中的作用。

黄仁勋表示,到2030年,汽车制造商将建立300家工厂,生产2亿辆电动汽车,而电池制造商正在建设100家巨型工厂。他表示:“数字化将提高该行业的效率、生产力和速度。”

谈到Omniverse在整个行业的应用,黄仁勋表示,Lotus正在使用Omniverse以虚拟方式组装焊接站。梅赛德斯-奔驰使用Omniverse为新车型建立、优化和规划装配线。Rimac和Lucid Motors在Omniverse上使用真实设计数据创建数字商店,以实现对汽车逼真的描绘。

宝马与Idealworks合作,使用Omniverse中的Isaac Sim生成训练工厂机器人的合成数据和场景。

黄仁勋表示,宝马正在使用Omniverse规划全球工厂的运营,在实际工厂开业两年之前,他们会在 Omniverse 中完整建造一间新的电动汽车工厂。

NVIDIA 还宣布全球领先的新能源汽车制造商比亚迪将在其更广泛的车型中扩展对 NVIDIA DRIVE Orin 集中式计算平台的使用。

———————————————

雷递由媒体人雷建平创办,若转载请写明来源。

6a650f6946a6bad147a68c220f74b4f5.jpeg

da9dd569fb72d588bb02c3ab4c2b2d92.jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/62199.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

英伟达曝光超级芯片 黄仁勋:AI已重塑计算机产业

5月29日,英伟达再曝新品“NVIDIA DGX™超级计算机”,为生成式AI语言应用、推荐系统和数据分析工作负载的巨型模型提供硬件支持。 该计算机的核心组件是已经全面投产的英伟达Grace Hopper超级芯片——2000 亿个晶体管,在同一封装内集成了72核…

黄仁勋误入直播被当“路人”,英伟达粉丝都乐疯了

作者|李禾子 邮箱|lihezipingwest.com 黄仁勋,大名鼎鼎的芯片巨头英伟达CEO,硅谷最炙手可热的男人,最近出现在了台北街头两个女主播的直播间里。 不是宣传产品,不是接受访问,而是纯纯地路过被…

谷歌开源Live Transcribe语音识别转文字工具

8月18日,Google宣布开源Android语音识别转录工具Live Transcribe的语音引擎。 这家公司希望这样做可以让任何开发人员为长篇对话提供字幕,减少因网络延迟、断网等问题导致的沟通障碍。源代码现在可以在GitHub上获得。这意味着无论你是出国或是与新朋友见…

python简单实现文字转语音,语音识别

直接语音合成 需要安装 pip3 install pyttsx3 pip3 install pypiwin32 安装pyttsx3的时候出错,结果重装了一次python才行。。。 tips:最后本人安装的版本是3.6 import pyttsx3 # 初始化 engine pyttsx3.init()engine.say(我要开始语音合成) engine.say(好好学习&am…

语音识别(语音转文字) 语音合成(文字转语音)

【语音合成API】SpeechSynthesisUtterance是HTML5中新增的API,用于将指定文字合成为对应的语音.也包含一些配置项,指定如何去阅读(语言,音量,音调)等 // 语音播报speek (content) {let message new SpeechSynthesisUtterance()message.text contentmessage.lang zh-CNmessag…

手把手使用Python语音识别,进行语音转文字

目录 0. 太长不看系列,直接使用 识别结果 1. Python调用标贝科技语音识别接口,实现语音转文字 1.1 环境准备: 1.2 获取权限 1.2.1 登录 1.2.2 创建新应用 1.2.3 选择服务 1.2.4 获取Key&Secret 2. 代码实现 2.1 获取access_to…

语音识别1-3语音克隆-语音转文字-聊天盒子-python

语音识别 文本合成语音克隆声音项目语音转文字bug解决 文字转语音不保存文件转语音重复自己刚说过的话聊天盒子 环境信息 B站教学视频跳转 音频格式在线转换: https://www.aconvert.com/cn/audio/m4a-to-mp3/ 或者用格式工厂 文本合成语音 from gtts import gTTS …

Android语音转文字一识别语音

项目地址:https://github.com/zhanlv/VtDemo 讯飞AndroidSDK文档:https://doc.xfyun.cn/msc_android/%E9%A2%84%E5%A4%87%E5%B7%A5%E4%BD%9C.html 讯飞语音SDK不提供android平台语音转写的功能(只支持java平台,当然android可以通…

语音识别,将语音转换成文字

通常,我们在不想打字的时候,就会给别人发语音。但是如果你想把你说的一段话给 它转换成文字,该怎么操作呢?今天就来给大家分享一个技能,快速的将语音转换成 文字。无论是写文章,或者做会议记录,…

语音识别(利用python将语音转化为文字)

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言一、申请讯飞语音端口1.点击链接进入讯飞平台主页面2.在页面注册自己的个人账户3.申请语音端口4.查看自己的端口编码 二、python代码讲解1.代码如下&#xff08…

chatglm-6b_ptuning error:bash .sh,出现ModuleNotFoundError

文章目录 模型效果演示问题描述分析一分析二 ChatGLM-6B是一个由清华大学和智谱AI联合研发的开源对话语言模型。它是一个支持中英双语问答的对话系统,并在中文方面进行了特别的优化。 该模型基于General Language Model (GLM)架构,具有62亿参数。借助模型…

【自然语言处理】【大模型】用于大型Transformer的8-bit矩阵乘法介绍

用于大型Transformer的8-bit矩阵乘法介绍 原文地址:A Gentle Introduction to 8-bit Matrix Multiplication for transformers at scale using transformers, accelerate and bitsandbytes 相关博客 【深度学习】【分布式训练】Collective通信操作及Pytorch示例 【自…

简单易懂------使用PyTorch实现Chatbot

本系列文章通过通俗易懂的方式介绍强化学习的基本概念,虽然语言通俗,但是内容依旧非常严谨性。文中用很多的公式,对数学公式头疼的读者可能会被吓住,但是如果读者一步一步follow下来,就会发现公式的推导非常自然&#…

Hugging Face Transformer:从原理到实战的全面指南

一、前言 前面我面介绍过ChatGPT的基本原理以及预训练大语言模型的发展史,我们知道ChatGPT和所有预训练大语言模型的核心是什么?其实就是 Transformer,Hugging Face 的火爆离不开他们开源的这个 Transformers 库。这个开源库里有数万个我们可…

[AI存储] NLP 和 AI: 数据存储在推动生成式 AI 工具中的作用

很少有技术现象像新一批生成式 AI 工具(如Dall-E和ChatGPT)那样迅速流行起来。似乎一夜之间,这些引人入胜的新应用正被各种各样的人用于不同的应用 – 从内容原创到邮件和报告撰写、软件开发、内容研究等等。 特别是ChatGPT,由于其…

微信小程序云开发实现一对一即时聊天,发送语音、文件、图片、朋友圈、添加好友等功能

点此源码获取 前几篇博文 前几篇文章实现了,利用云开发的即时通信demo做的仿照微信好友聊天。 本篇文章主要在前几篇的基础上进行的修改,实现 即时一对一聊天,群聊天,发送文件图片,发送语音,更换聊天背景…

微信小程序目前最新的授权登录接口-2021年10月份

微信小程序目前最新的授权登录接口-2021年10月份 效果图: 说明:首先我们需要在app.js里用云函数获取到openid,然后在用户点击登录的时候用获取到的openid去用户表里查询是否有该用户,如果没有就把用户信息写入数据库里的用户表,再…

微信小程序原生接入腾讯云im(单聊,列表,聊天界面,自定义消息,自动回复)

微信小程序原生接入腾讯云im(单聊,列表,聊天界面,自定义消息,自动回复) 发送图片语音消息传送→ 文章目录 1.项目需求 2.参考文档 3.效果图 4.初始化 集成SDK 5.登录 6.会话列表 7.聊天页面 8.遇到的问…

微信小程序接入腾讯云IM即时通讯(发送消息开发步骤)

微信小程序接入腾讯云IM即时通讯(聊天窗口) 1.效果图: 2.功能点 : 1.布局要分左右两边布局,如果是自己为发送消息方,都在右边,对方发送的消息在左边。 2.腾讯云返回的是时间戳,需…

uniapp小程序接入腾讯IM聊天

腾讯IM中创建项目 拿到AppID 与 密钥 下载demo 将debug 文件夹拖到自己项目中 在第一个js文件中填入自己项目的APPID 与密钥 下载(tim-wx-sdk 上传文件 的依赖 看项目所需 import TIM from tim-wx-sdk; import TIMUploadPlugin from tim-upload-plugin; let optio…