英伟达GTC发布会—AI的决定时刻

一.加速库

 

       NVIDIA率先推出加速计算,着力解决普通计算机无法解决的问题。加速计算并非易事,它需要从芯片,系统,网络,加速库,到重构应用的全栈发明。

       加速后,应用可以获得难以置信的速度,还可以扩展到许多计算机,再过去的十年里,加速和纵向扩展的结合使我们能够为许多应用实现百万倍的性能提升,进而有助于解决以前无法解决的问题。

        2012年,AlexKerchvsky、loyal Suskever 和George Hinton需要一台速度超快的计算机开训练AlexNet计算机视觉模型,研究人员在GeForce GTX580上使用1400万张图像训练了 AlexNet ,可处理262千万亿次浮点运算。经过训练的模型以压倒性优势赢得了 ImageNet 挑战赛,并触发了 Al 的大爆炸。

          下面是一些新型加速库:

(1)CFD

        汽车和航空航天行业使用 CFD 进行湍流和空气动力学仿真。电子行业使用 CFD 进行热管理设计。 由 CUDA 加速的新 CFD 求解器在同等系统成本下,NVIDIAA100的吞吐量是 CPU 服务器的9倍。或者,在同等仿真吞吐量下, NVIDIA 的成本降低了9倍,能耗降低了17倍。

  (2)CuQuantum

           CuQuantumcu 是用于量子电路仿真的加速库。 今天,英伟达宣布推出一个量子控制链路,这是与 QuantumMachines 合作开发的。它可将 NVIDIAGPU 连接到量子计算机,以极快的速度进行纠错。

(3)Spark RAPIDS

            Spark - RAPIDS 是 NVIDIA 加速的 ApacheSpark 数据处理引擎。现在, Spark - RAPIDS 可加速主要云数据处理平台,包括 GCPDataproc 、 AmazonEMR 、 Databricks 和 Cloudera 。

 (4)cuOpt

             NVIDIAcuOpt 使用进化算法和加速计算每秒分析300亿次动作,打破了世界纪录,并为 Li 和 Lim 的挑战找到了合适的解决方案。 cuOpt 还可以优化物流服务。

(5)NVIDIA Triton Managevent Service

              支持集成模型的模型分析器、并发多模型服务,适用于 GPT -3大语言模型的多 GPU 、多节点推理。

(6)CV - CUDA 和 VPF

         CV - CUDA 和 VPF 用于计算机视觉的 CV - CUDA 和用于视频处理的 VPF 是新的云规模加速库。

(7)NVIDIA Parabricks

         加速计算帮助基因组学实现了里程碑式发展。

(8)cuLitho

          NVIDIAHoloscan cuLitho -﹣一个计算光刻库 将计算光刻加速了40倍以上。

二.数据硬件

(1)Grace CPU

           Grace 包含72个 Arm 核心,由超高速片内可扩展的、缓存一致的网络连接,可提供3.2TB/ s 的截面带宽。 GraceSuperchip 通过900GB/ s 的低功耗芯片到芯片缓存一致接口,连接两个 CPU 芯片之间的144个核。内存系统由 LPDDR 低功耗内存构成 手机上使用的相似) 它提供1TB/ s 的带宽,是目前系统的2.5倍,而功耗只是其1/8。整个14核GraceSuperchip 模 的大小仅为5x8英寸,而内存高达1TB。该模组的功耗超低,风冷即可。 Grace 的性能和能效非常适合云计算应用和科学计算应用。

(2)NVIDIA Blue Field

          在现代软件定义的数据中心中,操作系统在执行虚拟化、网络、存储和安全任务时会消耗近一半的数据中心 CPU 核心和相关功耗。数据中心必须加速每个工作负载,从而降低功耗并释放 CPU 给可创造收入的工作负载。

           NVIDIA Blue Field 卸载并加速数据中心操作系统和基础设施软件。

(3)NVIDIA DGX H100

           NVIDIA 加速计算始于 DGX ( AI 超级计算机)。这是大语言模型实现突破背后的引擎。 DGX 配有8个H100GPU模组,H100配有 Transformer 引擎,旨在处理类似令人惊叹的 ChatGPT 模型。 这8个H100模组通过 NVLINKSwitch 彼此相连,以实现全面无阻塞通信。8个H100协同工作,就像一个巨型 GPU 。

 三.DGX 云&生成式AI

(1)DGX 云

           DGX 超级计算机是现代 AI 工厂,我们正处于 Al 的" iPhone 时刻"。NVIDIA 宣布推出 NVIDIA DGX Cloud ,并与 MicrosoftAzure 、 GoogleGCP 和 OracleOCI 合作,为客户提供出色的 NVIDIAAI 以及全球主要的云服务提供商。            Oracle Cloud Infrastructure ( OCI )将成为首个 NVIDIADGXCloud 。 OCI 具有出色的性能,它拥有两层计算网络和管理网络,具有业界最佳 RDMA 功能的 NVIDIACX -7提供了计算网络,而 BlueField -3将成为管理网络的基础设施处理器。这种组合是一款先进的 DGXAl 超级计算机,可提供多租户云服务。

(2) NVIDIA AI Foundations

          众多突破性成果造就了生成式 Al , Transformer 能以大规模并行的方式,从数据的关系和依赖性中学习上下文和含义,这使得大型语言模型能够利用海量数据进行学习,他们可以在没有明确训练的情况下执行下游任务,受物理学启发的扩散模型通过无监督学习来生成图像。   

            生成式 AI 是一种新型计算机,一种我们可以用人类语言进行编程的计算机。这种能力影响深远,每个人都可以命令计算机来解决问题, 生成式 AI 是一种新型计算平台,与 PC 、互联网、移动设备和云类似。与之前的计算时代类似,先行者正在打造新的应用,并成立新公司,以利用生成式 AI 的自动化和协同创作能力。

              NVIDIA Al Foundations 。这是一项云服务,面向需要构建、优化和运营定制 LLM (大型语言模型)和生成式 AI ,使用其专有数据进行训练,用于处理特定领域的任务。

              NVIDIA AI Foundations 包括语言、视觉和生物学模型制作服务。 NVIDIANemo 用于构建定制的语言文本转文本生成式模型。

四.新推理平台

 (1)L4

            47b9f03583684d1ba39b309e74882a0d.png

            随着生成式 AI 掀起新一波机遇浪潮, Al 正处于转折点,使得推理工作负载呈阶梯函数式增长。 AI 现在可以生成多种数据,从语音、文本、图像、视频和3D图形,到蛋白质和化学物质,不一而足。设计一个云数据中心来处理生成式 Al 是一项巨大挑战。

             针对 AI 视频工作负载,英伟达推出了L4,它针对以下方面进行了优化:视频解码和转码、视频内容审核,以及视频通话功能,例如背景替换、重新打光、眼神交流,转录和实时翻译。

(2)L40

d20bbd4226e84c879d217bebe143dd3f.png

           针对 Omniverse 、图形渲染以及文本转图像和文本转视频等生成式 AI ,英伟达宣布推出L40。L40的性能是 NVIDIA 最受欢迎的云推理GPUT4的10倍。

(3)H100 NVL

5e661f6dc9934c82b190d496037426f6.png

          ChatGPT等大型语言模型是一个新出现的重要的推理工作负载。 GPT 模型是内存和计算密集型模型。此外,推理是一种高容量、外扩型工作负载,需要标准的商用服务器。

          针对 ChatGPT 等大型语言模型的推理,英伟达宣布推出一款新的 HopperGPU -﹣配备双 GPUNVLINK 的PCIEH100。这一款H100配备94GBHBM3显存。H100可以处理拥有1750亿参数的 GPT -3。同时还可支持商用 PCIE 服务器轻松扩展。

           目前在云上唯一可以实际处理 ChatGPT 的 GPU 是HGXA100。与适用于 GPT -3处理的HGXA100相比,一台搭载四对H100及双 GPUNVLINK 的标准服务器的速度要快10倍。H100可将大型语言模型的处理成本降低一个数量级。

(4)Hopper GPU 和 Grace Hopper

ec1fd0905ad44160a050c52ff2c5a973.png

            Grace Hopper 是我们的新的超级芯片,通过900GB/秒的高速一致性芯片到芯片接口连接 GraceCPU 和 HopperGPU 。 GraceHopper 非常适合处理大型数据集,例如适用于推荐系统和大型语言模型的 Al 数据库。

五.Omniverse

 

        Omniverse 是一个工业数字化平台,旨在搭建数字化和物理实体之间的桥梁。该平台让各个行业先以数字方式设计、构建、运营和优化实体产品和工厂,然后再投入实际生产。数字化提高了效率和速度,并节省了资金。

        Omniverse 其中一个用途是以虚拟方式构建工厂,在真正的实体工厂建成之前,以数字方式整合工厂的所有机械设备。这样可以减少在最后时刻出现意外、变更订单和工厂延迟开工等情况。

        本次发布会,英伟达向我们展示了其最先进的计算机技术,尤其强调AI领域的发展,多次指出我们正处于AI的iPhone时代,我们通过这次发布会能够看到未来科技的发展方向和AI对未来的影响,社会和产业的数字化变革已经是大势所趋,这对未来的从业者提出了更加高的技术个知识要求,在不久的将来,技术的更新换代可能会更加频繁,因此我们这些学习者需要更加迅速得掌握并运用好新知识。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/15924.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

音视频技术开发周刊 | 288

每周一期,纵览音视频技术领域的干货。 新闻投稿:contributelivevideostack.com。 YC爆发AIGC潮,100项目完整盘点 硅谷顶级孵化器Y Combinator冲向AI创业者,2023冬季孵化营一口气选了百家AI相关的创业项目,占到今年总孵…

谷歌云开启GPU算力狂飙,驱动AIGC时代加速到来

‍数据智能产业创新服务媒体 ——聚焦数智 改变商业 随着人工智能的飞速发展,尤其是大型AI模型、AIGC的崛起,对AI算力产生了巨大的需求。以GPU为核心的算力供给,已经成为大模型、AIGC乃至整个智能产业发展的关键基础设施。因此,对…

互联网成围城,“转码”神话破灭?身在其中的程序员何去何从

前言 在数字化的时代,程序员的角色正在变得越来越重要,尤其在互联网行业,程序员的薪资和发展前景都是非常吸引人的。然而,随着市场的发展和变化,互联网行业也在悄然发生改变。近年来,"转码"成为…

恐怖的GPT4,轻松解决支付宝乱码问题!

最近有反馈说支付宝的理财页面出现了中文乱码,估计不少小伙伴和我一样,都惊呆了😮!阿里这种大厂还能出现这种低级错误? 难道人力都投入到“通义千问”的突然发布上了? 那借这个机会,我就来和大…

一个时代彻底结束了

你好,我是厂长。 之前有很多读者咨询我说:当下的互联网前景怎么样?还有必要转码吗? 不管是非科班的朋友,还是正在学习计算机专业的同学,相信大家都有这个疑惑,因为职业的选择,不仅关…

只知道ChatGPT?偷偷告诉你金融民工都在学的13个王炸金融AI工具,搞钱效率提升10倍!

要论金融民工的日常工作,读报告绝对排在第一位。 大量的财报、研报、背调资料、会议记录等等,动辄一份就几十页、上百页,导致很多朋友一看到报告就头疼。 下面这些AI工具,可以帮我们快速总结报告的主要内容,在短时间内…

开源赋能 普惠未来——回顾全球数字经济大会及开放原子全球开源峰会(Intel专题)

一、峰会背景 2023年6月11日至13日,中国北京迎来了一场全球数字经济大会和开放原子全球开源峰会的盛会。这次大会在北京北人亦创国际会展中心隆重举行,为来自世界各地的数字经济和开源社区的代表们提供了一个共同交流、合作的平台。 本次大会以"开…

AIGC来了,你的版权还安全吗?

引言 |人工智能生成内容(AIGC)是热度居高不下,据Gartner预计,到2025年,AIGC将占全球所有生成数据的10%,以ChatGPT、Stable Diffusion为代表的现象级应用受到强势追捧,AIGC毫无疑问是强有力的生产…

比ChatGPT更好用的Claude来了

比ChatGPT更好用的Claude来了,不需要魔法上网!!! claude官网 点击 add to slack slack跟discord有点类似,先要去slack注册账号 登录之后就添加创建一个工作区 添加 不过现在已经停止添加了,会出现App u…

ChatGPT的竞争对手:Claude 简介

Introducing Claude 克劳德简介 After working for the past few months with key partners like Notion, Quora, and DuckDuckGo in a closed alpha, we’ve been able to carefully test out our systems in the wild, and are ready to offer Claude more broadly so it can…

ChatGPT被超越了?OpenAI核心成员出走,打造Claude模型

文|衡宇 萧箫 源|量子位 因不满老东家成为微软附庸,11名OpenAI前员工怒而出走。 如今带着“ChatGPT最强竞品”杀回战场,新公司估值50亿美元,一出手就获得3亿美元融资。 这家公司名叫Anthropic,新推出的聊天…

GPT前2代版本简介

承接上文ChatGPT进化的过程简介 2018年,Google的Bert和OpenAI的GPT绝代双骄,两者非常像,都是语言模型,都基本上是无监督的方式去训练的,你给我一个文本,我给你一个语言模型出来。 GPT前两代没有什么特别的…

强人工智能时代,区块链还有戏吗?

最近很多人都在问我,ChatGPT 把 AI 又带火了,区块链和 Web3 被抢了风头,以后还有戏吗?还有比较了解我的朋友问,当年你放弃 AI 而选择区块链,有没有后悔? 这里有一个小背景。2017 年初我离开 IBM…

chatgpt赋能python:Python抽奖程序:让彩票游戏更加有趣

Python抽奖程序:让彩票游戏更加有趣 随着科技的进步,彩票抽奖游戏已经成为许多人喜爱的活动之一。为了增加游戏的趣味性和公正性,许多抽奖游戏采用了Python编程语言来实现程序。本文将介绍Python抽奖程序的基本原理和使用方法,让…

独立开发者案例:每周4h月入数万刀;国家数据局与时代红利;创业前先买个域名;工程师成长最重要的是什么 | ShowMeAI周刊

这是ShowMeAI周刊的第6期。聚焦AI领域本周热点,及其在各圈层泛起的涟漪;关注AI技术进步,并提供我们的商业洞察。欢迎关注与订阅!👀日报合辑 ⌛ 独立开发者案例:每周只工作4小时,独立开发者打造月…

王炸-GPT4.0的新能力与商业价值

转自微信公众号:嵌入式单片机之家 有多王炸 ? GPT-4 可以接受文本和图像输入,允许用户指定任何视觉或语言任务。具体来说,它在给定文本和图像输入的情况下能够生成文本输出(自然语言、代码等)。在一系列其它…

OpenAI宣布漏洞赏金计划,最高奖金2万美元

安全问题,已经成为 ChatGPT 和 GPT-4 等 AI 大模型是否能够大规模应用在各行各业的重要问题之一。OpenAI 也因为这一问题受到了业内人士、监管部门的诸多批评。 今天,OpenAI 官方发布了一篇名为 “Announcing OpenAI’s Bug Bounty Program” 的博客文章…

王慧文因健康问题辞任美团董事;数百万GitHub项目易受依赖库劫持攻击;特斯拉首台超级计算机或在七月投产|极客头条...

「极客头条」—— 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧。 整理 | 梦依丹 出品 | CSDN(ID:CSDNnews) 一分钟速览新闻点&#…

一篇就够:uniapp-Mqtt系列问题详细攻略(解决掉线、真机调试错误等问题)

😹背景 昨天搞了一天,我觉得新手可以参考我这篇文章思路,避免你和我一样踩坑,刚好去年的这几天也在搞mqtt,不过当时弄的是微信小程序,这次项目是uniapp,我想实现uniapp中的h5能够使用mqtt&…

英语配音软件哪个好?

在英语的学习上最难的就是口语了,想要让发音变得更加标准,那么一定要体验几款英语配音的软件,最近就有一些小伙伴问到了英语配音app推荐免费的有哪些?好的英语配音软件可以让我们更好地完成英语的配音体验,还能体验多种…