你的GPT跟ChatGPT可能只差了一个DPU

        “人类永远不会嫌网络太快,就像永远不会嫌高铁太快,你只会嫌它慢,希望它更快些。”

        一个月内,百度、阿里、腾讯、商汤、讯飞、360等国内大厂扎堆发布“中国版 GPT ”,这家的名字还没记清楚,另一家的又蹦了出来,一时间 AI 大模型“诸神混战”。可实话实说,和 ChatGPT 相比,国内的 GPT 还存在一定差距,但大家对于 AI 的狂热渴求已经被点燃,越来越多的企业意识到, AI 这班车,再不上,就来不及了。


01 | 大语言模型的成功与挑战

        以 GPT 系列模型为代表的大语言模型成为近来最受关注的技术之一。

图 | OpenAI-ChatGPT

ChatGPT 凭什么落别人那么远?

        模型越大, AI 回馈的效果越好。 OpenAI 的 GPT-1 模型有50亿个参数, GPT-3.5 有1750亿个参数,到现在的 GPT-4 预计将有超过一个T的参数。可以看出参数是成倍甚至成指数级增长。这种增长模型的变化,首先对内存性能有着极高要求,因为训练它需要海量数据,同时需要处理海量数据集;此外,是数据中心的计算能力,还有 GPU 与 CPU 之间的通信;更重要的是网络的带宽,这些因素将决定大语言模型的整体性能。

        整体性能决定了大模型运行、训练所需的时长,也决定了对大模型后续调优再训练的周期。比如你的大语言模型训练需要6个月,一年可能最多训练2次,而别人训练只需要2或3个月,一年就可以训练多次,那么最后 AI 的迭代效果是完全不一样的。

图 | NVIDIA

        如今,不只是提出大语言模型的公司,越来越多的企业已经意识到 AI 可能会优化工作流程或是给客户提供相应的服务,大家纷纷开始尝试做自己的产品。但一旦大家都在这个模型的基础上去做,就会遇到吞吐量和性能的瓶颈。要支撑这么一个大模型做训练,投入成本是非常高的。

图 | NVIDIA

        此外还有电力的限制,能做大模型训练的数据中心的功耗和电力需求是非常大的,且增长趋势明显。数据显示,数据中心一年消耗电力200 T瓦时,也就是2000亿度电,占全球电力使用量的2%。2000亿度电是什么概念?2021年我国三峡水电站发电量为1036亿度,也就是三峡水电站两年发的电量才够全球数据中心用一年。而随着 AI 数据中心的部署和持续增长,到2030年,全球电力使用的预测份额将达到5%,这将为全球能源、环保、碳排放等带来巨大挑战。


02 | 你跟ChatGPT可能只差了一个DPU

        在 AI 的竞赛中,有两种方式:第一种是用资源去堆,就像造车一样,后造车的永远要比先造车的人烧更多的钱去打市场;第二种是在同等资源下,比谁快,快就需要效率,而提高效率就需要 DPU 。

        微软此前发布的博客透露了 OpenAI 的 ChatGPT 采用的硬件是基于 NVIDIA 智能网卡和 InfiniBand 200G 网络所做的产品,未来也有意部署 DPU 。

图 | 微软官博

        而为了应对 AI 模型训练、推理带来的需求和挑战, NVIDIA 近日发布了其最新一代数据处理器 BlueField-3 DPU ,并宣布全面量产。

图 | NVIDIA

        NVIDIA 创始人兼首席执行官黄仁勋先生表示, AI 时代需要云数据中心基础设施来支持非凡的计算需求。“ NVIDIA BlueField-3 DPU 实现了这一进步,将传统的云计算环境转变为加速、节能和安全的基础设施,以处理生成 AI 的苛刻工作负载。”

        据 NVIDIA 介绍, BlueField-3 DPU 是一款专为数据中心设计的、软件定义、硬件加速的云服务计算平台。它集成了高达16个计算核心,可提供高达400Gbp/s的网络带宽,并且支持多种协议和功能,包括网络虚拟化、弹性负载均衡、数据中心互连等。 BlueField-3 DPU 还拥有世界领先的存储加速功能,可提供高达1.6Tbp/s的存储带宽,并支持 NVMe-over-Fabric 和 RDMA 等高性能存储协议。

        大语言模型背后的硬件构成是怎样的?各家都不同。以 NVIDA DGX 为参照,支持大语言模型的服务器由8颗 NVIDIA 高性能 GPU 、4个 NVIDIA NVSWITCHES 、2颗x86 ?CPU、9块 NVIDIA BlueField-3 DPU 、2T DDR5内存、PCIe Gen5.0,以及服务器间的 NVIDIA Quantum-2 InfiniBand 网络构成。

        其中 NVIDIA BlueField-3 DPU 发挥了怎样的作用?首先是加速性能:NVIDIA BlueField-3 DPU 具有丰富的硬件加速器,可以满足大语言模型严格的性能要求,并运行苛刻的工作负载;其次,云规模效率:NVIDIA BlueField-3 DPU 可以释放 CPU 核心,使大语言模型应用具有更好的性能和可扩展性,提升服务器的效率和能效,降本增效;第三是强大的零信任安全:安全的基础设施都可以运行在 NVIDIA BlueField-3 DPU 之上,并基于此构建零信任安全模型,在不影响性能的情况下,确保数据中心安全;第四是完全可编程的基础设施:NVIDIA DOCA 2.0 体现了 NVIDIA BlueField-3 DPU 的软件可编程性,借助 NVIDIA BlueField-3 DPU 可以获得完全可编程的加速数据中心平台。

图 | NVIDIA

        简单地说,NVIDIA BlueField-3 DPU 可以提升整个网络性能,配合高算力 GPU ,可以支撑更大规模的大语言模型训练,从而缩短训练时间。根据模型需求动态调整部署以共享算力资源,并应对不同规模的模型训练;提升服务器能效、释放算力资源,用更少的服务器完成更多的任务,从而帮助企业实现节能环保、降本增效。

        据 NVIDIA 介绍,大语言模型和生成式AI主要会构建在云基础设施之上,以云服务的方式服务于市场,因此,DPU 会主要应用于云服务提供商、AI 技术公司以及采用 AI 技术的企业。据悉,NVIDIA BlueField-3 DPU 已经在部分国内公有云服务提供商进行测试,后续会逐步开始采用。

        在不久前的 GTC 2023 大会上,NVIDIA 创始人兼首席执行官黄仁勋先生坚定表示“ AI 迎来了‘ iPhone 时刻’”,回想当年苹果手机刚问世,当时的用户还都想着手机不就是用来打电话、发短信的?而今天,我们几乎已经遗忘了当时的想法和其他手机。同样,你会发现生活将慢慢被 AI 改变。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/52379.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

最快下月!地表最强语言模型GPT-4发布在即?CEO暗示:已通过图灵测试

【导读】千呼万唤始出来!GPT-4,真要来了? 作为史上最受期待的AI模型,GPT-4真要来了? 这几天,AI分析师罗梅罗的一篇专栏文章,一经推出便迅速「引爆」了整个AI科技圈。 他表示,「GP…

chatgpt赋能python:错误后如何继续编辑Python代码

错误后如何继续编辑Python代码 作为Python程序员,即使有多年的编程经验,我们还是难免会犯错误。有时您可能会意识到自己写错了代码,但有时会发现错误类型与源自身的知识不同。 然而,无论这些错误类型如何,Python都提…

ChatGPT实战:情感顾问助你告别单身生活

爱情很美好,但这个事学校不讲,家长不教,至今孤身一人的小伙伴怕是不在少数,出现问题时,没有“知心大姐”交心,只能自己一个人硬扛,有时候就是一层窗户纸,没人帮你捅破,最…

因为写不出拖拽移动效果,我恶补了一下Dom中的各种距离

前端Q 我是winty,专注分享前端知识和各类前端资源,乐于分享各种有趣的事,关注我,一起做个有趣的人~ 公众号 点击上方 前端Q,关注公众号 回复加群,加入前端Q技术交流群 背景 最近在项目中要实现一…

大型 3D 互动项目开发和优化实践

点击上方 前端Q,关注公众号 回复加群,加入前端Q技术交流群 开发背景 得益于“元宇宙”概念在前段时间的爆火,各家公司都推出了使用 3D 场景的活动或频道。 https://img13.360buyimg.com/imagetools/jfs/t1/220303/24/28446/2896414/6476b7f1F…

建立数字化、学习型人事平台,HR 与业务终于不再「隔空对话」

本篇文章暨 CSDN《中国 101 计划》系列数字化转型场景之一。 《中国 101 计划——探索企业数字化发展新生态》为 CSDN 联合《新程序员》、GitCode.net 开源代码仓共同策划推出的系列活动,寻访一百零一个数字化转型场景,聚合呈现并开通评选通道&#xff…

程序员因薪资低拒绝offer,HR恼羞成怒,网友瞬间炸翻了..

一名程序员员在求职过程中,碰到一位薪资谈不拢就恼羞成怒的HR,并说出“估计你一辈子就是个程序员”这样的话。 从这位测试员和HR的聊天内容中,我们可以看到二者的谈薪过程。 首先,HR开出15k的薪资,测试员表示太低了&a…

模拟书本世界-Ai外语训练平台-文字冒险游戏-程序介绍

首先给出这个平台的进入链接:模拟书本世界 www.chatlangue.com 然后我会简要介绍一下这个平台。最后我会分享一下这个程序是如何实现的。 简要介绍:这个平台既是一款游戏又是一款外语学习软件。你通过这个平台可以进入一本书的模拟世界,这个世…

chatgpt赋能python:Python如何将英文转化为中文的最佳方法

Python如何将英文转化为中文的最佳方法 介绍 在现代全球化社会中,国与国之间的交流越来越频繁,相应的语言翻译工具的需求也愈发迫切。Python是一种易于学习、快速上手的编程语言,适合初学者和经验丰富的程序员使用,在语言翻译方…

chatgpt赋能python:Python做出来的图:探究数据可视化的魅力

Python做出来的图:探究数据可视化的魅力 在当今数字化时代,数据可视化是一种越来越重要的手段。随着数据分析和处理技术的飞速发展,现在可以轻松地使用Python编写代码来实现复杂而美丽的图形化呈现。 Python:强大的工具 Python…

chatgpt赋能python:Python图表:可视化数据的艺术

Python图表:可视化数据的艺术 作为一种易于学习和使用的编程语言,Python在数据科学和数据分析领域中的应用越来越普遍。Python的一个强大的功能是其图表功能,可以帮助我们将数据转化为可视化图表,从而更好地理解数据、提供洞察和…

chatgpt赋能python:Python面积图:简单易学、功能强大的数据可视化工具

Python 面积图:简单易学、功能强大的数据可视化工具 Python 是一种目前非常流行的编程语言,拥有强大的数据处理和可视化功能。其中,Python 的面积图是一种非常实用的数据可视化工具,能够直观地展现数据的变化趋势和占比关系。 什…

如何自己制作简历模板?简历在线制作的方法介绍

找工作时好看并有意义的简历是十分重要的事儿,如何制作一份出色的简历,在漫天的简历中脱颖而出呢?如何自己制作简历模板?今天七分简历--简历在线制作就来给大家介绍方法吧。 1.选用正确的简历模板 所谓正确的简历模板,…

用HTML做一份个人简历

学习了基本的HTML知识后&#xff0c;今天尝试用Html做一份个人简历。需要用到的基础知识是&#xff1a; Html表格&#xff1a;以<table></table>标签作为开始&#xff0c;<tr></tr>作为行&#xff0c;<td></td>作为列。 <th></…

手把手教你打造自己的简历编辑网站-编辑完后可以一键导出为PDF

如何打造自己的简历编辑网站 目录 如何打造自己的简历编辑网站一.相关环境配置A.服务器环境B.服务器面板 二.相关软件安装A.安装Node.jsB.安装yarn 三.部署简历网站A.开始安装 先看下效果&#xff0c;然后下面开始教大家搭建操作了 一.相关环境配置 A.服务器环境 系统&#x…

简历上的照片怎么制作?这两种方法真的很简单

怎么制作简历上的照片呢&#xff1f;简历是每个人在找工作的时候必须要用到的&#xff0c;在简历中&#xff0c;除了填写我们出众的履历和工作技能之外&#xff0c;还有一个很重要的影响因素&#xff0c;那就是我们放在简历中的证件照&#xff0c;一个好的照片可以让面试官一眼…

手机怎么做个人简历?多行业简历模板自由选择

如何利用手机来制作简历呢&#xff1f;现在找工作的时候&#xff0c;大多会使用手机来查看各种招聘app软件的信息来选择自己喜欢的工作。那么为了能够更好的获取面试的机会&#xff0c;那么准备一份优质的个人简历是必不可少的&#xff0c;那么从手机上如何下载一个精美简历模板…

html制作个人简历

前几天我为大家介绍了些html的标签&#xff0c;利用这些标签咱们可以简单制作个简历&#xff0c;来巩固知识。 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><title>个人简历</title> </head>…

简历生成工具(类似wps简历助手)

目前支持简历的编辑&#xff0c;导出&#xff0c;模块化&#xff0c;顺序调整&#xff0c;导出样式选择&#xff0c;完成进度等功能&#xff0c;已经完全可以满足简历编辑的基本需求 github地址&#xff1a;GitHub - bllon/jianli-tools: 简历助手前端项目 &#xff08;求给st…

BEVFusion(mit)最强环境安装,部署复现

0.前言 最近在做BEV视图下融合感知的项目&#xff0c;需要对相关工作进行学习。BEVFusion作为一项经典的工作&#xff0c;值得深入探索&#xff0c;论文地址&#xff0c;代码地址。然而由于配置环境比较麻烦&#xff0c;耽误了一些时间。经过几次成功配置之后&#xff0c;有了一…