我们是否需要AI服务器?推动人工智能繁荣发展的AI服务器

揭穿人工智能服务器的炒作

人工智能的研究已经有几十年了,早在 1960 年代,生成式人工智能就已应用于聊天机器人。然而,2022 年 11 月 30 日发布的 ChatGPT 聊天机器人和虚拟助手席卷了 IT 界,让 GenAI 成为家喻户晓的术语,并掀起了开发人工智能相关硬件和软件的热潮。

通用 AI 和 GenAI 推动力开始增强的一个领域是 AI 服务器。分析公司 IDC 将 AI 服务器定义为运行专用于 AI 应用程序开发的软件平台、主要用于执行 AI 模型的应用程序和/或具有某些 AI 功能的传统应用程序的服务器。

我们是否需要AI服务器?推动人工智能繁荣发展的AI服务器

IDC 在 5 月份估计,到 2023 年,AI 服务器将占整个市场的 23% 左右,这一份额未来还将继续增长。IDC 还预测,到 2027 年,AI 服务器收入将达到 491 亿美元,前提是 GPU 加速服务器收入的增长速度将快于其他加速器的收入。

据供应商和销售商称,人工智能服务器和通用服务器之间的区别并不总是那么明显。

联想全球人工智能业务总监罗伯特戴格尔 (Robert Daigle) 表示,很多人在谈论人工智能服务器时,尤其是随着 GenAI 的蓬勃发展,都提到了富含 GPU 的系统,尤其是通常为训练和微调模型而设计的系统。

“[但] 还有很多用于 AI 工作负载的通用服务器,”Daigle 告诉我们。“当你脱离生成式 AI,甚至脱离深度学习,进入传统机器学习时,许多机器学习工作负载仍然在 CPU 上运行。”

Nor-Tech 是明尼苏达州伯恩斯维尔的一家定制系统构建商,也是 Nvidia 的顶级渠道合作伙伴,该公司既构建 AI 服务器,也销售其他制造商的模型。该公司工程副总裁 Dominic Daninger 告诉我们,AI 服务器基本上有两种类型,一种旨在进行训练,另一种在训练完成后旨在进行推理。

Daninger 表示,AI 服务器并不一定需要 GPU 来运行,但它们的性能比 CPU 好得多。

同时,他表示,还要注意的是,并非每台配备 GPU 的服务器都是以 AI 为重点的。诸如模拟模型或液体流动动力学之类的工作负载是使用 GPU 完成的,而不是 AI。

是否需要AI服务器?

加州圣何塞 Supermicro 高级副总裁 Michael McNerney 表示,人工智能服务器和非人工智能服务器之间的界限可能很微妙,取决于工作量。

McNerney表示:“我认为我们有八个不同的主要部分,从 LLM 大规模训练一直到边缘推理服务器,这些服务器将安装在工厂车间的杆式或壁式盒子上。”“我们确实看到人工智能几乎成为系统的一种功能,特别是当你深入到边缘时,这些盒子会根据其配置用于不同的事情。每台服务器在某个时候都可以成为 API 服务器,具体取决于它运行的工作负载类型。”

McNerney 表示,AI 是基于 GPU 的服务器上的主要工作负载,特别是那些通常用于 LLM 或大规模推理的最高配置的服务器,而中端机架式配置可以处理大多数推理工作负载。

Daigle 表示,联想拥有约 80 个经过认证的 AI 就绪服务器平台,可用于 GenAI 和广泛的 AI 领域。

“我们已经采取了一些措施,比如增加这些产品线对 GPU 和加速器的支持,并在它们上运行 MLPerf 等基准测试,以便客户能够看到这些系统的性能,以及我们如何提高性能并增强 AI 工作负载,”他说。“然后是我们在它们上运行的软件堆栈。我们的独立软件供应商生态系统中有 60 多家 AI 公司。这使我们能够实现 165 多种企业级 AI 解决方案。”

戴格尔表示,展望未来,人工智能服务器和通用服务器之间将继续存在界限。

“除了添加支持 AI 的基础设施外,客户还需要在其 IT 环境中支持大量传统工作负载,”他说。“因此,我认为除了扩展到 AI 之外,我们还将继续看到为这些传统 IT 工作负载设计的系统。”

展望未来,丹宁格表示,他预计英特尔和 AMD 将投资于以人工智能为重点的技术,但很难赶上英伟达。

“我们了解到的一件事是,Nvidia 在 CUDA 和真正实现 AI 所需的各种库上投入了大量精力,”他说。“此外,Nvidia 在硬件方面取得了巨大进步。英特尔或 AMD 等公司必须迅速采取行动才能在硬件方面击败 Nvidia,但另一个阻碍是开发所有代码以利用这些东西需要很多年。Nvidia 在这方面遥遥领先。”

McNerney表示,随着AI工作负载的增加,AI服务器集群变得非常重要,这将导致液体冷却的使用增加。

他说道:“我们认为,由于效率、性能和成本节省,在大规模集群空间中,使用液体冷却的部署比例将从不到 1% 上升至 30%。”

下来来看看来自多家服务器供应商和系统构建商的AI服务器样本。

联想 ThinkSystem SR780a V3

ThinkSystem SR780a V3 搭载 8 个 Nvidia H100/H200/B200 Tensor Core GPU,搭配两个第五代英特尔至强可扩展处理器和 32 个 DDR5 DIMM。Nvidia GPU 通过高速 NVLink 互连。该服务器包括联想 Neptune 液冷系统,该公司表示该系统比传统空气冷却更有效地散热,并允许 GPU 和 CPU 长时间以加速模式运行。ThinkSystem SR780a V3 可装入 5U 机箱中。

戴尔 PowerEdge R760xa

Dell PowerEdge R760xa 是一款专用服务器,采用双插槽、2U 风冷外形,支持各种 GPU。它以两个第四代或第五代英特尔至强处理器为中心,每个处理器最多有 64 个内核,并采用片上创新技术来增强 AI 和 ML 操作。该服务器最多有四个双宽 PCIe Gen5 加速器或最多 12 个单宽 PCIe 加速器,并支持 NVIDIA、AMD 和 Intel 的 PCIe GPU 适配器。该服务器提供最多 32 个 DDR5 内存 DIMM 插槽、Gen4 NVLink、PCIe Gen 5 和 E3.S NVMe SSD。

我们是否需要AI服务器?推动人工智能繁荣发展的AI服务器

超微 AS-4125GS-TNHR2-LCC

Supermicro 的 AS-4125GS-TNHR2-LCC 配备双插槽 AMD EPYC 9004 系列处理器和八个 Nvidia H100 GPU,通过 Nvidia NVLink 连接,体积紧凑,为 4U。该服务器面向 AI、深度学习和 HPC 应用,配备八个 PCIe 5.0 插槽和 24 个 DIMM 插槽,最多可容纳 6 TB 的 4800 ECC DDR5 内存。液冷可提高性能。

Nor-Tech 通用 GPU 服务器

Nor-Tech 的通用 GPU 服务器提供多架构灵活性和面向未来的开放标准设计,以提供先进且灵活的 GPU 服务器平台。服务器的模块化、基于标准的平台支持多种外形和组合的多种 GPU 技术,可用于大规模 AI 深度学习和 HPC 工作负载。这些 4U 服务器包括双第三代 Intel Xeon 可扩展或 AMD EPYC 7003 系列处理器、一系列行业标准 GPU 外形以及最多 10 个 2.5 英寸 NVMe/SATA 驱动器。可选的 1U 扩展模块可为高达 700 瓦的 GPU 和两个额外的 AIOM/PCIe 插槽提供更高的热容量。

HPE ProLiant DL385 Gen11 服务器

HPE ProLiant DL385 是一款 2U 双插槽服务器,配备第四代 AMD EPYC 9004 系列处理器和高达 6 TB 的 DDR5 内存和 36 个 EDSFF E3.5 NVMe SSD。这些服务器还可以容纳多达四个双宽或八个单宽 Nvidia L4、L40 或 L40S GPU。管理由 HPE GreenLake 提供,用于计算运营管理。

文章来源:我们是否需要AI服务器?推动人工智能繁荣发展的AI服务器-国外VPS网站

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/355272.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

vue3 + vite + js 配置Eslint + prettier_vite+js+vue3配置eslint

plugins: [ ‘vue’ ], rules: { } } ##### 第三步 安装 vite-plugin-eslint// 该包是用于配置vite运行的时候自动检测eslint规范,不符合页面会报错 pnpm add vite-plugin-eslintlatest -D // 安装最新版eslint-plugin-vue pnpm add eslint-plugin-vuelatest -D ###…

论文阅读--Cross-view Transformers for real-time Map-view Semantic Segmentation

一种新的2D维度的bev特征提取方案,其通过引入相机先验信息(相机内参和外参)构建了一个多视图交叉注意力机制,能够将多视图特征映射为BEV特征。 cross view attention:BEV位置编码由根据相机标定结果(内参和…

【2024最新华为OD-C/D卷试题汇总】[支持在线评测] 密码解密(100分) - 三语言AC题解(Python/Java/Cpp)

🍭 大家好这里是清隆学长 ,一枚热爱算法的程序员 ✨ 本系列打算持续跟新华为OD-C/D卷的三语言AC题解 💻 ACM银牌🥈| 多次AK大厂笔试 | 编程一对一辅导 👏 感谢大家的订阅➕ 和 喜欢💗 &#x1f…

Python-gui开发之Pycharm+pyside6/Pyqt6环境搭建

Python-gui开发之Pycharm+pyside6/Pyqt6环境搭建 软件版本一、软件安装1、Python安装2、Pycharm安装3、pyside6或pyqt6安装①安装pyside6②安装PyQt6和pyqt6-tools二、Pycharm项目配置1、插件安装2、新建项目以及环境配置3、包管理安装三、在Pycharm中配置PySide61、pyside6 Qt…

[leetcode hot 150]第十五题,三数之和

题目: 给你一个整数数组 nums ,判断是否存在三元组 [nums[i], nums[j], nums[k]] 满足 i ! j、i ! k 且 j ! k ,同时还满足 nums[i] nums[j] nums[k] 0 。请 你返回所有和为 0 且不重复的三元组。 注意:答案中不可以包含重复…

CRMEB多商户阿里云集群部署流程

注意: 1.所有服务创建时地域一定要选择一致,这里我用的是杭州K区 2.文件/图片上传一定要用类似oss的云文件服务, 本文不做演示 一、 创建容器镜像服务,容器镜像服务(aliyun.com) ,个人版本就可以 先创建一个命名空间然后创建一个镜像仓库查看并记录镜像公网地址创建…

Ubuntu server 24 (Linux) 安装lua + 卸载软件

1 apt 安装 # sudo apt update #查看可安装的lua版本 sudo apt-get install luaversion # sudo apt-get install lua5.3 #查看版本 testiZbp1g7fmjea77vsqc5hmmZ:/data/soft$ lua -v Lua 5.3.6 Copyright (C) 1994-2020 Lua.org, PUC-Rio2 Ubuntu卸载软件 #查找lua已安装…

计算机毕业设计Python+Spark音乐推荐系统 音乐数据分析 音乐可视化 音乐爬虫 音乐大数据 大数据毕业设计 大数据毕设

2023届本科生毕业论文(设计)开题报告 知识图谱音乐推荐系统 学 院: XXX 专 业: XXX 年 级 班 级: XXX 学 生 姓 名: XXX 指 导 教 师: XXX 协助指导教师: …

生成对抗网络——CGAN(代码+理解)

目录 一、CGAN模型介绍 二、CGAN训练流程 1. 初始化 2. 数据准备 3. 输出模型计算结果 4. 计算损失 5. 反向传播和优化 6. 迭代训练 三、CGAN实现 1. 模型结构 (1)生成器(Generator) (2)判别器…

【深度学习】GELU激活函数是什么?

torch.nn.GELU 模块在 PyTorch 中实现了高斯误差线性单元(GELU)激活函数。GELU 被用于许多深度学习模型中,包括Transformer,因为它相比传统的 ReLU(整流线性单元)函数能够更好地近似神经元的真实激活行为。…

如何使用ChatGPT辅助设计工作

文章目录 设计师如何使用ChatGPT提升工作效率?25个案例告诉你!什么是 prompt?咨询信息型 prompt vs 执行任务 prompt编写出色 prompt 的基本思路撰写 prompt 的案例和技巧1、将 ChatGPT 视作专业人士2、使用 ChatGPT 创建表单3、使用 ChatGPT…

JDBC(简介、入门与IDEA中导入MySQL的驱动)

(建议学完 MySQL 的基础部分) JDBC——简而言之:用 Java 语言操作数据库。 Java DataBase Connectivity(Java 语言连接数据库) 目录 一、引言 (1)基本介绍 (2)JDBC 简…

2024华为OD机试真题- 计算三叉搜索树的高度-(C++/Python)-C卷D卷-100分

2024华为OD机试题库-(C卷+D卷)-(JAVA、Python、C++) 题目描述 定义构造三叉搜索树规则如下: 每个节点都存有一个数,当插入一个新的数时,从根节点向下寻找,直到找到一个合适的空节点插入。查找的规则是: 1.如果数小于节点的数减去500,则将数插入节点的左子树 2.如果数大于…

【配置】Notion自动化备份到github方案

步骤 打开notion网页,获取到需要的值 token_v2 找到请求getSpaces的 Cookie 值 token_v2 space_id 找到请求getSpaces的响应结果space,如下图: file_token 找个页面点击导出,之后拿到这个配置项 注意:配置项会过期&#xff0c…

低版本火狐浏览器报错:class is a reserved identifier

低版本火狐浏览器报错:class is a reserved identifier 原因:react-dnd,dnd-core 等node包的相关依赖有过更新,使得在低版本火狐浏览器中不支持 class 解决方法:在使用webpack打包构建时,编译排除node_modu…

Unity OpenCVForUnity 安装和第一个案例详解 <一>

目录 一、资源简介 二、安装使用 1.下载案例Demo 2.移动StreamingAssets文件夹 3.添加场景 三、今日案例 1.案例Texture2DToMat Example 2.什么是Mat? 3.如何把Texture2D变成Mat (1).初始化Mat (2).Cv_…

【React Native】measureInWindow在安卓上无法正确获取View在屏幕上的布局信息

问题描述: 在React Native中,我们可以使用measureInWindow的方式去获取一个View在屏幕中的位置信息: 下面这个Demo中,我们写了一个页面HomePage和一个列表项组件ListItemA,我们期望每过5s监测一次列表中每一项在屏幕中…

RabbitMQ(六)仲裁队列、流式队列、异地容灾(联邦队列Federation Queue)

文章目录 仲裁队列1、创建交换机2、创建仲裁队列3、验证主节点宕机不影响消息发送和接收 流式队列(不推荐,Kafka主场)概念 异地容灾一、Federation插件概述 二、Federation交换机1、总体说明2、准备工作3、启用联邦插件4、添加上游连接端点5、…

【深度学习】TCN,An Empirical Evaluation of Generic Convolutional【二】

文章目录 膨胀卷积什么是膨胀卷积膨胀卷积公式PyTorch代码 从零开始手动实现一个1D膨胀卷积,不使用PyTorch的nn.Conv1d1. 基本概念2. 手动实现1D膨胀卷积 TCN结构如何使用TCN源码说明1. Chomp1d 类2. TemporalBlock 类3. TemporalConvNet 类 使用方法 膨胀卷积 什么…

DVWA - Brute Force

DVWA - Brute Force 等级:low ​ 直接上bp弱口令爆破,设置变量,攻击类型最后一个,payload为用户名、密码简单列表 ​ 直接run,长度排序下,不一样的就是正确的用户名和密码 ​ 另解: 看一下…