英伟达NVIDIA服务器显卡多实例技术(MIG)


❤️觉得内容不错的话,欢迎点赞收藏加关注😊😊😊,后续会继续输入更多优质内容❤️

👉有问题欢迎大家加关注私戳或者评论(包括但不限于NLP算法相关,linux学习相关,读研读博相关......)👈

博主原文链接:https://www.yourmetaverse.cn/deep_learning/194/

英伟达服务器显卡多实例技术(MIG)

1. 多实例技术介绍

多实例技术有点类似于vGPU,只不过vGPU是在虚拟机层次的显卡虚拟化,如果物理服务器安装的是vmware或者KVM这种虚拟机系统,那么如果想给每个虚拟机分配一张显卡显然显卡不够分,一般6U的服务器也就8张显卡,所以需要用到vGPU技术,将显卡虚拟化成多张显卡,而这玩意跟虚拟机系统一样是需要收费的,按照显卡数量进行授权收费。而如果物理服务器安装的不是虚拟机操作系统,例如安装的是Ubuntu系统,然后采用docker等容器技术,也是需要对显卡进行多实例划分的,提高显卡的利用率。这个时候NVIDIA Multi-Instance GPU(MIG)技术就非常有用了。

英伟达的多实例技术是一种可以将单个物理GPU资源分割成多个虚拟GPU资源的技术。这种技术可以帮助多个用户或应用程序共享一块物理GPU而不会相互干扰,从而提高了GPU资源的利用率。

具体来说,英伟达的多实例技术通过将单个物理GPU分割成多个虚拟GPU,每个虚拟GPU都可以被不同的用户或应用程序访问。每个虚拟GPU都有自己的显存和计算资源,并且可以独立地运行不同的计算任务。这意味着多个用户或应用程序可以同时使用同一块物理GPU,而不会相互干扰或影响对方的计算任务。

多实例技术还可以为不同的虚拟GPU配置不同的计算能力,以满足不同用户或应用程序的需求。例如,一些虚拟GPU可以被配置为支持图形渲染,而其他虚拟GPU可以被配置为支持深度学习计算等高性能计算任务。

总的来说,英伟达的多实例技术可以帮助用户更好地管理和利用GPU资源,并且可以提高GPU资源的利用率和灵活性。

2. 多实例技术支持的显卡列表

多实例技术支持的基本上都是一些服务器显卡,而是还是最新的旗舰机服务器显卡,如A100,H100等,如下所示。
多实例技术支持的显卡列表

3. MIG使用指南

3.1 开启MIG技术

一般情况下,MIG技术默认是关闭的,需要手动开启,可以使用nvidia-smi命令查看是否开启MIG,nvidia-smi命令的一些详细内容可以查看之前的博客:nvidia-smi命令详解和一些高阶技巧介绍
未开启MIG
上图是没有开启MIG的显示结果,下图是开启了MIG的显示结果。
开启MIG
如果没有开启MIG,可以使用如下命令开启MIG:

sudo nvidia-smi -i [显卡ID] -mig 1
这个是针对某个显卡开启MIG的命令,例如我想开启第一张显卡的MIG,则可以使用以下命令
sudo nvidia-smi -i 0 -mig 1

在这个特定的DGX例子中,必须停止nvsm和dcgm服务,在所需的GPU上启用MIG模式,然后恢复监控服务,如下所示:

sudo systemctl stop nvsm
sudo systemctl stop dcgm

使用nvidia-smi mig -lgipp可以查看开启MIG的显卡可以划分成那几个实力

用户名@主机名:~$ sudo nvidia-smi mig -lgipp
GPU  6 Profile ID 19 Placements: {0,1,2,3,4,5,6}:1
GPU  6 Profile ID 14 Placements: {0,2,4}:2
GPU  6 Profile ID  9 Placements: {0,4}:4
GPU  6 Profile ID  5 Placement : {0}:4
GPU  6 Profile ID  0 Placement : {0}:8
GPU  7 Profile ID 19 Placements: {0,1,2,3,4,5,6}:1
GPU  7 Profile ID 14 Placements: {0,2,4}:2
GPU  7 Profile ID  9 Placements: {0,4}:4
GPU  7 Profile ID  5 Placement : {0}:4
GPU  7 Profile ID  0 Placement : {0}:8

使用nvidia-smi mig -lgip可以查看每个开启MIG的设备支持的实例类型,一共有1g.5gb(7个4.75GB显卡)、2g.10gb(3个9.75GB显卡)、3g.20gb(2个19.62GB显卡)、4g.20gb(1个19.62B显卡)、7g.40gb(1个39.50GB显卡)五种类型。

用户名@主机名:~$ sudo nvidia-smi mig -lgip
+--------------------------------------------------------------------------+
| GPU instance profiles:                                                   |
| GPU   Name          ID    Instances   Memory     P2P    SM    DEC   ENC  |
|                           Free/Total   GiB              CE    JPEG  OFA  |
|==========================================================================|
|   6  MIG 1g.5gb     19     0/7        4.75       No     14     0     0   |
|                                                          1     0     0   |
+--------------------------------------------------------------------------+
|   6  MIG 2g.10gb    14     0/3        9.75       No     28     1     0   |
|                                                          2     0     0   |
+--------------------------------------------------------------------------+
|   6  MIG 3g.20gb     9     0/2        19.62      No     42     2     0   |
|                                                          3     0     0   |
+--------------------------------------------------------------------------+
|   6  MIG 4g.20gb     5     0/1        19.62      No     56     2     0   |
|                                                          4     0     0   |
+--------------------------------------------------------------------------+
|   6  MIG 7g.40gb     0     0/1        39.50      No     98     5     0   |
|                                                          7     1     1   |
+--------------------------------------------------------------------------+
|   7  MIG 1g.5gb     19     0/7        4.75       No     14     0     0   |
|                                                          1     0     0   |
+--------------------------------------------------------------------------+
|   7  MIG 2g.10gb    14     0/3        9.75       No     28     1     0   |
|                                                          2     0     0   |
+--------------------------------------------------------------------------+
|   7  MIG 3g.20gb     9     0/2        19.62      No     42     2     0   |
|                                                          3     0     0   |
+--------------------------------------------------------------------------+
|   7  MIG 4g.20gb     5     0/1        19.62      No     56     2     0   |
|                                                          4     0     0   |
+--------------------------------------------------------------------------+
|   7  MIG 7g.40gb     0     0/1        39.50      No     98     5     0   |
|                                                          7     1     1   |
+--------------------------------------------------------------------------+

3.2 创建MIG实例

使用如下命令创建MIG实例

sudo nvidia-smi mig -cgi [ID],[实例名称] -C
[ID]指的是sudo nvidia-smi mig -lgip中ID那一列的值
[实例名称]指的是Name那一列的内容,注意ID需要与[实例名称]对应
例如,使用以下命令,创建ID为9的那个实例,实例名称为3g.20gb,即创建了两个显存为19.62GB的显卡实例。
sudo nvidia-smi mig -cgi 9,3g.20gb -C

3.3 在docker中使用MIG实例

结合Docker使用英伟达NVIDIA服务器显卡多实例技术可以让GPU资源的管理更加灵活和高效。下面是结合Docker使用英伟达NVIDIA服务器显卡多实例技术的一般步骤:

安装NVIDIA Docker
要使用英伟达NVIDIA服务器显卡多实例技术,需要先安装NVIDIA Docker。NVIDIA Docker是一个基于Docker的扩展,可以支持GPU加速的容器化应用程序。在安装NVIDIA Docker之前,请确保已经安装了Docker引擎。

启用多实例功能
要启用多实例功能,需要在NVIDIA Docker中指定相应的选项。在Dockerfile中添加以下语句以启用多实例功能:

ENV NVIDIA_VISIBLE_DEVICES all
ENV NVIDIA_DRIVER_CAPABILITIES compute,utility,mig

这将告诉NVIDIA Docker在运行容器时启用所有可见的GPU设备,并支持计算、实用程序和多实例功能。

配置虚拟GPU
在Dockerfile中可以使用nvidia-smi mig命令配置虚拟GPU。例如,以下命令可以为虚拟GPU 1配置12GB显存和一个10Gbps的带宽限制:

RUN nvidia-smi mig -cgi 1 -C -m -g 0 -a 2 -b 10Gbps

这将在构建容器镜像时配置虚拟GPU实例。

分配虚拟GPU
要将虚拟GPU分配给Docker容器,可以在docker run命令中使用nvidia-smi mig命令为每个虚拟GPU分配一个唯一的ID,并指定哪些进程可以访问该虚拟GPU。例如,以下命令将虚拟GPU 1分配给运行在容器内的进程:

docker run --gpus 1 -it nvidia/cuda /bin/bash
nvidia-smi mig -cgi 1 -i 0 -a $$

这将在容器内分配虚拟GPU 1,并将其分配给容器中的当前进程。

总的来说,结合Docker使用英伟达NVIDIA服务器显卡多实例技术可以方便地管理GPU资源,并使GPU资源的使用更加高效和灵活。可以通过在Dockerfile中配置虚拟GPU实例来管理虚拟GPU,并使用docker run命令将虚拟GPU分配给不同的容器和进程。

参考文献

[1] NVIDIA Multi-Instance GPU User Guide https://docs.nvidia.com/datacenter/tesla/mig-user-guide/index.html
[2] NVIDIA 多实例 GPU 用户指南 https://blog.csdn.net/wangqi4720/article/details/126358886


❤️觉得内容不错的话,欢迎点赞收藏加关注😊😊😊,后续会继续输入更多优质内容❤️

👉有问题欢迎大家加关注私戳或者评论(包括但不限于NLP算法相关,linux学习相关,读研读博相关......)👈

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/14943.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

英伟达发布ChatGPT专用GPU,性能提升10倍,还推出云服务,普通企业也能训练LLM...

文|Pine 发自 凹非寺 源|量子位 “AI的iPhone时刻已至”,英伟达或成最大赢家。 在GTC2023大会上,黄仁勋接连放出大招: 不仅发布了ChatGPT专用GPU,比之前就能实时处理ChatGPT的HGX A100快了10倍;…

在Windows平台监视英伟达(Nvidia)显卡性能

深度学习训练时,常常需要监视显卡性能情况。在Linux/Ubuntu平台命令行输入nvidia-smi就可以监测显卡性能。 在Windows平台要稍微复杂一些。 先要找到显卡驱动安装位置。我的是C:\Program Files\NVIDIA Corporation\NVSMI。 文件夹中有一个nvidia-smi.exe。 利用命令…

公式+ChatGPT:为你的标题创作注入新鲜活力

大家是不是经常遇到文章已经写好了,但是标题却还空着,不是不会写,就是写得平淡无奇😂。自己都觉得无趣的标题又怎么能吸引有趣的灵魂呢?何不让chatGPT来试试呢? 首先,我们要明白一个基础理念&am…

《花雕学AI》27:如何在ChatGPT时代提高数字媒体艺术的原创性和价值?

引言 数字媒体艺术是指使用各种数字、信息技术制作的各种形式的有独立审美价值的艺术作品,具有模拟现实的虚拟性、艺术创造的想象性、交互性和使用网络媒体的基本特征。数字媒体艺术是一个跨自然科学、社会科学和人文科学的综合性学科,集中体现了“科学…

爆火的ChatGPT是什么?一帧秒创AI作画生-优漫动游

12月1日,这一语言模型正式对公众开放。仅用了5天时间,其用户就突破了100万人。ChatGPT的强大能力,让体验者惊叹“人类要被抢饭碗了”“AI成精了”,且不断吸引着世界各地的用户持续探索它的能力和边界。 9月初开始盛行的AI作画风头…

张朝阳陆川谈AI:人才能思考问题 ChatGPT只能完成重复工作

雷递网 乐天 6月15日 6月14日《星空下的对话》再度开启,搜狐创始人、董事局主席兼首席执行官、物理学博士张朝阳与导演、编剧、制片人陆川展开跨界对话。 二十多年老友重聚,带来了一场充满生活乐趣的沉浸式内容直播。 现场,二人一起品尝手磨咖…

AutoGPT:AutoGPT简介及与ChatGPT对比分析

文章目录 [toc]一、AutoGPT是什么二、AutoGPT的利弊优势弊端 四、小结 一、AutoGPT是什么 AutoGPT的兴起,无需用人敲代码、自己有解决问题的思维、拥有一整套逻辑和自主运行能力。AI的发展这么快的吗?它是一个实验性的开源应用程序,展示了 GP…

这三个被全网吹爆了的AI工具,分享给你

伴随着ChatGPT的横空出世,一场史无前例的科技革命正在拉开序幕。 “上知天文下知地理”、“学富五车、才高八斗”、“博古通今”、“学贯中西”……这些最能彰显博学和智慧的形容词,显然已不足以形容AI的博学和智慧了。 而扎进艺术领域的AI&#xff0c…

【还在传统绑骨骼动画?】让AI助力你实现2D游戏角色动画流程

思路(让3D模型替代动作) 一、利用MJ或者SD生成你需要的游戏角色(获取原图像) 需要的知识: 会调关键词chatGpt(看小红书、抖音、B站、Youtube、Telegrame等等都行,别傻忽忽跑到知识星球被收割…

Adobe软件还行吗?

前段时间,美国政府“准备通过诉讼阻止Adobe去年公布的,以200亿美元收购Figma的交易,理由是此举属于反竞争行为。”新闻一出,Adobe股价旋即下跌,但跌幅并不像2022年刚公布这笔交易时那么迅猛。 看起来,相较于…

这18个被全网吹爆了的AI绘画工具,分享给你!

伴随着ChatGPT的横空出世,一场史无前例的科技革命正在拉开序幕。 AI 拥有强大的信息储备和数据处理能力,无论是速度、质量,还是思维模式,都让人只呼不得了!写代码、造论文丝毫不在话下,甚至还能和你探讨茶…

Orillusion引擎正式开源!AIGC时代下的WebGPU轻量级3D渲染引擎!

开源生态的建设根植于社区,开发者在社区共享、共创、共赢,将会激发出无限的创造力,这就是开源最大的魅力! 选择开源,源于我们坚信,“独行快,众行远”! 1 Orillusion 引擎 WebGPU经过…

ChatGPT只是个聊天工具,根本没什么用?

到今天还有很多人对于ChatGPT不屑一顾,认为这就是一个聊天工具,真的对于ChatGPT的了解太肤浅了。 绝大多数让人对于世界的变化都是迟钝的,这个也可以理解,因为人类就是不喜欢变化,因为变化意味着风险,而人…

开源了,我做了一个基于GPT的桌宠聊天系统:Pet-GPT!

前言 最近chatgpt的热度高居不下。作为一个深度成谜者,发现大部分开发者在调用GPT的时候要不就是基于Tauri做本地窗口外接网页,要不就是web直接展示。在沉思苦想一段时间后,才发现好像没啥什么人用pyqt做啊?特别是没人用桌面宠物…

ChatGPT:YES or NO?

人们经常谈论人工智能技术今天给我们带来的机会。尤其要关注ChatGPT的趋势,它在制作既有好的也有坏的方向的片段和代码方面做得很好。 开发人员可以从这些工具中获得什么样的影响? 我毫不怀疑这些工具应该不会对在不友好的地方工作的开发人员产生任何负面影响。因为这些工具…

通过ChatGPT看董事会会议,如何快速生成会议纪要?

最近ChatGPT大火,许多人发现通过其自动生成周报日报可以大大提高工作效率。同样,在会后,自动生成会议纪要可以有效地减轻会后的工作压力。 董事会会议纪要往往不只是文字工作,还要体现着领导的评论注释、表决事项的结果。不同公司…

chatgpt赋能python:Python判断IP地址类型的介绍

Python判断IP地址类型的介绍 在网络开发和服务器管理中,IP地址是一个非常重要的概念。对于大多数人来说,我们都知道IP地址是一个由四个数值组成的数字组合,例如:192.168.1.1。但是,在网络开发中,我们经常需…

chatgpt赋能python:python查询IP:基础知识与实践

python查询IP:基础知识与实践 介绍 在现代互联网世界中,每一个连接到网络的设备都被分配了一个IP(Internet Protocol)地址。有时,你需要查询一个IP的详细信息,比如它的所在地、市场份额、运营商等。Pytho…

狼,真来了!

文 / 谷雨(微信公众号:王不留) 今天群里大清早就炸开了锅,群友们不断分享着GPT-4的强大。 GPT-4对于ChatGPT的升级就相当于一个高中生变成了一个研究生,收集信息的能力、解决问题的能力和输出结果的逻辑性都有了质的飞…

智慧医疗基础平台-01

缘起 回望去年的光景,虽然东西奔走、南北逐流,但没有什么成绩,只是收获了些许疲劳,还在出差期间染上了大号感冒,虽然带上了2层口罩但也无济于事。回想起来,人生无趣工作内卷。尤其是经历了疫情三年&#x…