[技术杂谈]nvidia-smi参数和显示信息解释

GPU:本机中的GPU编号,从0开始,上图为0,一块GPU
Fan:风扇转速(0%-100%),N/A表示没有风扇
Name:GPU名字/类型,上图为NVIDIA GeForce . . .
Temp:GPU温度(GPU温度过高会导致GPU频率下降)
Perf:性能状态,从P0(最大性能)到P12(最小性能),上图为P2
Pwr:Usager/Cap:GPU功耗,Usage表示用了多少,Cap表示总共多少
Persistence-M:持续模式状态,持续模式耗能大,但在新的GPU应用启动时花费时间更少,上图均为On
Bus-Id:GPU总线
Disp.A:Display Active,表示GPU是否初始化
Memory-Usage:显存使用率
Volatile GPU-UTil:GPU使用率,与显存使用率的区别可参考显存与GPU
Uncorr. ECC:是否开启错误检查和纠错技术,0/DISABLED,1/ENABLED,上图为N/A
Compute M:计算模式,0/DEFAULT,1/EXCLUSIVE_PROCESS,2/PROHIBITED,上图为Default
Processes:显示每个进程占用的显存使用率、进程号、占用的哪个GPU

nvidia-smi 常用命令
可以通过 nvidia-smi --help 命令查看完整的选项列表和用法说明。

-h查看帮助手册:nvidia-smi -h 
-n动态地观察 GPU 的状态:watch -n 0.5 nvidia-smi 
-i 查看指定GPU:nvidia-smi -i 0
-L查看GPU列表及其UUID:nvidia-smi -L
-l 指定动态刷新时间,默认5秒刷新一次,通过Ctrl+C停止:nvidia-smi -l 5
-q查询GPU详细信息:nvidia-smi -q
-i只列出某一GPU的详细信息,可使用 -i 选项指定:nvidia-smi -q -i 0

更多信息:

C:\Users\Administrator>nvidia-smi -h
NVIDIA System Management Interface -- v546.26NVSMI provides monitoring information for Tesla and select Quadro devices.
The data is presented in either a plain text or an XML format, via stdout or a file.
NVSMI also provides several management operations for changing the device state.Note that the functionality of NVSMI is exposed through the NVML C-based
library. See the NVIDIA developer website for more information about NVML.
Python wrappers to NVML are also available.  The output of NVSMI is
not guaranteed to be backwards compatible; NVML and the bindings are backwards
compatible.http://developer.nvidia.com/nvidia-management-library-nvml/
http://pypi.python.org/pypi/nvidia-ml-py/
Supported products:
- Full Support- All Tesla products, starting with the Kepler architecture- All Quadro products, starting with the Kepler architecture- All GRID products, starting with the Kepler architecture- GeForce Titan products, starting with the Kepler architecture
- Limited Support- All Geforce products, starting with the Kepler architecture
nvidia-smi [OPTION1 [ARG1]] [OPTION2 [ARG2]] ...-h,   --help                Print usage information and exit.LIST OPTIONS:-L,   --list-gpus           Display a list of GPUs connected to the system.-B,   --list-excluded-gpus  Display a list of excluded GPUs in the system.SUMMARY OPTIONS:<no arguments>              Show a summary of GPUs connected to the system.[plus any of]-i,   --id=                 Target a specific GPU.-f,   --filename=           Log to a specified file, rather than to stdout.-l,   --loop=               Probe until Ctrl+C at specified second interval.QUERY OPTIONS:-q,   --query               Display GPU or Unit info.[plus any of]-u,   --unit                Show unit, rather than GPU, attributes.-i,   --id=                 Target a specific GPU or Unit.-f,   --filename=           Log to a specified file, rather than to stdout.-x,   --xml-format          Produce XML output.--dtd                 When showing xml output, embed DTD.-d,   --display=            Display only selected information: MEMORY,UTILIZATION, ECC, TEMPERATURE, POWER, CLOCK,COMPUTE, PIDS, PERFORMANCE, SUPPORTED_CLOCKS,PAGE_RETIREMENT, ACCOUNTING, ENCODER_STATS,SUPPORTED_GPU_TARGET_TEMP, VOLTAGE, FBC_STATSROW_REMAPPER, RESET_STATUSFlags can be combined with comma e.g. ECC,POWER.Sampling data with max/min/avg is also returnedfor POWER, UTILIZATION and CLOCK display types.Doesn't work with -u or -x flags.-l,   --loop=               Probe until Ctrl+C at specified second interval.-lms, --loop-ms=            Probe until Ctrl+C at specified millisecond interval.SELECTIVE QUERY OPTIONS:Allows the caller to pass an explicit list of properties to query.[one of]--query-gpu                 Information about GPU.Call --help-query-gpu for more info.--query-supported-clocks    List of supported clocks.Call --help-query-supported-clocks for more info.--query-compute-apps        List of currently active compute processes.Call --help-query-compute-apps for more info.--query-accounted-apps      List of accounted compute processes.Call --help-query-accounted-apps for more info.This query is not supported on vGPU host.--query-retired-pages       List of device memory pages that have been retired.Call --help-query-retired-pages for more info.--query-remapped-rows       Information about remapped rows.Call --help-query-remapped-rows for more info.[mandatory]--format=                   Comma separated list of format options:csv - comma separated values (MANDATORY)noheader - skip the first line with column headersnounits - don't print units for numericalvalues[plus any of]-i,   --id=                 Target a specific GPU or Unit.-f,   --filename=           Log to a specified file, rather than to stdout.-l,   --loop=               Probe until Ctrl+C at specified second interval.-lms, --loop-ms=            Probe until Ctrl+C at specified millisecond interval.DEVICE MODIFICATION OPTIONS:[any one of]-e,   --ecc-config=         Toggle ECC support: 0/DISABLED, 1/ENABLED-p,   --reset-ecc-errors=   Reset ECC error counts: 0/VOLATILE, 1/AGGREGATE-c,   --compute-mode=       Set MODE for compute applications:0/DEFAULT, 1/EXCLUSIVE_THREAD (DEPRECATED),2/PROHIBITED, 3/EXCLUSIVE_PROCESS-dm,  --driver-model=       Enable or disable TCC mode: 0/WDDM, 1/TCC-fdm, --force-driver-model= Enable or disable TCC mode: 0/WDDM, 1/TCCIgnores the error that display is connected.--gom=                Set GPU Operation Mode:0/ALL_ON, 1/COMPUTE, 2/LOW_DP-lgc  --lock-gpu-clocks=    Specifies <minGpuClock,maxGpuClock> clocks as apair (e.g. 1500,1500) that defines the rangeof desired locked GPU clock speed in MHz.Setting this will supercede application clocksand take effect regardless if an app is running.Input can also be a singular desired clock value(e.g. <GpuClockValue>). Optionally, --mode can bespecified to indicate a special mode.-m    --mode=               Specifies the mode for --locked-gpu-clocks.Valid modes: 0, 1-rgc  --reset-gpu-clocksResets the Gpu clocks to the default values.-lmc  --lock-memory-clocks=  Specifies <minMemClock,maxMemClock> clocks as apair (e.g. 5100,5100) that defines the rangeof desired locked Memory clock speed in MHz.Input can also be a singular desired clock value(e.g. <MemClockValue>).-rmc  --reset-memory-clocksResets the Memory clocks to the default values.-lmcd --lock-memory-clocks-deferred=Specifies memClock clock to lock. This limit isapplied the next time GPU is initialized.This is guaranteed by unloading and reloading the kernel module.Requires root.-rmcd --reset-memory-clocks-deferredResets the deferred Memory clocks applied.-ac   --applications-clocks= Specifies <memory,graphics> clocks as apair (e.g. 2000,800) that defines GPU'sspeed in MHz while running applications on a GPU.-rac  --reset-applications-clocksResets the applications clocks to the default values.-pl   --power-limit=        Specifies maximum power management limit in watts.Takes an optional argument --scope.-sc   --scope=              Specifies the device type for --scope: 0/GPU, 1/TOTAL_MODULE (Grace Hopper Only)-cc   --cuda-clocks=        Overrides or restores default CUDA clocks.In override mode, GPU clocks higher frequencies when running CUDA applications.Only on supported devices starting from the Volta series.Requires administrator privileges.0/RESTORE_DEFAULT, 1/OVERRIDE-am   --accounting-mode=    Enable or disable Accounting Mode: 0/DISABLED, 1/ENABLED-caa  --clear-accounted-appsClears all the accounted PIDs in the buffer.--auto-boost-default= Set the default auto boost policy to 0/DISABLEDor 1/ENABLED, enforcing the change only after thelast boost client has exited.--auto-boost-permission=Allow non-admin/root control over auto boost mode:0/UNRESTRICTED, 1/RESTRICTED-mig  --multi-instance-gpu= Enable or disable Multi Instance GPU: 0/DISABLED, 1/ENABLEDRequires root.-gtt  --gpu-target-temp=    Set GPU Target Temperature for a GPU in degree celsius.Requires administrator privileges[plus optional]-i,   --id=                 Target a specific GPU.-eow, --error-on-warning    Return a non-zero error for warnings.UNIT MODIFICATION OPTIONS:-t,   --toggle-led=         Set Unit LED state: 0/GREEN, 1/AMBER[plus optional]-i,   --id=                 Target a specific Unit.SHOW DTD OPTIONS:--dtd                 Print device DTD and exit.[plus optional]-f,   --filename=           Log to a specified file, rather than to stdout.-u,   --unit                Show unit, rather than device, DTD.--debug=                    Log encrypted debug information to a specified file.Device Monitoring:dmon                        Displays device stats in scrolling format."nvidia-smi dmon -h" for more information.daemon                      Runs in background and monitor devices as a daemon process.This is an experimental feature. Not supported on Windows baremetal"nvidia-smi daemon -h" for more information.replay                      Used to replay/extract the persistent stats generated by daemon.This is an experimental feature."nvidia-smi replay -h" for more information.Process Monitoring:pmon                        Displays process stats in scrolling format."nvidia-smi pmon -h" for more information.NVLINK:nvlink                      Displays device nvlink information. "nvidia-smi nvlink -h" for more information.C2C:c2c                         Displays device C2C information. "nvidia-smi c2c -h" for more information.CLOCKS:clocks                      Control and query clock information. "nvidia-smi clocks -h" for more information.ENCODER SESSIONS:encodersessions             Displays device encoder sessions information. "nvidia-smi encodersessions -h" for more information.FBC SESSIONS:fbcsessions                 Displays device FBC sessions information. "nvidia-smi fbcsessions -h" for more information.MIG:mig                         Provides controls for MIG management. "nvidia-smi mig -h" for more information.COMPUTE POLICY:compute-policy              Control and query compute policies. "nvidia-smi compute-policy -h" for more information.BOOST SLIDER:boost-slider                Control and query boost sliders. "nvidia-smi boost-slider -h" for more information.POWER HINT:    power-hint                  Estimates GPU power usage. "nvidia-smi power-hint -h" for more information.BASE CLOCKS:    base-clocks                 Query GPU base clocks. "nvidia-smi base-clocks -h" for more information.GPU PERFORMANCE MONITORING:gpm                         Control and query GPU performance monitoring unit. "nvidia-smi gpm -h" for more information.PCI:pci                         Display device PCI information. "nvidia-smi pci -h" for more information.Please see the nvidia-smi documentation for more detailed information.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/248709.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

《Numpy 简易速速上手小册》第10章:Numpy案例研究和实践技巧(2024 最新版)

文章目录 10.1 实际案例分析10.1.1 基础知识10.1.2 完整案例&#xff1a;天气数据分析10.1.3 拓展案例 1&#xff1a;股票价格分析10.1.4 拓展案例 2&#xff1a;信号处理 10.2 Numpy 最佳实践10.2.1 基础知识10.2.2 完整案例&#xff1a;高效数组操作10.2.3 拓展案例 1&#x…

2023年博客总结反思与未来规划

前言&#xff1a; 24将至&#xff0c;23收尾&#xff0c;作为一名电信专业的大一学生&#xff0c;我在这后半年学习了不少的编程知识&#xff0c;也写了几十篇博客&#xff0c;今天想反思自己在博客创作和知识学习中的不足并且对未来进行规划。 种下一棵树最好的时间是10年前&…

Doris 与 Clickhouse 对比(一)

1. 常用引擎 ☕️ Doris 表数据模型 duplicate key &#x1f3ac; 场景&#xff1a;适用于数据无需提前聚合的分析业务。 ⚠️ 注意点&#xff1a;只指定排序列&#xff0c;相同的行并不会合并。 unique key &#x1f3ac; 场景&#xff1a;适用于有更新需求的业务。 ⚠…

心灵鸡汤美文:温暖你的每一寸心田

1.人生就像一杯茶&#xff0c;不会苦一辈子&#xff0c;但总会苦一阵子。只有经历过苦涩&#xff0c;才能品味到甜美的滋味。 2.每一次失败都是一次宝贵的经验&#xff0c;它教会我们如何更好地面对困难和挑战。不要害怕失败&#xff0c;因为失败是成功的前奏。 3.人生最重要的…

开源项目MessageNest打造个性化消息推送平台多种通知方式

今天介绍一个开源项目&#xff0c;Message Nest - 可以打造个性化消息推送平台&#xff0c;整合邮件、钉钉、企业微信等多种通知方式。定制你的消息&#xff0c;让通知方式更灵活多样。 开源地址&#xff1a; https://github.com/engigu/Message-Push-Nest 测试平台 系统&am…

工业级数据采集通用网关在生产过程中的实际应用及其解决的问题-天拓四方

在工业生产过程中&#xff0c;实时数据是评估设备性能、监控生产流程、预测潜在问题以及优化资源配置的关键。数据采集不仅有助于提高生产效率&#xff0c;降低故障率&#xff0c;还可以为企业的决策提供科学依据。因此&#xff0c;选择一款高效、稳定的数据采集网关是至关重要…

使用nginx对视频、音频、图片等静态资源网址,加token签权

目前很多静态资源&#xff0c;都可以无权限验证&#xff0c;进行访问或转发&#xff0c;对有价值的资源进行签权&#xff0c;限制转发无法在代码中实现拦截&#xff0c;我们可以使用nginx对视频、音频、图片等静态资源网址&#xff0c;加token签权 如&#xff1a; http://192…

2024年新提出的算法:(凤头豪猪优化器)冠豪猪优化算法Crested Porcupine Optimizer(附Matlab代码)

本次介绍一种新的自然启发式元启发式算法——凤头豪猪优化器(Crested Porcupine Optimizer&#xff0c;CPO)。该成果于2024年1月发表在中科院1区SCI top期刊Knowledge-Based Systems&#xff08;IF 8.8&#xff09;上。 1、简介 受到凤头豪猪&#xff08;CP&#xff09;各种…

将 Quartz.NET 调度框架与 Stimulsoft Reports 结合使用

今天&#xff0c;我们将深入探讨软件开发的一种现代趋势 - 流程自动化&#xff0c;这自然是 Stimulsoft 产品中报表处理的一部分。在本文中&#xff0c;我们将讨论如何使用第三方调度程序自动执行与 Web 项目中的报告相关的任务。作为对报告执行操作的示例&#xff0c;我们考虑…

Hive 行列转换

行列转换 列转行 使用 lateral view explode(array|map) 或 lateral view inline(array_struct) 可以将列转换为行。 单列转多行&#xff0c;降维&#xff08;单列数组或键值对&#xff09; 示例1&#xff1a;explode(array(…)) select ..., A from T lateral view exp…

博云科技与中科可控全面合作,探索前沿金融科技新机遇

2024年1月26日&#xff0c;博云科技与中科可控在昆山高新区成功举办合作签约仪式。昆山市委常委、昆山高新区党工委书记孙道寻、中科可控董事长聂华、博云科技董事长花磊等领导出席了本次签约仪式。 中科可控将利用其在先进计算和智造领域的优势&#xff0c;为博云科技提供有关…

Redis系列-数据结构篇

数据结构 string&#xff08;字符串&#xff09; redis的字符串是动态字符串&#xff0c;类似于ArrayList&#xff0c;采用预分配冗余空间的方式减少内存的频繁分配。 struct SDS<T>{ T capacity; T len; byte flags; byte[] content; } 当字符串比较短时&#xff0c…

多线程代码案例之单例模式

作者简介&#xff1a; zoro-1&#xff0c;目前大二&#xff0c;正在学习Java&#xff0c;数据结构&#xff0c;javaee等 作者主页&#xff1a; zoro-1的主页 欢迎大家点赞 &#x1f44d; 收藏 ⭐ 加关注哦&#xff01;&#x1f496;&#x1f496; 多线程代码案例之单例模式 单例…

linux_ftp客户端如何带有密码下载文件

目录 简介linux 使用密码登录ftplinux 客户端指定密码下来文件下载成功截图 简介 当我们使用linux 的ftp 客户端想从服务端下载一个文件的时候 又不会指定密码 应该如何处理呢 linux 使用密码登录ftp # 语法 lftp -u {ftp账号},{ftp密码} ftp://{服务器IP}:{端口}# 实例使用…

蓝桥杯 第 1 场 小白入门赛

目录 1.蘑菇炸弹 2.构造数字 3.小蓝的金牌梦 4.合并石子加强版 5.简单的LIS问题 6.期望次数 1.蘑菇炸弹 我们直接依照题目 在中间位置的数进行模拟即可 void solve(){cin>>n;vector<int> a(n1);for(int i1;i<n;i) cin>>a[i];int ans0;for(int i2;i…

02-opencv简单实例效果和基本介绍-上

机器视觉概述 机器视觉是人工智能正在快速发展的一个分支。简单说来,机器视觉就是用机器代替人眼来做测量和判断。机器视觉系统是通过机器视觉产品(即图像摄取装置,分CMOS和CCD两种)将被摄取目标转换成图像信号,传送给专用的图像处理系统,得到被摄目标的形态信息,根据像素…

Consul容器服务自动发现和更新

目录 前瞻 什么是服务注册与发现 什么是consul Docker-consul实现过程 Docker-consul集群部署 实验准备 实验流程 前瞻 什么是服务注册与发现 服务注册与发现是微服务架构中不可或缺的重要组件。起初服务都是单节点的&#xff0c;不保障高可用性&#xff0c;也不考虑服…

MyBatis常见面试题汇总

说一下MyBatis执行流程&#xff1f; MyBatis是一款优秀的基于Java的持久层框架&#xff0c;它内部封装了JDBC&#xff0c;使开发者只需要关注SQL语句本身&#xff0c;而不需要花费精力去处理加载驱动、创建连接等的过程&#xff0c;MyBatis的执行流程如下&#xff1a; 加载配…

华为radius认证

组网需求 如图1所示&#xff0c;用户同处于huawei域&#xff0c;Router作为目的网络接入服务器。用户需要通过服务器的远端认证才能通过Router访问目的网络。在Router上的远端认证方式如下&#xff1a; Router对接入用户先用RADIUS服务器进行认证&#xff0c;如果认证没有响应…

第七篇:node中间件详解

&#x1f3ac; 江城开朗的豌豆&#xff1a;个人主页 &#x1f525; 个人专栏 :《 VUE 》 《 javaScript 》 &#x1f4dd; 个人网站 :《 江城开朗的豌豆&#x1fadb; 》 ⛺️ 生活的理想&#xff0c;就是为了理想的生活 ! ​ 目录 &#x1f4d8; 引言&#xff1a; &#…