当前位置: 首页 > 网络应用技术

NVIDIA-SMI命令摘要

时间:2023-03-07 23:00:38 网络应用技术

  NVIDIA-SMI显示了所有GPU的当前状态

  显示表:

  粉丝:风扇速度(0%-100%),n/a意味着没有风扇

  温度:GPU温度(GPU温度过高会导致GPU频率降低)

  perf:性能状态,从P0(最大性能)到P12(最低性能)

  PWR:GPU功耗

  持久性M:连续模式的状态(连续模式很大,但是新的GPU应用程序启动的时间较少)

  BUS-ID:GPU总线,域:总线:设备。功能

  DISP.A:显示活动,指示GPU显示是否初始化

  记忆用户:内存使用率

  挥发性GPU-UTIL:GPU使用率

  ECC:是否打开错误检查和校正技术,0/禁用,1/已启用

  计算m。

  其他选项:

  NVIDIA -SMI -Q查询所有GPU的当前细节

  其他选项:

  nvidia-smi-query-gpu = gpu_name,gpu_bus_id,vbios_version-format = csv

  选择性查询选项,您可以指定显示的属性选项

  可以查看的属性是:TimessTamp,driver_version,pci.bus,pcie.link.width.current等(查看nvidia-smi-help-Query - GPU - 查看可用的属性)

  设备修改选项可以手动设置GPU卡设备的状态选项

  NVIDIA-SMI DMON设备监视命令以滚动条的形式显示GPU设备统计信息。

  GPU统计信息以滚动格式显示,并且可以根据终端窗口的宽度进行调整。如果未指定GPU,则默认情况下监视GPU0-GPU3(GPU索引从0开始)。

  其他选项:

  NVIDIA-SMI PMON流程监视命令以滚动栏的形式显示GPU过程状态信息。

  GPU过程统计信息以滚动格式显示,该信息列出了GPU所有过程的统计信息。可以根据终端窗口的宽度进行调整要监视的指标。Monitor最高4 GPU。如果未指定GPU,则默认情况下监视GPU0-GPU3(GPU索引从0开始)。

  其他选项: