其他分享
首页 > 其他分享> > Nvidia GPU风扇和电源显示ERR! 解决办法

Nvidia GPU风扇和电源显示ERR! 解决办法

作者:互联网

训练模型时,风扇异常响,然后输入nvidia-smi发现风扇异常如下图(网上找的图)

 

 

nvidia论坛有人给出了解决方案,即问题的根源可能是风扇转速不足使GPU过热导致的。

首先开启GPU的persistent mode,再设置风扇的功率,重启即可生效。其中200代表的是风扇的最大功率限制,可以将其设置为最大,这样过热的时候风扇就会自动加大功率。

sudo nvidia-smi -pm 1
sudo nvidia-smi -pl 200 -i 1 # 最高250,指定运行的1卡最高功率为200,从而降低发热

手动风扇控制

此外,还可以将GPU风扇的手动风速控制打开。方法为:

首先,使用sudo nvidia-xconfig --enable-all-gpus命令打开所有gpu在xserver中的设置(不使用sudo可能无权限写入新配置)
然后修改配置文件:sudo vim /etc/X11/xorg.conf,在其中的DeviceSection中加入Option "Coolbits" "4"如下图所示:

 

 

标签:200,Nvidia,ERR,sudo,风扇,smi,nvidia,GPU
来源: https://www.cnblogs.com/xiaoaoran/p/14904624.html