系统相关
首页 > 系统相关> > 【Ubuntu】终端输入nvidia-smi时报错:Failed to initialize NVML: Driver/library version mismatch

【Ubuntu】终端输入nvidia-smi时报错:Failed to initialize NVML: Driver/library version mismatch

作者:互联网

问题描述

输入:

nvidia-smi

报错

Failed to initialize NVML: Driver/library version mismatch

解决方法

Step1 卸载现有驱动,重新安装

sudo /usr/bin/nvidia-uninstall
sudo apt-get --purge remove nvidia-*
sudo apt-get purge nvidia*
sudo apt-get purge libnvidia*

直到下面的命令不输出任何内容,则卸载成功

sudo dpkg --list | grep nvidia-*

重新安装
Step2 添加第三方驱动源

sudo add-apt-repository ppa:graphics-drivers/ppa

Step3 更新软件列表

sudo apt-get update

Step4 安装nvidia

sudo apt-get install nvidia-430

Step5 再次更新软件列表

sudo apt-get update

Step5 更新软件

sudo apt-get upgrade

Step6 重启(一定要重启!)

sudo reboot

遇到问题:在执行Step4 安装nvidia,终端显示缺少ast_dp501_fw.bin

原因分析:
安装ubuntu系统时需要重装Nvidia驱动,当使用低版本的Nvidia.run文件Nvidia驱动时,提示在指定位置找不到ast_dp501_fw.bin的文件,需要将此文件放到指定位置重新安装即可解决此问题
链接:https://pan.baidu.com/s/1DHdz0-INI5gLh__DbdCCKw
提取码:tj04

上述方法若还是不行,则需要重新安装cuda

1.ubuntu卸载CUDA10.1和cudnn

卸载cudnn

sudo rm -rf /usr/local/cuda/include/cudnn.h
sudo rm -rf /usr/local/cuda/lib64/libcudnn*

卸载cuda
第一步

sudo /usr/local/cuda-10.1/bin/cuda-uninstaller

第二步

cd /usr/local/
sudo rm -r cuda-10.1

2. 重新安装cuda

下载链接:
笔者选择的是cuda=10.1版本的安装
进入安装包的文件夹,在终端输入:

sudo sh cuda_10.1.243_418.87.00_linux.run

接下来运行整体流程如下所示:

2. 安装cudnn

下载对应版本的cudnn,笔者下载的是cudnn v7.6.5

tar -zxvf cudnn-10.1-linux-x64-v7.6.5.32.tgz
sudo cp cuda/include/cudnn.h /usr/local/cuda-10.0/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda-10.1/lib64
sudo chmod a+r /usr/local/cuda-10.1/include/cudnn.h /usr/local/cuda-10.0/lib64/libcudnn*

标签:NVML,nvidia,sudo,mismatch,cudnn,usr,Ubuntu,local,cuda
来源: https://blog.csdn.net/qq_44703886/article/details/118565648