服务器断电重启后cuda失效的解决方案
以前遇到显卡驱动突然出现问题,都是直接重装,后来发现也许不用。
# 现象
服务器断电或者重启后,输入nvidia-smi
出现Failed to initialize NVML: Driver/library version mismatch
。
# 可以尝试的解决方法
- 重新加载 NVIDIA 内核模块: 在终端中运行以下命令来卸载并重新加载 NVIDIA 内核模块:
sudo rmmod nvidia_uvm nvidia_drm nvidia_modeset nvidia
sudo modprobe nvidia
1
2
2
如果第一个命令遇到“module is in use”错误,可以先不管,继续执行第二条,然后再重新执行第一条和第二条,如果这次没出错就不用管了,如果还是出错,可以先正常重启一下,再尝试这两个命令。
编辑 (opens new window)
上次更新: 2024/11/17, 13:04:13
- 02
- containerd高版本换源,containerd换源无效问题11-07
- 03
- apt-get使用代理11-05