Ubuntu安装过Nvidia驱动却检测不到的问题记录
本文最后更新于:2024年11月26日 下午
记录一次重新安装Nvidia驱动的经过
起因
由于docker内运行着ollama,发现docker无法启动服务,进而发现nvitop命令的输出说明驱动没有加载,因为之前手动安装过驱动,所以理论上只是需要加载驱动
经过
首先reboot重启确认没有重新加载驱动
检查内核版本
uname -r
,没有更换内核检查dkms,
dkms status
发现在内核中确实安装了nvidia驱动查看驱动版本
ls /usr/src | grep nvidia
,说明也有驱动现在不知道怎么办了😮💨,怀疑是Secure Boot的问题,但是还不想关掉SB,只能重装驱动
找到本地的英伟达驱动
.run
文件,重新执行安装程序,重新生成驱动需要注册的密钥重启后在Ubuntu显示器上加载
MOK
,选Enroll MOK
然后continue
如果还不行,执行如下命令将der格式的密钥导入mok
sudo mokutil --import /usr/share/nvidia/nvidia-*.der
然后输入密码两次这个注册的步骤我还是执行了两次才OK,很烦
还重新安装了nvidia-container-toolkit,重启了docker
最终才正常加载了驱动文件。
结果
FUCK NVIDIA!!!
断一次电实验室两台服务器都掉了驱动,真的绷不住
Ubuntu安装过Nvidia驱动却检测不到的问题记录
https://ash-one.github.io/2024/11/26/ubuntu-an-zhuang-guo-nvidia-qu-dong-que-jian-ce-bu-dao-de-wen-ti-ji-lu/