Ubuntu安装过Nvidia驱动却检测不到的问题记录

本文最后更新于:2024年11月26日 下午

记录一次重新安装Nvidia驱动的经过

起因

由于docker内运行着ollama,发现docker无法启动服务,进而发现nvitop命令的输出说明驱动没有加载,因为之前手动安装过驱动,所以理论上只是需要加载驱动

经过

  1. 首先reboot重启确认没有重新加载驱动

  2. 检查内核版本uname -r,没有更换内核

  3. 检查dkms,dkms status发现在内核中确实安装了nvidia驱动

  4. 查看驱动版本 ls /usr/src | grep nvidia,说明也有驱动

  5. 现在不知道怎么办了😮‍💨,怀疑是Secure Boot的问题,但是还不想关掉SB,只能重装驱动

  6. 找到本地的英伟达驱动.run文件,重新执行安装程序,重新生成驱动需要注册的密钥

  7. 重启后在Ubuntu显示器上加载MOK,选Enroll MOK然后continue

  8. 如果还不行,执行如下命令将der格式的密钥导入mok

    sudo mokutil --import /usr/share/nvidia/nvidia-*.der然后输入密码两次

    这个注册的步骤我还是执行了两次才OK,很烦

  9. 还重新安装了nvidia-container-toolkit,重启了docker

    最终才正常加载了驱动文件。

结果

FUCK NVIDIA!!!

断一次电实验室两台服务器都掉了驱动,真的绷不住


Ubuntu安装过Nvidia驱动却检测不到的问题记录
https://ash-one.github.io/2024/11/26/ubuntu-an-zhuang-guo-nvidia-qu-dong-que-jian-ce-bu-dao-de-wen-ti-ji-lu/
作者
灰一
发布于
2024年11月26日
许可协议