背景:
MMdetection环境配置激活好之后,在训练数据集的时候发现提示显存不足,于是怀疑服务器上跑的有别的项目在利用显卡。为了验证这个设想,于是重启了ubuntu服务器,等服务器重新启动后,发现显卡加速不能用了,使用“nvidia-smi”命令,提示一下错误:
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver.
Make sure that the latest NVIDIA driver is installed and running.
问题分析:
经过查询网络上相关资料讲解并进行测试,初步判断是服务器显卡驱动出问题了。
解决思路:
1.卸载原有的显卡驱动
sudo apt-get --purge remove nvidia*
sudo apt autoremove
2.下载服务器上显卡对应的驱动
https://www.nvidia.cn/Download/index.aspx?lang=cn#
3.安装新的驱动
相关的参考链接如下:
1.(服务器重启nvidia无法使用)
https://www.jianshu.com/p/deb0ac3f6d58https://www.jianshu.com/p/deb0ac3f6d58
2. (Ubuntu20.04显卡驱动安装)
https://zhuanlan.zhihu.com/p/308407850
安装之后问题顺利解决。