0x00 前言
之前在Ubuntu 16.04上安装了[cuda 9.1],工作也很正常。但是,后来莫名奇妙就出问题了,重装cuda之后还总是进不了系统。因此,寻找到了以下优化的安装方法。
0x01 安装步骤
主要优化点:将之前使用cuda中自带的GPU驱动改为手动安装。
以下操作都在root
权限下执行:
1、 安装GPU驱动
更新源
add-apt-repository ppa:graphics-drivers/ppa
apt update
检查当前最佳驱动版本
root@vm:~# ubuntu-drivers devices
== /sys/devices/pci0000:00/0000:00:01.0/0000:01:00.0 ==
modalias : pci:v000010DEd000011C0sv00001458sd0000354Ebc03sc00i00
vendor : NVIDIA Corporation
model : GK106 [GeForce GTX 660]
driver : nvidia-390 - third-party free
driver : nvidia-384 - third-party free
driver : nvidia-396 - third-party free recommended
driver : xserver-xorg-video-nouveau - distro free builtin
driver : nvidia-340 - third-party free
driver : nvidia-304 - third-party free
可以看出,目前推荐的驱动版本是nvidia-396
apt install nvidia-396
几分钟后安装完成,使用nvidia-smi
命令测试驱动安装是否成功
root@vm:~# nvidia-smi
Fri May 18 09:18:28 2018
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 396.24 Driver Version: 396.24 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
|===============================+======================+======================|
| 0 GeForce GTX 660 Off | 00000000:01:00.0 N/A | N/A |
| 57% 57C P0 N/A / N/A | 1871MiB / 1994MiB | N/A Default |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: GPU Memory |
| GPU PID Type Process name Usage |
|=============================================================================|
| 0 Not Supported |
+-----------------------------------------------------------------------------+
2、安装cuda 9.2
点击链接https://developer.nvidia.com/cuda-downloads?target_os=Linux&target_arch=x86_64&target_distro=Ubuntu&target_version=1604&target_type=runfilelocal,下载cuda安装程序到本地。
如果本地安装,可以按Ctrl + Alt + F1
进入命令行模式;如果是远程访问,可以使用ssh
连接过去。
systemctl stop lightdm
使用上面的命令关闭桌面服务
chmod 755 cuda_9.2.88_396.26_linux.run
./cuda_9.2.88_396.26_linux.run
运行下载下来的安装文件
Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 396.26?
(y)es/(n)o/(q)uit:
除了驱动项选择no
,其它使用默认值即可
0x02 后记
如果下次又出现驱动无法使用,或进不了系统的情况,只要重新安装一下驱动即可,不需要重新安装cuda