Ubuntu 18.04上CUDA 10.2与CUDNN 7.6.5的完整安装与配置指南（含图形界面关闭与恢复）

松脂领花

Ubuntu 18.04深度学习环境配置：CUDA 10.2与CUDNN 7.6.5实战指南

在深度学习领域，GPU加速已成为提升模型训练效率的标配。对于Ubuntu 18.04用户而言，正确配置CUDA和CUDNN环境是开启GPU加速的第一步。本文将带你从零开始，完成CUDA 10.2与CUDNN 7.6.5的完整安装流程，涵盖图形界面管理、环境变量配置以及常见问题排查。

1. 环境准备与版本确认

在开始安装前，我们需要确保系统环境符合要求。首先确认NVIDIA驱动已正确安装：

bash复制nvidia-smi

输出示例：

code复制+-----------------------------------------------------------------------------+
| NVIDIA-SMI 450.80.02    Driver Version: 450.80.02    CUDA Version: 10.2     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  GeForce RTX 2080    Off  | 00000000:01:00.0  On |                  N/A |
| 30%   45C    P8    10W / 215W |    256MiB /  7982MiB |      0%      Default |
+-------------------------------+----------------------+----------------------+

关键检查点：

驱动版本：确保与CUDA 10.2兼容（建议≥440.33）
CUDA支持：输出中显示的"CUDA Version"表示驱动支持的最高CUDA版本

提示：如果nvidia-smi命令报错，说明驱动未正确安装，需先解决驱动问题再继续。

2. 安装包下载与版本选择

2.1 CUDA 10.2获取

访问NVIDIA开发者网站，选择CUDA Toolkit 10.2版本。根据系统配置选择：

选项	推荐值
操作系统	Linux → x86_64 → Ubuntu → 18.04
安装类型	runfile (local)

下载命令示例：

bash复制wget https://developer.download.nvidia.com/compute/cuda/10.2/Prod/local_installers/cuda_10.2.89_440.33.01_linux.run

2.2 CUDNN 7.6.5获取

CUDNN需要NVIDIA开发者账号登录后下载。在归档版本中找到对应CUDA 10.2的CUDNN 7.6.5：

选择"Download cuDNN"
点击"Archived cuDNN Releases"
找到"cuDNN v7.6.5 (November 5th, 2019), for CUDA 10.2"
下载"cuDNN Library for Linux"

3. 图形界面处理与CUDA安装

3.1 关闭图形界面

为避免安装冲突，需要临时关闭显示管理器：

bash复制sudo systemctl stop lightdm  # 或gdm3

此时系统会切换到命令行界面，使用Ctrl+Alt+F1~F6登录终端。

3.2 执行CUDA安装

进入下载目录，运行安装程序：

bash复制sudo sh cuda_10.2.89_440.33.01_linux.run

安装过程中需注意：

接受许可协议（输入accept）
关键步骤：取消勾选Driver安装（已安装驱动）
- 使用方向键移动
- 回车取消选中Driver选项
确认安装Toolkit和Samples

安装完成后，添加环境变量到~/.bashrc：

bash复制export PATH=/usr/local/cuda-10.2/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-10.2/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
export CUDA_HOME=/usr/local/cuda-10.2

应用更改：

bash复制source ~/.bashrc

验证安装：

bash复制nvcc -V

预期输出应显示CUDA 10.2版本信息。

4. CUDNN安装与验证

解压下载的CUDNN包：

bash复制tar -xzvf cudnn-10.2-linux-x64-v7.6.5.32.tgz

执行安装命令：

bash复制sudo cp cuda/include/cudnn.h /usr/local/cuda-10.2/include/
sudo cp cuda/lib64/libcudnn* /usr/local/cuda-10.2/lib64/
sudo chmod a+r /usr/local/cuda-10.2/include/cudnn.h
sudo chmod a+r /usr/local/cuda-10.2/lib64/libcudnn*

验证安装：

bash复制cat /usr/local/cuda-10.2/include/cudnn.h | grep CUDNN_MAJOR -A 2

输出应显示CUDNN版本号为7.6.5。

5. 图形界面恢复与测试

5.1 恢复图形界面

bash复制sudo systemctl start lightdm

如果遇到问题，可尝试重启系统：

bash复制sudo reboot

5.2 深度学习框架测试

安装PyTorch测试环境：

bash复制conda create -n test_env python=3.7
conda activate test_env
conda install pytorch==1.7.1 torchvision==0.8.2 torchaudio==0.7.2 cudatoolkit=10.2 -c pytorch

验证GPU可用性：

python复制import torch
print(torch.cuda.is_available())  # 应输出True
print(torch.backends.cudnn.version())  # 应显示7610（对应7.6.5）

6. 常见问题排查

6.1 版本兼容性问题

常见错误组合：

CUDA 10.2 + CUDNN 8.x → 可能不稳定
旧驱动 + 新CUDA → 功能受限

解决方案矩阵：

问题现象	可能原因	解决方法
nvcc -V报错	PATH未正确设置	检查.bashrc配置
训练时CUDA错误	CUDNN版本不匹配	重新安装指定版本
GPU不可用	驱动版本过低	升级NVIDIA驱动

6.2 图形界面恢复失败

如果重启后无法进入图形界面：

检查当前使用的显示管理器：

bash复制cat /etc/X11/default-display-manager

尝试重新安装显示管理器：

bash复制sudo apt install --reinstall lightdm

6.3 环境变量冲突

多版本CUDA管理技巧：

bash复制# 使用alternatives系统管理多版本
sudo update-alternatives --install /usr/local/cuda cuda /usr/local/cuda-10.2 100
sudo update-alternatives --config cuda

7. 性能优化建议

持久化模式设置：
```
bash复制sudo nvidia-smi -pm 1
```

GPU时钟锁定（适用于服务器）：

bash复制sudo nvidia-smi -lgc <clock_speed>

CUDNN优化：

启用自动调优：

python复制torch.backends.cudnn.benchmark = True

实际部署中，建议定期检查驱动和CUDA的更新，但生产环境应保持版本稳定。我在多个项目中使用这套配置组合，相比新版本反而遇到更少的兼容性问题，特别是与TensorFlow 1.x和早期PyTorch版本的配合更为稳定。

已经到底了哦

精选内容

1 从内核升级到桌面美化：小新Air 14 Ubuntu 20.04 新机调优全记录 2 ROS Noetic下，手把手教你用AMCL和move_base搞定已知地图的机器人导航（附避坑指南）3 深入解析Android healthd电池日志：从字段到实际应用 4 Windows资源管理器太卡？试试Directory Opus，这5个功能让文件管理效率翻倍 5 解锁新玩法｜M1 MacBook运行iOS/iPadOS应用的两种IPA获取方案 6 Jetson Orin Nano上EC20 4G模组驱动移植全攻略：从内核配置到QMI_WWAN调试 7 【YOLO优化】WIoU Loss在MMYOLO中的实战应用与性能对比 8 实战 | PC-DMIS最佳拟合算法在复杂曲面测量中的精准应用 9 告别LM2596！智能车舵机电源实测：AS1015方案如何让38KG舵机稳如泰山？10 UE4蓝图也能写数据表？用EditorUtilityWidget实现DataTable动态存储（附完整蓝图节点）