Ubuntu 18.04上CUDA 10.2与CUDNN 7.6.5的保姆级安装避坑指南（含图形界面关闭与恢复）

林葭音

Ubuntu 18.04深度学习环境配置实战：CUDA 10.2与CUDNN 7.6.5全流程解析

在深度学习领域，GPU加速已成为模型训练的标准配置。对于使用Ubuntu系统的开发者而言，正确安装CUDA和CUDNN是搭建高效开发环境的第一步。本文将详细介绍在Ubuntu 18.04系统上安装CUDA 10.2和CUDNN 7.6.5的全过程，特别针对安装过程中可能遇到的图形界面管理问题提供解决方案。

1. 环境准备与前置检查

在开始安装之前，我们需要确保系统满足基本要求并完成必要的准备工作。Ubuntu 18.04作为长期支持版本(LTS)，提供了稳定的基础环境，特别适合深度学习开发。

首先确认系统内核版本和显卡驱动状态：

bash复制uname -r  # 查看内核版本
nvidia-smi  # 检查NVIDIA驱动状态

典型的nvidia-smi输出会显示类似以下信息：

code复制+-----------------------------------------------------------------------------+
| NVIDIA-SMI 440.33.01    Driver Version: 440.33.01    CUDA Version: 10.2     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  GeForce RTX 208...  Off  | 00000000:01:00.0 Off |                  N/A |
| 27%   36C    P8     9W / 250W |    108MiB / 11019MiB |      0%      Default |
+-------------------------------+----------------------+----------------------+

关键检查点：

确保驱动版本支持CUDA 10.2（建议440.33或更高）
确认系统已安装gcc和make等基础编译工具
检查磁盘空间（至少需要3GB空闲空间）

提示：如果尚未安装NVIDIA驱动，可通过ubuntu-drivers devices查看推荐驱动版本，然后使用sudo apt install nvidia-driver-440安装。

2. CUDA 10.2安装详解

2.1 获取安装包

CUDA Toolkit提供了多种安装方式，我们推荐使用runfile(local)方式，因为它提供了更多自定义选项。访问NVIDIA开发者网站下载CUDA 10.2的runfile安装包：

bash复制wget https://developer.download.nvidia.com/compute/cuda/10.2/Prod/local_installers/cuda_10.2.89_440.33.01_linux.run

2.2 图形界面处理策略

安装CUDA时可能需要临时关闭图形界面，以下是三种处理方案：

方案一：完全关闭图形界面（推荐用于服务器环境）

bash复制sudo systemctl stop gdm3  # 或lightdm，取决于你的显示管理器
sudo systemctl disable gdm3  # 永久禁用（仅限无头服务器）

方案二：临时关闭图形界面（适合大多数桌面用户）

bash复制sudo service gdm3 stop  # 临时停止服务
# 安装完成后使用以下命令恢复：
sudo service gdm3 start

方案三：使用--override参数跳过检查（风险较高）

bash复制sudo sh cuda_10.2.89_440.33.01_linux.run --override

重要：如果选择关闭图形界面，请记住通过Ctrl+Alt+F1切换到终端界面进行操作，安装完成后可通过Ctrl+Alt+F7返回图形界面（具体功能键可能因系统而异）。

2.3 安装过程关键步骤

执行安装命令：

bash复制sudo sh cuda_10.2.89_440.33.01_linux.run

安装过程中需要注意以下选项：

接受EULA条款（按空格键翻页，输入accept确认）
取消勾选"NVIDIA Accelerated Graphics Driver"（如果已安装最新驱动）
确保勾选"CUDA Toolkit 10.2"
保持默认安装路径(/usr/local/cuda-10.2)
不安装符号链接（后续手动配置更安全）

安装完成后，需要设置环境变量。编辑~/.bashrc文件：

bash复制nano ~/.bashrc

在文件末尾添加以下内容：

bash复制# CUDA 10.2配置
export PATH=/usr/local/cuda-10.2/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-10.2/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
export CUDA_HOME=/usr/local/cuda-10.2

使配置立即生效：

bash复制source ~/.bashrc

验证安装：

bash复制nvcc --version

成功安装后应显示类似信息：

code复制nvcc: NVIDIA (R) Cuda compiler
release 10.2, V10.2.89

3. CUDNN 7.6.5安装指南

3.1 获取CUDNN安装包

访问NVIDIA CUDNN下载页面（需要注册开发者账号），选择"Download cuDNN v7.6.5 (November 5th, 2019), for CUDA 10.2"下的"cuDNN Library for Linux"。

下载完成后验证文件完整性：

bash复制md5sum cudnn-10.2-linux-x64-v7.6.5.32.tgz

正确MD5值应为：a31d7b7f710ba8a1616bcc6b824acbc2

3.2 安装步骤

解压并安装CUDNN：

bash复制tar -xzvf cudnn-10.2-linux-x64-v7.6.5.32.tgz
sudo cp cuda/include/cudnn.h /usr/local/cuda-10.2/include/
sudo cp cuda/lib64/libcudnn* /usr/local/cuda-10.2/lib64/
sudo chmod a+r /usr/local/cuda-10.2/include/cudnn.h
sudo chmod a+r /usr/local/cuda-10.2/lib64/libcudnn*

3.3 验证安装

检查CUDNN版本：

bash复制cat /usr/local/cuda-10.2/include/cudnn.h | grep CUDNN_MAJOR -A 2

正确输出应显示：

code复制#define CUDNN_MAJOR 7
#define CUDNN_MINOR 6
#define CUDNN_PATCHLEVEL 5
--
#define CUDNN_VERSION (CUDNN_MAJOR * 1000 + CUDNN_MINOR * 100 + CUDNN_PATCHLEVEL)

4. 环境测试与常见问题排查

4.1 基础功能测试

创建简单的CUDA测试程序test.cu：

cpp复制#include <stdio.h>
#include <cuda_runtime.h>

int main() {
    int deviceCount;
    cudaGetDeviceCount(&deviceCount);
    for (int i = 0; i < deviceCount; ++i) {
        cudaDeviceProp prop;
        cudaGetDeviceProperties(&prop, i);
        printf("Device %d: %s\n", i, prop.name);
    }
    return 0;
}

编译并运行：

bash复制nvcc test.cu -o test
./test

4.2 深度学习框架测试

安装PyTorch测试环境：

bash复制conda create -n pytorch-test python=3.7
conda activate pytorch-test
conda install pytorch==1.5.0 torchvision==0.6.0 cudatoolkit=10.2 -c pytorch

运行GPU测试脚本：

python复制import torch
print(f"CUDA available: {torch.cuda.is_available()}")
print(f"CUDA device count: {torch.cuda.device_count()}")
print(f"Current device: {torch.cuda.current_device()}")
print(f"Device name: {torch.cuda.get_device_name(0)}")

4.3 常见问题解决方案

问题1：图形界面无法恢复
解决方案：

bash复制sudo systemctl restart gdm3  # 或lightdm

问题2：CUDA版本冲突
如果系统中有多个CUDA版本，可以使用alternatives管理：

bash复制sudo update-alternatives --install /usr/local/cuda cuda /usr/local/cuda-10.2 100
sudo update-alternatives --config cuda

问题3：权限问题
确保用户对CUDA目录有访问权限：

bash复制sudo chmod -R a+r /usr/local/cuda-10.2

问题4：CUDNN验证失败
重新安装CUDNN并检查文件权限：

bash复制sudo cp cuda/include/cudnn* /usr/local/cuda-10.2/include/
sudo cp cuda/lib64/libcudnn* /usr/local/cuda-10.2/lib64/
sudo ldconfig

5. 性能优化与进阶配置

5.1 持久化模式设置

启用NVIDIA持久化模式可以减少驱动加载时间：

bash复制sudo nvidia-smi -pm 1

5.2 CUDA环境优化

在~/.bashrc中添加以下优化参数：

bash复制# CUDA性能优化
export CUDA_CACHE_PATH=$HOME/.nv/ComputeCache
export CUDA_AUTO_BOOST=0

5.3 多版本CUDA管理

当需要同时维护多个CUDA版本时，推荐使用环境模块管理：

bash复制sudo apt install environment-modules
mkdir -p $HOME/modules/cuda

为每个CUDA版本创建模块文件，例如$HOME/modules/cuda/10.2：

code复制#%Module1.0
prepend-path PATH /usr/local/cuda-10.2/bin
prepend-path LD_LIBRARY_PATH /usr/local/cuda-10.2/lib64
setenv CUDA_HOME /usr/local/cuda-10.2

加载特定版本：

bash复制module use $HOME/modules
module load cuda/10.2

5.4 监控与调试工具

安装NVIDIA系统管理界面：

bash复制sudo apt install nvidia-smi

常用监控命令：

bash复制watch -n 1 nvidia-smi  # 实时监控GPU状态
nvprof ./your_cuda_app  # 性能分析
cuda-gdb ./your_cuda_app  # CUDA调试器

在实际项目部署中，我们发现CUDA 10.2与CUDNN 7.6.5的组合在稳定性方面表现优异，特别是对于需要长期运行的训练任务。相比更新的版本，这套配置虽然可能缺少某些最新特性，但对于大多数传统深度学习模型来说已经足够，且社区支持成熟，遇到问题更容易找到解决方案。

已经到底了哦

精选内容

1 安捷伦示波器实战指南：从基础操作到精准触发 2 操作系统内存分配实战：首次适应、最佳适应、最坏适应、邻接适应算法到底怎么选？3 FreeRTOS任务栈给了4096，FATFS还是崩？分享我的STM32H7+SD卡+FATFS排坑实录 4 用TI处理器和超级电容复刻电赛小车：手把手教你搭建动态无线充电系统（附代码）5 netstat命令实战指南：从基础到高级网络诊断 6 实战避坑：DJI无人机开发中UART/CAN/以太网连接方式的深度选择与排错指南 7 SAP ABAP MASS/MM17批量维护增强：从IDoc扩展、BADI实现到用户出口的完整实战 8 从电流到声波：揭秘扬声器核心部件的协同工作奥秘 9 从凸包到凹包：滚球法的算法演进与实战解析 10 从编译到调试：手把手教你用VCS + Verdi搭建高效数字IC验证环境（含KDB与增量编译避坑指南）

最新内容

从密度视角洞察异常：深入解析局部离群因子(LOF)算法原理与实践

本文深入解析局部离群因子(LOF)算法原理与实践，通过密度视角识别异常点。LOF算法利用相对密度而非绝对距离，有效解决传统方法在复杂场景中的局限性。文章详细拆解LOF核心四步，包括k距离、可达距离、局部可达密度和局部离群因子计算，并结合电商平台等实战案例展示其应用价值。同时，探讨了参数选型、重复点处理等工程技巧，以及流数据增量计算和深度学习混合应用等高级玩法。

别再手动画图了！用Python脚本玩转HFSS建模，效率提升10倍（附完整代码）

本文详细介绍了如何利用Python脚本实现HFSS自动化建模，大幅提升微波器件设计效率。通过参数化设计、批量操作和流程标准化，工程师可将建模时间缩短90%以上。文章包含完整代码示例，涵盖从基础几何创建到高级参数扫描的全流程，特别适合需要频繁迭代设计的HFSS用户。

PyCharm 与 GitLab 高效协作：从项目克隆到代码推送的完整工作流

本文详细介绍了PyCharm与GitLab高效协作的完整工作流，从环境配置、项目克隆到代码推送的全流程实践。重点讲解了SSH认证、分支管理、冲突解决等核心技巧，帮助开发者提升团队协作效率，实现无缝的代码版本控制与项目管理。

别再死记硬背if-else了！从‘最大数输出’这道题，聊聊C++里更优雅的写法（含algorithm头文件妙用）

本文探讨了C++中如何优雅地解决'最大数输出'问题，避免使用繁琐的if-else结构。通过介绍algorithm头文件中的max函数、三目运算符、循环结构以及现代C++特性，提供了五种更简洁高效的解决方案。这些技巧不仅适用于信息学奥赛(NOI)和OpenJudge等编程竞赛，也能提升日常开发中的代码质量。

别再硬着头皮画图了！用FlexSim快速搭建你的第一个自动化立库仿真模型（附避坑指南）

本文详细介绍了如何使用FlexSim快速搭建自动化立库仿真模型，特别针对AGV路径规划、货架布局等关键环节提供实用避坑指南。通过核心模块解析、参数优化技巧和动态验证方法，帮助读者从零开始掌握物流仿真技术，显著提升方案设计效率。

不止于SMB：在openSUSE上为Canon LBP2900配置LPD和命令行打印的几种姿势

本文详细介绍了在openSUSE Tumbleweed系统上为Canon LBP2900打印机配置LPD和命令行打印的多种方法，包括SMB共享、LPD协议和CUPS原生工具链。通过具体的命令模板和排错指南，帮助用户实现高效打印和自动化任务处理，特别适合需要批量处理和脚本集成的中级用户。

【Pluto SDR实战】从零搭建OFDM通信链路：MATLAB与SDR的协同设计

本文详细介绍了如何使用Pluto SDR和MATLAB从零搭建OFDM通信链路，涵盖OFDM技术原理、Pluto SDR配置、发射机与接收机实现，以及系统性能优化。通过实战案例，帮助读者深入理解数字通信系统设计，掌握SDR与MATLAB协同开发的核心技能。

告别手动删行！用Notepad++正则表达式5分钟搞定FEKO .ffe仿真数据清洗

本文介绍如何使用Notepad++正则表达式快速清洗FEKO .ffe仿真数据文件，解决手动删除注释行和空行的低效问题。通过详细的正则表达式替换步骤和进阶技巧，帮助用户5分钟内完成数据清洗，提升电磁仿真数据处理效率，特别适合ISAR成像等场景。

STM32H743驱动AD7616踩坑记：从HAL库到标准库，解决双SPI数据错位问题

本文详细记录了STM32H743驱动AD7616时遇到的双SPI数据错位问题及解决方案。通过从HAL库转向标准库的寄存器级操作，解决了ARM小端架构与SPI协议的数据打包冲突，并提供了性能优化建议和扩展应用案例，为嵌入式开发者提供了实用的调试经验。

华为防火墙GRE隧道穿越公网实战：eNSP模拟企业分支安全互联

本文详细介绍了华为防火墙GRE隧道在eNSP模拟环境中的实战配置，实现企业分支安全互联。通过GRE隧道技术，企业可以在公网上建立虚拟直连通道，结合IPSec加密确保数据安全传输。文章涵盖拓扑设计、基础网络配置、GRE隧道核心配置及安全策略控制，帮助读者掌握华为防火墙的部署与优化技巧。