Jetson平台Ubuntu系统——APT一键部署CUDA与cuDNN实战指南（基于Jetson AGX Orin验证）

景海UI

1. 为什么选择APT安装CUDA和cuDNN？

在Jetson设备上部署深度学习环境时，很多开发者第一反应是去NVIDIA官网下载.run安装包。我刚开始用Jetson AGX Orin时也这么干过，结果踩了一堆坑：依赖冲突、驱动不兼容、环境变量混乱...后来发现用APT安装才是真香。这里分享下我的实测对比：

传统手动安装需要：

下载几百MB的.run文件
关闭图形界面进入命令行
处理各种依赖报错
手动配置环境变量
版本冲突时还得重装系统

而APT安装只需要：

bash复制sudo apt-get install cuda-toolkit-11-4
sudo apt-get install libcudnn8

两行命令搞定所有事情，系统自动处理依赖关系，版本绝对匹配当前JetPack。实测在AGX Orin上整个过程不超过10分钟，比传统方法节省80%时间。

2. 环境准备与基础工具安装

2.1 系统版本确认

首先确认你的Ubuntu版本，Jetson AGX Orin预装的一般是Ubuntu 20.04 L4T：

bash复制lsb_release -a
cat /etc/nv_tegra_release

我用的系统输出是：

code复制No LSB modules are available.
Distributor ID: Ubuntu
Description:    Ubuntu 20.04.4 LTS
Release:        20.04
Codename:       focal

# 内核版本
R35 (release), REVISION: 1.0

2.2 安装jetson-stats监控工具

Jetson系列不能用nvidia-smi，需要装jtop：

bash复制sudo apt-get update
sudo apt-get install python3-pip
sudo -H pip3 install jetson-stats

安装后直接运行：

bash复制jtop

会看到彩色监控界面，这里可以实时查看GPU/CPU状态，也能验证CUDA和cuDNN版本。第一次使用建议按[4]键开启所有监控项。

3. CUDA安装实战

3.1 查询可用CUDA版本

先查看仓库支持的CUDA版本：

bash复制apt-cache search cuda-toolkit

在AGX Orin上我看到有：

code复制cuda-toolkit-11-4 - NVIDIA CUDA Toolkit 11.4
cuda-toolkit-11-4-config-common - Common config package for CUDA Toolkit 11.4

3.2 一键安装CUDA

选择11.4版本安装：

bash复制sudo apt-get install cuda-toolkit-11-4

安装过程约5-8分钟（取决于网络速度），完成后需要配置环境变量。编辑~/.bashrc：

bash复制nano ~/.bashrc

在末尾添加：

bash复制export PATH=/usr/local/cuda-11.4/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-11.4/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
export CUDA_HOME=/usr/local/cuda-11.4

保存后执行：

bash复制source ~/.bashrc

4. cuDNN安装与验证

4.1 查询cuDNN版本

先查看可用的cuDNN版本：

bash复制apt-cache search libcudnn

输出类似：

code复制libcudnn8 - cuDNN runtime libraries
libcudnn8-dev - cuDNN development libraries

4.2 安装cuDNN

安装runtime和dev版本：

bash复制sudo apt-get install libcudnn8 libcudnn8-dev

如果想指定版本（比如8.6.0）：

bash复制sudo apt-get install libcudnn8=8.6.0.*-1+cuda11.4

5. 双重验证安装结果

5.1 通过jtop验证

运行jtop后，在INFO页面可以看到：

code复制CUDA: 11.4
cuDNN: 8.6.0

如果显示正确版本号，说明基础安装成功。

5.2 通过PyTorch验证

先安装PyTorch for Jetson：

bash复制sudo apt-get install python3-pip libopenblas-base libopenmpi-dev 
pip3 install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/nightly/cu116

然后运行测试：

python复制import torch
print(torch.__version__)
print('CUDA available:', torch.cuda.is_available())
print('cuDNN version:', torch.backends.cudnn.version())

a = torch.randn(3,3).cuda()
b = torch.randn(3,3).cuda()
c = a + b
print('计算结果:', c)

正常输出应该类似：

code复制2.1.0.dev20230401+cu116
CUDA available: True 
cuDNN version: 8600
计算结果: tensor([[ 0.1234, -0.5678,  0.9012],
        [ 1.2345, -2.3456,  3.4567]], device='cuda:0')

6. 常见问题排查

6.1 安装后jtop不显示版本

如果jtop里CUDA/cuDNN版本显示为N/A：

检查.bashrc配置是否正确
尝试重启设备
运行sudo ldconfig更新库链接

6.2 PyTorch无法识别CUDA

这种情况多是PyTorch版本不匹配导致：

确认PyTorch是通过jetson专用源安装
检查torch.version.cuda输出是否与系统CUDA版本一致
尝试重装PyTorch：

bash复制pip3 uninstall torch
pip3 install --pre torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/nightly/cu116

7. 版本管理技巧

7.1 多版本CUDA切换

虽然APT安装默认绑定当前JetPack版本，但可以通过修改.bashrc切换：

bash复制# CUDA 11.4
export PATH=/usr/local/cuda-11.4/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-11.4/lib64:$LD_LIBRARY_PATH

# CUDA 10.2
# export PATH=/usr/local/cuda-10.2/bin:$PATH
# export LD_LIBRARY_PATH=/usr/local/cuda-10.2/lib64:$LD_LIBRARY_PATH

注释掉不需要的版本即可。

7.2 降级cuDNN版本

如果需要旧版cuDNN：

bash复制sudo apt-get install libcudnn8=8.2.1.*-1+cuda11.4

安装后建议重启：

bash复制sudo reboot

在AGX Orin上实测这套方案，从系统安装到完整环境配置不到30分钟。最关键的是完全避开了手动安装的各种坑，特别适合需要快速部署多台设备的场景。如果遇到其他问题，建议先检查JetPack版本是否匹配，这是大部分兼容性问题的根源。

已经到底了哦

精选内容

1 从源码到镜像：手把手教你用BUILD.gn在OpenHarmony里集成一个第三方C库（以zlib为例）2 动手实现一个离线语音唤醒：用TensorFlow Lite在树莓派上跑你的第一个‘Hey Jarvis’模型 3 M2DGR：多模态SLAM数据集如何用RGB+红外+事件+雷达+IMU+GNSS挑战算法极限 4 Windows下用Miniconda+Clang编译OpenBLAS，给OpenCV加速的保姆级教程 5 Minecraft服务器总崩溃？试试这3个带自动重启功能的启动脚本（附Linux/Windows版）6 从零部署：Win10与GTX1650的CUDA深度学习环境搭建实录 7 从零到一：掌握supervisorctl进程管理的核心命令与实战场景 8 LabVIEW事件结构：从原理到实战，打造响应式用户界面 9 HFSS实战：从零到一仿真设计威尔金森功分器 10 Inno Setup 6 实战：从零构建专业级 Windows 安装程序（含多语言与JRE集成）