保姆级教程：用清华镜像源离线安装PyTorch 1.12.1 + CUDA 11.3（附常见dll报错解决方案）

偏执梦想家

深度学习环境搭建实战：PyTorch 1.12.1与CUDA 11.3的离线部署指南

在深度学习项目开发中，环境配置往往是第一个拦路虎。特别是当网络条件不佳时，从官方源下载大型依赖包不仅耗时，还经常因网络波动导致失败。本文将手把手带你通过清华镜像源完成PyTorch 1.12.1 + CUDA 11.3的离线安装，并解决常见的dll缺失问题，让你在内网或受限网络环境下也能高效搭建开发环境。

1. 环境准备与规划

在开始安装前，我们需要明确几个关键点：硬件兼容性、软件版本匹配以及离线资源的获取途径。许多安装失败案例都源于前期准备不足，导致后续步骤出现各种兼容性问题。

首先确认你的显卡型号和支持的CUDA版本。打开命令提示符，执行以下命令：

bash复制nvidia-smi

这个命令会显示显卡驱动版本和最高支持的CUDA版本。例如输出中的CUDA Version: 11.6表示你的驱动最高支持CUDA 11.6，但我们可以安装低版本的CUDA 11.3。

接下来确定各组件版本对应关系：

组件	版本	备注
PyTorch	1.12.1	核心深度学习框架
Python	3.8.19	推荐使用conda管理
CUDA Toolkit	11.3.1	GPU加速核心组件
cuDNN	8.2.1	深度神经网络加速库

提示：版本匹配至关重要，特别是PyTorch与CUDA、cuDNN之间的对应关系。官方文档提供了详细的兼容性矩阵，建议安装前查阅。

2. 创建隔离的虚拟环境

使用conda创建虚拟环境是Python开发的最佳实践，它能避免不同项目间的依赖冲突。我们将创建一个专为PyTorch 1.12.1设计的环境：

bash复制conda create -n pytorch_1.12.1 python=3.8.19 -y
conda activate pytorch_1.12.1

环境创建后，建议立即安装一些基础工具包：

bash复制conda install numpy pandas matplotlib jupyter -y

这些工具在后续的数据处理和模型可视化中都会用到。虚拟环境的另一个优势是你可以随时导出环境配置：

bash复制conda env export > environment.yml

这样在其他机器上只需执行conda env create -f environment.yml就能复现完全相同的环境。

3. 通过清华镜像源离线安装CUDA和cuDNN

直接从NVIDIA官网下载CUDA和cuDNN不仅速度慢，而且在内网环境下几乎不可能完成。清华镜像源提供了完整的Anaconda仓库镜像，我们可以利用它快速获取所需组件。

首先查询镜像源中可用的CUDA Toolkit版本：

bash复制conda search cudatoolkit -c https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/win-64/

然后查找匹配的cuDNN版本：

bash复制conda search cudnn -c https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/win-64/

确认版本后，执行安装命令：

bash复制conda install cudatoolkit=11.3.1 -c https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/win-64/
conda install cudnn=8.2.1 -c https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/win-64/

安装完成后，可以验证CUDA是否可用：

python复制import numpy as np
from numba import cuda
print(cuda.gpus)

如果输出显示检测到的GPU信息，说明CUDA安装成功。

4. PyTorch及其组件的离线安装

PyTorch的安装包通常包含三个主要组件：torch、torchvision和torchaudio。我们需要从清华镜像源分别下载这些组件的.conda文件进行本地安装。

首先访问清华镜像站的PyTorch仓库：

code复制https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/win-64/

找到与你的环境匹配的版本：

pytorch-1.12.1-py3.8_cuda11.3_cudnn8.2.1_0.conda
torchvision-0.13.1-py38_cu113.conda
torchaudio-0.12.1-py38_cu113.conda

下载这些文件到本地目录后，使用conda进行本地安装：

bash复制conda install ./pytorch-1.12.1-py3.8_cuda11.3_cudnn8.2.1_0.conda
conda install ./torchvision-0.13.1-py38_cu113.conda
conda install ./torchaudio-0.12.1-py38_cu113.conda

这种离线安装方式不仅速度快，而且可以避免网络不稳定导致的中断。安装完成后，不要急于进行下一步，先检查所有组件是否完整安装：

bash复制conda list | grep -E "torch|cuda"

5. 环境验证与常见问题解决

安装完成后，必须进行全面的功能测试。创建一个简单的测试脚本：

python复制import torch

print(f"PyTorch版本: {torch.__version__}")
print(f"CUDA可用性: {torch.cuda.is_available()}")
print(f"当前CUDA设备: {torch.cuda.current_device()}")
print(f"设备数量: {torch.cuda.device_count()}")
print(f"设备名称: {torch.cuda.get_device_name(0)}")

理想情况下，输出应该显示CUDA可用，并正确识别你的GPU设备。但实际安装过程中，可能会遇到以下常见问题：

5.1 caffe2_nvrtc.dll缺失错误

当导入torch时出现ImportError: DLL load failed: 找不到指定的模块 caffe2_nvrtc.dll错误，说明某些依赖项未正确安装。解决方法：

bash复制conda install pytorch==1.12.1 torchvision==0.13.1 torchaudio==0.12.1 cudatoolkit=11.3 -c pytorch

这个命令会从PyTorch官方渠道补充安装缺失的依赖。

5.2 shm.dll缺失错误

类似地，如果遇到shm.dll缺失的错误，可以尝试：

首先确认文件是否存在于Lib\site-packages\torch\lib目录下
如果文件存在但无法加载，可能是权限问题，尝试以管理员身份运行命令提示符
如果文件不存在，重新执行完整的PyTorch安装命令

5.3 CUDA版本不匹配

有时虽然安装了CUDA 11.3，但PyTorch仍报告版本不兼容。这可能是因为：

系统PATH环境变量中包含了其他版本的CUDA
Conda环境中混用了不同来源的包

解决方法：

bash复制conda list cudatoolkit  # 确认安装的版本
which nvcc  # 检查使用的CUDA编译器路径

6. 高级配置与优化

环境安装完成后，还可以进行一些优化配置以提升性能：

设置PyTorch默认使用GPU：

python复制device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

启用cuDNN自动调优：

python复制torch.backends.cudnn.benchmark = True

内存优化配置：

python复制torch.cuda.empty_cache()  # 及时清空未使用的缓存

多GPU数据并行（如果有多张显卡）：

python复制model = nn.DataParallel(model)

对于大型项目，建议将环境配置脚本化，例如创建一个setup_env.sh：

bash复制#!/bin/bash
# 自动环境配置脚本
conda create -n pytorch_1.12.1 python=3.8.19 -y
conda activate pytorch_1.12.1
conda install cudatoolkit=11.3.1 -c https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/win-64/
conda install cudnn=8.2.1 -c https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/win-64/
conda install ./pytorch-1.12.1-py3.8_cuda11.3_cudnn8.2.1_0.conda
conda install ./torchvision-0.13.1-py38_cu113.conda
conda install ./torchaudio-0.12.1-py38_cu113.conda

7. 实际项目中的经验分享

在多个工业级项目中部署PyTorch环境后，我总结出几点关键经验：

版本锁定：在团队协作中，使用conda env export > environment.yml导出精确版本号，避免"在我的机器上能运行"的问题。
离线包缓存：将下载的.conda文件归档保存，建立内部软件仓库，方便团队其他成员快速部署。
容器化部署：考虑使用Docker封装环境，特别是当项目需要部署到生产服务器时。一个基本的Dockerfile示例：

dockerfile复制FROM nvidia/cuda:11.3.1-cudnn8-runtime-ubuntu20.04

RUN apt-get update && apt-get install -y \
    wget \
    && rm -rf /var/lib/apt/lists/*

# 安装Miniconda
RUN wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh \
    && bash Miniconda3-latest-Linux-x86_64.sh -b -p /opt/conda \
    && rm Miniconda3-latest-Linux-x86_64.sh
ENV PATH=/opt/conda/bin:$PATH

# 复制本地conda包
COPY pytorch-1.12.1-py3.8_cuda11.3_cudnn8.2.1_0.conda /tmp/
COPY torchvision-0.13.1-py38_cu113.conda /tmp/
COPY torchaudio-0.12.1-py38_cu113.conda /tmp/

# 创建环境并安装PyTorch
RUN conda create -n myenv python=3.8.19 -y \
    && echo "conda activate myenv" >> ~/.bashrc
SHELL ["conda", "run", "-n", "myenv", "/bin/bash", "-c"]
RUN conda install /tmp/*.conda

性能监控：安装后定期检查GPU利用率，确保PyTorch正确利用了CUDA加速：

python复制print(torch.cuda.memory_allocated())  # 当前分配的显存
print(torch.cuda.memory_reserved())   # 当前保留的显存

已经到底了哦

精选内容

1 别再被版本坑了！手把手教你用VS2019和UE4.24在Win10上搞定AirSim 1.3.1编译 2 从RAID0到RAID50：一张图看懂磁盘阵列的选型逻辑 3 从电商AB测试到药物疗效评估：如何用do-calculus的‘后门准则’搞定混杂变量？4 从入门到精通：MS COCO数据集在目标检测实战中的核心应用与避坑指南 5 SAP BOM实战：别再傻傻分不清标准、销售、订单BOM，5分钟搞懂区别与使用场景 6 如何优化DeepSeek训练数据的存储与处理？高效压缩与分布式分片技巧 7 从‘靠谱分’到‘专家会诊’：图解GAT注意力机制与多头协作的实战演进 8 从ProcessBuilder源码看Java进程通信：为什么你的Shell命令总是卡住？9 【特征工程实战】从诊断到优化：共线性处理、降维策略与特征构建 10 如何在Adobe Premiere Pro中高效处理WebM格式视频