从零部署：Win10与GTX1650的CUDA深度学习环境搭建实录

谷桐羽

1. 从Ubuntu到Windows的GPU环境迁移之路

作为一个长期使用Ubuntu进行深度学习开发的程序员，最近因为工作需要开始尝试在Windows 10系统上配置GPU环境。我的笔记本搭载的是NVIDIA GeForce GTX 1650显卡，这个配置在Ubuntu下跑PyTorch代码毫无压力，但在Windows环境下却需要重新配置整套工具链。说实话，刚开始我对Windows下的GPU环境搭建有些抵触，毕竟Linux环境下一切都那么顺滑。但经过一番折腾后，我发现Windows下的配置其实也没有想象中那么复杂，只要掌握几个关键点就能轻松搞定。

这次环境搭建的主要目标是能够在Windows 10系统上使用PyTorch调用GTX 1650显卡进行深度学习运算。整个过程涉及到显卡驱动安装、CUDA Toolkit配置、cuDNN部署以及最后的PyTorch环境验证。虽然网上有很多教程，但大多数要么过于简略，要么版本已经过时。我决定记录下这个完整的过程，既是为了自己以后查阅方便，也能帮助到有同样需求的朋友们。

2. 硬件准备与驱动安装

2.1 确认显卡型号与驱动版本

在开始安装之前，首先要确认你的显卡型号和当前安装的驱动版本。在Windows 10中，你可以通过以下几种方式查看：

右键点击桌面空白处，选择"NVIDIA控制面板"
在控制面板左下角点击"系统信息"
在弹出的窗口中可以看到显卡型号和驱动版本

我的笔记本显示显卡型号为GeForce GTX 1650，驱动版本为511.79。这个信息非常重要，因为它决定了我们可以安装哪些版本的CUDA Toolkit。NVIDIA官方提供了一个驱动版本与CUDA版本的对应关系表，建议在安装前先查阅这个表格，确保选择的CUDA版本与你的驱动兼容。

2.2 下载并安装显卡驱动

如果你的显卡驱动不是最新版本，或者你打算安装特定版本的CUDA，可能需要先更新或降级显卡驱动。以下是具体步骤：

访问NVIDIA官方网站的驱动下载页面
选择你的显卡产品类型（GeForce）、系列（16系列）、具体型号（GTX 1650）以及操作系统（Windows 10）
点击搜索按钮，网站会显示可用的驱动版本
下载适合的驱动版本并安装

安装过程中有几个需要注意的地方：

建议选择"自定义安装"而不是"快速安装"
勾选"执行清洁安装"选项，这样可以避免旧驱动文件的残留
安装完成后建议重启电脑

3. CUDA Toolkit的安装与配置

3.1 选择合适的CUDA版本

CUDA Toolkit的版本选择非常重要，它需要与你的显卡驱动版本匹配，同时也需要与你打算使用的深度学习框架兼容。以我的GTX 1650为例，经过查询我选择了CUDA 11.4版本，这个版本与我的驱动兼容，同时也支持最新的PyTorch版本。

在NVIDIA开发者网站上，你可以找到所有历史版本的CUDA Toolkit。下载时建议选择"exe(local)"安装方式，这样下载的是一个完整的离线安装包，安装过程会更加稳定。

3.2 安装CUDA Toolkit

下载完成后，运行安装程序。安装过程中有几个关键选项需要注意：

安装类型选择"自定义"而不是"精简"
在组件选择界面，确保勾选了"CUDA"下的所有子组件
Visual Studio Integration选项可以根据你是否使用VS来决定是否安装
安装路径建议保持默认，这样后续配置环境变量会比较方便

安装完成后，我们需要验证CUDA是否安装成功。打开命令提示符，输入：

bash复制nvcc -V

如果安装成功，这个命令会输出CUDA的版本信息。

3.3 配置环境变量

CUDA安装程序通常会自动添加必要的环境变量，但为了确保万无一失，我们可以手动检查一下：

右键点击"此电脑"，选择"属性"
点击"高级系统设置"
在"高级"选项卡下点击"环境变量"
在系统变量中检查是否有以下路径：
- CUDA_PATH: C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.4
- CUDA_PATH_V11_4: C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.4
检查Path变量中是否包含以下路径：
- %CUDA_PATH%\bin
- %CUDA_PATH%\libnvvp

如果缺少任何变量或路径，可以手动添加。

4. cuDNN的安装与验证

4.1 下载cuDNN库

cuDNN是NVIDIA提供的深度神经网络加速库，它是许多深度学习框架的基础依赖。下载cuDNN需要注意以下几点：

你需要注册NVIDIA开发者账号才能下载cuDNN
cuDNN版本必须与安装的CUDA版本严格匹配
对于CUDA 11.4，我选择了cuDNN 8.2版本

下载完成后，你会得到一个压缩包，里面包含三个文件夹：bin、include和lib。

4.2 安装cuDNN

cuDNN的安装实际上就是文件复制的过程：

解压下载的cuDNN压缩包
打开CUDA的安装目录（通常是C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.4）
将cuDNN中的bin、include和lib文件夹中的内容复制到CUDA安装目录下对应的文件夹中
如果提示覆盖文件，选择"是"

4.3 验证cuDNN安装

为了验证cuDNN是否安装成功，我们可以运行NVIDIA提供的测试程序。打开命令提示符，导航到CUDA安装目录下的extras\demo_suite文件夹，然后运行：

bash复制bandwidthTest.exe
deviceQuery.exe

如果这两个程序都能正常运行并显示相关信息，说明cuDNN安装成功。

5. PyTorch环境配置与GPU验证

5.1 安装PyTorch

现在我们已经准备好了所有必要的底层环境，可以安装PyTorch了。PyTorch官方提供了非常方便的安装命令生成器：

访问PyTorch官网
选择你的配置：Windows、pip、Python、CUDA 11.4
复制生成的安装命令
在命令行中执行该命令

对于我的配置，安装命令类似于：

bash复制pip3 install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu114

5.2 验证GPU可用性

安装完成后，我们需要验证PyTorch是否能正确识别和使用GPU。打开Python解释器，输入以下代码：

python复制import torch
print(torch.cuda.is_available())  # 应该输出True
print(torch.cuda.get_device_name(0))  # 应该输出你的显卡型号
print(torch.cuda.current_device())  # 应该输出0

如果所有测试都通过，恭喜你！现在你的Windows 10系统已经可以完全利用GTX 1650显卡进行深度学习计算了。

6. 常见问题与解决方案

在实际安装过程中，可能会遇到各种问题。以下是我遇到的一些典型问题及其解决方法：

问题1：安装CUDA时报错"Visual Studio集成失败"
解决方法：这通常是因为缺少必要的Visual Studio组件。可以安装Visual Studio 2019或2022，并确保勾选了"C++桌面开发"工作负载。

问题2：PyTorch无法识别CUDA
解决方法：首先确认PyTorch版本与CUDA版本匹配。然后检查环境变量是否正确设置。最后可以尝试重新安装PyTorch，指定正确的CUDA版本。

问题3：运行深度学习模型时显存不足
解决方法：GTX 1650的显存只有4GB，对于大型模型可能不够用。可以尝试减小batch size，或者使用混合精度训练来节省显存。

问题4：系统性能不稳定
解决方法：确保你的电源管理设置为"高性能"模式，并且在NVIDIA控制面板中将"首选图形处理器"设置为"高性能NVIDIA处理器"。

7. 性能优化建议

为了让GTX 1650发挥最佳性能，我总结了一些优化建议：

使用混合精度训练：PyTorch的AMP（自动混合精度）功能可以显著减少显存使用并提高训练速度。

python复制from torch.cuda.amp import autocast, GradScaler
scaler = GradScaler()

with autocast():
    outputs = model(inputs)
    loss = criterion(outputs, labels)

scaler.scale(loss).backward()
scaler.step(optimizer)
scaler.update()

合理设置batch size：根据模型大小和显存容量调整batch size，太大可能导致OOM错误，太小则影响训练效率。
定期清理显存：长时间训练可能会导致显存碎片化，定期重启Python内核可以解决这个问题。
监控GPU使用情况：可以使用NVIDIA的nvidia-smi工具或Windows任务管理器来监控GPU使用情况，找出性能瓶颈。
保持驱动和库更新：定期检查NVIDIA驱动和CUDA、cuDNN的更新，新版本通常会带来性能改进和bug修复。

经过这番配置后，我的GTX 1650在Windows 10下跑PyTorch代码的性能已经非常接近在Ubuntu下的表现了。虽然Windows不是深度学习开发的首选平台，但对于需要在Windows环境下工作的人来说，这套配置方案确实能解决很多实际问题。

已经到底了哦