手把手复现CVPR2022去雾模型Dehamer：从环境配置到效果验证

林脸脸

1. 环境准备：从零搭建Dehamer运行环境

复现深度学习论文的第一步永远是搭建合适的开发环境。我花了三天时间反复测试不同硬件和软件组合，最终总结出这套兼容性最强的配置方案。先说说硬件要求：原作者使用的是NVIDIA显卡，实测GTX1050确实会出现显存不足的问题（训练时直接报CUDA out of memory），建议至少RTX2060以上显卡。我分别在RTX3060笔记本和RTX4090台式机上测试过，后者训练速度能快3倍左右。

软件环境配置分三个关键步骤：

创建隔离的Python环境：强烈推荐使用conda而不是pip直接安装，因为能避免版本冲突。执行conda env create -f environment.yaml时会自动安装基础依赖，但这里有个坑要注意——原环境文件里的pytorch版本可能和你的CUDA不兼容。比如我的服务器装的是CUDA11.7，就需要手动调整torch安装命令：

bash复制conda install pytorch==1.8.1 torchvision==0.9.1 torchaudio==0.8.1 cudatoolkit=11.7 -c pytorch

处理缺失的依赖项：环境文件里缺少了几个隐式依赖，实测需要额外安装：

bash复制pip install opencv-python-headless scikit-image

验证环境正确性：运行python -c "import torch; print(torch.cuda.is_available())"必须返回True，否则后续所有操作都无法进行。如果报错，大概率是CUDA版本不匹配，需要重装对应版本的pytorch。

2. 模型获取与部署技巧

官方提供了百度网盘下载链接（提取码：1tap），但下载速度可能较慢。我整理了备用下载方式：

模型文件结构解析：
- dense/：处理密集雾气的场景
- NH/：自然雾气数据集专用
- indoor/和outdoor/：分别针对室内外场景优化

下载后需要严格按照以下目录结构放置：

code复制Dehamer
  |- ckpts
    |- dense
      |- PSNR1662_SSIM05602.pt
    |- NH
      |- PSNR2066_SSIM06844.pt
    |- indoor
      |- PSNR3663_ssim09881.pt
    |- outdoor
      |- PSNR3518_SSIM09860.pt

常见问题排查：

如果测试时报"Model file not found"，检查两点：
1. 确认文件路径是否包含中文或特殊字符
2. 使用ls -l ckpts/NH/查看文件权限，必要时执行chmod 644 PSNR2066_SSIM06844.pt

3. 训练自定义数据集

虽然官方提供了预训练模型，但实际应用中我们常需要针对特定场景微调。以下是完整训练流程：

数据准备：

训练集和验证集需要成对的有雾/无雾图像
推荐使用RESIDE标准数据集，目录结构示例：

code复制data
 |- train_NH
   |- hazy
     |- 1.png
   |- clear
     |- 1.png
 |- valid_NH
   |- hazy
     |- 101.png
   |- clear
     |- 101.png

启动训练（关键参数详解）：

bash复制CUDA_VISIBLE_DEVICES=0,1 python src/train.py \
  --dataset-name custom \
  --train-dir ./data/train_NH/ \
  --valid-dir ./data/valid_NH/ \
  --ckpt-save-path ./ckpts/custom \
  --batch-size 4 \
  --train-size 512 512 \
  --valid-size 512 512 \
  --loss l1+l2 \
  --plot-stats

训练技巧：

当显存不足时，减小batch-size和train-size
监控loss曲线，正常情况应该在前100epoch快速下降
使用--plot-stats会生成训练过程可视化图表

4. 效果验证与实战测试

完成训练后，可以通过三种方式验证模型效果：

标准数据集测试：

bash复制CUDA_VISIBLE_DEVICES=0 python src/test_PSNR.py --dataset-name NH

输出会包含PSNR和SSIM指标，我的RTX3060上NH数据集得分PSNR=20.66，SSIM=0.6844

单张图片测试：

bash复制python src/test_image.py -i input_hazy.jpg -o output_dehazed.jpg

视频流处理（扩展功能）：

python复制import cv2
from src.models import Dehamer

model = Dehamer(ckpt_path='ckpts/NH/PSNR2066_SSIM06844.pt')
cap = cv2.VideoCapture('input.mp4')

while cap.isOpened():
    ret, frame = cap.read()
    if not ret: break
    output = model.dehaze(frame)
    cv2.imshow('Dehazed', output)
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

效果优化技巧：

对于浓雾图像，尝试使用dense模型
室内场景优先选择indoor模型
输出图像偏暗时，可以用cv2.convertScaleAbs(output, alpha=1.2, beta=10)微调亮度和对比度

5. 常见问题解决方案

在复现过程中我遇到过各种报错，这里分享几个典型问题的解决方法：

CUDA out of memory：
- 降低测试时的图像分辨率：添加--resize 512参数
- 修改src/config.py中的MAX_DIM值
TypeError: expected Tensor as element 0：
- 更新numpy版本：pip install numpy==1.21.6
- 检查输入图像是否为RGB三通道格式
模型加载失败：
- 使用torch.load(ckpt_path, map_location='cpu')检查模型是否完整
- 确认pytorch版本与训练时一致
边缘模糊问题：
- 在test_image.py中调整padding=32参数
- 后处理使用cv2.detailEnhance()增强细节

对于想深入理解算法原理的同学，建议重点阅读论文中的3D Position Embedding部分，这是Dehamer区别于传统去雾方法的核心创新点。我在实现时发现，其位置编码方式能有效保留远距离像素间的关联，这对处理大雾场景特别关键。

已经到底了哦

精选内容

1 Maven依赖解析困局：Failed to read artifact descriptor 深度排查与实战修复 2 解锁38TOPS INT8算力：基于瑞芯微RK3588+寒武纪的AI边缘计算盒子在智慧城市多场景实战解析 3 DSPF28335 ADC实战：从寄存器配置到精准数据采集 4 从零到一：高电平复位电路的设计精要与实战解析 5 从DNA到弹簧：螺旋线曲率半径公式在工程与生物中的有趣应用 6 【Python】PaddleOCR实战调优：从参数解析到场景化性能提升 7 STM32F103VET6串口调试实战：从printf重定向到中断接收，一个工程搞定 8 围棋AI KataGo搭配Sabaki GUI：从引擎配置到实战对弈的完整避坑指南 9 【技术解析】无监督跨模态生成与配准：破解红外与可见光图像融合中的“鬼影”难题 10 手把手教你用MATLAB和C++实现地震波场模拟（附完整代码和避坑指南）