MMRotate训练遥感目标检测模型：从数据裁剪到模型测试的完整实战复盘（附配置文件详解）

小波思基

MMRotate遥感目标检测实战：从数据预处理到模型调优的全流程解析

遥感图像中的目标检测一直是计算机视觉领域的重要课题。与常规水平框检测不同，旋转目标检测能够更精确地定位建筑物、车辆等具有方向性的目标。本文将基于MMRotate框架，分享一个完整的遥感目标检测项目实战经验，涵盖数据预处理、模型训练、调优技巧等关键环节。

1. 数据准备与预处理：处理非标准遥感图像

遥感图像通常具有大尺寸、非方形比例的特点，直接输入模型训练会导致显存不足和性能下降。合理的数据预处理是项目成功的第一步。

1.1 标注工具选择与格式转换

roLabelImg是旋转目标标注的利器，支持旋转矩形框标注。标注时需要注意：

保持标注一致性：统一采用"长边法"(le90)标注，即旋转框的长边与x轴夹角在[-90°,90°]范围内
标注文件转换：将roLabelImg生成的XML格式转换为DOTA格式，关键坐标转换公式如下：

python复制def rotatePoint(xc, yc, xp, yp, theta):
    xoff = xp - xc
    yoff = yp - yc
    cosTheta = math.cos(theta)
    sinTheta = math.sin(theta)
    pResx = cosTheta * xoff + sinTheta * yoff
    pResy = -sinTheta * xoff + cosTheta * yoff
    return xc + pResx, yc + pResy

1.2 图像裁剪策略优化

大尺寸遥感图像需要裁剪为适合模型输入的尺寸，img_split.py脚本提供了灵活的裁剪配置：

参数	推荐值	说明
image_ext	.png	建议统一转换为PNG格式
patch_size	1024	平衡显存占用与目标完整性
overlap	200	避免目标被切割
iof_thr	0.7	保留足够的目标区域

实际项目中，我们发现以下配置组合效果最佳：

json复制{
    "image_ext": ".png",
    "patch_size": 1024,
    "overlap": 256,
    "iof_thr": 0.75,
    "no_padding": false
}

2. 模型配置深度解析：从基础到优化

MMRotate提供了多种旋转检测模型，针对遥感目标特点，我们选择Rotated Faster R-CNN作为基础架构。

2.1 关键配置文件修改

rotated_faster_rcnn_r50_fpn_x1_dota_le90.py需要调整的核心参数：

python复制model = dict(
    roi_head=dict(
        bbox_head=dict(
            num_classes=1,  # 根据实际类别数调整
            loss_bbox=dict(type='RotatedIoULoss', loss_weight=1.0)
        )
    ),
    train_cfg=dict(
        rpn=dict(
            nms_pre=2000,
            max_per_img=2000
        )
    )
)

提示：对于小目标密集场景，可适当增加nms_pre和max_per_img值

2.2 数据增强策略

遥感图像需要特殊的数据增强组合：

python复制train_pipeline = [
    dict(type='LoadImageFromFile'),
    dict(type='LoadAnnotations', with_bbox=True),
    dict(type='RotatedRandomFlip', flip_ratio=0.5),
    dict(type='RandomRotate', rate=0.5, angles=[30, 60, 90, 120]),
    dict(type='BrightnessTransform', level=10),
    dict(type='ContrastTransform', level=10),
    dict(type='Normalize'),
    dict(type='Pad', size_divisor=32),
    dict(type='DefaultFormatBundle'),
    dict(type='Collect', keys=['img', 'gt_bboxes', 'gt_labels'])
]

3. 训练技巧与性能优化

3.1 显存不足解决方案

遇到"CUDA out of memory"错误时，可采取以下措施：

调整batch size和workers数量：

python复制data = dict(
    samples_per_gpu=2,  # 根据GPU显存调整
    workers_per_gpu=2   # 根据CPU核心数调整
)

使用梯度累积：

python复制optimizer_config = dict(grad_clip=dict(max_norm=35, norm_type=2), cumulative_iters=4)

3.2 学习率策略调优

针对遥感数据特点，我们采用warmup+余弦退火的学习率策略：

python复制lr_config = dict(
    policy='CosineAnnealing',
    warmup='linear',
    warmup_iters=500,
    warmup_ratio=1.0/3,
    min_lr=1e-6
)
optimizer = dict(
    type='SGD',
    lr=0.005,  # 初始学习率
    momentum=0.9,
    weight_decay=0.0001
)

4. 模型评估与结果分析

4.1 评估指标解读

MMRotate提供了全面的评估指标，重点关注：

mAP: 平均精度(mean Average Precision)
AP50: IoU阈值为0.5时的AP
AP75: IoU阈值为0.75时的AP
AR: 平均召回率(Average Recall)

4.2 常见问题诊断

在实际项目中，我们遇到并解决了以下典型问题：

低召回率：增加RPN阶段的anchor数量，调整anchor scales和ratios

python复制rpn_head=dict(
    anchor_generator=dict(
        scales=[4, 8, 16, 32],  # 针对不同大小目标调整
        ratios=[0.5, 1.0, 2.0],
        strides=[4, 8, 16, 32, 64]
    )
)

误检率高：调整NMS阈值和得分阈值

python复制test_cfg=dict(
    rpn=dict(
        nms_pre=2000,
        max_per_img=2000,
        nms=dict(type='nms', iou_threshold=0.7),
        min_bbox_size=0
    ),
    rcnn=dict(
        score_thr=0.05,  # 提高可减少误检
        nms=dict(type='nms', iou_threshold=0.1),
        max_per_img=2000
    )
)

小目标检测效果差：增加FPN特征层数，调整ROI Align参数

python复制neck=dict(
    type='FPN',
    in_channels=[256, 512, 1024, 2048],
    out_channels=256,
    num_outs=5  # 增加特征金字塔层数
),
roi_head=dict(
    bbox_roi_extractor=dict(
        type='SingleRoIExtractor',
        roi_layer=dict(
            type='RoIAlignRotated',
            out_size=7,
            sample_num=2  # 增加采样点
        )
    )
)

已经到底了哦

精选内容

1 从理论到流片：基于Cadence Virtuoso的100MHz CMOS环形振荡器全流程实战 2 从频段到设备：三大运营商网络覆盖解析与随身WiFi选购避坑指南 3 麒麟qcow2虚拟机密码重置实战与离线软件包管理全攻略 4 别再浪费AutoDL的30GB免费镜像额度了！清理系统盘无用文件的保姆级清单 5 从‘ElementType’看C语言泛型编程：手写一个通用的中位数查找函数 6 别再到处找字库了！手把手教你用PCtoLCD2002为OLED屏生成自定义6x8和8x16点阵字库 7 STM32软件模拟IIC实战：从时序解析到AT24Cxx存储驱动 8 [eNSP实战] 构建企业级远程管理：从AAA认证到Telnet安全登录 9 ThinkPHP6路由分组与REST接口开发：提升代码可维护性的秘密武器 10 FDR土壤水分传感器精度优化：含盐量与温度影响的建模实践