使用C#和TorchSharp实现深度学习图像分类全流程-代码聚汇网

使用C#和TorchSharp实现深度学习图像分类全流程

王洛堇

1. 深度学习模型训练全流程解析：从数据准备到模型部署

在.NET生态中，TorchSharp为开发者提供了强大的深度学习能力。本文将完整演示如何使用C#和TorchSharp构建一个图像分类模型，从环境配置到模型部署的全过程。不同于Python生态，.NET下的深度学习开发有其独特的技术栈和注意事项，这正是本文要重点分享的内容。

1.1 环境准备与工具选型

首先创建一个.NET控制台项目（建议使用.NET 6+），通过NuGet安装以下核心包：

TorchSharp：.NET版的PyTorch接口
TorchSharp-cuda-windows：GPU加速支持（如使用NVIDIA显卡）
TorchVision：计算机视觉专用库
Maomi.Torch：国产开源工具包，提供便捷API

注意：如果安装CUDA版本遇到问题，可先使用CPU版本测试。开发环境建议Visual Studio 2022，其对NuGet包管理和GPU调试支持较好。

设备检测代码是项目的第一步，它自动选择最优计算设备：

csharp复制using Maomi.Torch;

// 自动检测最佳计算设备（优先GPU）
Device defaultDevice = MM.GetOptimalDevice(); 
torch.set_default_device(defaultDevice);
Console.WriteLine($"当前使用设备: {defaultDevice}");

这段代码会优先尝试CUDA（NVIDIA GPU），其次是MPS（Apple芯片），最后回退到CPU。我在实际项目中发现，对于FashionMNIST这类小规模数据集，现代CPU也能获得不错的训练速度。

1.2 数据集加载与预处理

深度学习项目中，数据准备往往占据70%的工作量。TorchVision内置了FashionMNIST数据集，这是一个包含6万张28x28灰度服装图片的分类数据集，共10个类别：

csharp复制using TorchSharp;
using static TorchSharp.torch;
using datasets = TorchSharp.torchvision.datasets;
using transforms = TorchSharp.torchvision.transforms;

// 加载训练集（自动下载）
var training_data = datasets.FashionMNIST(
    root: "data",
    train: true,
    download: true,
    target_transform: transforms.ConvertImageDtype(ScalarType.Float32)
);

// 加载测试集
var test_data = datasets.FashionMNIST(
    root: "data",
    train: false,
    download: true,
    target_transform: transforms.ConvertImageDtype(ScalarType.Float32)
);

关键参数说明：

root：数据集存储路径
train：区分训练/测试集
download：自动下载缺失数据
target_transform：数据转换（这里将像素值转为Float32）

与Python版不同，C#缺少ToTensor()方法，必须显式指定数据类型转换。这是TorchSharp开发中常见的"陷阱"之一。

2. 数据可视化与批处理

2.1 数据集结构探查

理解数据结构是模型开发的基础。FashionMNIST的每个样本包含data（图片张量）和label（分类标签）：

csharp复制// 查看前三个样本
for (int i = 0; i < 3; i++) {
    var sample = training_data.GetTensor(i);
    var img = sample["data"];
    var label = sample["label"];
    Console.WriteLine($"样本{i}: 形状={img.shape}, 标签={label.item<int>()}");
    
    // 使用Maomi.Torch可视化
    img.ShowImage(); 
    img.SavePng($"sample_{i}.png");
}

输出示例：

code复制样本0: 形状=[1, 28, 28], 标签=9
样本1: 形状=[1, 28, 28], 标签=0  
样本2: 形状=[1, 28, 28], 标签=1

技巧：ShowImage()方法依赖Maomi.ScottPlot.Winforms库。如果控制台项目无法显示窗口，可改用SavePng()保存图片查看。

2.2 数据批处理与加载器

全量加载6万张图片会耗尽内存，必须使用批处理：

csharp复制// 训练集加载器（打乱顺序）
var train_loader = torch.utils.data.DataLoader(
    training_data, 
    batchSize: 64,
    shuffle: true,
    device: defaultDevice
);

// 测试集加载器（保持顺序）
var test_loader = torch.utils.data.DataLoader(
    test_data,
    batchSize: 64, 
    shuffle: false,
    device: defaultDevice
);

批处理大小（batchSize）是重要超参数：

值越大：内存占用越高，训练速度越快
值越小：梯度更新更频繁，可能提升模型精度
常见范围：32-256，需根据GPU显存调整

3. 神经网络模型构建

3.1 定义网络结构

以下是适用于FashionMNIST的全连接神经网络实现：

csharp复制using TorchSharp.Modules;
using static TorchSharp.torch;
using nn = TorchSharp.torch.nn;

public class NeuralNetwork : nn.Module
{
    private readonly Flatten flatten;
    private readonly Sequential linear_relu_stack;

    public NeuralNetwork() : base(nameof(NeuralNetwork))
    {
        flatten = nn.Flatten();
        linear_relu_stack = nn.Sequential(
            nn.Linear(28 * 28, 512),
            nn.ReLU(),
            nn.Linear(512, 512),
            nn.ReLU(), 
            nn.Linear(512, 10)
        );
        
        RegisterComponents(); // 必须调用！
    }

    public override Tensor forward(Tensor input)
    {
        var x = flatten.call(input);
        var logits = linear_relu_stack.call(x);
        return logits;
    }
}

关键点说明：

Flatten层将28x28图片展平成784维向量
两个隐藏层（512神经元）使用ReLU激活函数
输出层10个神经元对应10个分类
RegisterComponents()必须调用以注册模型参数

踩坑记录：曾忘记调用RegisterComponents()导致参数无法更新，调试2小时才发现。这是TorchSharp与PyTorch的重要区别！

3.2 模型初始化与设备转移

csharp复制var model = new NeuralNetwork();
model.to(defaultDevice); // 将模型转移到GPU/CPU

// 打印模型结构
Console.WriteLine(model);

输出示例：

code复制NeuralNetwork(
  (flatten): Flatten()
  (linear_relu_stack): Sequential(
    (0): Linear(in_features=784, out_features=512)
    (1): ReLU()
    (2): Linear(in_features=512, out_features=512) 
    (3): ReLU()
    (4): Linear(in_features=512, out_features=10)
  )
)

4. 模型训练与评估

4.1 配置损失函数与优化器

csharp复制// 交叉熵损失函数（适合分类任务）
var loss_fn = nn.CrossEntropyLoss();

// SGD优化器（学习率0.001）
var optimizer = torch.optim.SGD(
    model.parameters(), 
    learningRate: 1e-3
);

优化器选型建议：

SGD：基础选择，需调参
Adam：自适应学习率，推荐新手使用
RMSprop：适合RNN等序列模型

4.2 训练循环实现

csharp复制static void Train(DataLoader dataloader, NeuralNetwork model, 
                 CrossEntropyLoss loss_fn, SGD optimizer)
{
    model.train();
    int size = dataloader.dataset.Count;
    int batch = 0;

    foreach (var item in dataloader)
    {
        var x = item["data"];
        var y = item["label"];

        // 前向传播
        var pred = model.call(x);
        var loss = loss_fn.call(pred, y);

        // 反向传播
        loss.backward();
        optimizer.step();
        optimizer.zero_grad();

        // 打印进度
        if (batch % 100 == 0)
        {
            var current = (batch + 1) * x.shape[0];
            Console.WriteLine($"loss: {loss.item():F4} [{current}/{size}]");
        }
        batch++;
    }
}

4.3 测试集评估

csharp复制static void Test(DataLoader dataloader, NeuralNetwork model, 
                CrossEntropyLoss loss_fn)
{
    model.eval();
    int size = (int)dataloader.dataset.Count;
    int num_batches = (int)dataloader.Count;
    float test_loss = 0, correct = 0;

    using (var no_grad = torch.no_grad())
    {
        foreach (var item in dataloader)
        {
            var x = item["data"];
            var y = item["label"];
            var pred = model.call(x);
            
            test_loss += loss_fn.call(pred, y).item();
            correct += (pred.argmax(1) == y)
                      .type(ScalarType.Float32)
                      .sum().item();
        }
    }

    test_loss /= num_batches;
    correct /= size;
    Console.WriteLine($"测试结果:\n  准确率: {(100*correct):F1}%, 平均损失: {test_loss:F4}\n");
}

4.4 执行训练

csharp复制int epochs = 5;
for (int epoch = 0; epoch < epochs; epoch++)
{
    Console.WriteLine($"Epoch {epoch+1}\n-------------------------------");
    Train(train_loader, model, loss_fn, optimizer);
    Test(test_loader, model, loss_fn);
}
Console.WriteLine("训练完成！");

典型输出：

code复制Epoch 1
-------------------------------
loss: 2.3012 [64/60000]
loss: 2.2881 [6464/60000]
...
测试结果:
   准确率: 82.3%, 平均损失: 0.5124

Epoch 5  
-------------------------------
loss: 0.4128 [64/60000]
...
测试结果:
   准确率: 85.7%, 平均损失: 0.3982

5. 模型部署与应用

5.1 模型保存与加载

csharp复制// 保存模型
model.save("fashion_mnist_model.dat");
Console.WriteLine("模型已保存");

// 加载模型
var loaded_model = new NeuralNetwork();
loaded_model.load("fashion_mnist_model.dat");
loaded_model.to(defaultDevice);

5.2 单图片预测

csharp复制var class_names = new[] {
    "T恤", "裤子", "套头衫", "裙子", "外套",
    "凉鞋", "衬衫", "运动鞋", "包", "短靴"
};

// 使用测试集第一张图片
var test_sample = test_data.GetTensor(0);
var x = test_sample["data"];
var y = test_sample["label"];

loaded_model.eval();
using (var no_grad = torch.no_grad())
{
    x = x.to(defaultDevice);
    var pred = loaded_model.call(x);
    var predicted_idx = pred.argmax(0).ToInt32();
    var actual_idx = y.ToInt32();
    
    Console.WriteLine($"预测: '{class_names[predicted_idx]}', 实际: '{class_names[actual_idx]}'");
}

5.3 自定义图片处理

csharp复制// 加载本地图片并预测
var img = MM.LoadImage("my_shoe.png");
img = img.to(defaultDevice);

loaded_model.eval();
using (var no_grad = torch.no_grad())
{
    var pred = loaded_model.call(img);
    var probs = torch.nn.functional.softmax(pred, dim: 0);
    var top_prob = probs.max().ToFloat32();
    var top_idx = pred.argmax(0).ToInt32();
    
    Console.WriteLine($"识别结果: {class_names[top_idx]}, 置信度: {top_prob*100:F1}%");
}

6. 性能优化技巧

混合精度训练：使用torch.cuda.amp自动管理精度

csharp复制using var grad_scaler = torch.cuda.amp.GradScaler();
// 在训练循环中使用
using (var amp = torch.cuda.amp.autocast()) 
{
    var pred = model.call(x);
    var loss = loss_fn.call(pred, y);
}
grad_scaler.scale(loss).backward();
grad_scaler.step(optimizer);
grad_scaler.update();

数据增强：提升模型泛化能力

csharp复制var transform = transforms.Compose(
    transforms.RandomHorizontalFlip(),
    transforms.RandomRotation(10),
    transforms.ConvertImageDtype(ScalarType.Float32)
);

学习率调度：动态调整学习率

csharp复制var scheduler = torch.optim.lr_scheduler.StepLR(
    optimizer, 
    step_size: 30, 
    gamma: 0.1
);
// 每个epoch后调用
scheduler.step();

7. 常见问题排查

CUDA内存不足：
- 减小batchSize
- 使用torch.cuda.empty_cache()
- 检查是否有张量未释放
模型不收敛：
- 检查数据预处理是否正确
- 尝试更小的学习率
- 添加BatchNorm层
预测结果异常：
- 确保model.eval()模式
- 检查输入数据范围是否与训练时一致
- 验证模型是否加载正确

通过这个完整案例，我们实现了从数据准备到模型部署的全流程。TorchSharp虽然生态不如PyTorch完善，但对于.NET开发者来说，它提供了在熟悉环境中进行深度学习开发的可能性。特别是在工业部署场景，.NET的运行时优势可能成为关键因素。