别再只用交叉熵了！用PyTorch手把手实现Siamese网络，搞定人脸比对和商品相似度

申月有五

孪生网络实战：从对比损失原理到PyTorch商品去重系统

当你在电商平台搜索"白色运动鞋"时，为什么系统能准确排除黑色皮鞋？当你在相册输入人脸照片，手机如何从几千张照片中筛选出同一个人的所有影像？这背后可能都藏着一个关键技术——Siamese Network（孪生网络）。与传统分类网络不同，这种特殊架构通过"比较"而非"分类"来实现智能识别，成为人脸验证、商品去重等场景的利器。

1. 为什么交叉熵在相似性任务中会失灵？

在构建图像相似度系统时，很多开发者的第一个直觉是使用经典的交叉熵损失函数。但实际测试会发现，这种常规方案在相似性度量任务中往往表现不佳。根本原因在于两种任务本质差异：

分类任务：需要绝对判断（这张图片是猫还是狗？）
相似性任务：需要相对比较（这两张图片是否属于同一类？）

python复制# 典型分类网络结构（不适合相似性任务）
class ClassificationModel(nn.Module):
    def __init__(self):
        super().__init__()
        self.conv1 = nn.Conv2d(3, 64, kernel_size=3)
        self.fc = nn.Linear(256, 10)  # 输出10个类别概率
        
    def forward(self, x):
        x = F.relu(self.conv1(x))
        return F.softmax(self.fc(x), dim=1)

交叉熵损失关注的是单个样本的类别概率分布，而相似性任务需要同时考虑两个样本的特征关系。下表对比了两种任务的差异要素：

对比维度	分类任务	相似性任务
输入形式	单张图像	图像对/三元组
输出目标	类别标签	相似度分数
损失函数	交叉熵	对比损失/Triplet损失
特征空间优化	类间分离	同类聚集/异类远离
典型应用	ImageNet分类	人脸验证、商品去重

提示：当你的任务是判断"这两个东西是否属于同一类"而非"这个东西属于哪一类"时，就该考虑Siamese架构了

2. 对比损失函数深度解析

2.1 对比损失数学原理

对比损失(Contrastive Loss)的核心思想是：让相似样本在特征空间中靠近，不相似样本彼此远离。其数学表达式为：

$$
L = \frac{1}{2N} \sum_{n=1}^N y \cdot d^2 + (1-y) \cdot \max(margin - d, 0)^2
$$

其中：

$d$：两个样本特征的欧氏距离
$y$：标签（1表示不相似，0表示相似）
$margin$：预设的安全距离阈值

python复制# PyTorch实现对比损失
class ContrastiveLoss(nn.Module):
    def __init__(self, margin=1.0):
        super().__init__()
        self.margin = margin
        
    def forward(self, output1, output2, label):
        euclidean_distance = F.pairwise_distance(output1, output2)
        loss = torch.mean(
            label * torch.pow(euclidean_distance, 2) +
            (1-label) * torch.pow(torch.clamp(self.margin - euclidean_distance, min=0.0), 2)
        )
        return loss

2.2 参数margin的调优技巧

margin是影响模型性能的关键超参数：

margin过小：模型难以有效分离不相似对
margin过大：可能导致训练难以收敛

通过电商商品数据实验得到的经验值参考：

数据类型	推荐margin范围	训练epoch
服装类目	1.2-1.5	50-80
电子产品	1.5-2.0	80-120
家居用品	1.0-1.3	60-100

实际项目中，建议采用动态margin策略：

python复制# 动态margin调整示例
def adjust_margin(epoch, initial_margin=1.0):
    if epoch < 10:
        return initial_margin
    elif 10 <= epoch < 30:
        return initial_margin * 1.2
    else:
        return initial_margin * 1.5

3. 完整PyTorch实现：商品去重系统

3.1 数据准备与Pair生成

商品去重系统的数据流需要特殊处理——必须构造相似对和不相似对：

python复制from torch.utils.data import Dataset
import random

class ProductPairDataset(Dataset):
    def __init__(self, image_folder):
        self.class_dict = build_class_dict(image_folder)  # {class_id: [img_paths]}
        
    def __getitem__(self, idx):
        # 50%概率生成相似对
        if random.random() > 0.5:
            class_id = random.choice(list(self.class_dict.keys()))
            img1, img2 = random.sample(self.class_dict[class_id], 2)
            label = 0  # 相似
        else:
            class1, class2 = random.sample(list(self.class_dict.keys()), 2)
            img1 = random.choice(self.class_dict[class1])
            img2 = random.choice(self.class_dict[class2])
            label = 1  # 不相似
            
        img1 = load_and_transform(img1)
        img2 = load_and_transform(img2)
        return img1, img2, label

3.2 网络架构设计

共享权重的Siamese网络核心实现：

python复制import torchvision.models as models

class SiameseNetwork(nn.Module):
    def __init__(self):
        super().__init__()
        # 以ResNet18为特征提取器
        self.cnn = models.resnet18(pretrained=True)
        self.cnn.fc = nn.Identity()  # 移除原始全连接层
        
        # 自定义投影头
        self.projection = nn.Sequential(
            nn.Linear(512, 256),
            nn.BatchNorm1d(256),
            nn.ReLU(),
            nn.Linear(256, 128)  # 最终输出128维特征
        )
        
    def forward_once(self, x):
        features = self.cnn(x)
        return self.projection(features)
        
    def forward(self, input1, input2):
        output1 = self.forward_once(input1)
        output2 = self.forward_once(input2)
        return output1, output2

3.3 训练技巧与监控

商品去重任务特有的训练策略：

困难样本挖掘：每轮训练后，找出预测结果与标签差异最大的样本对，下轮优先训练
动态采样比例：随着训练进行，逐步增加困难样本比例
特征可视化：使用t-SNE定期检查特征空间分布

python复制# 训练循环核心代码
def train_epoch(model, dataloader, criterion, optimizer):
    model.train()
    running_loss = 0.0
    
    for img1, img2, labels in dataloader:
        optimizer.zero_grad()
        
        output1, output2 = model(img1, img2)
        loss = criterion(output1, output2, labels)
        
        loss.backward()
        optimizer.step()
        
        running_loss += loss.item()
    
    # 困难样本挖掘
    hard_indices = find_hard_examples(model, dataloader)
    dataloader.dataset.update_sampling_weights(hard_indices)
    
    return running_loss / len(dataloader)

4. 部署优化与性能提升

4.1 在线推理优化

生产环境部署需要考虑的实用技巧：

特征预计算：商品库特征提前计算存储
近似最近邻(ANN)：使用Faiss加速相似度搜索
异步处理：高并发时采用消息队列缓冲请求

python复制# 使用Faiss进行高效相似搜索
import faiss

class SimilaritySearch:
    def __init__(self, dimension=128):
        self.index = faiss.IndexFlatL2(dimension)
        
    def add_features(self, features):
        self.index.add(features)
        
    def search(self, query_feature, k=5):
        distances, indices = self.index.search(query_feature, k)
        return distances[0], indices[0]  # 返回距离和索引

4.2 性能监控指标

不同于分类任务的准确率，相似性系统需要特殊评估指标：

ROC-AUC：综合考量不同阈值下的表现
F1@K：前K个结果中的正确率
推理延迟：99分位响应时间

实际电商项目中的典型性能基准：

指标	入门级	生产级	优秀级
准确率@1	85%	92%	96%+
推理延迟(ms)	300	150	50
QPS	50	200	1000+

在商品去重项目中，最实用的调优经验是定期用bad case反哺训练数据。我们发现，将系统出错的样本对加入训练集，能快速提升模型在边缘案例上的表现。

已经到底了哦

精选内容

1 DHT11传感器数据老跳变？用STM32的SysTick定时器实现精准时序采集与滤波 2 告别STLink！用一根MiniUSB线搞定STM32F103C8T6程序下载（Arduino IDE + Maple Bootloader保姆级教程）3 从MATLAB仿真到5G NR：手把手教你构建莱斯与瑞利信道模型（附代码）4 STM32 IAP 实战：基于 Ymodem 协议的固件升级全流程解析 5 从ACTF2020赛题看文件上传漏洞：Burp抓包改后缀+蚁剑连接完整操作指南 6 MVCC 有点绕，但理顺了是真通透 7 Xilinx Tri-Mode Ethernet MAC IP核：从配置到三速自适应的实战解析 8 【实战解析】~ 从原理到实现：手撕任意占空比分频器的核心思路 9 给医生的AI课：看懂YOLO、DINO在心脏血管造影里找‘狭窄’到底靠不靠谱？10 穿越机DIY进阶：从零构建高可靠FPV图传链路