Informer滚动预测实战：从零构建科研级长期预测框架（附完整代码与调优指南）

德国人Leo乐柏说

1. Informer模型与滚动预测基础

时间序列预测是数据分析中的常见需求，无论是电力负荷预测、股票走势分析还是气象预报，都需要根据历史数据预测未来趋势。传统方法如ARIMA、LSTM在面对长期预测任务时往往力不从心，而Informer模型通过改进Transformer架构，在长序列时间序列预测(LSTF)任务中表现出色。

滚动预测是实际应用中更符合业务需求的预测方式。想象一下天气预报场景：气象台不会一次性预测未来30天的天气，而是每天根据最新观测数据更新预测结果。这种"预测-更新-再预测"的循环就是滚动预测的核心思想。相比单次预测，滚动预测能持续修正预测偏差，提高长期预测的准确性。

官方Informer代码虽然提供了基础预测功能，但存在两个主要局限：一是只能进行固定长度的单次预测，二是缺乏完整的评估体系。我在原代码基础上实现了自动化滚动预测功能，主要改进包括：

自动数据填充机制：每次预测后自动将预测结果作为新输入
多轮预测结果整合：将各轮预测结果拼接为完整时间序列
可视化评估模块：生成预测曲线与误差分析报告

python复制# 滚动预测核心逻辑示例
def rolling_predict(model, initial_data, steps, window):
    predictions = []
    current_data = initial_data.copy()
    
    for _ in range(steps // window):
        # 单次预测
        pred = model.predict(current_data[-seq_len:])
        predictions.extend(pred)
        
        # 自动填充新数据
        current_data = np.concatenate([current_data, pred])
    
    return predictions

2. 环境配置与数据准备

2.1 开发环境搭建

建议使用Python 3.8+和PyTorch 1.10+环境。为方便复现，推荐使用conda创建独立环境：

bash复制conda create -n informer python=3.8
conda activate informer
pip install torch==1.10.0+cu113 -f https://download.pytorch.org/whl/torch_stable.html
pip install pandas scikit-learn matplotlib

硬件方面，GPU加速可以显著提升训练速度。我在RTX 3090上测试，相比CPU训练速度提升约8倍。如果没有GPU，可以减小batch_size和d_model参数降低计算需求。

2.2 数据预处理要点

ETTh1数据集包含电力系统7个维度的指标（温度、湿度等）和1个时间戳列。预处理时需要注意：

时间戳标准化：将时间戳转换为模型可识别的数值特征
缺失值处理：电力数据常有采集缺失，可采用线性插值填补
数据归一化：不同指标量纲差异大，需做MinMax归一化

python复制# 数据预处理示例代码
def preprocess_data(df):
    # 时间特征提取
    df['hour'] = df['date'].dt.hour
    df['day_of_week'] = df['date'].dt.dayofweek
    
    # 归一化
    scaler = MinMaxScaler()
    scaled_values = scaler.fit_transform(df[feature_columns])
    df[feature_columns] = scaled_values
    
    # 构建时序样本
    X, y = [], []
    for i in range(len(df)-seq_len-pred_len):
        X.append(df.iloc[i:i+seq_len][feature_columns].values)
        y.append(df.iloc[i+seq_len:i+seq_len+pred_len][target_column].values)
    return np.array(X), np.array(y)

3. 模型关键参数解析

3.1 核心架构参数

d_model（512）：特征维度，越大表示模型容量越大，但计算开销也越大。对于简单数据集可以降至256
n_heads（8）：注意力头数，建议设置为特征数的约数
e_layers/d_layers（2/1）：编码器/解码器层数，层数增加可能提升效果但也会导致过拟合

3.2 序列长度参数

seq_len（96）：历史窗口大小。电力数据具有日周期（24小时），设置为4天（96小时）效果较好
label_len（48）：解码器初始输入长度，通常设为seq_len的1/2
pred_len（24）：预测长度，设置为24小时（1天）符合业务需求

python复制# 参数设置示例
args = {
    'seq_len': 96,      # 输入序列长度
    'label_len': 48,    # 解码器初始序列长度
    'pred_len': 24,     # 预测序列长度
    'd_model': 512,     # 模型维度
    'n_heads': 8,       # 注意力头数
    'e_layers': 2,      # 编码器层数
    'd_layers': 1,      # 解码器层数
    'd_ff': 2048,       # 前馈网络维度
    'factor': 5,        # ProbSparse因子
    'dropout': 0.05     # 丢弃率
}

4. 滚动预测实现细节

4.1 预测流程优化

原始滚动预测需要手动拼接预测结果，我实现的自动化流程包括：

初始化：加载模型和初始数据窗口
预测阶段：模型预测未来pred_len个时间点
更新阶段：将预测结果拼接到历史数据末尾
滑动窗口：移除最早的数据，保持序列长度不变

4.2 结果评估方法

为全面评估预测效果，实现了三种评估方式：

点对点误差：MAE、MSE、RMSE
趋势准确性：预测方向与真实变化方向的一致性
可视化对比：预测曲线与真实曲线的重叠展示

python复制# 评估指标计算
def evaluate_predictions(true, pred):
    mae = np.mean(np.abs(true - pred))
    mse = np.mean((true - pred)**2)
    
    # 趋势准确率
    true_dir = np.sign(true[1:] - true[:-1])
    pred_dir = np.sign(pred[1:] - pred[:-1])
    trend_acc = np.mean(true_dir == pred_dir)
    
    return {'MAE': mae, 'MSE': mse, 'TrendAccuracy': trend_acc}

5. 调优技巧与常见问题

5.1 效果提升技巧

注意力蒸馏：通过distil参数控制，能有效减少长序列的计算开销
学习率预热：前5个epoch逐步提高学习率，避免初期震荡
混合精度训练：use_amp=True可减少显存占用，允许更大batch_size

5.2 典型问题解决

内存不足：减小batch_size或seq_len
预测值偏移：检查inverse参数是否设置为True
训练震荡：尝试减小学习率或增加patience参数

python复制# 学习率预热实现
def adjust_learning_rate(optimizer, epoch, args):
    lr = args.learning_rate
    if epoch < 5:  # 前5个epoch逐步提高学习率
        lr = lr * (epoch + 1) / 5
    for param_group in optimizer.param_groups:
        param_group['lr'] = lr

6. 自定义数据集适配

6.1 数据格式要求

模型支持标准CSV格式，需包含：

时间列：明确标记为date或time
特征列：多个相关时序特征
目标列：待预测的指标

6.2 关键修改步骤

修改data_parser字典，添加自定义数据集配置
调整enc_in/dec_in参数匹配特征数
设置正确的target参数指定预测目标列

python复制# 自定义数据集配置示例
data_parser['my_data'] = {
    'data': 'custom_data.csv',
    'T': 'target_column',  # 目标列名
    'M': [feature_num, feature_num, feature_num],  # 多元预测
    'S': [1, 1, 1],        # 单元预测
    'MS': [feature_num, feature_num, 1]  # 多元预测单元
}

7. 完整代码结构与执行流程

项目主要文件结构：

code复制informer-rolling/
├── data/                # 数据目录
│   ├── ETTh1.csv        # 原始数据
│   └── ETTh1-Test.csv   # 测试数据
├── checkpoints/         # 模型保存
├── utils/               # 工具函数
│   ├── metrics.py       # 评估指标
│   └── timefeatures.py  # 时间特征处理
├── exp/                 # 实验模块
│   └── exp_informer.py  # 主实验类
└── main_informer.py     # 入口文件

典型执行流程：

数据准备：将数据集放入data目录
模型训练：python main_informer.py --data custom --do_train True
滚动预测：python main_informer.py --data custom --do_predict True --is_rolling_predict True
结果可视化：在results目录查看生成的图表和CSV文件

8. 进阶优化方向

对于希望进一步提升效果的开发者，可以考虑：

特征工程：添加节假日标记、天气等外部特征
模型融合：结合Informer与线性模型的优势
在线学习：定期用新数据微调模型参数
不确定性估计：输出预测值的置信区间

python复制# 不确定性估计示例
class ProbabilisticInformer(nn.Module):
    def __init__(self, model):
        super().__init__()
        self.model = model
        self.logvar = nn.Linear(model.d_model, model.pred_len)
    
    def forward(self, x):
        mean = self.model(x)
        logvar = self.logvar(x[:, -1:])
        return torch.distributions.Normal(mean, torch.exp(0.5*logvar))

实际项目中，我发现预测效果与数据质量强相关。曾遇到因传感器故障导致数据异常，使预测误差突然增大。建议在预处理阶段加入严格的数据质量检查，这对工业级应用尤为重要。

已经到底了哦

精选内容

1 【实战】SSCOM串口调试：从虚拟串口搭建到双工通信模拟 2 别再自己造轮子了！用这个开箱即用的Vue3+TS后台模板，5分钟搞定权限路由和国际化 3 【从零到一】3dMax现代简约餐椅建模全流程解析 4 RT-Thread软件包生态初体验：手把手教你为Simulator添加LVGL图形库支持 5 手把手调试：用CANoe/CANalyzer抓包分析UDS多帧传输（FF/FC/CF）全流程 6 小米刷机报错Sending sparse super的深度排查与实战修复指南 7 从AT8870到H桥实战：直流电机驱动芯片的选型、替换与核心控制逻辑详解 8 从5V到1.8V：聊聊手机和IoT设备里电平标准是怎么越做越“低”的 9 汽车电子 -- 车载ADAS之FCW(前方碰撞预警)法规与算法实战解析 10 突破NCBI下载限制：利用Python并行化脚本高效获取海量蛋白与基因序列