实验设置
使用相同的训练/测试数据集对四种模型进行公平对比。
数据集
- 训练:2023 全年数据(8760 个时间点)
- 测试:2024 年 1 月数据(744 个时间点)
- 特征:历史功率 + 气象协变量
模型对比
Chronos-2
Amazon 发布的预训练时序大模型,零样本能力出色:
from chronos import ChronosPipeline
pipeline = ChronosPipeline.from_pretrained("amazon/chronos-t5-large")
forecast = pipeline.predict(context=history, prediction_length=24)
GTT (General Time Transformer)
基于 Transformer 的时序模型,需要微调:
model = GTTModel(input_dim=10, d_model=256, n_heads=8, n_layers=4)
trainer.fit(model, train_loader)
结果总结
Chronos-2 在零样本场景下表现最佳(MAE 2.31),微调后 XGBoost 在短期预测(<6h)任务上更有优势。融合模型结合了预训练模型的泛化能力和 GBDT 的局部拟合能力,最终 MAE 降至 1.98。