项目背景
为南方电网五省(云南、广东、广西、海南、贵州)构建月度用电量预测系统。项目从 2024 年启动,经历了 V1 到 V3 三次技术迭代,目前已形成稳定的”模型基础预测 + 冻结规则增强链 + 汇总审计”工作流。
核心技术方案
- 多模型框架:五省各自使用经过历史验证的最优候选模型(LightGBM/XGBoost),每个 horizon 独立训练直接多步模型
- 特征体系:120+ 维特征,覆盖滞后、滚动统计、增长率、日历、天气、宏观和异常波动
- 泄漏控制:三级防线 — 排除预测月真实气象版本、final test 不参与调参、未来实际电量不进入训练
- 规则增强:冻结残差层级校正(5 省通用)+ 云南 Ridge 直接残差 + 广西月份融合 + 广东恢复上限 + 深圳缩放
当前进展
- 最新发布窗口:2026-05 至 2026-12
- 五省省月平均准确率 95.90%,WMAPE 4.11%
- 已建立 wide/long/metadata/sum_check 多格式审计交付规范
- 异常波动特征目前覆盖至 2026-05,后续需扩展
后续计划
- 引入概率预测和不确定性量化
- 验证时间序列大模型(Chronos-2、GTT)的适应能力
- 建立自动化数据新鲜度监控和重训触发机制