进行中 · 更新于 6月1日

南网五省月度用电量预测平台

面向南方电网五省的月度用电量预测系统,覆盖数据管线、LightGBM/XGBoost 建模、泄漏控制、冻结残差层级校正、深圳缩放和汇总审计的端到端工程方案。

LightGBMXGBoostPythonPandasScikit-learnShapely

项目背景

为南方电网五省(云南、广东、广西、海南、贵州)构建月度用电量预测系统。项目从 2024 年启动,经历了 V1 到 V3 三次技术迭代,目前已形成稳定的”模型基础预测 + 冻结规则增强链 + 汇总审计”工作流。

核心技术方案

  • 多模型框架:五省各自使用经过历史验证的最优候选模型(LightGBM/XGBoost),每个 horizon 独立训练直接多步模型
  • 特征体系:120+ 维特征,覆盖滞后、滚动统计、增长率、日历、天气、宏观和异常波动
  • 泄漏控制:三级防线 — 排除预测月真实气象版本、final test 不参与调参、未来实际电量不进入训练
  • 规则增强:冻结残差层级校正(5 省通用)+ 云南 Ridge 直接残差 + 广西月份融合 + 广东恢复上限 + 深圳缩放

当前进展

  • 最新发布窗口:2026-05 至 2026-12
  • 五省省月平均准确率 95.90%,WMAPE 4.11%
  • 已建立 wide/long/metadata/sum_check 多格式审计交付规范
  • 异常波动特征目前覆盖至 2026-05,后续需扩展

后续计划

  • 引入概率预测和不确定性量化
  • 验证时间序列大模型(Chronos-2、GTT)的适应能力
  • 建立自动化数据新鲜度监控和重训触发机制