问题定义
给定历史 N 天的发电功率记录和未来 M 小时的气象预报,预测未来 M 小时的发电功率。
数据来源
- 历史功率:逆变器 15 分钟级采集数据
- 气象预报:NWP 模式输出(温度、辐照度、风速、湿度、云量)
- 地理信息:经纬度、倾角、方位角
特征工程
# 时间特征
df['hour_sin'] = np.sin(2 * np.pi * df['hour'] / 24)
df['hour_cos'] = np.cos(2 * np.pi * df['hour'] / 24)
# 滞后特征
for lag in [1, 3, 6, 12, 24]:
df[f'power_lag_{lag}h'] = df['power'].shift(lag)
时间特征和滞后特征对短期预测(24 小时内)贡献最大,而气象协变量在中期预测(48-72 小时)中更为重要。
实验结果
XGBoost 基准模型在仅使用历史功率时 MAE 为 3.5kW,加入气象协变量后降至 2.8kW,再加入时间特征后降至 2.3kW。多源数据融合是提升预测精度的关键。