news 2026/4/16 16:43:02

如何使用- 台风电机组数据 来自同一风电场的134台风机 风电功率预测 风力发电预测 风电场中所有风力涡轮机的相对位置和高程,以模拟它们之间的空间相关性。

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
如何使用- 台风电机组数据 来自同一风电场的134台风机 风电功率预测 风力发电预测 风电场中所有风力涡轮机的相对位置和高程,以模拟它们之间的空间相关性。

台风电机组数据 来自同一风电场的134台风机 24个月(2020.1-2021.12月)2年的数据 有单台风机每个风机的数据

适用于风电功率预测 风力发电预测
空间分布:它包括风电场中所有风力涡轮机的相对位置和高程,以模拟它们之间的空间相关性。

动态环境特征:数据集提供了SCADA系统检测到的每个风力涡轮机的天qi状况和内部状态,以帮助进行风电预测
包含来自ERA5的NWP数据,时间分辨率为30分钟
附带数据集使用注意事项以及内容说明


1

台风电机组数据集是一个高质量、多维度的风电预测研究资源,包含134 台风机 × 24 个月(2020.1–2021.12)的 SCADA 数据 + ERA5 再分析 NWP 数据 + 空间位置信息。以下是系统化的使用指南,涵盖数据结构、应用场景、建模方法与实操步骤。


✅ 一、数据集核心组成(表格化)

数据类型内容说明时间分辨率用途
SCADA 数据每台风机的:• 实际发电功率(kW)• 风速(m/s)• 风向(°)• 转速(RPM)• 偏航角度• 机舱温度• 故障状态等10 分钟 / 30 分钟(常见)风机内部状态建模、异常检测、功率映射
NWP 数据(ERA5)来自 ECMWF 的再分析数据:• 10m/100m 风速/风向• 气温、气压、湿度• 边界层高度• 地表粗糙度30 分钟提供大尺度气象驱动,用于超短期/短期预测
空间信息每台风机的:• 经纬度(或相对坐标 x, y)• 海拔高程(m)静态构建风机间尾流效应模型、图神经网络(GNN)输入
时间范围2020 年 1 月 – 2021 年 12 月覆盖四季、台风季、低风/高风期,具代表性

📌总样本量估算
134 台 × 24 月 × 30 天 × 48(30分钟/天)≈460 万条记录


✅ 二、典型应用场景

应用方向具体任务所需数据子集
单机功率预测预测某台风机未来 15min~72h 发电功率该机 SCADA + 对应 NWP
全场功率预测预测整个风电场总出力所有风机 SCADA + NWP + 空间布局
尾流效应建模分析上游风机对下游风机的功率损失空间坐标 + 风向 + 功率数据
异常检测识别性能退化或故障风机同类风机功率-风速曲线对比
不确定性量化输出预测区间(如分位数回归)历史误差分布 + 气象不确定性

✅ 三、建模范式与模型选择

1.传统方法(基线)

  • Persistence Model:用当前功率作为未来预测(适用于超短期)
  • Power Curve Mapping:拟合风速 → 功率曲线(忽略动态性)

2.机器学习方法

模型输入特征优势
XGBoost / LightGBMNWP + SCADA 滞后特征(t-1, t-2…)训练快、可解释性强
SVR / Random Forest同上小数据集表现稳定

3.深度学习方法(推荐)

模型适用场景关键设计
LSTM / GRU单机时间序列预测输入:历史功率 + NWP 序列
ConvLSTM融合时空特征将风机视为网格点
Graph Neural Network (GNN)全场预测 + 尾流建模图结构:节点=风机,边=距离/风向相关性
Transformer / Informer长序列依赖(>24h)自注意力捕捉远期气象影响
Hybrid ModelSCADA + NWP + 空间融合如:GNN + LSTM

💡当前 SOTA 方案
Spatio-Temporal GNN + NWP Embedding(如 Graph-WaveNet, MTGNN)


✅ 四、数据预处理关键步骤

步骤 1:数据对齐

# 示例:对齐 SCADA 与 ERA5(30分钟粒度)scada=pd.read_csv("scada_turbine_001.csv")# 时间列: 'timestamp'nwp=pd.read_csv("era5_nwp.csv")# 时间列: 'time'# 统一时间索引(UTC)df=pd.merge(scada,nwp,left_on='timestamp',right_on='time',how='inner')

步骤 2:特征工程

# 构造关键特征df['wind_speed_100m']=np.sqrt(df['u100']**2+df['v100']**2)df['wind_direction']=np.arctan2(df['v100'],df['u100'])*180/np.pi df['air_density']=df['sp']/(287.05*(df['t2m']+273.15))# 理想气体定律# 滞后特征(用于时序模型)forlagin[1,2,3]:df[f'power_lag_{lag}']=df['power'].shift(lag)

步骤 3:构建空间图(用于 GNN)

# 使用风机坐标构建邻接矩阵coords=pd.read_csv("turbine_locations.csv")# 列: turbine_id, x, y, elevationfromsklearn.metricsimportpairwise_distances dist_matrix=pairwise_distances(coords[['x','y']].values)adj_matrix=np.exp(-dist_matrix/sigma)# 高斯核,sigma=典型风机间距np.fill_diagonal(adj_matrix,0)# 自环设为0

✅ 五、完整建模流程(以 GNN 为例)

1. 输入设计

  • 节点特征(每台风机):
    • 历史功率(过去 6 小时)
    • 实时 SCADA(风速、转速等)
    • NWP 预报(未来 6 小时风速、温度等)
  • 图结构:基于空间距离的邻接矩阵

2. 模型架构

# 伪代码(PyTorch Geometric)classWindPowerGNN(torch.nn.Module):def__init__(self):self.gnn_layer=GCNConv(node_features,hidden_dim)self.lstm=LSTM(hidden_dim,lstm_hidden)self.predictor=Linear(lstm_hidden,pred_horizon)defforward(self,x,edge_index,nwp_future):h=self.gnn_layer(x,edge_index)# 融合邻居信息h=self.lstm(h)# 时序建模out=self.predictor(h)+nwp_future# 融合 NWP 先验returnout

3. 损失函数

  • 主损失:MAE 或 RMSE(功率预测)
  • 辅助损失:尾流误差约束(可选)

✅ 六、评估指标(风电预测标准)

指标公式说明
MAE1 N ∑ ∣ y − y ^ ∣ \frac{1}{N}\sum |y - \hat{y}|N1yy^平均绝对误差(kW)
RMSE1 N ∑ ( y − y ^ ) 2 \sqrt{\frac{1}{N}\sum (y - \hat{y})^2}N1(yy^)2对大误差敏感
MAPE$\frac{100%}{N}\sum \left\frac{y - \hat{y}}{y}\right
NMAEMAE / (装机容量)归一化 MAE(行业标准)

📊行业基准

  • 超短期(15min):NMAE - 短期(24h):NMAE 💡一句话总结
    该数据集是“时空+气象+设备”三位一体的风电预测黄金数据,通过GNN 融合空间布局 + LSTM 建模时序 + NWP 提供先验,可构建高精度、物理一致的风电功率预测系统。

如需以下支持,请告知:

  • 数据对齐与清洗脚本(Python)
  • GNN 完整训练代码(PyG)
  • 与 WRF/FLORIS 物理模型耦合方案
  • 预测结果可视化(功率曲线 + 尾流热力图)

祝您在风电智能预测领域取得突破!🌬️⚡

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/15 20:45:17

LIO-SAM技术架构深度解析:紧耦合激光惯性里程计的性能突破

LIO-SAM技术架构深度解析:紧耦合激光惯性里程计的性能突破 【免费下载链接】LIO-SAM LIO-SAM: Tightly-coupled Lidar Inertial Odometry via Smoothing and Mapping 项目地址: https://gitcode.com/GitHub_Trending/li/LIO-SAM 在自动驾驶与机器人感知领域&…

作者头像 李华
网站建设 2026/4/16 12:02:11

Vibe Kanban完整入门指南:如何高效管理AI编程任务

Vibe Kanban完整入门指南:如何高效管理AI编程任务 【免费下载链接】vibe-kanban Kanban board to manage your AI coding agents 项目地址: https://gitcode.com/GitHub_Trending/vi/vibe-kanban Vibe Kanban是一款专为开发者设计的AI编程代理管理看板工具&a…

作者头像 李华
网站建设 2026/4/16 12:07:18

FRCRN语音降噪镜像核心优势解析|附ClearerVoice-Studio实践

FRCRN语音降噪镜像核心优势解析|附ClearerVoice-Studio实践 在语音处理领域,清晰、干净的音频是高质量通信、智能语音交互和专业录音制作的基础。然而,现实场景中的背景噪声——如空调声、键盘敲击、交通噪音等——常常严重影响语音质量。FR…

作者头像 李华
网站建设 2026/4/16 12:05:55

提升ASR后处理效率|FST ITN-ZH中文ITN转换全场景覆盖

提升ASR后处理效率|FST ITN-ZH中文ITN转换全场景覆盖 在语音识别(ASR)系统落地过程中,一个常被忽视却至关重要的环节是逆文本标准化(Inverse Text Normalization, ITN)。原始ASR输出的文本往往包含大量口语…

作者头像 李华
网站建设 2026/4/16 13:43:59

Sambert中文合成自然度提升:文本预处理技巧实战教程

Sambert中文合成自然度提升:文本预处理技巧实战教程 1. 为什么预处理是语音合成的“隐形开关” 你有没有试过用Sambert生成一段话,结果听起来怪怪的?语调平、停顿生硬、多音字读错、数字念得像机器人……这些问题,90%不是模型本…

作者头像 李华
网站建设 2026/4/11 14:50:01

Yuzu模拟器版本选择指南:告别盲目下载的3个实用技巧

Yuzu模拟器版本选择指南:告别盲目下载的3个实用技巧 【免费下载链接】yuzu-downloads 项目地址: https://gitcode.com/GitHub_Trending/yu/yuzu-downloads 还在为选择哪个Yuzu模拟器版本而纠结吗?每次看到新版本发布都像在开盲盒,不知…

作者头像 李华