# 光伏发电功率预测
## 1、任务:
通过学习历史一段时间内的数值天气预测数据和对应的光伏发电功率训练模型,结合未来某时间点的数值天气预测数据,预测该时间点的光伏发电功率。
### 2、数据:
已上传至Data文件夹中,包括10个电站的历史数据,分为训练集与测试集,其具体数据描述参考:[数据集描述](https://www.dcjingsai.com/common/cmpt/%E5%9B%BD%E8%83%BD%E6%97%A5%E6%96%B0%E7%AC%AC%E4%BA%8C%E5%B1%8A%E5%85%89%E4%BC%8F%E5%8A%9F%E7%8E%87%E9%A2%84%E6%B5%8B%E8%B5%9B_%E7%AB%9E%E8%B5%9B%E4%BF%A1%E6%81%AF.html)
### 3、备注:
因2020年3月20日起,DC竞赛平台评分未配置计算资源无法将进行评分。__因此项目中止,未获得有有效名次。__
### 4、文件描述:
0: 外部运行数据处理、建模和格式化输出的程序;
1:数据探索;
2:利用R语言中OCE函数包计算太阳辐照特征;
3:数据处理;
4:模型建立与结果输出。
### 5、运行方法:
[1] 单独运行文件2;
[2] 使用文件0在外部依次运行文件3和4;
[3] 使用文件0进行格式化输出。
### 6、算法描述:
[1] 评分方法并不计入低于发电功率阈值的数据点。根据辐照度与发电功率阈值的关系,可以建立两类模型:包含辐照度为-1和不包括辐照度为-1的数据集。并将预测中所有低于阈值结果调整至阈值,以图减小误差;
[2] 依据辐射度变化规律,推测日出时间,进而将十个电厂的地理位置归为以下四处:海西、哈密、西宁、乌鲁木齐。利用R语言包OCE,将数据集中的时间、地理位置输入,得到太阳高度、赤纬角、预测辐照度等太阳功率的特征,加入到数据集中;
[3] 光伏发电功率是一个存在日周期性和季度特征变化的变量,可以将其视为时间序列处理。利用Facebook开发的fbprophet时间序列工具对训练集中的时间和功率进行拟合,构造出功率的预测值、预测值上限、预测值下限三个特征,加入到数据集中;
[4] 鉴于数据集中发电功率存在大量不可有气象数据解释的功率异常点,本算法结合实际辐照度和功率之间的应呈线性正比的特殊关系,进行了数据筛选。但此过程中发现实际辐照度已存在众多异常点,因此建立每月固定时间点的功率应符合正态分布的假设,对数据进行了[5%,95%]分位的筛选,异常的数据可以由中位数填充。
[5] 构造了前一时间点、与月平均值差值、季度等新特征,并应用sklearn中的多项式特征、标准化、PCA等函数进行了数据处理;
[6] 在建模方面,采用XgBoost、Lasso、ElasticNet、SVR、DNN、LSTM建立了单独的模型,并集合Grid_Search进行了初步的参数调优。因数据集中存在较多的缺失时间段,故放弃LSTM模型。XgBoost、SVR和DNN的训练时间较长, 线性模型的Lasso和ElasticNet训练较快。
[7] 在训练集拟合的模型评分与平台评估的模型评分具有较大差异(5%以上)。推测其原因:一部分是树模型Xgboost对离群点较为敏感;测试集中亦有可能存在较多无法预测的异常点数据,给预测结果带来了较大偏差;部分数据集(train_10)等电站数据存在大量不可用现有数据解释的样本,模型偏差较大。
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
风电光伏人工智能竞赛(DataFountain光伏发电量预测/百度KDD杯 2022/photovoltaics/PVPredict/Wind_predict_seq2seq/国能日新光伏竞赛/光伏第三方库)
资源推荐
资源详情
资源评论
收起资源包目录
风电光伏人工智能竞赛(DataFountain光伏发电量预测/百度KDD杯 2022/光伏第三方库等等) (258个子文件)
checkpoint 185B
wtbdata_245days.csv 318.82MB
0001in.csv 17.73MB
train_9.csv 8.32MB
电站4_气象.csv 8.1MB
电站2_气象.csv 8.09MB
电站5_气象.csv 8.09MB
电站3_气象.csv 8.09MB
电站1_气象.csv 8.08MB
电站7_气象.csv 8.07MB
电站10_气象.csv 8.04MB
电站9_气象.csv 8.04MB
电站6_气象.csv 8.04MB
电站8_气象.csv 8MB
train_10.csv 7.98MB
train_2.csv 7.73MB
train_4.csv 7.63MB
train_6.csv 7.62MB
train_1.csv 7.53MB
train_7.csv 5.67MB
train_5.csv 4.22MB
train_3.csv 3.97MB
0001out.csv 2.55MB
test_4.csv 1.3MB
test_9.csv 1.29MB
test_5.csv 1.28MB
test_6.csv 1.25MB
test_10.csv 1.25MB
test_3.csv 1.14MB
test_2.csv 1.14MB
test_1.csv 1.1MB
test_8.csv 1.06MB
public.train.csv 1.04MB
train_8.csv 914KB
public.test.csv 895KB
test_7.csv 866KB
adj_matrix.csv 438KB
sdwpf_baidukddcup2022_turb_location.CSV 3KB
sdwpf_baidukddcup2022_turb_location.csv 3KB
model.ckpt-6521.data-00000-of-00001 444B
model.ckpt-6546.data-00000-of-00001 444B
model.ckpt-16001.data-00000-of-00001 444B
.DS_Store 10KB
.DS_Store 6KB
.DS_Store 6KB
.gitignore 203B
.gitignore 50B
.gitignore 47B
.gitignore 33B
.gitkeep 0B
lstm_model_8805_a8485.h5 2.49MB
tdata1.h5 1.3MB
twomonthes.h5 202KB
fitt.h5 163KB
KDDCup2022-Baidu-master.iml 452B
kddcup2022.iml 441B
model.ckpt-6521.index 681B
model.ckpt-16001.index 681B
model.ckpt-6546.index 681B
fitted.ipynb 1.43MB
wind.ipynb 367KB
DataInsight_code.ipynb 161KB
DataInsight_code-checkpoint.ipynb 161KB
DataCastle国能日新光伏功率预测.ipynb 41KB
1_数据探索.ipynb 11KB
2_太阳功率特征功率构造.ipynb 3KB
data.ipynb 3KB
0_外部运行程序.ipynb 2KB
LICENSE 34KB
README.md 3KB
README.md 2KB
README.md 2KB
README.md 2KB
README.md 1KB
README.md 606B
README.md 254B
model.ckpt-6521.meta 264KB
model.ckpt-16001.meta 264KB
model.ckpt-6546.meta 264KB
kddcup22_88vip_technical_report.pdf 662KB
Baidu_KDD_Cup_2022_Workshop_paper_8243.pdf 629KB
Baidu_KDD_Cup_2022_Workshop_paper_2696.pdf 409KB
scaler.pickle 617B
scaler.pickle 546B
similarMap.pkl 9.9MB
countMap_1.pkl 145KB
countMap_2.pkl 144KB
countMap_4.pkl 144KB
countMap_3.pkl 130KB
similarMap_1.pkl 35KB
similarMap_2.pkl 33KB
similarMap_4.pkl 33KB
similarMap_3.pkl 31KB
model.png 85KB
1.png 49KB
show.png 46KB
checkpoint.pth 6.37MB
checkpoint_horizon_288.pth 175KB
checkpoint_horizon_216.pth 132KB
checkpoint_horizon_144.pth 89KB
共 258 条
- 1
- 2
- 3
资源评论
qq742234984
- 粉丝: 1w+
- 资源: 35
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功