时间序列预测实战时间序列预测实战

共10个文件

xml：5个

csv：2个

gitignore：1个

需积分: 1 51 浏览量 2023-07-16 17:30:13 上传评论 1 收藏 16KB RAR 举报

资源推荐

资源详情

资源评论

收起资源包目录

基于双向GRU的时间序列预测实战-高质量精讲.rar （10个子文件）

main.py 7KB

.idea

workspace.xml 3KB

misc.xml 194B

inspectionProfiles

Project_Default.xml 9KB

profiles_settings.xml 174B

modules.xml 271B

.gitignore 50B

测试.iml 330B

jieguo.csv 2KB

工作表1.csv 28KB

import matplotlib.pyplot as plt import numpy as np import pandas as pd import torch import torch.nn as nn # import tushare as ts from sklearn.preprocessing import StandardScaler, MinMaxScaler from torch.utils.data import TensorDataset from tqdm import tqdm class Config(): data_path = '工作表1.csv' timestep = 1 # 时间步长，就是利用多少时间窗口 batch_size = 32 # 批次大小 feature_size = 1 # 每个步长对应的特征数量，这里只使用1维，每天的风速 hidden_size = 256 # 隐层大小 output_size = 1 # 由于是单输出任务，最终输出层大小为1，预测未来1天风速 num_layers = 2 # gru的层数 epochs = 50 # 迭代轮数 best_loss = 0 # 记录损失 learning_rate = 0.003 # 学习率 model_name = 'gru' # 模型名称 save_path = './{}.pth'.format(model_name) # 最优模型保存路径 config = Config() # 1.加载时间序列数据 df = pd.read_csv(config.data_path, index_col=0) # 2.将数据进行标准化 scaler = MinMaxScaler() scaler_model = MinMaxScaler() data = scaler_model.fit_transform(np.array(df)) scaler.fit_transform(np.array(df['ZK3/4']).reshape(-1, 1)) # 形成训练数据，例如12345789 12-3456789 def split_data(data, timestep, feature_size): dataX = [] # 保存X dataY = [] # 保存Y # 将整个窗口的数据保存到X中，将未来一天保存到Y中 for index in range(len(data) - timestep): dataX.append(data[index: index + timestep][:, 0]) # data[index:index timestep][:,0]是Python中对二维数组进行切片的语法， # 表示取出data数组中从index到index timestep的行，并且取出每行的第一个元素。 # [:,0]表示取出每行的第一个元素，其中":"表示取出所有行。 dataY.append(data[index + timestep][0]) dataX = np.array(dataX) dataY = np.array(dataY) # print(dataX.shape) # print(dataX) # 获取训练集大小 train_size = int(np.round(0.8 * dataX.shape[0])) # 划分训练集、测试集 x_train = dataX[: train_size, :].reshape(-1, timestep, feature_size) y_train = dataY[: train_size].reshape(-1, 1) x_test = dataX[train_size:, :].reshape(-1, timestep, feature_size) y_test = dataY[train_size:].reshape(-1, 1) return [x_train, y_train, x_test, y_test] # 3.获取训练数据 x_train: 170000,30,1 y_train:170000,7,1 x_train, y_train, x_test, y_test = split_data(data, config.timestep, config.feature_size) # 4.将数据转为tensor x_train_tensor = torch.from_numpy(x_train).to(torch.float32) y_train_tensor = torch.from_numpy(y_train).to(torch.float32) x_test_tensor = torch.from_numpy(x_test).to(torch.float32) y_test_tensor = torch.from_numpy(y_test).to(torch.float32) # 5.形成训练数据集 train_data = TensorDataset(x_train_tensor, y_train_tensor) test_data = TensorDataset(x_test_tensor, y_test_tensor) # 6.将数据加载成迭代器 train_loader = torch.utils.data.DataLoader(train_data, config.batch_size, False) test_loader = torch.utils.data.DataLoader(test_data, config.batch_size, False) # 7.定义GRU网络 class GRU(nn.Module): def __init__(self, feature_size, hidden_size, num_layers, output_size): super(GRU, self).__init__() self.hidden_size = hidden_size # 隐层大小 self.num_layers = num_layers # gru层数 # feature_size为特征维度，就是每个时间点对应的特征数量，这里为1 self.gru = nn.GRU(feature_size, hidden_size, num_layers, batch_first=True)# LSTM RNN self.fc = nn.Linear(hidden_size, output_size) def forward(self, x, hidden=None): batch_size = x.shape[0] # 获取批次大小 # 初始化隐层状态 if hidden is None: h_0 = x.data.new(self.num_layers, batch_size, self.hidden_size).fill_(0).float() else: h_0 = hidden # GRU运算 output, h_0 = self.gru(x, h_0) # 获取GRU输出的维度信息 batch_size, timestep, hidden_size = output.shape # 将output变成 batch_size * timestep, hidden_dim output = output.reshape(-1, hidden_size) # 全连接层 output = self.fc(output) # 形状为batch_size * timestep, 1 # 转换维度，用于输出 output = output.reshape(timestep, batch_size, -1) # 我们只需要返回最后一个时间片的数据即可 return output[-1] model = GRU(config.feature_size, config.hidden_size, config.num_layers, config.output_size) # 定义GRU网络 loss_function = nn.MSELoss() # 定义损失函数 optimizer = torch.optim.AdamW(model.parameters(), lr=config.learning_rate) # 定义优化器 # 8.模型训练 for epoch in range(config.epochs): model.train() running_loss = 0 train_bar = tqdm(train_loader) # 形成进度条 for data in train_bar: x_train, y_train = data # 解包迭代器中的X和Y optimizer.zero_grad() y_train_pred = model(x_train) loss = loss_function(y_train_pred, y_train.reshape(-1, 1)) loss.backward() optimizer.step() running_loss += loss.item() train_bar.desc = "train epoch[{}/{}] loss:{:.3f}".format(epoch + 1, config.epochs, loss) # 模型验证 model.eval() test_loss = 0 with torch.no_grad(): test_bar = tqdm(test_loader) for data in test_bar: x_test, y_test = data y_test_pred = model(x_test) test_loss = loss_function(y_test_pred, y_test.reshape(-1, 1)) if test_loss < config.best_loss: config.best_loss = test_loss # torch.save(model.state_dict(), save_path) print('Finished Training') # 9.绘制结果 plot_size = 200 plt.figure(figsize=(12, 8)) plt.plot(scaler.inverse_transform((model(x_train_tensor).detach().numpy()[: plot_size]).reshape(-1, 1)), "b") plt.plot(scaler.inverse_transform(y_train_tensor.detach().numpy().reshape(-1, 1)[: plot_size]), "r") plt.legend() plt.show() y_test_pred = model(x_test_tensor) # data是一个以为度得列表，这样是把数据写进去一列 print("--------------------------") yuce=scaler.inverse_transform(y_test_pred.detach().numpy()) true=scaler.inverse_transform(y_test_tensor.detach().numpy().reshape(-1, 1)) res = [] for i in range(len(yuce)): temp=[] temp.append(true[i][0]) temp.append(yuce[i][0]) # print() # print(yuce[i][0]) res.append(temp) columns = ['真实值', '预测值'] test = pd.DataFrame(columns=columns, data=res) test.to_csv('jieguo.csv') plt.figure(figsize=(12, 8)) plt.plot(scaler.inverse_transform(y_test_pred.detach().numpy()[: plot_size]), "b") plt.plot(scaler.inverse_transform(y_test_tensor.detach().numpy().reshape(-1, 1)[: plot_size]), "r") plt.legend() plt.show()

评论收藏

内容反馈