【深度学习实战应用案例】时序分析-seq2seq(attention)（代码+数据）.zip

共2个文件

py：1个

csv：1个

版权申诉

5星 · 超过95%的资源 14 浏览量 2022-03-24 15:09:24 上传评论 6 收藏 505KB ZIP 举报

深度学习是一种人工智能领域的核心技术，它基于神经网络模型对复杂数据进行建模，尤其在处理时序数据方面展现出强大的能力。本资源"【深度学习实战应用案例】时序分析-seq2seq(attention)"是一个深入实践的教程，涵盖了时序数据分析的关键技术——序列到序列（Seq2Seq）模型，并结合注意力机制（Attention）进行详细讲解。以下是关于这些主题的详细说明： 1. **序列到序列（Seq2Seq）模型**： Seq2Seq模型由两个主要部分组成：编码器（Encoder）和解码器（Decoder）。编码器负责将输入序列的信息压缩成一个固定长度的向量，这个向量被称为上下文向量（Context Vector）。解码器则利用这个上下文向量来生成目标序列。Seq2Seq模型最初应用于机器翻译任务，但在语音识别、文本生成、时间序列预测等多个领域都有广泛应用。 2. **时序分析**：时序分析是研究时间序列数据模式和趋势的方法，它涉及到数据的预处理、特征提取、建模和预测等步骤。在深度学习中，时序数据如股票价格、天气预报、人体运动等可以被转化为序列输入，通过Seq2Seq模型进行建模，以预测未来的序列值或进行其他任务。 3. **注意力机制（Attention）**：在Seq2Seq模型中，注意力机制解决了上下文向量可能无法完全捕捉到整个输入序列信息的问题。注意力机制允许解码器在生成每个目标词时，根据需要动态地“关注”输入序列的不同部分。这提高了模型的性能，特别是在长序列处理中。注意力机制通常包括查询（Query）、键（Key）和值（Value）的概念，通过计算查询与键之间的相似度来确定注意力权重。 4. **实战应用**：本资源提供的实战案例可能包含实际的数据集、代码实现和详细的解释，帮助读者理解如何将Seq2Seq模型和注意力机制应用到实际问题中。这可能涉及以下步骤： - 数据准备：预处理时序数据，将其转化为适合深度学习模型的格式。 - 模型构建：搭建Seq2Seq模型，添加注意力层。 - 训练过程：定义损失函数，选择优化器，训练模型并调整超参数。 - 结果评估：使用合适的评价指标如BLEU分数（对于机器翻译）或均方误差（对于时间序列预测）来评估模型性能。通过这个实战案例，学习者不仅可以掌握理论知识，还能通过实践操作加深理解，提升解决问题的能力。对于想要在深度学习领域特别是时序分析方向深化研究的人来说，这是一个非常有价值的资源。

资源推荐

资源详情

资源评论

收起资源包目录

【深度学习实战应用案例】时序分析-seq2seq(attention)（代码+数据）.zip （2个子文件）

【深度学习实战应用案例】时序分析-seq2seq(attention)（代码+数据）

seq2seq.py 23KB

AEP_hourly.csv 3.24MB

# -*- coding: utf-8 -*- # @Time : 2020/12/3 13:39 # @Author : import pandas as pd import torch import torch.nn as nn from sklearn.metrics import mean_squared_error from torch import optim import torch.nn.functional as F import time from sklearn.preprocessing import MinMaxScaler import numpy as np import random from torch.utils.data import TensorDataset, DataLoader from torch.utils.tensorboard import SummaryWriter # writer = SummaryWriter() device = torch.device("cuda" if torch.cuda.is_available() else "cpu") print(f'device is {device}') class EncoderRNN(nn.Module): def __init__(self, input_size, hidden_size, output_dim, n_layers, drop_prob=0): super(EncoderRNN, self).__init__() self.hidden_dim = hidden_size self.n_layers = n_layers self.gru = nn.GRU(input_size, hidden_size, n_layers, batch_first=True, dropout=drop_prob) self.fc = nn.Linear(hidden_size, output_dim) self.relu = nn.ReLU() def forward(self, input, hidden=None): if hidden == None: output, hidden = self.gru(input) else: output, hidden = self.gru(input, hidden) # output = self.fc(self.relu(output[:, -1])) output = self.fc(output[:, -1]) return output, hidden def init_hidden(self, batch_size): # weight = next(self.parameters()).data hidden = torch.zeros(self.n_layers, batch_size, self.hidden_dim, device=device) return hidden class DecoderRNN(nn.Module): def __init__(self, input_size, hidden_size, output_size, n_layers, drop_prob=0): super(DecoderRNN, self).__init__() self.hidden_size = hidden_size self.n_layers = n_layers self.gru = nn.GRU(input_size, hidden_size, n_layers, batch_first=True, dropout=drop_prob) self.out = nn.Linear(hidden_size, output_size) self.relu = nn.ReLU() def forward(self, input, hidden): output, hidden = self.gru(input, hidden) # output = self.out(self.relu(output[:, -1])) output = self.out(output[:, -1]) return output, hidden def init_hidden(self, batch_size): # weight = next(self.parameters()).data # hidden = weight.new(self.n_layers, batch_size, self.hidden_size).zero().to(device) hidden = torch.zeros(self.n_layers, batch_size, self.hidden_size, device=device) return hidden class AttnDecoderRNN(nn.Module): def __init__(self, input_size, hidden_size, output_size, input_length, dropout_p=0.1): super(AttnDecoderRNN, self).__init__() self.hidden_size = hidden_size self.output_size = output_size self.dropout_p = dropout_p self.attn = nn.Linear(self.hidden_size + input_size, input_length) self.attn_combine = nn.Linear(self.hidden_size + input_size, self.hidden_size) self.dropout = nn.Dropout(self.dropout_p) self.gru = nn.GRU(self.hidden_size, self.hidden_size, batch_first=True) self.out = nn.Linear(self.hidden_size, self.output_size) def forward(self, input, hidden, encoder_outputs): hidden = hidden.view(-1, 1, self.hidden_size) attn_weights = F.softmax( self.attn(torch.cat((input[:, 0], hidden[:, 0]), 1)), dim=1) attn_applied = torch.bmm(attn_weights.unsqueeze(1), encoder_outputs) output = torch.cat((input[:, 0], attn_applied[:, 0]), 1) # print(output.size()) output = self.attn_combine(output).unsqueeze(1) # print(output.size()) output = F.relu(output) hidden = hidden.view(1, -1, self.hidden_size) output, hidden = self.gru(output, hidden) output = self.out(output[:, -1]) return output, hidden, attn_weights def init_hidden(self, batch_size): weight = next(self.parameters()).data hidden = weight.new(self.n_layers, batch_size, self.hidden_size).zero_().to(device) return hidden def scale(X: np.ndarray, y: np.ndarray): x_sc = MinMaxScaler() x_train_scaled = x_sc.fit_transform(X) y_sc = MinMaxScaler() y_train_scaled = y_sc.fit_transform(y.reshape(-1, 1)) return x_train_scaled, y_train_scaled, x_sc, y_sc def lookback(x, y, days, period=24): # define lookback period inputs = np.zeros((int(x.shape[0] / period) - days, period * (days - 1), x.shape[1])) labels = np.zeros((int(x.shape[0] / period) - days, period * 2)) decoder_inputs = np.zeros((int(x.shape[0] / period) - days, period * 2, x.shape[1])) # print(inputs.shape, labels.shape) for i in range(period * days, x.shape[0] - period, period): """顺移 0---0:90; 1---1:91;...... """ # print(i, period, (i - period * 2) / 96, y[i:i + period].shape) inputs[int((i - period * days) / period)] = x[i - period * days:i - period] labels[int((i - period * days) / period)] = y[i - period:i + period].reshape(-1, ) decoder_inputs[int((i - period * days) / period)] = x[i - period:i + period] # print(i) inputs = inputs.reshape(-1, period * (days - 1), x.shape[1]) labels = labels.reshape(-1, period * 2) decoder_inputs = decoder_inputs.reshape(-1, period * 2, x.shape[1]) # print(x.shape, y.shape) # print(inputs.shape, labels.shape) return inputs, decoder_inputs, labels def RNNTrain(train_loader, learning_rate=0.001, hidden_dim=256, EPOCHS=10): input_dim = next(iter(train_loader))[0].shape[2] output_dim = 1 encoder = EncoderRNN(input_dim, hidden_dim, output_dim, n_layers).to(device) decoder = DecoderRNN(input_dim, hidden_dim, output_dim, n_layers, drop_prob=0).to(device) print('starting training of {} model'.format('RNN')) encoder_optimizer = optim.Adam(encoder.parameters(), lr=learning_rate) decoder_optimizer = optim.Adam(decoder.parameters(), lr=learning_rate) criterion = nn.MSELoss() encoder.train() decoder.train() epoch_times = [] for epoch in range(1, EPOCHS + 1): start_time = time.process_time() avg_loss = 0 counter = 0 # encoder_hidden = encoder.init_hidden(batch_size) for input_tensor, decoder_inputs, target_tensor in train_loader: input_tensor = input_tensor.to(device).float() decoder_inputs = decoder_inputs.to(device).float() target_tensor = target_tensor.to(device).float() # encoder_hidden = encoder_hidden.data encoder.zero_grad() decoder.zero_grad() loss = 0 counter += 1 input_length = input_tensor.size(1) target_length = target_tensor.size(1) for ei in range(input_length): if ei == 0: encoder_output, encoder_hidden = encoder(input_tensor[:, ei, :].unsqueeze(1)) else: encoder_output, encoder_hidden = encoder(input_tensor[:, ei, :].unsqueeze(1), encoder_hidden) # encoder_output, encoder_hidden = encoder(input_tensor) # print(f'input_tensor,{input_tensor},\n encoder_hidden,{encoder_hidden}') decoder_hidden = encoder_hidden use_teacher_forcing = True if random.random() < teacher_forcing_ratio else False # with torch.autograd.set_detect_anomaly(True): if use_teacher_forcing: # teacher forcing:feed the target as the next input for di in range(target_length): decoder_input = decoder_inputs[:, di, :].unsqueeze(1).data # teacher forcing # print(f'teacher forcing {decoder_input,decoder_hidden}') decoder_output, decoder_hidden = decoder(decoder_input, decoder_hidden) # pri

评论收藏

内容反馈

版权申诉