Pytorch实现基于CharRNN的文本分类与生成示例_基于循环神经网络（RNN）的文本生成模型资源-CSDN文库

90 浏览量 2020-12-23 05:53:21 上传评论收藏 181KB PDF 举报

资源推荐

资源详情

资源评论

Pytorch实现基于实现基于CharRNN的文本分类与生成示例的文本分类与生成示例

1 简介简介

本篇主要介绍使用pytorch实现基于CharRNN来进行文本分类与内容生成所需要的相关知识，并最终给出完整的实现代码。

2 相关相关API的说明的说明

pytorch框架中每种网络模型都有构造函数，在构造函数中定义模型的静态参数，这些参数将对模型所包含weights参数的维度

进行设置。在运行时，模型的实例将接收动态的tensor数据并调用forword，在得到模型输出之后便可以和真实的标签数据进

行误差计算，并通过优化器进行反向传播以调整模型的参数。下面重点介绍NLP常用到的模型和相关方法。

2.1 nn.Embedding

词嵌入层是NLP应用中常见的模块。在word2vec出现之前，一种方法是使用每个token的one-hot向量进行运算。one-hot是一

种稀疏编码，运算效果较差。word2vec用于生成每个token的Dense向量表示。目前的研究结果证明，word2vec可以有效提升

模型的训练效果。

pytorch的模型提供了Embedding模型用于实现词嵌入过程Embedding层中的权重用于随机初始化词的向量，权重参数在后续

的训练中会被不断调整，并被优化。

模型的创建方法为：embeding = nn.Embedding(vocab_size, embedding_dim)

vocab_size 表示字典的大小

embedding_dim 词嵌入的维度数量，通常设置远小于字典大小，60-300之间通常可满足需要

使用：embeded = embeding(input)

input 需要嵌入的句子，可为任意维度。单个句子表示为token的索引列表，如[283, 4092, 1, ]

output 数据的嵌入表示，shape=[*, embedding_dim]，*为input的维度

示例代码：

import torch

from torch import nn

embedding = nn.Embedding(5, 4) # 假定语料只有5个词，词向量维度为3

sents = [[1, 2, 3],

[2, 3, 4]] # 两个句子，how:1 are:2 you:3, are:2 you:3 ok:4

embed = embedding(torch.LongTensor(sents))

print(embed) # shape=(2

'''

tensor([[[-0.6991, -0.3340, -0.7701, -0.6255],

[ 0.2969, 0.4720, -0.9403, 0.2982],

[ 0.8902, -1.0681, 0.4035, 0.1645]],

[[ 0.2969, 0.4720, -0.9403, 0.2982],

[ 0.8902, -1.0681, 0.4035, 0.1645],

[-0.7944, -0.1766, -1.5941, 0.4544]]], grad_fn=<EmbeddingBackward>)

'''

2.2 nn.RNN

RNN是NLP的常用模型，普通的RNN单元结构如下图所示：

本内容试读结束，登录后可阅读更多

下载后可阅读完整内容，剩余8页未读，立即下载

评论收藏

内容反馈

weixin_38748207

粉丝: 7
资源: 917

Pytorch实现基于CharRNN的文本分类与生成示例

Pytorch 实现RNN分类.zip

pytorch实现用CNN和LSTM对文本进行分类方式

使用pytorch生成文本：使用pytorch GRU构建文本生成模型

Pytorch 实现文本分类

New-Pytorch-Chinese:中文文本摘要，基于pytorch，采用LCSTS数据集

Python-PyTorch实现的轻量seq2seq文本摘要

TextSummarization:Pytorch中的文本摘要此项目的目的是建立一个文本摘要器，以汇总Amazon评论

Python-PyTorch实现的CNNDailyMail文本摘要

RNN实现文本生成

基于pytorch+bert的中文文本分类项目源码（大作业项目）.zip

python基于深度学习框架-PyTorch实战新闻数据集文本分类实战源代码

Python-Pytorch实现的CRAFT文本检测器

Python-PyTorch中的模型摘要类似于Keras中的modelsummary

TextClf：简单易上手的基于pytorch/sklearn的文本分类工具

基于 pytorch-transformers 实现的 BERT 中文文本分类代码

python基于pytorch+bert的中文文本分类源码.zip

神经网络实现英文文本分类（pytorch）

pytorch实现基于BERT的中文新闻事件抽取项目源码.zip

用pytorch实现基于迁移学习的图像分类

Python-PyTorch实现的BERT多标签文本分类

Python-PyTorch实现基于Transformer的神经机器翻译

pytorch实现基于LSTM的高速公路车辆轨迹预测源码+数据集.zip

Pytorch实现基于卷积神经网络的面部表情识别项目源码

基于PyTorch搭建CNN实现视频动作分类任务 有数据有代码 可直接运行 数据

最新资源

基于PyTorch搭建CNN实现视频动作分类任务有数据有代码可直接运行数据