没有合适的资源?快使用搜索试试~ 我知道了~
hw3_language_model:利用 PyTorch,本作业实现了一个基于word embedding和GRU的语言模型(...
共9个文件
py:4个
txt:2个
jpg:1个
需积分: 50 0 下载量 87 浏览量
2021-05-16
07:50:20
上传
评论
收藏 1.79MB ZIP 举报
温馨提示
作业三:循环神经网络 by Charles 前言 利用 PyTorch,本作业实现了一个基于word embedding和GRU的语言模型(Language Model,以下简称LM)。其包括一个encoder层、一个GRU层和一个decoder层,embedding维度与GRU的hidden state维度均为1500,采用了自己搭建的带有Layer Normalization(LN)的GRU模块,运用了dropout、学习初始状态、锁定encoder与decoder参数、梯度裁剪等技巧来提升模型性能,最终在测试集上模型的perplexity (PP)值为89.52,所得模型大小约为108M。本报告将从模型搭建、模型训练、测试方法等方面对本作业的工作进行详细说明。 作业所有代码以及训练好的模型存放于 hw3_language_model_handed 文件夹中。参考借鉴 Pytorch
资源推荐
资源详情
资源评论
收起资源包目录
hw3_language_model-master.zip (9个子文件)
hw3_language_model-master
main.py 10KB
image
gru_expression.jpg 33KB
data
ptb
valid.txt 390KB
train.txt 4.87MB
prepare_data.py 2KB
.gitignore 1KB
modules.py 6KB
README.md 10KB
build_model.py 3KB
共 9 条
- 1
资源评论
法学晨曦
- 粉丝: 15
- 资源: 4608
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功