#### 各个文件夹说明
- dataset:主要用于存放数据集与训练用的词表库(大约1.8G,没放上去)内容如下:
- tokens_list_en.pt
- tokens_list_zh.pt
- train.en
- train.zh
- vocab_en.pt
- vocab_zh.pt
[百度网盘地址](https://pan.baidu.com/s/1iCbIqzPC8LxsaIr49TJ1dA?pwd=0709 )[提取码:0709]
- model/transformer_checkpoints:主要用于保存训练数据,主要内容如下
- model_5000.pt
- model_10000.pt
- model_15000.pt
- model_20000.pt
- model_25000.pt
- model_30000.pt
- model_35000.pt
- model_40000.pt
- model_45000.pt
- model_50000.pt
- model_55000.pt
- model_60000.pt
[百度网盘地址](https://pan.baidu.com/s/1bE2QlsVIstkp7MRozNMojg?pwd=0709 )[提取码:0709]
由于自己笔记跑一个epoch太长,五六十个小时,我只训练了十几个小时,在batch_size=32的前提下,每5000个batch_size保存一次,训练到60000.pt就结束了,用的这个版本做的预测。
当然在云服务器跑完了一个完整的epoch,报告最后有结果展示。
- runs/transformer_loss:存放损失函数的数据记录
- 报告中的小练习:主要是在用Transformer做翻译的前,找了一个小案例-CopyTask,作为练手的小项目,报告中有介绍。
- Transforme_MT.ipynb:代码文件,按照网上的教程,自己做注释理解敲了一遍,并修正了一些版本不兼容的问题。# NLP_Report
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
自然语言处理机器翻译大作业项目Python源码+报告文档+词表库资料(95分以上),个人大三学期的期末大作业、经导师指导并认可通过的高分大作业设计项目,评审分98分。主要针对计算机相关专业的正在做大作业的学生和需要项目实战练习的学习者,可作为课程设计、期末大作业。 自然语言处理机器翻译大作业项目Python源码+报告文档+词表库资料(95分以上),自然语言处理机器翻译大作业项目Python源码+报告文档+词表库资料自然语言处理机器翻译大作业项目Python源码+报告文档+词表库资料自然语言处理机器翻译大作业项目Python源码+报告文档+词表库资料自然语言处理机器翻译大作业项目Python源码+报告文档+词表库资料自然语言处理机器翻译大作业项目Python源码+报告文档+词表库资料自然语言处理机器翻译大作业项目Python源码+报告文档+词表库资料自然语言处理机器翻译大作业项目Python源码+报告文档+个人大三学期的期末大作业、经导师指导并认可通过的高分大作业设计项目,评审分98分。主要针对计算机相关专业的正在做大作业的学生和需要项目实战练习的学习者,可作为课程设计、期末大作业。
资源推荐
资源详情
资源评论
收起资源包目录
自然语言处理机器翻译大作业项目Python源码+报告.zip (36个子文件)
-Fox
ReadME.md 1KB
runs
transformer_loss
events.out.tfevents.1673395434.DESKTOP-U2BLGA7.11900.0 40B
events.out.tfevents.1673395516.DESKTOP-U2BLGA7.11900.1 40B
events.out.tfevents.1673439555.DESKTOP-U2BLGA7.17892.0 40B
events.out.tfevents.1673397456.DESKTOP-U2BLGA7.700.0 40B
events.out.tfevents.1673439388.DESKTOP-U2BLGA7.15436.3 40B
events.out.tfevents.1673394403.DESKTOP-U2BLGA7.11504.0 40B
events.out.tfevents.1673397625.DESKTOP-U2BLGA7.700.1 40B
events.out.tfevents.1673395549.DESKTOP-U2BLGA7.11900.2 40B
events.out.tfevents.1673454020.DESKTOP-U2BLGA7.17892.1 40B
events.out.tfevents.1673396376.DESKTOP-U2BLGA7.10532.0 40B
events.out.tfevents.1673393667.DESKTOP-U2BLGA7.27608.0 40B
events.out.tfevents.1673439337.DESKTOP-U2BLGA7.15436.2 40B
events.out.tfevents.1673393746.DESKTOP-U2BLGA7.27608.1 40B
events.out.tfevents.1673397149.DESKTOP-U2BLGA7.17092.0 40B
events.out.tfevents.1673397991.DESKTOP-U2BLGA7.15436.0 40B
events.out.tfevents.1673439186.DESKTOP-U2BLGA7.15436.1 40B
events.out.tfevents.1673394110.DESKTOP-U2BLGA7.14740.0 40B
Transformer_MT.ipynb 51KB
dataset
vocab_zh.pt 105KB
vocab_en.pt 448KB
.idea
Transformer.iml 327B
misc.xml 195B
inspectionProfiles
Project_Default.xml 1KB
profiles_settings.xml 174B
modules.xml 274B
.gitignore 176B
报告中的小练习
.idea
报告中的小练习.iml 327B
misc.xml 195B
inspectionProfiles
Project_Default.xml 1KB
profiles_settings.xml 174B
modules.xml 294B
.gitignore 176B
CopyTask.ipynb 0B
pytorch_test.py 450B
2101978-胡泽航-自然语言处理作业报告.pdf 495KB
共 36 条
- 1
资源评论
猰貐的新时代
- 粉丝: 1w+
- 资源: 2695
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功