没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
日语gpt2 该存储库提供用于训练日语GPT-2模型的代码。 此代码已被用于生产的释放 。 在自己的机器上从头训练日语GPT-2 下载培训语料库并解压缩ja.txt文件。 移动ja.txt文件或修改src/corpus/jp_cc100/config.py到的文件路径相匹配ja.txt与self.raw_data_dir在配置文件中。 通过运行以下ja.txt将ja.txt拆分为较小的文件: cd src/ python -m corpus.jp_cc100.split_to_small_files 通过运行以下命令,在4个GPU上训练中型GPT-2: CUDA_VISIBLE_DEVICES=0,1,2,3 python -m task.pretrain.train --n_gpus 4 --save_model True --enable_log True 与训练有素的模型
资源推荐
资源详情
资源评论
收起资源包目录
japanese-gpt2-master.zip (18个子文件)
japanese-gpt2-master
.gitignore 1KB
requirements.txt 136B
data
tokenizer
google_sp.model 787KB
google_sp.vocab 582KB
src
model
gpt2-ja-small-config.json 739B
gpt2-ja-medium-config.json 740B
corpus
jp_cc100
config.py 218B
split_to_small_files.py 1KB
task
pretrain
checkpoint2huggingface.py 2KB
check_huggingface.py 2KB
data_source.py 1KB
interact.py 4KB
train.py 20KB
helpers.py 901B
optimization
lr_scheduler.py 608B
LICENSE 1KB
README.md 2KB
rinna.png 59KB
共 18 条
- 1
资源评论
biuh
- 粉丝: 23
- 资源: 4737
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 前端-html+css+js实现爱心特效
- c40539bc-071a-486c-9d52-9d0c18d62dac 4.html
- 基于物理的非视域成像(NLOS)算法,利用了nerf+python源码+文档说明
- yuluer知更鸟.7z(1).001
- 基于Qt实现医院信息管理系统c++源码+文档说明+数据库(期末大作业)
- 基于python实现的医院信息管理系统完整源码+sql数据库+详细注释(高分课程设计)
- 基于python的眼底图像视杯视盘分割项目源码+文档说明+截图演示+详细注释(高分课程设计)
- ImageBasedModellingEdu-贰壹贰叁零
- DFFmeasurement-数据预处理
- ImageBasedModellingEdu-回文素数c语言
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功