该项目可以根据用户给出的上文自动生成下文该项目是本人的本科毕业设计。项目主要基于GPT-2Chinese实现。资源-CSDN文库

共31个文件

py：12个

txt：6个

json：4个

需积分: 5 178 浏览量 2024-05-11 20:50:00 上传评论收藏 496KB ZIP 举报

资源推荐

资源详情

资源评论

收起资源包目录

该项目可以根据用户给出的上文自动生成下文该项目是本人的本科毕业设计。项目主要基于GPT-2 Chinese实现。本人的工作主要是用新的语料库进行了几次训练，得出来了一个还凑合的模型。该项目已经初步完成，不再进行进一步的更新。.zip （31个子文件）

content

spider

FF14Wiki_Spider.py 6KB

Formater.py 2KB

girlsfront_Spider.py 2KB

eval.py 8KB

LICENSE 1KB

cache

vocab_guwen.txt 127KB

vocab_seg.txt 374KB

vocab_all.txt 84KB

make_vocab.sh 114B

make_vocab.py 1KB

vocab_small.txt 61KB

vocab.txt 107KB

generate.py 10KB

tokenizations

encoder.json 26B

vocab.bpe 21B

tokenization_bert_word_level.py 20KB

tokenization_bert.py 19KB

bpe_tokenizer.py 4KB

thulac_dict

seg 30B

__pycache__

bpe_tokenizer.cpython-37.pyc 5KB

tokenization_bert.cpython-37.pyc 15KB

generate.bat 196B

requirements.txt 76B

train.bat 214B

generate_texts.py 9KB

train_single.py 10KB

train.py 12KB

README.md 2KB

config

model_config.json 175B

model_config_small.json 175B

model_config_test.json 169B

[演示视频](https://www.iqiyi.com/v_19rxoxbkhk.html#curid=16678996500_b4cdcb4320cdfae5f480487b73576efb) 项目的深度学习代码基于[GPT-2 Chinese](https://github.com/Morizeyao/GPT2-Chinese)项目。安装方法：请先于NVIDIA官网下载 0) 显卡驱动 1) CUDA 10.1 2) cuDNN 7.6.5 for CUDA 10.1 之后，在Windows Terminal中将工作路径跳转到gpt-2 chinese目录下输入pip install -r requirements.txt 本人在几乎对GPT-2没有改动的前提下，为该项目添加了bat脚本： 0) train.bat 训练脚本 1) generate.bat 生成脚本可以根据自己的需要调整bat脚本 # -语料库- 如果您想使用我们的语料库，可以在[网盘链接](https://pan.baidu.com/s/1LcHMtyhUEqpGa46bA1aDTg)（提取码：9k3e）下载语料库。语料库包含： 0) 已经转换为GPT-2 Chinese要求的JSON格式的《最终幻想14》截至5.1版本的剧本 1）已经转换为GPT-2 Chinese要求的JSON格式的《少女前线》截至4月1日的剧本 2）尚未转换为GPT-2 Chinese要求的JSON格式的《Fate/Grand Order》1.0的剧本爬取和整合数据的方式可以参考文件夹“Spider”中的Python脚本 # -模型- 本人使用了[散文语料](https://github.com/Morizeyao/GPT2-Chinese)预模型、[百度贴吧语料](https://github.com/brightmart/nlp_chinese_corpus)预模型训练了一些可以生成《最终幻想14》风格剧本和《少女前线》风格剧本的模型，如果有需要可以通过[网盘链接](https://pan.baidu.com/s/1xXD8JPS4ibdweMUhu3AwOA)（提取码：uu7p）下载。

评论收藏

内容反馈