没有合适的资源?快使用搜索试试~ 我知道了~
KGPT:EMNLP2020论文“ KGPT的代码和数据
共55个文件
sh:30个
py:8个
json:6个
需积分: 10 0 下载量 128 浏览量
2021-04-14
14:01:06
上传
评论
收藏 1010KB ZIP 举报
温馨提示
KGPT:知识基础的预培训 EMNLP2020论文代码和数据,本文提出了一种监督监督的预训练算法来训练一般的数据到文本体系结构:1)序列KGPT和2)图表KGPT。 这两个模型都可以应用于各种数据到文本的生成任务。 我们从Wikipedia检索了700万个不受监督的数据到文本数据,以预训练这一代并将其微调到下游任务上。 经过微调的模型可以在多个数据集上实现SOTA,并且在少拍设置下的改进尤其显着。 序列编码器: 图形编码器: 要求: 张量板 tqdm 下载预处理数据集 wget https://kgpt.s3-us-west-2.amazonaws.com/dataset.zip unzip dataset.zip 如果您想进行预培训,请也下载WikiData Graph。 wget https://kgpt.s3-us-west-2.amazonaws.com/preproces
资源推荐
资源详情
资源评论
收起资源包目录
KGPT-main.zip (55个子文件)
KGPT-main
sequence-encoder.png 105KB
preprocess
create_db.py 1KB
Database.py 2KB
properties.json 76KB
README.md 309B
create_summarized.py 2KB
graph-encoder.png 159KB
scripts
e2enlg
train_sequence_e2enlg.sh 280B
train_graph_e2enlg.sh 277B
eval_sequence_e2enlg.sh 330B
train_sequence_e2enlg_fewshot.sh 353B
finetune_sequence_e2enlg_from_wikidata_fewshot.sh 415B
finetune_graph_e2enlg_from_wikidata.sh 342B
eval_sequence_e2enlg_all.sh 378B
eval_graph_e2enlg.sh 290B
finetune_sequence_e2enlg_from_wikidata.sh 346B
.history 2KB
eval_graph_e2enlg_all.sh 389B
wikibio
finetune_sequence_wikibionlg_from_wikidata.sh 350B
eval_sequence_wikibionlg.sh 297B
finetune_sequence_wikibionlg_few_shot.sh 488B
train_graph_wikibionlg.sh 280B
finetune_graph_wikibionlg_from_wikidata.sh 347B
eval_graph_wikibionlg.sh 295B
.history 4KB
train_sequence_wikibionlg.sh 283B
train_sequence_wikibionlg_few_shot.sh 355B
webnlg
finetune_sequence_webnlg_from_wikidata_fewshot.sh 397B
train_graph_webnlg.sh 278B
eval_sequence_webnlg_all.sh 378B
eval_graph_webnlg.sh 290B
finetune_graph_webnlg_from_wikidata.sh 324B
train_sequence_webnlg_fewshot.sh 369B
train_sequence_webnlg.sh 281B
eval_graph_webnlg_all.sh 391B
eval_sequence_webnlg.sh 293B
.history 778B
finetune_sequence_webnlg_from_wikidata.sh 348B
wikidata
train_graph_wikidata_pretraining.sh 308B
train_sequence_wikidata_pretraining.sh 310B
.history 871B
code
run.py 27KB
DataLoader.py 20KB
template-gpt2.py 13KB
Model.py 40KB
preprocess.py 10KB
overview.png 168KB
LICENSE 1KB
README.md 5KB
GPT2_tokenizer
special_tokens_map.json 96B
vocab.json 878KB
added_tokens.json 116B
tokenizer_config.json 26B
knowledge_config.json 276B
merges.txt 446KB
共 55 条
- 1
资源评论
weixin_42097189
- 粉丝: 38
- 资源: 4567
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功