没有合适的资源?快使用搜索试试~ 我知道了~
scitldr
共34个文件
py:14个
jsonl:9个
csv:4个
需积分: 10 0 下载量 87 浏览量
2021-03-19
06:41:28
上传
评论
收藏 41.11MB ZIP 举报
温馨提示
科学TLDR 该存储库包含我们的论文“ ”的数据集,模型权重和生成代码。 演示版 可以在找到我们模型的运行演示。 数据集 SciTLDR分为60/20/20训练/开发/测试部分。对于每个文件,每一行都是一个json,格式如下 { "source":[ "sent0", "sent1", "sent2", ... ], "source_labels":[binary list in which 1 is the oracle sentence], "rouge_scores":[precomputed rouge-1 scores], "paper_id":"PAPER-ID", "target":[ "author-tldr", "pr-tldr0", "pr-tldr1
资源推荐
资源详情
资源评论
收起资源包目录
scitldr-master.zip (34个子文件)
scitldr-master
decoder_params.md 439B
LICENSE 11KB
analysis
significance_tests.csv 6KB
human_eval_informativeness.csv 123KB
tldr_pred_nuggets.csv 47KB
tldr_auth_pr_gold_nuggets.csv 36KB
requirements.txt 160B
.gitignore 328B
SciTLDR-Data
make_datafiles.py 4KB
SciTLDR-FullText
train.jsonl 67.96MB
dev.jsonl 18.23MB
test.jsonl 19.58MB
multiprocessing_bpe_encoder.py 4KB
SciTLDR-AIC
train.jsonl 14.85MB
dev.jsonl 4.59MB
test.jsonl 4.92MB
to_stories.py 2KB
build_ctrl_datasets.py 1001B
make_datafiles.sh 2KB
SciTLDR-A
train.jsonl 3.01MB
dev.jsonl 1.07MB
test.jsonl 1.15MB
README.md 4KB
scripts
analyze_email_arxiv_authors.py 2KB
convert_matchsum_predictions_to_files2rouge.py 690B
novelty_stats.py 5KB
get_oracle_sents.py 2KB
cal-rouge.py 6KB
generation_stats.py 2KB
generate.py 4KB
ttest.R 2KB
tldr_analyze_nuggets.py 4KB
convert_scitldr_to_matchsum.py 962B
lexical_variation.py 4KB
共 34 条
- 1
资源评论
msjhfu
- 粉丝: 27
- 资源: 4607
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功