没有合适的资源?快使用搜索试试~ 我知道了~
ir_datasets:为许多IR排名数据集提供通用接口
共189个文件
py:93个
html:54个
yaml:24个
需积分: 20 1 下载量 21 浏览量
2021-02-21
16:25:43
上传
评论
收藏 442KB ZIP 举报
温馨提示
ir_datasets ir_datasets是一个python软件包,为许多IR临时排名基准,培训数据集等提供了通用接口。它是作为的分支而,以便于与其他系统的轻松集成。 该软件包负责从公共资源获得数据集(包括文档,查询,相关性判断等)的下载。 当数据集不公开时,将提供有关如何获取数据集的说明。 ir_datasets提供了一种通用的迭代器格式,以允许在python中轻松使用它们。 它试图以不变的形式提供数据(即保留所有字段和标记),同时处理文件格式,编码等方面的差异。适配器提供了额外的功能,例如,允许按ID快速查找文档。 也可以使用命令行界面。 您可以找到数据集及其功能的列表。 想要一个新的数据集,增加的功能或修复的错误? 随时发布问题或提出请求! 入门 要快速开始使用Python API,请查看我们的。 通过pip安装: pip install ir_datasets 如
资源推荐
资源详情
资源评论
收起资源包目录
ir_datasets:为许多IR排名数据集提供通用接口 (189个子文件)
CNAME 15B
main.css 5KB
main.css 5KB
.gitignore 2KB
wikir.html 90KB
wikir.html 90KB
index.html 85KB
all.html 84KB
clueweb12.html 71KB
clueweb12.html 71KB
clueweb09.html 68KB
clueweb09.html 68KB
msmarco-passage.html 64KB
msmarco-passage.html 64KB
gov2.html 49KB
gov2.html 49KB
nfcorpus.html 38KB
nfcorpus.html 38KB
msmarco-document.html 37KB
msmarco-document.html 37KB
gov.html 24KB
trec-robust04.html 24KB
gov.html 24KB
trec-robust04.html 24KB
antique.html 23KB
medline.html 23KB
antique.html 23KB
medline.html 23KB
car.html 20KB
car.html 20KB
codesearchnet.html 18KB
pmc.html 18KB
codesearchnet.html 18KB
pmc.html 18KB
cord19.html 17KB
msmarco-qna.html 17KB
cord19.html 17KB
msmarco-qna.html 17KB
highwire.html 13KB
highwire.html 13KB
trec-mandarin.html 12KB
trec-mandarin.html 12KB
trec-spanish.html 12KB
trec-spanish.html 11KB
trec-arabic.html 11KB
trec-arabic.html 11KB
nyt.html 11KB
nyt.html 11KB
python.html 10KB
aquaint.html 8KB
aquaint.html 7KB
index.html 6KB
vaswani.html 4KB
vaswani.html 4KB
all.html 202B
datasets.html 202B
datasets.html 202B
googlef138777977eebf92.html 53B
MANIFEST.in 104B
ir_datasets.ipynb 112KB
main.js 3KB
main.js 2KB
LICENSE 11KB
README.md 12KB
clueweb_warc_checkpoints.md 3KB
highwire.py 66KB
cord19.py 59KB
clueweb09.py 45KB
documentation.py 31KB
clueweb12.py 21KB
wikir.py 16KB
clueweb12.py 16KB
gov2.py 16KB
msmarco_passage.py 15KB
nyt.py 15KB
pmc.py 15KB
msmarco_qna.py 14KB
trec_robust04.py 14KB
gov2.py 13KB
codesearchnet.py 12KB
trec.py 12KB
msmarco_passage.py 11KB
indexed_tsv_docstore.py 11KB
clueweb_warc.py 11KB
clueweb09.py 11KB
download.py 11KB
base.py 10KB
nfcorpus.py 10KB
trec_mandarin.py 9KB
medline.py 9KB
lz4_pickle.py 8KB
msmarco_document.py 8KB
highwire.py 7KB
fileio.py 7KB
trec_arabic.py 7KB
cord19.py 7KB
nfcorpus.py 7KB
codesearchnet.py 7KB
antique.py 7KB
gov.py 6KB
共 189 条
- 1
- 2
资源评论
沐水涤尘
- 粉丝: 24
- 资源: 4626
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功