没有合适的资源?快使用搜索试试~ 我知道了~
dataset:Multi30k数据集
共158个文件
gz:53个
de:22个
en:22个
需积分: 50 20 下载量 169 浏览量
2021-05-06
05:35:46
上传
评论
收藏 17.34MB ZIP 举报
温馨提示
Multi30k数据存储库 做好准备 除了数据文件,我们还提供: subword-nmt作为GIT子模块 Moses预处理脚本的最新快照(2017年12月) 在,以最大程度地减少用户之间的处理差异。 为了正确获取所有内容,您需要使用--recursive标志克隆存储库: $ git clone --recursive https://github.com/multi30k/dataset.git multi30k-dataset 视觉特征 可以预先提取的视觉功能,也可以在Flickr30k的原始图像。 可以从 下载test_2017_flickr和test_2018_flickr图像。 任务1 下的原始文件 在下的标记文件。 这些文件是使用预处理脚本。 Multi30K 2018测试仪 您可以使用正在进行的竞赛在2018年测试集上评估模型。 统计数据 train (en) 29
资源推荐
资源详情
资源评论
收起资源包目录
dataset:Multi30k数据集 (158个子文件)
basic-protected-patterns 178B
nonbreaking_prefix.ca 249B
train.lc.norm.tok.cs 1.71MB
test_2018_flickr.lc.norm.tok.cs 69KB
test_2016_flickr.lc.norm.tok.cs 62KB
val.lc.norm.tok.cs 60KB
nonbreaking_prefix.cs 2KB
train.lc.norm.tok.de 2.05MB
train.lc.norm.tok.5.de 2.01MB
train.lc.norm.tok.4.de 1.84MB
train.lc.norm.tok.3.de 1.68MB
train.lc.norm.tok.2.de 1.57MB
train.lc.norm.tok.1.de 1.47MB
test_2018_flickr.lc.norm.tok.de 80KB
val.lc.norm.tok.de 75KB
test_2016_flickr.lc.norm.tok.de 70KB
test_2016.lc.norm.tok.5.de 67KB
test_2016.lc.norm.tok.4.de 66KB
test_2017_flickr.lc.norm.tok.de 64KB
val.lc.norm.tok.4.de 62KB
test_2016.lc.norm.tok.3.de 61KB
val.lc.norm.tok.5.de 61KB
val.lc.norm.tok.2.de 57KB
val.lc.norm.tok.3.de 56KB
test_2016.lc.norm.tok.2.de 55KB
val.lc.norm.tok.1.de 52KB
test_2016.lc.norm.tok.1.de 48KB
test_2017_mscoco.lc.norm.tok.de 30KB
nonbreaking_prefix.de 2KB
nonbreaking_prefix.el 17KB
train.lc.norm.tok.1.en 2.66MB
train.lc.norm.tok.2.en 2.06MB
train.lc.norm.tok.en 1.75MB
train.lc.norm.tok.3.en 1.72MB
train.lc.norm.tok.4.en 1.45MB
train.lc.norm.tok.5.en 1.17MB
val.lc.norm.tok.1.en 97KB
test_2016.lc.norm.tok.1.en 95KB
val.lc.norm.tok.2.en 74KB
test_2016.lc.norm.tok.2.en 73KB
test_2018_flickr.lc.norm.tok.en 70KB
val.lc.norm.tok.en 63KB
val.lc.norm.tok.3.en 62KB
test_2016_flickr.lc.norm.tok.en 62KB
test_2016.lc.norm.tok.3.en 61KB
test_2017_flickr.lc.norm.tok.en 55KB
val.lc.norm.tok.4.en 53KB
test_2016.lc.norm.tok.4.en 51KB
val.lc.norm.tok.5.en 42KB
test_2016.lc.norm.tok.5.en 41KB
test_2017_mscoco.lc.norm.tok.en 25KB
nonbreaking_prefix.en 1KB
nonbreaking_prefix.es 835B
feature-extractor 5KB
nonbreaking_prefix.fi 1KB
train.lc.norm.tok.fr 2.13MB
test_2018_flickr.lc.norm.tok.fr 88KB
val.lc.norm.tok.fr 76KB
test_2016_flickr.lc.norm.tok.fr 75KB
test_2017_flickr.lc.norm.tok.fr 68KB
test_2017_mscoco.lc.norm.tok.fr 31KB
nonbreaking_prefix.fr 1009B
nonbreaking_prefix.ga 171B
.gitmodules 131B
train.1.en.gz 847KB
train.2.en.gz 651KB
train.5.de.gz 643KB
train.de.gz 622KB
train.fr.gz 590KB
train.4.de.gz 584KB
train.cs.gz 580KB
train.en.gz 556KB
train.3.en.gz 542KB
train.3.de.gz 524KB
train.2.de.gz 485KB
train.4.en.gz 455KB
train.1.de.gz 446KB
train.5.en.gz 367KB
multi30k_test_sets_d3ec2a38.tar.gz 169KB
val.1.en.gz 32KB
test_2016.1.en.gz 31KB
test_2018_flickr.de.gz 26KB
test_2018_flickr.fr.gz 25KB
val.2.en.gz 25KB
test_2018_flickr.cs.gz 25KB
test_2016.2.en.gz 24KB
val.de.gz 24KB
test_2016.5.de.gz 23KB
test_2018_flickr.en.gz 23KB
test_2016.4.de.gz 22KB
val.fr.gz 22KB
test_2016_flickr.de.gz 22KB
test_2016_flickr.cs.gz 22KB
test_2016_flickr.fr.gz 22KB
val.cs.gz 22KB
val.en.gz 21KB
val.4.de.gz 21KB
test_2017_flickr.de.gz 21KB
val.5.de.gz 21KB
test_2016.3.de.gz 21KB
共 158 条
- 1
- 2
资源评论
不就是输
- 粉丝: 21
- 资源: 4612
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功