没有合适的资源?快使用搜索试试~ 我知道了~
e2e-cleaning:清理的E2E NLG挑战数据和支持脚本
共93个文件
txt:81个
csv:9个
py:2个
需积分: 9 0 下载量 188 浏览量
2021-05-27
05:23:55
上传
评论
收藏 5.43MB ZIP 举报
温馨提示
清除E2E数据集中的语义噪声 的更新版本,其中包含已清除的MR和脚本,并随附以下论文: OndřejDušek,David M.Howcroft和Verena Rieser(2019):。 在日本东京的INLG 。 清理数据 可以在找到完全清除的E2E NLG Challenge。 对训练和开发集进行过滤,以使它们不与测试集重叠,因此使用no-ol命名。 部分清除的数据(请参见纸张)在。 除非有充分的理由,否则请勿使用它们。 清洗过程 这只是记录我们为获取清理后的数据所做的工作; 您无需运行此程序。 1.)重新注释数据中的MR(如果仅需要部分修复,请使用-t ): ./slot_error.py -f train-fixed.csv path/to/trainset.csv ./slot_error.py -f devel-fixed.csv path/to/devset.csv
资源推荐
资源详情
资源评论
收起资源包目录
e2e-cleaning-master.zip (93个子文件)
e2e-cleaning-master
README.md 3KB
system-outputs
train-orig_test-orig
sclstm.run0.txt 91KB
tgen-minus.run0.txt 71KB
tgen-minus.run2.txt 75KB
tgen-std.run1.txt 84KB
tgen-plus.run3.txt 85KB
tgen-std.run0.txt 82KB
tgen-std.run3.txt 82KB
tgen-minus.run1.txt 75KB
tgen-std.run2.txt 84KB
sclstm.run4.txt 110KB
sclstm.run1.txt 103KB
sclstm.run3.txt 112KB
tgen-plus.run4.txt 82KB
tgen-plus.run1.txt 86KB
tgen-plus.run2.txt 86KB
tgen-minus.run3.txt 64KB
tgen-plus.run0.txt 83KB
sclstm.run2.txt 110KB
tgen-minus.run4.txt 69KB
tgen-std.run4.txt 81KB
train-orig_test-clean
sclstm.run0.txt 266KB
tgen-minus.run0.txt 188KB
tgen-minus.run2.txt 208KB
tgen-std.run1.txt 209KB
tgen-plus.run3.txt 206KB
tgen-std.run0.txt 210KB
tgen-std.run3.txt 204KB
tgen-minus.run1.txt 196KB
tgen-std.run2.txt 219KB
sclstm.run4.txt 304KB
sclstm.run1.txt 290KB
sclstm.run3.txt 309KB
tgen-plus.run4.txt 210KB
tgen-plus.run1.txt 213KB
tgen-plus.run2.txt 220KB
tgen-minus.run3.txt 189KB
tgen-plus.run0.txt 213KB
sclstm.run2.txt 308KB
tgen-minus.run4.txt 189KB
tgen-std.run4.txt 209KB
sclstm_MRs-for-eval.txt 209KB
train-clean_test-clean
sclstm.run0.txt 315KB
tgen-minus.run0.txt 212KB
tgen-minus.run2.txt 204KB
tgen-std.run1.txt 208KB
tgen-plus.run3.txt 210KB
tgen-std.run0.txt 215KB
tgen-std.run3.txt 211KB
tgen-minus.run1.txt 205KB
tgen-std.run2.txt 208KB
sclstm.run4.txt 306KB
sclstm.run1.txt 319KB
sclstm.run3.txt 296KB
tgen-plus.run4.txt 211KB
tgen-plus.run1.txt 207KB
tgen-plus.run2.txt 206KB
tgen-minus.run3.txt 208KB
tgen-plus.run0.txt 213KB
sclstm.run2.txt 315KB
tgen-minus.run4.txt 210KB
tgen-std.run4.txt 213KB
train-clean_test-orig
sclstm.run0.txt 111KB
tgen-minus.run0.txt 80KB
tgen-minus.run2.txt 78KB
tgen-std.run1.txt 80KB
tgen-plus.run3.txt 80KB
tgen-std.run0.txt 81KB
tgen-std.run3.txt 81KB
tgen-minus.run1.txt 78KB
tgen-std.run2.txt 80KB
sclstm.run4.txt 108KB
sclstm.run1.txt 115KB
sclstm.run3.txt 108KB
tgen-plus.run4.txt 81KB
tgen-plus.run1.txt 79KB
tgen-plus.run2.txt 79KB
tgen-minus.run3.txt 79KB
tgen-plus.run0.txt 80KB
sclstm.run2.txt 112KB
tgen-minus.run4.txt 80KB
tgen-std.run4.txt 81KB
slot_error.py 21KB
partially-cleaned-data
cleaned-missed
train-nomiss.no-ol.csv 11.04MB
devel-nomiss.no-ol.csv 1.53MB
test-nomiss.csv 1.83MB
cleaned-added
devel-noadd.no-ol.csv 1.66MB
train-noadd.no-ol.csv 13.2MB
test-noadd.csv 1.89MB
remove_overlaps.py 3KB
cleaned-data
test-fixed.csv 1.83MB
devel-fixed.no-ol.csv 1.51MB
train-fixed.no-ol.csv 10.59MB
共 93 条
- 1
资源评论
马雁飞
- 粉丝: 23
- 资源: 4519
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功