没有合适的资源?快使用搜索试试~ 我知道了~
LEXB:用于构建南蒂罗尔州法规(IT-DE)的LEXB并行语料库的Python脚本
共17个文件
py:10个
pdf:2个
md:2个
需积分: 9 0 下载量 161 浏览量
2021-04-18
03:09:37
上传
评论
收藏 480KB ZIP 举报
温馨提示
LEXB语料库 LEXB语料库是南蒂罗尔州立法的双语(意大利语-德语)集合。 语料库有三种版本: LEXB_full :语料库的完整版本,带有上下文,结构和语言信息。 可以在[corpora.dipintra.it]上咨询该语料库。 LEXB_tm :语料库的原始版本,用作翻译记忆库。 LEXB_mt :用于MT训练和/或MT适应的语料库的完全清洗和过滤后的版本。
资源详情
资源评论
资源推荐
收起资源包目录
LEXB-master.zip (17个子文件)
LEXB-master
mt
tmx_cleaner.py 22KB
removing_test-set_from_training-set.py 2KB
LexScraper_tm.py 2KB
dataset_splitting_dedupe.py 6KB
README.md 3KB
evaluation_metrics.py 5KB
full
LexScraper_full.py 14KB
parallel_URLs_stplc_full.csv 1018KB
it_URLs_stplc_full.txt 514KB
unpaired_texts_filter.py 4KB
tagsets
it_modified_tagset.pdf 45KB
de_modified_tagset.pdf 281KB
aligned2ladder.py 8KB
dehyphenation.py 3KB
de_URLs_stplc_full.txt 503KB
collect_parallelURLs.py 5KB
README.md 512B
共 17 条
- 1
流浪的夏先森
- 粉丝: 22
- 资源: 4688
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0