没有合适的资源?快使用搜索试试~ 我知道了~
Python-MTNT嘈杂文本机器翻译的试验台
共56个文件
py:18个
yaml:17个
sh:9个
需积分: 10 0 下载量 165 浏览量
2019-08-09
16:45:33
上传
评论
收藏 50KB ZIP 举报
温馨提示
Code for the EMNLP 2018 paper MTNT: A Testbed for Machine Translation of Noisy Text
资源推荐
资源详情
资源评论
收起资源包目录
Python-MTNT嘈杂文本机器翻译的试验台.zip (56个子文件)
pmichel31415-mtnt-02b351a
recipes
config.ja-en.yaml 5KB
config.en-ja.tune.yaml 3KB
config.en-fr.yaml 5KB
config.en-fr.eval.yaml 3KB
config.fr-en.yaml 5KB
config.ja-en.tune.yaml 3KB
config.en-ja.eval.yaml 2KB
config.ja-en.eval.yaml 2KB
README.md 4KB
config.wmt15.en-fr.1M.eval.yaml 602B
config.fr-en.tune.yaml 3KB
config.en-fr.tune.yaml 3KB
config.en-ja.yaml 5KB
config.fr-en.eval.yaml 3KB
src
util.py 1KB
text.py 3KB
noise.py 4KB
__init__.py 0B
scraper.py 5KB
normalize_punctuation.py 2KB
run_scraper.py 3KB
scripts
start_scraper.sh 205B
remove-tabs.py 355B
build_dic.py 662B
eval_kenlm.py 719B
paired_bootstrap_resampling.py 2KB
bleu_ja.sh 228B
train_ngram_lm.sh 871B
remove-outliers.py 819B
prepare_fr-en.sh 2KB
download_fr.sh 2KB
download_ja.sh 4KB
tokenize_sentencepiece.py 443B
post_processing.sh 1KB
print_stats.py 1KB
train_sentencepiece.py 297B
prepare_model.sh 2KB
download_en.sh 644B
analysis
uk_us_ratio.py 717B
count_keywords.py 485B
count_emojis.py 477B
config
en_reddit_anonymized.yaml 647B
fr_reddit_anonymized.yaml 666B
example_config.yaml 482B
data.en.config 193B
data.fr.config 101B
data.ja.config 101B
ja_reddit_anonymized.yaml 711B
LICENSE 1KB
README.md 4KB
resources
pronouns.ja 738B
profanities.en 8KB
profanities.ja 485B
informal_pronouns.ja 179B
profanities.fr 4KB
.gitignore 1KB
共 56 条
- 1
资源评论
weixin_39840650
- 粉丝: 409
- 资源: 1万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功