没有合适的资源?快使用搜索试试~ 我知道了~
NLP-Pivot-Translation-in-low-resource-environment
共31个文件
txt:23个
py:7个
md:1个
需积分: 9 0 下载量 42 浏览量
2021-03-05
04:33:35
上传
评论
收藏 19.36MB ZIP 举报
温馨提示
低资源环境中的NLP轴翻译 这个机器翻译项目的重点是翻译数据量有限的低资源语言,以训练NLP模型。在这里,我们使用透视技术处理低资源设置环境,在该技术中,我们将源语言旋转为具有足够数据集进行训练的语言非常准确的模型,然后将关键的语言转换为目标语言。 在这个项目中,我们将土耳其语作为主要语言将阿塞拜疆语翻译成英语,以提高翻译质量。 该项目中生成的预处理数据集,模型和输出可以在下面链接的google存储库中找到。
资源推荐
资源详情
资源评论
收起资源包目录
NLP-Pivot-Translation-in-low-resource-environment-main.zip (31个子文件)
NLP-Pivot-Translation-in-low-resource-environment-main
Outputs
Tanzil
direct_translated.txt 1.55MB
pivot_eng_translated_1.txt 1.42MB
az_tr_plotdata.txt 710B
pivot_eng_translated_2.txt 1.4MB
az_tr_azer_translated.txt 1.67MB
tr_en_azer_translated.txt 1.42MB
tl_tr_en_pivot_eng_20k.txt 1.41MB
pivot_turk_translated_1.txt 1.67MB
tl_az_tr_pivot_turk20k.txt 1.47MB
az_en_azer_translated.txt 1.58MB
pivot_turk_translated_2.txt 1.57MB
tr_en_plotdata.txt 710B
tl_az_en_direct_eng20k.txt 1.22MB
Transformer
tf_az_en_direct_eng20k.txt 1.26MB
tf_az_tr200k_pivot_turk20k.txt 1.43MB
tf_az_tr400k_pivot_turk20k.txt 1.45MB
tf_tr_en200k_pivot_eng20k.txt 1.43MB
tf_tr_en400k_pivot_eng20k.txt 1.54MB
Backtranslated_data
input
turkish_200k.txt 18.23MB
output
azerbaijani_200k.txt 19.56MB
Transformer_pytorch
transformer_utils.py 3KB
GoogleColabcmd.txt 126B
preprocess.py 3KB
seq2seq_transformer.py 12KB
seq2seq_pytorch
seq2seq.py 10KB
utils.py 4KB
preprocess.py 2KB
seq2seq_TeacherForc.py 10KB
Testset
eng_20k.txt 1.53MB
azer_20k.txt 2.05MB
README.md 797B
共 31 条
- 1
资源评论
茶了不几
- 粉丝: 30
- 资源: 4772
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功