没有合适的资源?快使用搜索试试~ 我知道了~
subword-nmt:用于神经机器翻译和文本生成的无监督分词
共26个文件
py:17个
en:2个
gitignore:2个
需积分: 50 1 下载量 157 浏览量
2021-05-10
23:22:06
上传
评论
收藏 130KB ZIP 举报
温馨提示
子词神经机器翻译 该存储库包含预处理脚本,用于将文本分段为子词单元。 主要目的是促进带有子词单元的神经机器翻译实验的重现(请参阅下面的参考资料)。 安装 通过pip安装(来自PyPI): pip install subword-nmt 通过pip安装(来自Github): pip install https://github.com/rsennrich/subword-nmt/archive/master.zip 或者,克隆此存储库; 这些脚本可以独立执行。 使用说明 检查各个文件以获取使用说明。 要将字节对编码应用于分词,请调用以下命令: subword-nmt learn-bpe -s {num_operations} < {train_file} > {codes_file} subword-nmt apply-bpe -c {codes_file} < {test_file
资源推荐
资源详情
资源评论
收起资源包目录
subword-nmt-master.zip (26个子文件)
subword-nmt-master
.github
workflows
pythonpublish.yml 619B
get_vocab.py 24B
apply_bpe.py 24B
LICENSE 1KB
setup.py 1KB
README.md 6KB
learn_joint_bpe_and_vocab.py 40B
subword_nmt
subword_nmt.py 4KB
get_vocab.py 3KB
bpe_toy.py 2KB
apply_bpe.py 17KB
__init__.py 0B
learn_joint_bpe_and_vocab.py 7KB
segment_char_ngrams.py 3KB
tests
test_glossaries.py 4KB
__init__.py 0B
test_bpe.py 2KB
data
corpus.en 130KB
corpus.bpe.ref.en 181KB
bpe.ref 8KB
.gitignore 8B
learn_bpe.py 14KB
chrF.py 4KB
.gitignore 1KB
learn_bpe.py 24B
CHANGELOG.md 2KB
共 26 条
- 1
资源评论
weixin_42128015
- 粉丝: 20
- 资源: 4641
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 直接插入排序,冒泡排序,直接选择排序.zip
- 在排序2的基础上,再次对快排进行优化,其次增加快排非递归,归并排序,归并排序非递归版.zip
- 实现了7种排序算法.三种复杂度排序.三种nlogn复杂度排序(堆排序,归并排序,快速排序)一种线性复杂度的排序.zip
- 冒泡排序 直接选择排序 直接插入排序 随机快速排序 归并排序 堆排序.zip
- 课设-内部排序算法比较 包括冒泡排序、直接插入排序、简单选择排序、快速排序、希尔排序、归并排序和堆排序.zip
- Python排序算法.zip
- C语言实现直接插入排序、希尔排序、选择排序、冒泡排序、堆排序、快速排序、归并排序、计数排序,并带图详解.zip
- 常用工具集参考用于图像等数据处理
- 音乐展示网页、基于Stenography的图像数字水印添加与提取,以及基于颜色矩和Tamura算法的图像相似度评估算法py源码
- 基于EmguCV(OpenCV .net封装),图像数字水印加解密算法的实现,其中包含最低有效位算法,离散傅里叶变换算法+文档书
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功