没有合适的资源?快使用搜索试试~
我知道了~
文库首页
行业
互联网
NiuTrans中英平行语料库10万句
NiuTrans中英平行语料库10万句
共2个文件
ignore:1个
gz:1个
平行语料库
需积分: 12
27 下载量
133 浏览量
2018-06-12
08:52:23
上传
评论
6
收藏
45.53MB
ZIP
举报
温馨提示
立即下载
NiuTrans的开源中英平行语料库,可以用来训练机器翻译。
资源推荐
资源详情
资源评论
中英平行语料库.zip
浏览:169
中英文平行语料库,用于机器翻译,问答系统等模型的预处理语料
NiuTrans语料(中英文对照)
浏览:86
中英文对照语料库,可以用于训练翻译系统。
中英平行语料库
浏览:111
4星 · 用户满意度95%
一万句对齐的中英文平行语料库,用于机器翻译,问答系统等模型的预处理语料。
中英平行语料库(八万对,句粒度)
浏览:94
共8400多对中英语句,已预处理,中文用jieba分了词,标点符号没问题,保存于en-zh.csv,分隔符是制表符\t(不是默认逗号)。 句粒度,但有不少长句,裁剪后5w对也够用。 原始数据集也在包中,其中en-zh_News.tmx有一部分句子有问题,(en-zh.csv丢弃了有问题的句子),如果必要建议不要直接使用该文件。 另外附赠我对语料的预处理文件(propressor.py),以及数据集
sample-submission-version.7z
浏览:155
NiuTrans中英平行语料库10万句,自己网上下载,然后压缩上传的,可用来训练阿里机器翻译自学习平台
中英平行语料50000句.rar
浏览:120
4星 · 用户满意度95%
语料来源为WMT18,本资源包含中英文的平行语料50000句,以及简单预处理后的文件。中文预处理:去除标点、数字,分词;英文预处理:去除标点、数字,大小写转换。可以用来做简单的神经机器翻译练习使用。
中英平行语料(共20万句)可用于训练机器翻译
浏览:9
5星 · 资源好评率100%
中文英文的平行语料,来源于niutrans语料,总共20万句(中文10万英文10万),该语料可用于机器翻译等的训练。
中英平行语料链接
浏览:7
3星 · 编辑精心推荐
UN parallel corpus. 15,886,041 lines casia2015: 1,050,000 lines casict2015: 2,036,833 lines datum2015: 1,000,003 lines datum2017: 1,999,968 lines NEU2017: 2,000,000 lines
平行语料库,用于机器翻译等的预处理语料。
浏览:139
汉英双语语料和德英双语语料,可以用来训练NMT模型,谨供学术实验用
一万句中英平行语料库,不用预处理
浏览:169
5星 · 资源好评率100%
平行语料库,用于机器翻译等大数据处理,有需要的可以下来用,可以直接用,不用全角半角变换
中英平行语料(白皮书,可以用于机器翻译,主题提取)
浏览:110
中英平行语料(白皮书,可以用于机器翻译,主题提取)
平行语料-中英数据对齐清洗
浏览:77
针对中英数据对齐的清洗,提高对齐质量,附带代码包含对中英序号不匹配,长数字不匹配等问题进行清洗!
TED 平行语料库数据集
浏览:199
TED平行语料库是多语言平行语料库,包括多语言并行语料库和单语语料库。从TED会议www.ted.com 提取109种世界语言。 多语言的平行语料库包括 12 种语言超过1.2亿 个对齐句子并进行了句子对齐。 所有的预处理都是自动完成。
NiuTrans的实现报告
浏览:175
NiuTrans的手册,以及NiuTrans基线系统的构建步骤
seq2seq模型和基于注意力机制的seq2seq模型
浏览:75
使用 seq2seq 模型和基于注意力机制的 seq2seq 模型(AttSeq2Seq)模型两种方法,实现 MNIST 数据集分类
中英双语对照语料
浏览:81
5星 · 资源好评率100%
鉴于大家要求发布了中英双文对照语料,大概有百兆以上,大家可以拿来试试。
Java 面经手册·小傅哥.pdf
浏览:173
5星 · 资源好评率100%
这是一本以面试题为入口讲解 Java 核心内容的技术书籍,书中内容极力的向你证实代码是对数学逻辑的具体实现。当你仔细阅读书籍时,会发现Java中有大量的数学知识,包括:扰动函数、负载因子、拉链寻址、开放寻址、斐波那契(Fibonacci)散列法还有黄金分割点的使用等等。 适合人群 1. 具备一定编程基础,工作1-3年的研发人员 2. 想阅读 Java 核心源码,但总感觉看不懂的 3. 看了太多
解压后拖入浏览器扩展程序使用.zip
浏览:165
5星 · 资源好评率100%
解压后拖入浏览器扩展程序使用
103套PPT模板.zip
浏览:87
4星 · 用户满意度95%
读本科常用的100套PPT模板,里面的模板能应用于答辩、汇报、经验分享,风格各异,可以根据自己的喜欢进行挑选
Beyond Compare 免安装直接使用
浏览:102
5星 · 资源好评率100%
比较工具,用于比较任何文本文件,包括.c文件、.cpp文件、.h文件等,或者比较文件夹;Beyond Compare.zip 解压之后直接可以使用
notepad++.exe官网下载
浏览:164
4星 · 用户满意度95%
官网进不去着实很烦,找的软件下载网站都是改过了的,上传供收藏使用。
收起资源包目录
NiuTrans_1.2.0.Beta.sample_data.tar.zip
(2个子文件)
.ignore
2B
NiuTrans_1.2.0.Beta.sample_data.tar.gz
45.51MB
共 2 条
1
评论
收藏
内容反馈
立即下载
资源评论
资源反馈
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~
联系上传者
评论
emily101
粉丝: 1
资源:
1
私信
上传资源 快速赚钱
我的内容管理
展开
我的资源
快来上传第一个资源
我的收益
登录查看自己的收益
我的积分
登录查看自己的积分
我的C币
登录后查看C币余额
我的收藏
我的下载
下载帮助
前往需求广场,查看用户热搜
最新资源
DynamicArray02.java
Image_1713714819368.png
数据可视化 matplotlib 实例.docx
Python 使用 Matplotlib 绘制甘特图的实践.docx
matplotlib 中的 cmap 参数介绍.docx
基于matlab的毕业设计基于Matlab使用LQR实现车辆轨迹跟踪源码.zip
基于Matplotlib 的高互动性可视化系统设计与实现
matplotlib 数据可视化报告.docx
传统网页UI设计在移动应用开发中的应用研究.pdf
基于pytorch实现BERT+BiLSTM+CRF实现中文命名实体识别源码.zip
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功