没有合适的资源?快使用搜索试试~
我知道了~
文库首页
行业
互联网
NiuTrans中英平行语料库10万句
NiuTrans中英平行语料库10万句
语料库,
平行语料库
5星
· 超过95%的资源
需积分: 50
308 下载量
67 浏览量
2017-05-01
10:31:19
上传
评论
12
收藏
45.51MB
GZ
举报
温馨提示
立即下载
共3个文件
gz:1个
license:1个
readme:1个
NiuTrans的开源中英平行语料库,可以用来训练机器翻译。
资源推荐
资源详情
资源评论
Opus-MT:开放式神经机器翻译模型和Web服务
浏览:120
开放翻译服务的工具和资源 基于 使用训练对数据进行 主要基于的细分 大部分受过基于词对齐的引导式对齐训练 (),CC-BY 4.0许可证 演示翻译界面可从 该存储库包括两个设置: 设置1:基于的Web应用程序,提供可与多种语言对一起使用的Web UI和api(由及其基金会的团队开发); 可以在此处找到示例实例: : 设置2: 也有用于训练模型的脚本,但是这些脚本目前仅在赫尔辛基大学和CSC
中英平行语料库
浏览:64
4星 · 用户满意度95%
一万句对齐的中英文平行语料库,用于机器翻译,问答系统等模型的预处理语料。
中英平行语料50000句.rar
浏览:179
4星 · 用户满意度95%
语料来源为WMT18,本资源包含中英文的平行语料50000句,以及简单预处理后的文件。中文预处理:去除标点、数字,分词;英文预处理:去除标点、数字,大小写转换。可以用来做简单的神经机器翻译练习使用。
中英平行语料(共20万句)可用于训练机器翻译
浏览:31
5星 · 资源好评率100%
中文英文的平行语料,来源于niutrans语料,总共20万句(中文10万英文10万),该语料可用于机器翻译等的训练。
中英平行语料链接
浏览:42
3星 · 编辑精心推荐
UN parallel corpus. 15,886,041 lines casia2015: 1,050,000 lines casict2015: 2,036,833 lines datum2015: 1,000,003 lines datum2017: 1,999,968 lines NEU2017: 2,000,000 lines
NiuTrans语料(中英文对照)
浏览:112
中英文对照语料库,可以用于训练翻译系统。
中英平行语料库.zip
浏览:137
中英文平行语料库,用于机器翻译,问答系统等模型的预处理语料
中英平行语料库(八万对,句粒度)
浏览:20
共8400多对中英语句,已预处理,中文用jieba分了词,标点符号没问题,保存于en-zh.csv,分隔符是制表符\t(不是默认逗号)。 句粒度,但有不少长句,裁剪后5w对也够用。 原始数据集也在包中,其中en-zh_News.tmx有一部分句子有问题,(en-zh.csv丢弃了有问题的句子),如果必要建议不要直接使用该文件。 另外附赠我对语料的预处理文件(propressor.py),以及数据集
平行语料库,用于机器翻译等的预处理语料。
浏览:44
汉英双语语料和德英双语语料,可以用来训练NMT模型,谨供学术实验用
一万句中英平行语料库,不用预处理
浏览:102
5星 · 资源好评率100%
平行语料库,用于机器翻译等大数据处理,有需要的可以下来用,可以直接用,不用全角半角变换
opus-dataset-parser:解析OPUS并行数据集以创建准备用于NLP的多语言并行语料库
浏览:166
数据集解析器 解析OPUS并行数据集以创建可用于NLP的多语言并行语料库
平行语料-中英数据对齐清洗
浏览:63
针对中英数据对齐的清洗,提高对齐质量,附带代码包含对中英序号不匹配,长数字不匹配等问题进行清洗!
数据集—基于TF NMT利用带有Attention的 ED模型训练、测试(中英文平行语料库)实现将英文翻译为中文的LSTM翻译(中英文平行语料库)训练数据集
浏览:184
数据集—基于TF NMT利用带有Attention的 ED模型训练、测试(中英文平行语料库)实现将英文翻译为中文的LSTM翻译(中英文平行语料库)训练数据集—train
英文-中文机器翻译语料库
浏览:87
英文-中文的一个文件,大约有两万个句子对,每一个句子对是(英文,中文),文件不大,主要用来做中英的机器翻译。
平行语料,用于机器翻译等的预处理语料
浏览:73
平行语料库,用于机器翻译等的预处理语料。 汉英双语语料和德英双语语料,可以用来训练NMT模型,谨供学术实验用
中英平行语料(白皮书,可以用于机器翻译,主题提取)
浏览:187
中英平行语料(白皮书,可以用于机器翻译,主题提取)
Java 面经手册·小傅哥.pdf
浏览:131
5星 · 资源好评率100%
这是一本以面试题为入口讲解 Java 核心内容的技术书籍,书中内容极力的向你证实代码是对数学逻辑的具体实现。当你仔细阅读书籍时,会发现Java中有大量的数学知识,包括:扰动函数、负载因子、拉链寻址、开放寻址、斐波那契(Fibonacci)散列法还有黄金分割点的使用等等。 适合人群 1. 具备一定编程基础,工作1-3年的研发人员 2. 想阅读 Java 核心源码,但总感觉看不懂的 3. 看了太多
解压后拖入浏览器扩展程序使用.zip
浏览:23
5星 · 资源好评率100%
解压后拖入浏览器扩展程序使用
103套PPT模板.zip
浏览:99
4星 · 用户满意度95%
读本科常用的100套PPT模板,里面的模板能应用于答辩、汇报、经验分享,风格各异,可以根据自己的喜欢进行挑选
Beyond Compare 免安装直接使用
浏览:114
5星 · 资源好评率100%
比较工具,用于比较任何文本文件,包括.c文件、.cpp文件、.h文件等,或者比较文件夹;Beyond Compare.zip 解压之后直接可以使用
notepad++.exe官网下载
浏览:52
4星 · 用户满意度95%
官网进不去着实很烦,找的软件下载网站都是改过了的,上传供收藏使用。
收起资源包目录
NiuTrans_1.2.0.Beta.sample_data.tar.gz
(3个子文件)
NiuTrans_1.2.0.Beta_sample_data
LICENSE
17KB
sample-data
sample.tar.gz
45.5MB
README
5KB
共 3 条
1
评论
收藏
内容反馈
立即下载
资源评论
资源反馈
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~
联系上传者
评论
yusiyusiyusisi
2018-04-01
好很好的资源
Goffic
2017-12-21
非常好,受用了
YRXGC
2018-07-29
感觉应该不错,谢谢
czybee
2018-04-04
有用的,感谢啦
大鵬cross
2018-04-08
还没下载 不过感觉应该不错
1
2
前往
页
LucyGill
粉丝: 182
资源:
11
私信
上传资源 快速赚钱
我的内容管理
展开
我的资源
快来上传第一个资源
我的收益
登录查看自己的收益
我的积分
登录查看自己的积分
我的C币
登录后查看C币余额
我的收藏
我的下载
下载帮助
前往需求广场,查看用户热搜
最新资源
量子安全应用的共识:量子安全的内涵、技术体系、安全观及应用体系
移动开发+android+listView+EditText+实现搜索ListView功能
多普勒效应对移动通信的影响解析.ppt
多维度分析数据库复制与存储复制的架构差异.docx
51单片机实现的vs53l01x激光距离传感器的校准与距离读取的程序
图新地球图源清晰度比较高的图源
微信小程序-侧滑布局源码.zip
微信小程序-步步高字典源码.zip
STM32 F0 F1 F2 F3 F4 F7 L1 W 全系列AD原理图库PCB封装库(AD集成库).zip
51单片机的1602时钟、具有闹钟等功能
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
- 1
- 2
前往页