没有合适的资源?快使用搜索试试~
我知道了~
文库首页
人工智能
深度学习
中英双语对照语料
中英双语对照语料
共8个文件
en:4个
vi:4个
机器翻译
中英语料
5星
· 超过95%的资源
需积分: 50
146 下载量
187 浏览量
2018-05-29
09:29:37
上传
评论
6
收藏
21.31MB
RAR
举报
温馨提示
立即下载
鉴于大家要求发布了中英双文对照语料,大概有百兆以上,大家可以拿来试试。
资源推荐
资源详情
资源评论
论文研究-一种基于Web数据挖掘构建中英双语对照翻译语料库的方法 .pdf
浏览:191
一种基于Web数据挖掘构建中英双语对照翻译语料库的方法,刘东飞,周星,本文介绍了一种基于Web数据挖掘构建中英双语对照翻译语料库的方法,通过网络爬虫技术,搜集海量网页数据,并进行一系列复杂的净化
中英双语语料 59W数据1
浏览:110
4星 · 用户满意度95%
中英双语语料 59W。一部分,互联网收集与整理,数据已去重!
中英平行语料库
浏览:150
4星 · 用户满意度95%
一万句对齐的中英文平行语料库,用于机器翻译,问答系统等模型的预处理语料。
中英平行语料链接
浏览:168
3星 · 编辑精心推荐
UN parallel corpus. 15,886,041 lines casia2015: 1,050,000 lines casict2015: 2,036,833 lines datum2015: 1,000,003 lines datum2017: 1,999,968 lines NEU2017: 2,000,000 lines
中英平行语料(白皮书,可以用于机器翻译,主题提取)
浏览:115
中英平行语料(白皮书,可以用于机器翻译,主题提取)
基本AIML格式中文语料1000条
浏览:67
3星 · 编辑精心推荐
基本AIML格式中文语料1000条,问题来自常用中文短语,答案来自网络采集。数据量不多,格式比较完整。
NiuTrans语料(中英文对照)
浏览:9
中英文对照语料库,可以用于训练翻译系统。
英文-中文机器翻译语料库
浏览:193
英文-中文的一个文件,大约有两万个句子对,每一个句子对是(英文,中文),文件不大,主要用来做中英的机器翻译。
最新新闻中英语料,可以用来测试翻译系统
浏览:24
最新新闻语料,为中英双语,可以训练翻译系统。新闻包括各种类别。
neu2017.tgz
浏览:51
4星 · 用户满意度95%
cwmt/neu2017中英神经机器翻译平行语料库,在fairseq和opennmt上均成功训练并预测得到不错的结果。
中英平行语料库.zip
浏览:141
中英文平行语料库,用于机器翻译,问答系统等模型的预处理语料
机器学习-100句中英文平行语料(中译英),内容为金融相关的日常用语-机器学习数据处理必看-数据集.txt
浏览:9
5星 · 资源好评率100%
机器学习-100句中英文平行语料(中译英),内容为金融相关的日常用语-机器学习数据处理必看-数据集.txt
中英平行语料50000句.rar
浏览:82
4星 · 用户满意度95%
语料来源为WMT18,本资源包含中英文的平行语料50000句,以及简单预处理后的文件。中文预处理:去除标点、数字,分词;英文预处理:去除标点、数字,大小写转换。可以用来做简单的神经机器翻译练习使用。
中英平行语料库(八万对,句粒度)
浏览:54
共8400多对中英语句,已预处理,中文用jieba分了词,标点符号没问题...另外附赠我对语料的预处理文件(propressor.py),以及数据集(pytorch的Dataset)等相关的实现(LangData.py)。 如果又可以改善的地方,欢迎留言
中英平行语料(共20万句)可用于训练机器翻译
浏览:131
5星 · 资源好评率100%
中文英文的平行语料,来源于niutrans语料,总共20万句(中文10万英文10万),该语料可用于机器翻译等的训练。
语料库双语处理工具
浏览:89
3星 · 编辑精心推荐
The program for de-alignment is attached below. To use the program, do the following: 1. Make a new folder on your machine; 2. Download and unzip the program file named dealigner.pl into that foler;
COCA美国当代语料库
浏览:131
5星 · 资源好评率100%
COCA美国当代语料库,美国人日常生活中所有接触的文字信息处理后提取出来的最高使用频率的单词表。
语料库,自己整理的,有需要的吗
浏览:122
语料库,自己整理的,对txt文件进行去停用词、分词。(停用词是指对文本含义几乎没有影响的词,这些词存入到.txt,分词调用的结巴分词库)
个人信用评分模型及其应用
浏览:155
5星 · 资源好评率100%
如题,介绍个人信用评分模型知识的电子书,详细讲述了个人信用评分模型建立所需的数据预处理、模型建立方法、模型检验方法等。正文部分总计181页。
数据集—基于TF NMT利用带有Attention的 ED模型训练、测试(中英文平行语料库)实现将英文翻译为中文的LSTM翻译(中英文平行语料库)训练数据集
浏览:57
数据集—基于TF NMT利用带有Attention的 ED模型训练、测试(中英文平行语料库)实现将英文翻译为中文的LSTM翻译(中英文平行语料库)训练数据集—train
一个面向信息抽取的中英文平行语料库.pdf
浏览:196
一个面向信息抽取的中英文平行语料库,
NiuTrans中英平行语料库10万句
浏览:184
5星 · 资源好评率100%
NiuTrans的开源中英平行语料库,可以用来训练机器翻译。
论文研究-从双语语料中获取翻译模板.pdf
浏览:172
在本体的映射研究中,大规模本体之间的映射一直是研究的难点。当前主要采用分块的思想来处理大本体映射问题。而应用的分块算法只是针对给定分块数的情况。据此,提出基于混合聚类的大本体分块与映射方法(BMC)。...
新闻中英平行语料_处理过的干净语料
浏览:172
已处理过的干净中英平行语料,无乱码空值杂质,其中还夹杂了其他场景的数据,一共30w,新手上手机器翻译时可以拿来练手,测试模型,免去了数据清洗的大量工作
知网机器翻译-中英文语料.zip
浏览:111
知网机器翻译-中英文语料.zip
中英翻译模型数据 中英互译语料
浏览:197
存放的中英翻译的模型数据,一个模型大概在220Mb左右,还有一些小的参数文件,共分为4个文件统一放在trainingzh_en_checkpoings\ckpt目录下
wmt2021:WMT 2021的存储库
浏览:97
wmt2021 WMT 2021的存储库 获取数据 ./scripts/get_data.sh -c paracrawl ./scripts/get_data.sh -c reuters 创建小型语料库 ./scripts/preprocess_small_sample.sh 解压缩数据并拆分以进行训练,开发和测试 ./scripts/preprocess_data.sh 脚本运行完成后,您将
WMT14数据集
浏览:142
4星 · 用户满意度95%
机器翻译数据集 ACL 2014 NINTH WORKSHOP ON STATISTICAL MACHINE TRANSLATION
机器翻译WMT14数据集
浏览:196
4星 · 用户满意度95%
机器翻译WMT14数据集,ACL2014公布的share task,很多模型都在这上benchmark
收起资源包目录
new_data.rar
(8个子文件)
new_data
tst2013.en
3.21MB
tst2012.en
3.26MB
train.vi
37.13MB
tst2013.vi
2.96MB
tst2012.vi
2.98MB
vocab.en
85KB
train.en
40.58MB
vocab.vi
72KB
共 8 条
1
评论
收藏
内容反馈
立即下载
资源评论
资源反馈
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~
联系上传者
评论
qwbug
2019-04-22
谢谢分享啊!
mfipt5
2018-07-02
谢谢楼主分享
icelights
2019-07-01
谢谢分享,不过离WMT系列的还是差了一些啊
为援不可图
粉丝: 122
资源:
7
私信
上传资源 快速赚钱
我的内容管理
展开
我的资源
快来上传第一个资源
我的收益
登录查看自己的收益
我的积分
登录查看自己的积分
我的C币
登录后查看C币余额
我的收藏
我的下载
下载帮助
前往需求广场,查看用户热搜
最新资源
CP2102 USB to UART Bridge Controller 驱动 Win11 USB转串口驱动
空气物性计算小软件.exe
Unity天气系统UniStorm
水蒸气性质计算小程序.exe
水岸分割数据集带数据标注
cad示坡线绘制,用于基坑上口绘制
Emurasoft文本编辑器是一款功能强大且非常好用的文本编辑器
亚马逊表单操作(内含模版)
基于OLA算法,用matlab制作 的变速不变调音频信号处理gui程序
2024 中国所有城市 json
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功