没有合适的资源?快使用搜索试试~
我知道了~
文库首页
人工智能
深度学习
中英双语对照语料
中英双语对照语料
共8个文件
en:4个
vi:4个
机器翻译
中英语料
5星
· 超过95%的资源
需积分: 50
1.2k 浏览量
2018-05-29
09:29:37
上传
评论
6
收藏
21.31MB
RAR
举报
温馨提示
立即下载
开通VIP(低至0.43/天)
买1年送3个月+抽豪礼
身份认证 购VIP最低享 7 折!
领优惠券(最高得80元)
鉴于大家要求发布了中英双文对照语料,大概有百兆以上,大家可以拿来试试。
资源推荐
资源详情
资源评论
中英平行语料库
4星 · 用户满意度95%
一万句对齐的中英文平行语料库,用于机器翻译,问答系统等模型的预处理语料。
中英双语语料 59W数据1
4星 · 用户满意度95%
中英双语语料 59W。一部分,互联网收集与整理,数据已去重!
NiuTrans语料(中英文对照)
中英文对照语料库,可以用于训练翻译系统。
最新新闻中英语料,可以用来测试翻译系统
最新新闻语料,为中英双语,可以训练翻译系统。新闻包括各种类别。
基本AIML格式中文语料1000条
3星 · 编辑精心推荐
基本AIML格式中文语料1000条,问题来自常用中文短语,答案来自网络采集。数据量不多,格式比较完整。
英汉汉英词库 json格式
4星 · 用户满意度95%
本资料为鄙人制作的英汉汉英互译的sql语句。因鄙人之前找词库找到相当头大,如今特发此资源,来给大家分享。另外,鄙人还会陆续推出sql语句的版本和xml数据格式的版本,希望大家能喜欢。
中英平行语料(共20万句)可用于训练机器翻译
5星 · 资源好评率100%
中文英文的平行语料,来源于niutrans语料,总共20万句(中文10万英文10万),该语料可用于机器翻译等的训练。
英文-中文机器翻译语料库
英文-中文的一个文件,大约有两万个句子对,每一个句子对是(英文,中文),文件不大,主要用来做中英的机器翻译。
数据集—基于TF NMT利用带有Attention的 ED模型训练、测试(中英文平行语料库)实现将英文翻译为中文的LSTM翻译(中英文平行语料库)训练数据集
数据集—基于TF NMT利用带有Attention的 ED模型训练、测试(中英文平行语料库)实现将英文翻译为中文的LSTM翻译(中英文平行语料库)训练数据集—train
中英翻译模型数据 中英互译语料
存放的中英翻译的模型数据,一个模型大概在220Mb左右,还有一些小的参数文件,共分为4个文件统一放在trainingzh_en_checkpoings\ckpt目录下
机器翻译WMT14数据集
4星 · 用户满意度95%
机器翻译WMT14数据集,ACL2014公布的share task,很多模型都在这上benchmark
wmt2021:WMT 2021的存储库
wmt2021 WMT 2021的存储库 获取数据 ./scripts/get_data.sh -c paracrawl ./scripts/get_data.sh -c reuters 创建小型语料库 ./scripts/preprocess_small_sample.sh 解压缩数据并拆分以进行训练,开发和测试 ./scripts/preprocess_data.sh 脚本运行完成后,您将
WMT14数据集
4星 · 用户满意度95%
机器翻译数据集 ACL 2014 NINTH WORKSHOP ON STATISTICAL MACHINE TRANSLATION
方言普通话语音识别语料库样例
4星 · 用户满意度95%
本数据是600人方言普通话语音识别语料库的样例,包括4个发音人(两男两女)录制的少量数据。完整语料库包括600名发音人,发音人覆盖全国不同地区、年龄、性别及文化程度,录音环境覆盖安静、座机、手机、车载、背景音乐及嘈杂声等场景,录音语料覆盖单字、词汇、语句、自然对话及语篇,采样率分8K和44K两种,采用16比特量化,标注粒度包括文字、拼音、韵律及音频标注。 用途:语音识别
可靠性设计原则1000条
给出了可靠性设计的1000条原则,具有很强的参考意义
COCA美国当代语料库
5星 · 资源好评率100%
COCA美国当代语料库,美国人日常生活中所有接触的文字信息处理后提取出来的最高使用频率的单词表。
语料库,自己整理的,有需要的吗
语料库,自己整理的,对txt文件进行去停用词、分词。(停用词是指对文本含义几乎没有影响的词,这些词存入到.txt,分词调用的结巴分词库)
美国当代英语语料库COCA词频20000 (完整)【包含常用格式】
5星 · 资源好评率100%
美国当代英语语料库COCA词频20000 高频2W (完整) 格式:pdf, word文档, txt, excel文档
美国当代英语语料库60000
3星 · 编辑精心推荐
美国当代英语语料库 COCA Frequency 60000,适用于欧路,mdict等第三方词典
英语语料库LOB语料库
4星 · 用户满意度95%
LOB语料库 创建时间: 1970年代初 创建单位:英国Lancaster大学和挪威Oslo大学以及Bergen大学 规模层级: 100万词次 基本情况:研究当代英国英语,与美国英语对比,使用了TAGIT系统,以统计方式建立换算几率矩阵,提高标注正确率。 The Lancaster-Oslo Bergen Corpus (LOB) was compiled by researchers in La
语料库双语处理工具
3星 · 编辑精心推荐
The program for de-alignment is attached below. To use the program, do the following: 1. Make a new folder on your machine; 2. Download and unzip the program file named dealigner.pl into that foler;
爬虫工具,用于获取平行语料
5星 · 资源好评率100%
通过爬得的网页来获取平行网页,java语言开发的,开源
NiuTrans中英平行语料库10万句
5星 · 资源好评率100%
NiuTrans的开源中英平行语料库,可以用来训练机器翻译。
平行语料库,用于机器翻译等的预处理语料。
汉英双语语料和德英双语语料,可以用来训练NMT模型,谨供学术实验用
用PyTorch实现MNIST手写数字识别对应源码文件
5星 · 资源好评率100%
博客“用PyTorch实现MNIST手写数字识别(非常详细)”中对应的完整代码文件,原文可见:https://blog.csdn.net/sxf1061700625/article/details/105870851
哈尔滨工业大学-ChatGPT调研报告-20230306-94页.pdf
5星 · 资源好评率100%
2022年11月30日,OpenAI推出全新的对话式通用人工智能工具——ChatGPT。ChatGPT表现出了非常惊艳的语言理解、生成、知识推理能力,它可以很好地理解用户意图,做到有效的多轮沟通,并且回答内容完整、重点清晰、有概括、有逻辑、有条理。ChatGPT上线后,5天活跃用户数高达100万,2个月活跃用户数已达1个亿,成为历史上增长最快的消费者应用程序。除了被广大用户追捧外,ChatGPT还
Deep Learning Tuning Playbook(中译版)
由五名研究人员和工程师组成的团队发布了《Deep Learning Tuning Playbook》,来自他们自己训练神经网络的实验结果以及工程师的一些实践建议,目前在Github上已有1.5k星。此版本为中文翻译版,提供给大家免费下载,因为本人知识水平有限,翻译过程中可能有误,随时欢迎大家指出错误,我会随时更正。
社交平台上经济类话题的文章热度信息,数据是真实的,但不是真实日期
使用LSTM模型进行时序预测的代码与说明见:https://blog.csdn.net/Q_M_X_D_D_/article/details/109366895
YOLOV5口罩检测数据集+代码+模型 2000张标注好的数据+教学视频.zip
5星 · 资源好评率100%
YOLOV5口罩检测数据集+代码+模型 2000张标注好的数据+教学视频 代码的下载地址在:https://gitee.com/song-laogou/yolov5-mask-42 大家可以按照这里的视频教程配置环境:https://www.bilibili.com/video/BV1YL4y1J7xz/ 更多数据请看:https://blog.csdn.net/ECHOSON/article/d
收起资源包目录
new_data.rar
(8个子文件)
new_data
tst2013.en
3.21MB
tst2012.en
3.26MB
train.vi
37.13MB
tst2013.vi
2.96MB
tst2012.vi
2.98MB
vocab.en
85KB
train.en
40.58MB
vocab.vi
72KB
共 8 条
1
评论
收藏
内容反馈
立即下载
开通VIP(低至0.43/天)
买1年送3个月+抽豪礼
资源评论
资源反馈
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~
联系上传者
评论
icelights
2019-07-01
谢谢分享,不过离WMT系列的还是差了一些啊
qwbug
2019-04-22
谢谢分享啊!
mfipt5
2018-07-02
谢谢楼主分享
为援不可图
粉丝: 118
资源:
7
私信
上传资源 快速赚钱
我的内容管理
收起
我的资源
快来上传第一个资源
我的收益
登录查看自己的收益
我的积分
登录查看自己的积分
我的C币
登录后查看C币余额
我的收藏
我的下载
下载帮助
前往需求广场,查看用户热搜
会员权益专享
图片转文字
PDF转文字
PDF转Word
PDF加水印
全年可省5,000元
立即开通
最新资源
成绩管理.mdf
Axure设计-拖拽获取
文件生成小工具.exe
.arch数据分析终极版-checkpoint.ipynb
opcUA交互数据包,可用wireshark打开
Web 3.0控件开发包编程指南+Demo实例+海康威视web开发
天池项目金融数据分析赛题1:银行客户认购产品预测
天池项目金融数据分析赛题1:银行客户认购产品预测
redis-6.2.1配置文件
天池项目金融数据分析赛题1:银行客户认购产品预测
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功