没有合适的资源?快使用搜索试试~
我知道了~
文库首页
人工智能
机器学习
中英平行语料(白皮书,可以用于机器翻译,主题提取)
中英平行语料(白皮书,可以用于机器翻译,主题提取)
机器学习
机器翻译
主题提取
NLP
需积分: 50
18 下载量
13 浏览量
2020-11-07
22:08:13
上传
评论
收藏
2.99MB
TXT
举报
温馨提示
立即下载
中英平行语料(白皮书,可以用于机器翻译,主题提取)
资源推荐
资源评论
平行语料,用于机器翻译等的预处理语料
浏览:27
平行语料库,用于机器翻译等的预处理语料。 汉英双语语料和德英双语语料,可以用来训练NMT模型,谨供学术实验用
平行语料库,用于机器翻译等的预处理语料。
浏览:97
汉英双语语料和德英双语语料,可以用来训练NMT模型,谨供学术实验用
中英平行语料(共20万句)可用于训练机器翻译
浏览:150
5星 · 资源好评率100%
中文英文的平行语料,来源于niutrans语料,总共20万句(中文10万英文10万),该语料可用于机器翻译等的训练。
中英平行语料库
浏览:119
4星 · 用户满意度95%
一万句对齐的中英文平行语料库,用于机器翻译,问答系统等模型的预处理语料。
中英平行语料链接
浏览:39
3星 · 编辑精心推荐
UN parallel corpus. 15,886,041 lines casia2015: 1,050,000 lines casict2015: 2,036,833 lines datum2015: 1,000,003 lines datum2017: 1,999,968 lines NEU2017: 2,000,000 lines
中英平行语料库.zip
浏览:12
中英文平行语料库,用于机器翻译,问答系统等模型的预处理语料
平行语料-中英数据对齐清洗
浏览:11
针对中英数据对齐的清洗,提高对齐质量,附带代码包含对中英序号不匹配,长数字不匹配等问题进行清洗!
NiuTrans语料(中英文对照)
浏览:30
中英文对照语料库,可以用于训练翻译系统。
已预处理 NLP 英文语料库 新闻组 20_Newsgroup(单标签英文平衡语料)
浏览:176
5星 · 资源好评率100%
已做预处理:分词、剔除停用词 可直接拿来统计建立文本模型
NiuTrans中英平行语料库10万句
浏览:5
NiuTrans的开源中英平行语料库,可以用来训练机器翻译。
英文-中文机器翻译语料库
浏览:136
英文-中文的一个文件,大约有两万个句子对,每一个句子对是(英文,中文),文件不大,主要用来做中英的机器翻译。
中英平行语料库(八万对,句粒度)
浏览:193
共8400多对中英语句,已预处理,中文用jieba分了词,标点符号没问题,保存于en-zh.csv,分隔符是制表符\t(不是默认逗号)。 句粒度,但有不少长句,裁剪后5w对也够用。 原始数据集也在包中,其中en-zh_News.tmx有一部分句子有问题,(en-zh.csv丢弃了有问题的句子),如果必要建议不要直接使用该文件。 另外附赠我对语料的预处理文件(propressor.py),以及数据集
一万句中英平行语料库,不用预处理
浏览:4
5星 · 资源好评率100%
平行语料库,用于机器翻译等大数据处理,有需要的可以下来用,可以直接用,不用全角半角变换
中英平行语料50000句.rar
浏览:35
4星 · 用户满意度95%
语料来源为WMT18,本资源包含中英文的平行语料50000句,以及简单预处理后的文件。中文预处理:去除标点、数字,分词;英文预处理:去除标点、数字,大小写转换。可以用来做简单的神经机器翻译练习使用。
NLP代码.rar(python机器学习——文本情感分析(英文文本情感分析))
浏览:86
python机器学习——文本情感分析(英文文本情感分析)代码下载,代码完整可以运行。希望可以帮助到正在学习的伙伴们。
中英双语对照语料
浏览:160
5星 · 资源好评率100%
鉴于大家要求发布了中英双文对照语料,大概有百兆以上,大家可以拿来试试。
新闻中英平行语料_处理过的干净语料
浏览:114
已处理过的干净中英平行语料,无乱码空值杂质,其中还夹杂了其他场景的数据,一共30w,新手上手机器翻译时可以拿来练手,测试模型,免去了数据清洗的大量工作
英文-中文机器翻译数据集
浏览:60
中英文翻译数据集: Anyone can do that. 任何人都可以做到。 How about another piece of cake? 要不要再來一塊蛋糕? She married him. 她嫁给了他。 I don't like learning irregular verbs. 我不喜欢学习不规则动词。 It's a whole new ball game for me. 這對我來
google 20k英文词库大全,适合NLP使用
浏览:72
该数据集包括常用的英文单词,诸如beijing,shenzhen这种地名也包含在内,但是没有其他小一点的城市,内容相对更为精简,包含的专有名词并不偏,适合NLP中用于匹配相似单词等。
neu2017.tgz
浏览:135
4星 · 用户满意度95%
cwmt/neu2017中英神经机器翻译平行语料库,在fairseq和opennmt上均成功训练并预测得到不错的结果。
seq2seq模型和基于注意力机制的seq2seq模型
浏览:83
使用 seq2seq 模型和基于注意力机制的 seq2seq 模型(AttSeq2Seq)模型两种方法,实现 MNIST 数据集分类
完整车牌号识别程序,可以识别车牌和颜色,可以集成到项目中 支持win7+
浏览:124
5星 · 资源好评率100%
基于.Net开发车牌号识别程序,通过控制台输出结果,可以通过启动参数传入地址,集成到项目中。 使用介绍:https://blog.csdn.net/billyyi/article/details/138597795
ChatGPT教程(终极版)最全整理
浏览:154
5星 · 资源好评率100%
这是一篇动了某些人利益的良心教程。 这是一篇姗姗来迟的ChatGPT教程。 纯小白关于ChatGPT入门,你看我这篇文章就够了。 如果你已经用上了ChatGPT,更要恭喜你挖到宝藏,后面的高级技巧一定能让你有收获。 文章包含以下内容: 一、ChatGPT是啥?有什么用; 二、ChatGPT如何注册; 三、ChatGPT使用方法; 四、用ChatGPT搞钱; 五、高级技巧;
博客中Kmeans以及FCM算法数据(免积分)
浏览:56
5星 · 资源好评率100%
博客中Kmeans以及FCM算法的数据,包括IRIS鸢尾花数据集、Wine葡萄酒数据集、Seed小麦种子数据集、glass数据集、WDBD乳腺癌数据集,下载在直接存入项目文件夹即可,如果下载不了,可以私信我,看到后会及时回复。
评论
收藏
内容反馈
立即下载
资源评论
资源反馈
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~
联系上传者
评论
爱因斯坦说
粉丝: 2
资源:
1
私信
上传资源 快速赚钱
我的内容管理
展开
我的资源
快来上传第一个资源
我的收益
登录查看自己的收益
我的积分
登录查看自己的积分
我的C币
登录后查看C币余额
我的收藏
我的下载
下载帮助
前往需求广场,查看用户热搜
最新资源
合同预览.pdf
基于python的智能停车场车牌识别计费系统的程序使用说明.zip
屏幕:直接使用串口屏,简单的要si,不要十分复杂的代码,你会发串口就可以用
json-1.zip
基于python的Excel数据分析师程序使用说明.zip
基于python的开心麻花影视作品分析的程序使用说明.zip
成都雷老板-2201301033.amr
基于python的高德地图+58租房的程序使用说明.zip
TG-2024-05-13-183218476.mp4
基于python的火车票分析助手的程序使用说明.zip
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功