下载 >  人工智能 >  机器学习 > dataSet_word2vec训练词向量

dataSet_word2vec训练词向量

word2vec训练词向量,word2vec训练词向量,word2vec训练词向量
2018-06-19 上传大小:49.25MB
分享
收藏 举报
中文维基glove词向量(已训练)-part2

中文维基glove词向量(已训练)-part2中文维基glove词向量(已训练)-part2

立即下载
中文维基glove词向量(已训练)-part1

中文维基glove词向量(已训练)-part1,中文维基glove词向量(已训练)-part1

立即下载
基于海量新闻语料训练得到的实体词向量

该资源便于对词向量感兴趣的童鞋进行实验

立即下载
word2vec词向量训练及中文文本相似度计算

用来得到TXT文本中词语的相关性的深度学习模型,需要分词,text8为样例,运行脚本可以直接开始训练。最后得到.bin模型

立即下载
word2vec词向量训练及中文文本相似度计算 【源码+语料】

该资源主要参考我的博客:word2vec词向量训练及中文文本相似度计算 http://blog.csdn.net/eastmount/article/details/50637476 其中包括C语言的Word2vec源代码(从官网下载),自定义爬取的三大百科(百度百科、互动百科、维基百科)中文语料,涉及到国家、景区、动物和人物。 同时包括60M的腾讯新闻语料,是一个txt,每行相当于一个新闻。 国家包括了Python的Jieba分词代码,详见博客。 免费资源希望对你有所帮助~

立即下载
Glove词向量 文本分类

文本建模,此项中的模型GLove, word2vec, 在文本分类实用重要的作用

立即下载
word2vec词向量

用word2vec的方法做词向量...........................................................................................................................

立即下载
fasttext java 版本

fasttext java 版本,可以进行 文本分类,以及词向量的训练

立即下载
基于词向量的机器翻译Python代码

基于词向量的机器翻译Python代码,其中train_word2vec_model.py为训练词向量代码,test.py为测试翻译结果代码。(本文件夹不包含词向量模型、训练集和测试集,仅为代码!!!)

立即下载
英文维基百科词向量训练语料

enwiki-latest-pages-articles1.xml-p10p30302.bz2,维基百科用来训练英文word2vec词向量的语料

立即下载
SSWE:embedding-results:融合特定情感的词向量

利用Twitter短文本,在训练词向量时融合进词语考虑带有的情感,得到带有情感信息的词向量。所用模型为SSWE,压缩包内包含三个文本文档:SSWE-h.txt、SSWE-r.txt、SSWE-u.txt。另,训练得到的词向量维度为50.

立即下载
英文word2vec模型训练语料

本语料适合于使用word2vec英文训练的语料,共98M,包括常用的英文词汇,训练后效果不错。

立即下载
Glove预训练词嵌入

该预训练词嵌入根据斯坦福大学提出的Glove模型进行训练,主要包括如下四个文件: 1) glove.6B:Wikipedia 2014 + Gigaword 5 (6B tokens, 400K vocab, uncased, 50d, 100d, 200d, & 300d vectors, 822 MB download) 2) glove.42B.300d:Common Crawl (42B tokens, 1.9M vocab, uncased, 300d vectors, 1.75 GB download) 3)glove.840B.300d:Common Crawl (840B tokens, 2.2M vocab, cased, 300d vectors, 2.03 GB download) 4)glove.twitter.27B:Twitter (2B tweets, 27B tokens, 1.2M vocab, uncased, 25d, 50d, 100d, & 200d vectors, 1.42 GB download)

立即下载
WiKi百科语料 1G多 已分词 可用于Word2Vec训练

WiKi百科语料 1G多 已分词 可用于Word2Vec训练 WiKi百科语料 1G多 已分词 可用于Word2Vec训练

立即下载
wiki.zh.text.model

中文维基百科语料库,将其转换为文本文件后,进行繁体字转换为简体字,字符集转换,分词,然后训练得到模型以及向量。由于文件上传的大小限制是60MB,我这里的压缩包中有model,然后对向量提供了下载链接。使用python中的gensim包进行训练得到的,运行时间较长,希望对你们有帮助。

立即下载
cw2vec: Learning ChineseWord Embeddings with Stroke n-gram Information

Alibaba研究的基于中文汉字n元笔画信息的词向量训练模型

立即下载
81万互联网词汇

81万互联网词汇,可以使用该词汇库训练得到词向量,进行自然语言相关处理。

立即下载
微博用户评论情感分析python代码(数据规模20w)

完整可运行的python代码。 数据过滤,清洗,分割,特征选择,训练词向量模型,测试等等, 每行都有注释,真实的数据集超过20w条,是个不错的nlp入门例子。

立即下载
基于双向LSTM的句子向量模型

此模型既可以用于训练词向量,也可以将句子表示成句子向量,质量都比较高

立即下载
中文的word2vec词向量

个人训练的一套word2vec中文词向量。维度为200维。python装gensim后可以直接用!

立即下载
关闭
img

spring mvc+mybatis+mysql+maven+bootstrap 整合实现增删查改简单实例.zip

资源所需积分/C币 当前拥有积分 当前拥有C币
5 0 0
点击完成任务获取下载码
输入下载码
为了良好体验,不建议使用迅雷下载
img

dataSet_word2vec训练词向量

会员到期时间: 剩余下载个数: 剩余C币: 剩余积分:0
为了良好体验,不建议使用迅雷下载
VIP下载
您今日下载次数已达上限(为了良好下载体验及使用,每位用户24小时之内最多可下载20个资源)

积分不足!

资源所需积分/C币 当前拥有积分
您可以选择
开通VIP
4000万
程序员的必选
600万
绿色安全资源
现在开通
立省522元
或者
购买C币兑换积分 C币抽奖
img

资源所需积分/C币 当前拥有积分 当前拥有C币
5 4 45
为了良好体验,不建议使用迅雷下载
确认下载
img

资源所需积分/C币 当前拥有积分 当前拥有C币
5 0 0
为了良好体验,不建议使用迅雷下载
VIP和C币套餐优惠
img

资源所需积分/C币 当前拥有积分 当前拥有C币
5 4 45
您的积分不足,将扣除 10 C币
为了良好体验,不建议使用迅雷下载
确认下载
下载
您还未下载过该资源
无法举报自己的资源

兑换成功

你当前的下载分为234开始下载资源
你还不是VIP会员
开通VIP会员权限,免积分下载
立即开通

你下载资源过于频繁,请输入验证码

您因违反CSDN下载频道规则而被锁定帐户,如有疑问,请联络:webmaster@csdn.net!

举报

若举报审核通过,可返还被扣除的积分

  • 举报人:
  • 被举报人:
  • *类型:
    • *投诉人姓名:
    • *投诉人联系方式:
    • *版权证明:
  • *详细原因: