下载 >  人工智能 >  机器学习 > dataSet_word2vec训练词向量

dataSet_word2vec训练词向量 评分:

word2vec训练词向量,word2vec训练词向量,word2vec训练词向量
2018-06-19 上传大小:49.25MB
立即下载 开通VIP
分享
收藏 举报
英文维基百科词向量训练语料

enwiki-latest-pages-articles1.xml-p10p30302.bz2,维基百科用来训练英文word2vec词向量的语料

立即下载
中文维基glove词向量(已训练)-part2

中文维基glove词向量(已训练)-part2中文维基glove词向量(已训练)-part2

立即下载
中文维基glove词向量(已训练)-part1

中文维基glove词向量(已训练)-part1,中文维基glove词向量(已训练)-part1

立即下载
基于海量新闻语料训练得到的实体词向量

该资源便于对词向量感兴趣的童鞋进行实验

立即下载
训练好的Word2vec词向量1.35G(使用120G大语料库所得)

训练所采用的语料如下: 12G百度百科词条 20G小说 90G的其他爬虫语料 训练得到词库1.35G,bin和model格式

立即下载
word2vec词向量训练及中文文本相似度计算

word2vec词向量训练及中文文本相似度计算。 word2vec是google在2013年推出的一个NLP工具,它的特点是将所有的词向量化,这样词与词之间就可以定量的去度量他们之间的关系,挖掘词之间的联系。虽然源码是开源的,但是谷歌的代码库国内无法访问,因此本文的讲解word2vec原理以Github上的word2vec代码为准。本文关注于word2vec的基础知识。

立即下载
word2vec词向量训练及中文文本相似度计算 【源码+语料】

该资源主要参考我的博客:word2vec词向量训练及中文文本相似度计算 http://blog.csdn.net/eastmount/article/details/50637476 其中包括C语言的Word2vec源代码(从官网下载),自定义爬取的三大百科(百度百科、互动百科、维基百科)中文语料,涉及到国家、景区、动物和人物。 同时包括60M的腾讯新闻语料,是一个txt,每行相当于一个新闻。 国家包括了Python的Jieba分词代码,详见博客。 免费资源希望对你有所帮助~

立即下载
精简版的fasttext词向量

https://github.com/facebookresearch/fastText/blob/master/pretrained-vectors.md 英文的精简版

立即下载
Glove预训练词嵌入

该预训练词嵌入根据斯坦福大学提出的Glove模型进行训练,主要包括如下四个文件: 1) glove.6B:Wikipedia 2014 + Gigaword 5 (6B tokens, 400K vocab, uncased, 50d, 100d, 200d, & 300d vectors, 822 MB download) 2) glove.42B.300d:Common Crawl (42B tokens, 1.9M vocab, uncased, 300d vectors, 1.75 GB download) 3)glove.840B.300d:Common Crawl (840B to

立即下载
WiKi百科语料 1G多 已分词 可用于Word2Vec训练

WiKi百科语料 1G多 已分词 可用于Word2Vec训练 WiKi百科语料 1G多 已分词 可用于Word2Vec训练

立即下载
Glove词向量 文本分类

文本建模,此项中的模型GLove, word2vec, 在文本分类实用重要的作用

立即下载
fasttext java 版本

fasttext java 版本,可以进行 文本分类,以及词向量的训练

立即下载
基于词向量的机器翻译Python代码

基于词向量的机器翻译Python代码,其中train_word2vec_model.py为训练词向量代码,test.py为测试翻译结果代码。(本文件夹不包含词向量模型、训练集和测试集,仅为代码!!!)

立即下载
Python程序写诗【1分钟】古诗词生成

Python词向量gensim文本生成,训练【一分钟】,诗词歌赋【一秒生成】

立即下载
英文word2vec模型训练语料

本语料适合于使用word2vec英文训练的语料,共98M,包括常用的英文词汇,训练后效果不错。

立即下载
SSWE:embedding-results:融合特定情感的词向量

利用Twitter短文本,在训练词向量时融合进词语考虑带有的情感,得到带有情感信息的词向量。所用模型为SSWE,压缩包内包含三个文本文档:SSWE-h.txt、SSWE-r.txt、SSWE-u.txt。另,训练得到的词向量维度为50.

立即下载
Word2vec谷歌词向量

wrod2vec谷歌词向量实验工具,压缩文档中有词向量实验的具体使用说明txt文档。

立即下载
wiki.zh.text.model

中文维基百科语料库,将其转换为文本文件后,进行繁体字转换为简体字,字符集转换,分词,然后训练得到模型以及向量。由于文件上传的大小限制是60MB,我这里的压缩包中有model,然后对向量提供了下载链接。使用python中的gensim包进行训练得到的,运行时间较长,希望对你们有帮助。

立即下载
cw2vec: Learning ChineseWord Embeddings with Stroke n-gram Information

Alibaba研究的基于中文汉字n元笔画信息的词向量训练模型

立即下载
Python一分钟生成古诗词

Python文本生成程序,从零训练词向量,一分钟生成古诗对联~

立即下载
img

spring mvc+mybatis+mysql+maven+bootstrap 整合实现增删查改简单实例.zip

资源所需积分/C币 当前拥有积分 当前拥有C币
5 0 0
点击完成任务获取下载码
输入下载码
为了良好体验,不建议使用迅雷下载
img

dataSet_word2vec训练词向量

会员到期时间: 剩余下载个数: 剩余C币: 剩余积分:0
为了良好体验,不建议使用迅雷下载
VIP下载
您今日下载次数已达上限(为了良好下载体验及使用,每位用户24小时之内最多可下载20个资源)

积分不足!

资源所需积分/C币 当前拥有积分
您可以选择
开通VIP
4000万
程序员的必选
600万
绿色安全资源
现在开通
立省522元
或者
购买C币兑换积分 C币抽奖
img

资源所需积分/C币 当前拥有积分 当前拥有C币
5 4 45
为了良好体验,不建议使用迅雷下载
确认下载
img

资源所需积分/C币 当前拥有积分 当前拥有C币
1 0 0
为了良好体验,不建议使用迅雷下载
VIP和C币套餐优惠
img

资源所需积分/C币 当前拥有积分 当前拥有C币
5 4 45
您的积分不足,将扣除 10 C币
为了良好体验,不建议使用迅雷下载
确认下载
下载
您还未下载过该资源
无法举报自己的资源

兑换成功

你当前的下载分为234开始下载资源
你还不是VIP会员
开通VIP会员权限,免积分下载
立即开通

你下载资源过于频繁,请输入验证码

您因违反CSDN下载频道规则而被锁定帐户,如有疑问,请联络:webmaster@csdn.net!

举报

若举报审核通过,可返还被扣除的积分

  • 举报人:
  • 被举报人:
  • *类型:
    • *投诉人姓名:
    • *投诉人联系方式:
    • *版权证明:
  • *详细原因: