没有合适的资源?快使用搜索试试~
我知道了~
文库首页
人工智能
深度学习
text8.train.txt
text8.train.txt
word2vec
text8
需积分: 36
13 下载量
132 浏览量
2020-06-03
09:51:52
上传
评论
收藏
60MB
TXT
举报
温馨提示
立即下载
word2vec的训练语料库text8.train.txt。一个很长的字符串,用来训练词向量。文件大小大约62M。
资源推荐
资源评论
text8测试文档
浏览:195
5星 · 资源好评率100%
深度学习中word2vector测试语料text8
word2vec訓練集text8.zip
浏览:167
word2vec訓練集text8.zip 使用word2vec的两种方法来构建word embedding,同时将embedding降维显示在图像上 一种是skip-gram ``` w2v_skip_gram.py ``` 一种是CBOW ``` w2v_cbow.py ``` 两种方法都使用负采样的方法计算loss # 输入 经过分词的汉语文章 # 输出 每个分词 + 128 维的词向
自然语言处理NLP训练数据text8.zip
浏览:190
官方的数据下载地址:http://mattmahoney.net/dc/text8.zip Word2Vec练习数据集 text8.zip
word2vec text8数据集
浏览:85
5星 · 资源好评率100%
深度学习中word2vector测试语料text8,Word2Vec数据集。TensorFlow实战
wiki数据集text8.zip
浏览:63
5星 · 资源好评率100%
解压后使用里面的压缩包,双重压缩防止重复资源无法上传。 妾发初覆额,折花门前剧。 郎骑竹马来,绕床弄青梅。 同居长干里,两小无嫌猜, 十四为君妇,羞颜未尝开。 低头向暗壁,千唤不一回。 十五始展眉,愿同尘与灰。 常存抱柱信,岂上望夫台。 十六君远行,瞿塘滟滪堆。 五月不可触,猿声天上哀。 门前迟行迹,一一生绿苔。 苔深不能扫,落叶秋风早。 八月胡蝶来,双飞西园草。 感此伤妾心,坐愁红颜老。 早晚下
使用HMM进行中文分词的train训练trainCorpus.txt文件
浏览:173
Python在Jupyter上使用HMM进行中文分词,将新闻文本分词后提取其中的高频词,HMM训练所需的trainCorpus.txt文件
word2vec Pytorch实现文本数据
浏览:46
里面包含三个文件,text8.dev.txt、text8.test.txt、text8.train.txt。
Word2Vec 需要的数据集 text8.zip
浏览:8
Word2Vec 需要的数据集 text8.zip 下载解压就可以获得text8.zip 下载解压就可以获得text8.zip 下载解压就可以获得text8.zip 下载解压就可以获得text8.zip
中文自然语言处理中文分词训练语料
浏览:78
5星 · 资源好评率100%
本次提供的中文汉语语料syj_trainCorpus_utf8.txt全网免费,转载需要注明出处,语料是作者通过爬取的短文本和网络上的预料处理、合并生成的。整个语料大小264M,包含1116903条数据,数据用空格隔开,可以用来训练分词模型。
文本训练语料集.rar
浏览:120
文本训练语料集.rar
train.txt
浏览:174
train.txt
train_data.txt
浏览:78
命名实体人物优化后语料,对大量单字人物进行了重新标注
txt_train-数据集
浏览:139
my_train_data.txt
浏览:51
my_train_data.txt
text8_word2vec训练数据集
浏览:14
word2vec常用训练数据集,text8数据集,解压后放入程序文件夹下,即可在程序中直接载入。
word2vec语料文档text8.zip
浏览:17
tensorflow实战word2vec用到的语料text8.zip,需要的可以下载
新闻语料的标记与分词——自然语言处理
浏览:103
该函数通过标记的机构名,人名,地名,然后来辨别大陆,港澳台,西方,日本,韩国的国籍
中文语料库:msr_training.utf8.ic
浏览:118
语料库。配合该实验使用:https://blog.csdn.net/admiz/article/details/109846185
微软亚洲研究院中文分词语料_icwb2-data
浏览:41
5星 · 资源好评率100%
微软亚洲研究院中文分词语料库_自然语言处理_科研数据集
Python-大规模中文自然语言处理语料LargeScaleChineseCorpusforNLP
浏览:38
大规模中文自然语言处理语料 Large Scale Chinese Corpus for NLP
train_LM.txt
浏览:125
5星 · 资源好评率100%
语言模型 python实现uni-gram和bi-gram 使用ppl困惑度对比模型效果 山东大学2019NLP实验1
bayes_train_text.txt
浏览:196
1 bayes_train_text.txt
train_step.txt
浏览:103
train_step.txt
目标驱动_train.txt
浏览:60
目标驱动数据集,可以用于对话驱动,该数据集较小,可以验证自己的算法。
Tcl train.txt
浏览:87
Tcl train.txt tcl 语言
total_text_test.zip
浏览:154
4星 · 用户满意度95%
totaltext 测试集,用于测试 totaltext 测试集,用于测试 totaltext 测试集,用于测试
深度学习word2vector测试语料text8
浏览:71
深度学习中word2vector测试语料text8 word2vec是google的一个开源工具,能够根据输入的词的集合计算出词与词之间的距离。 它将term转换成向量形式,可以把对文本内容的处理简化为向量空间中的向量运算,计算出向量空间上的相似度,来表示文本语义上的相似度。 word2vec计算的是余弦值,距离范围为0-1之间,值越大代表两个词关联度越高。 词向量:用Distribute
text8英文语料库
浏览:138
Text8语料库,自己从ewik8语料库中提取出来的,可以用来训练模型,例如word2Vec模型的训练,注意,只适用于英文!
分词训练语料
浏览:15
用于深度学习NLP分词训练,训练模式BEMS,已经标注好,可直接使用
评论
收藏
内容反馈
立即下载
资源评论
资源反馈
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~
联系上传者
评论
xhsun1997
粉丝: 89
资源:
4
私信
上传资源 快速赚钱
我的内容管理
展开
我的资源
快来上传第一个资源
我的收益
登录查看自己的收益
我的积分
登录查看自己的积分
我的C币
登录后查看C币余额
我的收藏
我的下载
下载帮助
前往需求广场,查看用户热搜
最新资源
2023年泰迪杯A题附件一,苹果图像数据集
www_a5tf_17111223930078087.m3u8..m3u
VBS整活代码:生成100个弹窗
各省铁路里程、公路里程、交通网密度数据集(2000-2022年).xlsx
周星驰:start me
基于物联网的智能婴儿床,检测婴儿哭闹、尿湿、体温和音乐摇床等功能
汇编语言-assembly-贪吃蛇游戏-汇编语言期末大作业
CVD.csv数据集import时注意名称
调试版_语音识别智能家居系统.apk
shampoo-sales.csv
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功