matlab有些代码不运行word2vec_matlab
Google在Matlab中预先训练的word2vec模型
通过该项目,您可以在Matlab中使用Google在庞大的Google新闻数据集上训练的word2vec模型。
重要说明:请注意,该项目当前确实提供了训练word2vec模型的任何功能。
它只是为您提供经过预先训练的Google模型,并演示了您可以使用此模型完成的一些基本技巧,例如识别相似的单词,识别哪个单词不属于一组单词或完成类推。
如果您有兴趣在自己的文本语料库上训练word2vec模型,建议您查看Python中的gensim包。
原始模型可以在此处公开获得。该模型包含300万个单词的词汇表;
但是,大多数都是垃圾。
我已经过滤掉了大约200,000个单词。
word2vec子目录包含一些用于模型播放的Matlab函数。
编写它们的目的是提供对这些技术的清晰说明。
您可以查看并运行runExample.m以查看这些单词向量的示例用法。
词汇过滤
我通过查找WordNet中的所有单词来过滤原始词汇-我仅保留WordNet中存在的单词。
这样可以将词汇量减少到大约200
评论0
最新资源