没有合适的资源?快使用搜索试试~ 我知道了~
word2vec-graph:探索word2vec嵌入作为最近邻居的图
共9个文件
js:3个
gitignore:3个
json:1个
需积分: 9 1 下载量 71 浏览量
2021-02-21
11:35:54
上传
评论
收藏 7KB ZIP 举报
温馨提示
word2vec图 此可视化通过高维word2vec嵌入构建最邻近的图形。 可用图 用于此可视化的数据集来自 ,具有6B令牌,400K词汇表,300维向量。 在此可视化中,当相应单词的向量之间的,在单词之间形成边缘。 具有非单词字符和数字的所有单词都将被删除。 最终的可视化是稀疏但有意义的。 与上述类似,但距离要求有所放松。 距离小于1.0的单词在图中被指定为边。 具有非单词字符和数字的所有单词都将被删除。 随着添加了更多的单词,可视化变得越来越填充。 仍然有意义。 (6.9 MB)-与上面的图表不同,该图表未经过过滤,包含了数据集中的所有单词。 这里形成的大多数簇具有数值性质。 我没有发现这一点特别有趣,但我将其包括在内以说明word2vec如何找到数值簇。 常见的抓取 我还从Common Crawl数据集(840B令牌,2.2M vocab,300d矢量)制作了一个图表。 带
资源推荐
资源详情
资源评论
收起资源包目录
word2vec-graph-master.zip (9个子文件)
word2vec-graph-master
save_text_edges.py 3KB
graph-data
.gitignore 14B
package.json 160B
graph-layout
.gitignore 14B
loadBinGraph.js 646B
.gitignore 19B
edges2graph.js 689B
layout.js 337B
README.md 7KB
共 9 条
- 1
资源评论
火器营松老三
- 粉丝: 20
- 资源: 4649
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功