作者对word2vec的相关代码和算法做了相关调研,本文就是作者关于word2vec调研的总结,也是作为自己以后备用 目录 一、什么是 word2vec? ..........................................................................................................2 二、快速入门...........................................................................................................................3 三、作者八卦...........................................................................................................................4 四、背景知识...........................................................................................................................5 4.1 词向量........................................................................................................................5 4.2 统计语言模型............................................................................................................5 4.3 NNLM ..........................................................................................................................7 4.4 其他 NNLM ................................................................................................................9 4.5 Log-Linear 模型...........................................................................................................9 4.6 Log-Bilinear 模型 ......................................................................................................10 4.6 层次化 Log-Bilinear 模型.........................................................................................10 五、模型.................................................................................................................................11 5.1 CBOW ........................................................................................................................11 5.2 Skip-Gram..................................................................................................................13 5.3 为什么要使用 Hierarchical Softmax 或 Negative Sampling....................................16 六、 Tricks................................................................................................................................17 6.1 指数运算..................................................................................................................17 6.2 按 word 分布随机抽样 ...........................................................................................18 6.3 哈希编码..................................................................................................................20 6.4 随机数......................................................................................................................20 6.5 回车符......................................................................................................................20 6.6 高频词亚采样..........................................................................................................21 七、分布式实现.....................................................................................................................21 八、总结.................................................................................................................................22 参考代码.................................................................................................................................22 参考文献.................................................................................................................................23
- 1
- 粉丝: 7
- 资源: 10
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 基于Vue+NodeJS的学生社团管理系统(前后端代码)
- 基于SSM+JSP的快递管理系统(前后端代码)
- 全球火点数据-modis-2015-2023年
- YOLOv8完整网络结构图详细visio
- LCD1602电子时钟程序
- 西北太平洋热带气旋【灾害风险统计】及【登陆我国次数评估】数据集-1980-2023
- 全球干旱数据集【自校准帕尔默干旱程度指数scPDSI】-190101-202312-0.5x0.5
- 基于Python实现的VAE(变分自编码器)训练算法源代码+使用说明
- 全球干旱数据集【标准化降水蒸发指数SPEI-12】-190101-202312-0.5x0.5
- C语言小游戏-五子棋-详细代码可运行