该存储库包含word2vec模型的实现,该模型利用了负采样和欠采样(如神经网络类中的项目所使用的),语料库处理脚本和在硬编码文件路径上运行该模型的脚本来语料库。 我感谢Stanford CS224n课程的老师,在此课程中,我开发了word2vec模型的第一个纯python实现,以及gensim的创建者RadimŘehůřek,在我优化模型时,我的代码也随之实现(现在,训练代码的“功能”几乎等于gensim的实现,并且在理论上也表现最佳。
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~