GSDMM:我自己的用于数字万用表(Dirichlet多项式混合)的Gibbs采样的实现-源码

所需积分/C币:19 2021-05-14 03:33:11 202KB ZIP
10
收藏 收藏
举报

动机 当我在进行数据挖掘课程的第三个家庭作业:将简短的文本聚类时,我在参考资料部分找到了这篇论文,原来是张老师在课堂上推荐的。 因此,我当然要借助在线资源来实现自己提出的GSDMM算法。 注意 该实现仍在进行中。 资料格式 vacabulary.json ,每行带有一个单词及其对应的id。 train_tokens.json ,每行带有一个doc-id及其令牌列表。 train_topics.json ,用于验证。 参考 纸 Yin,J. and Wang,J.,2014年8月。 基于Dirichlet多项式混合模型的短文本聚类方法。 在第20届ACM SIGKDD国际会议上,有关知识发现和数据挖掘的会议(第233-242页)。 Nguyen,DQ,Billingsley,R.,Du,L.,&Johnson,M.(2015年)。 用潜在特征词表示法改进主题模型。 ,3,299-313

...展开详情
立即下载
限时抽奖 低至0.43元/次
身份认证后 购VIP低至7折
一个资源只可评论一次,评论内容不能少于5个字
您会向同学/朋友/同事推荐我们的CSDN下载吗?
谢谢参与!您的真实评价是我们改进的动力~
  • 至尊王者

关注 私信
上传资源赚钱or赚积分
最新推荐
GSDMM:我自己的用于数字万用表(Dirichlet多项式混合)的Gibbs采样的实现-源码 19积分/C币 立即下载
1/0