没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
试读
64页
【课程简介】 本课程适合所有需要学习机器学习技术的同学,课件内容制作精细,由浅入深,适合入门或进行知识回顾。 本章为该课程的其中一个章节,如有需要可下载全部课程 全套资源下载地址:https://download.csdn.net/download/qq_27595745/85252312 【全部课程列表】 第1章 机器学习和统计学习 共75页.pptx 第2和12章 感知机和统计学习方法总结 共27页.pptx 第3章 k-近邻算法 共69页.pptx 第4章 贝叶斯分类器 共79页.pptx 第5章 决策树 共98页.pptx 第6章 Logistic回归 共75页.pptx 第7章 SVM及核函数 共159页.pptx 第8章 adaboost 共75页.pptx 第9章 EM算法 共48页.pptx 第10章 隐马尔科夫模型 共64页.pptx 第11章 条件随机场 共63页.pptx 第13章 无监督学习概论 共27页.pptx 第14章 聚类方法 共52页.pptx 第15章 奇异值分解 共66页.pptx 第16章 主成分分析 共67页.pptx 第17章 潜在语义
资源推荐
资源详情
资源评论
第二十章
潜在狄利克雷分配
潜在狄利克雷分配
•
潜在狄利克雷分配 (latent Dirichlet allocation, LDA) ,作为
基于贝叶斯学习的话题模型,是潜在语义分析、概率潜在语义分
析的扩展,
•
LDA 在文本数据挖掘、图像处理、生物信息处理等领域被广泛
使用
潜在狄利克雷分配
•
LDA 模型是文本集合的生成概率模型
•
假设每个文本由话题的一个多项分布表示,每个话题由单词的一
个多项分布表示
•
特别假设文本的话题分布的先验分布是狄利克雷分布,话题的单
词分布的先验分布也是狄利克雷分布
•
先验分布的导入使 LDA 能够更好地应对话题模型学习中的过拟
合现象
潜在狄利克雷分配
•
LDA 的文本集合的生成过程如下:
•
首先随机生成一个文本的话题分布
•
之后在该文本的每个位置,依据该文本的话题分布随机生成一个
话题
•
然后在该位置依据该话题的单词分布随机生成一个单词,直至文
本的最后一个位置,生成整个文本。
•
重复以 上过程生成所有文本。
潜在狄利克雷分配
•
LDA 模型是含有隐变量的概率图模型
•
模型中,每个话题的单词分布,每个文本的话题分布,文本的每
个位置的话题是隐变量
•
文本的每个位置的单词是观测变量
•
LDA 模型的学习与推理无法直接求解,通常使用吉布斯抽样
( Gibbs sampling )和变分 EM 算法( variational EM
algorithm) ,前者是蒙特卡罗法,而后者是近似算法。
剩余63页未读,继续阅读
资源评论
passionSnail
- 粉丝: 406
- 资源: 5624
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功