关于贝叶斯二择一形式公式的几点说明:
1.普通的贝叶斯公式:
<img src="https://wikimedia.org/api/rest_v1/media/math/render/svg/71d8066a406fb22ce08eec25dd04870779345cd3" class="mwe-math-fallback-image-inline" aria-hidden="true" style="vertical-align: -2.671ex; width:25.215ex; height:6.509ex;" alt="P(A|B)={\frac {P(B|A)\,P(A)}{P(B)}}">
2.二择一形式:
<img src="https://wikimedia.org/api/rest_v1/media/math/render/svg/4da5a989fc6ee3c6ece9478f476af4a1e98db269" class="mwe-math-fallback-image-inline" aria-hidden="true" style="vertical-align: -0.838ex; width:64.285ex; height:3.176ex;" alt="P(B)=P(A,B)+P(A^{C},B)=P(B|A)P(A)+P(B|A^{C})P(A^{C})">
其中A^C为A的补集,也可以这样理解成(1-A),结合以上1,2两个式子,我们可以得到下面这个式子3
3. 二分类中的式子:
<img src="https://wikimedia.org/api/rest_v1/media/math/render/svg/03c8d4c9b009705e33ae35317f3c7ae6e1d03485" class="mwe-math-fallback-image-inline" aria-hidden="true" style="vertical-align: -2.671ex; margin-right: -0.229ex; width:45.31ex; height:6.509ex;" alt="P(A|B)={\frac {P(B|A)\,P(A)}{P(B|A)P(A)+P(B|A^{C})P(A^{C})}}.,\!">
但是上面这个式子明显是在两个条件的一个贝叶斯概率计算情况,但是在一般情况下,都不是两个,这个可以扩展到N个条件下,预测贝叶斯概率事件,推倒一般公式,我们可以先从三个条件的开始.:
4 推倒过程:
P(C|AB)=P(AB|C)*P(C)/P(AB) (4.1)
P(AB|C) = P(A|C)*P(B|C) (4.2)
P(AB) = P(A)*P(B) (4.3)
从上面4.1,4.2,4.3三个式子中,我们就可以将一个三个条件的降为多个两个条件的贝叶斯概率事件了.
P(C|AB) = {P(C)P(A|C)*P(B|C)}/{P(A)*P(B)}
,我们在将其写成一般式子
P(C|EAi) = {P(C)P(EAi|C)}/{P(EAi)},然后我们将这个式子代入到我们的计算中,就可以用来简单的预测短信是否是垃圾信息啦~
5. 关于数据集合,从这个地址地方下载的http://archive.ics.uci.edu/ml/
6. 结果展示:
Rofl. Its true to its name>>>>>>|| result( prob spam ): --> 0.15844183241
Free Msg: Ringtone!From: http://tms. widelive.com/index. wml?id=1b6a5ecef91ff9*37819&first=true18:0430-JUL-05>>>>>>|| result( prob spam ): --> 1.0
龚细军>>>>>>|| result( prob spam ): --> 0.5
speak haha>>>>>>|| result( prob spam ): --> 0.00302526687657
helo,there is a ads>>>>>>|| result( prob spam ): --> 0.997563452806
没有合适的资源?快使用搜索试试~ 我知道了~
通过机器学习,贝叶斯二之一形式,对短信进行垃圾消息过滤..zip
共9个文件
xml:4个
py:2个
md:1个
需积分: 5 0 下载量 81 浏览量
2024-04-28
22:35:47
上传
评论
收藏 211KB ZIP 举报
温馨提示
机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。它专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径。 机器学习的发展历程可以追溯到20世纪50年代,当时Arthur Samuel在IBM开发了第一个自我学习程序,一个西洋棋程序,这标志着机器学习的起步。随后,Frank Rosenblatt发明了第一个人工神经网络模型——感知机。在接下来的几十年里,机器学习领域取得了许多重要的进展,包括最近邻算法、决策树、随机森林、深度学习等算法和技术的发展。 机器学习有着广泛的应用场景,如自然语言处理、物体识别和智能驾驶、市场营销和个性化推荐等。通过分析大量的数据,机器学习可以帮助我们更好地理解和解决各种复杂的问题。例如,在自然语言处理领域,机器学习技术可以实现机器翻译、语音识别、文本分类和情感分析等功能;在物体识别和智能驾驶领域,机器学习可以通过训练模型来识别图像和视频中的物体,并实现智能驾驶等功能;在市场营销领域,机器学习可以帮助企业分析用户的购买行为和偏好,提供个性化的产品推荐和定制化的营销策略。 总的来说,机器学习是一个快速发展且充满潜力的领域,它正在不断地改变我们的生活和工作方式。随着技术的不断进步和应用场景的不断扩展,相信机器学习将会在未来发挥更加重要的作用。
资源推荐
资源详情
资源评论
收起资源包目录
通过机器学习,贝叶斯二之一形式,对短信进行垃圾消息过滤..zip (9个子文件)
content
.idea
vcs.xml 180B
workspace.xml 32KB
misc.xml 681B
modules.xml 268B
bystrash.iml 453B
ReadMe.md 2KB
bayes
__init__.py 0B
sms.txt 467KB
emailTrash.py 2KB
共 9 条
- 1
资源评论
生瓜蛋子
- 粉丝: 3794
- 资源: 4174
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功