朴素贝叶斯与拣鱼的故事.rar资源-CSDN文库

共1个文件

pdf：1个

版权申诉

18 浏览量 2023-10-18 18:01:18 上传评论收藏 179KB RAR 举报

资源推荐

资源详情

资源评论

收起资源包目录

package

朴素贝叶斯与拣鱼的故事.rar （1个子文件）

朴素贝叶斯与拣鱼的故事.pdf 207KB

【重版】朴素⻉叶斯与拣⻥的故事

原创

⼣⼩瑶

2017-04-11⼣⼩瑶的卖萌屋

重版公告

由于⼩⼣之后要讲的好⼏篇⽂章要基于这⼀篇的知识，但是以前写的的这篇⽂章对朴素⻉叶斯的讨论不够深⼊，⼜不值得再额外

写⼀篇朴素⻉叶斯啦，因此本⽂重版了以前的⽂章《朴素⻉叶斯》。与旧版相⽐，新版对基础知识的讲解进⾏了⼤幅更新，并加⼊了

⼀些更深的讨论和结论，并重新进⾏了排版。

朴素⻉叶斯分类器可以说是最经典的基于统计的机器学习模型了。⾸先，暂且不管⻉叶斯是什么意思，朴素这个

名字放在分类器中好像有所深意。

⼀查，发现这个分类器的英⽂是“Naïve Bayes”。Naïve（读作“哪义务”）即幼稚的、天真的（但是总不能叫“幼稚⻉

叶斯”阿），Bayes即⻉叶斯。那么这⾥的Naïve/朴素，是什么意思呢？其实就是代表着简化问题复杂度，像⼀个⼩

孩⼦⼀样，不考虑复杂的东西。

Naive

⼀句话描述Naïve的意思就是“特征独⽴性假设”。详细的说，这⾥的独⽴性假设⼀般是指“条件独⽴性假设“，但是

在处理序列问题时（⽐如⽂本分类、语⾳识别），还经常⽤到“位置独⽴性假设”，分别是什么意思呢？

条件独⽴性假设 {

如果我们要识别⼀个⼈的性别，要⽤到“⾝⾼”和“体重”这两个特征。所以这⾥的类别y为男/⼥，特征X=[x1=⾝⾼

x2=体重]。

我们知道，“⾝⾼”和“体重”明明是有关系的，⽐如⾝⾼1⽶8的⼈是不太可能体重低于100⽄的，但是在朴素⻉叶斯

分类器的眼⾥，⾝⾼和体重没有关系。即令 x1=⾝⾼为180cm ， x2=体重为50kg ，则：

意思即⼀个⼈⾝⾼为180cm且体重为50kg的概率就等于⼀个⼈为180cm的概率乘以⼀个⼈为50kg的概率。虽

然⼀个⼈为180cm的概率很⼤（⽐如⼀个男孩⼦），⼀个⼈为50kg的概率也很⼤（⽐如⼀个⼥孩⼦），但是⼈的⾝

⾼为180cm且体重为50kg的概率很⼩。但是在⻉叶斯的条件独⽴性假设下，x1与x2相互独⽴，故是直接将

和这两个⼤概率相乘的，故算出来的概率肯定远⼤于实际值。

总结，朴素⻉叶斯模型会假设特征向量的各个维度间相互独⽴（毫⽆关系）。即“条件独⽴性假设”。

}

位置独⽴性假设{

位置独⽴性假设⼀般不会提，但是如果要⽤朴素⻉叶斯模型解决序列化的分类问题时，就必须引⼊这个假设了。

位置独⽴性的意思是对于序列中各个位置的特征向量，完全忽略其位置信息。举个栗⼦，⽐如在⽂本挖掘中，“我|

喜欢|狗”中有三个特征向量，即分别为向量“我”、向量“喜欢”、向量“狗”，如果我们按照先后顺

序来考虑这三个特征的话，就能得出你喜欢狗这个事实。但是如果按照“狗”“喜欢”“我”这样的顺序的话，得到的意

思就完全变了。显然，这⾥各个特征向量之间的先后顺序（即位置）对于语义相关的分类任务⽽⾔是很重要的。然

⽽，朴素⻉叶斯的假设就是位置之间是独⽴的，即完全抛弃序列的位置信息。因此在朴素⻉叶斯看来，“我|喜欢|

狗”与“狗|喜欢|我”是同⼀个分类任务。

}

好，朴素的意思我们懂了，那么核⼼就是⻉叶斯了。

Bayes

显然，在统计理论中，与⻉叶斯最相关的就是⻉叶斯定理，也叫⻉叶斯公式。不⽤管能不能看懂，先贴出通⽤形式

的公式：

我们把公式⾥的事件A看作样本特征为某值，该值⽤X表⽰。把B看作分类⽬标的类别为某值，该值⽤y表⽰。然后

就会发现⾮常⾮常简单啦，如下：

所以呢，这个公式的意思就是：

公式左边：已知样本特征的值为X的情况下，⽬标类别为y的概率（即，专业说法叫后验概率）就等于

公式右边：什么都不知道的情况下，⽬标类别为y的概率（即，专业说法叫类别y的先验概率）乘以已知⽬标

类别是y的情况下，特征的值为X的概率（即，专业说法叫似然函数）。再除以什么都不知道的情况下，特

征的值为X的概率（即，专业说法叫特征X的先验概率，也有的叫证据)。

诶？细⼼的读者有没有发现什么呢？相信此时肯定已经有⼈激动了！我们这⾥看⼀个栗⼦，引⼊更深的讨论。

就是这个栗⼦。

其实是下⾯的栗⼦啦(￣∇￣)。

假如⼩⼣捕获了⼀批⻥，这批⻥中只有⿊⻥和三⽂⻥。虽然⼩⼣并不认识这两种⻥，但是⼩⼣有设备可以测量出

每条⻥肚⽪的亮度等级（⽐如最⽩为10级，最⿊为1级）。然后有⼀位好⼼的粉丝送给了⼩⼣⼀批标好类别的⿊⻥

和三⽂⻥。那么⼩⼣借助上⾯这些已经知道的东西，⽤朴素⻉叶斯分类器来给⼩⼣捕的那些⻥的类别贴标签，从

内容反馈

版权申诉

QuietNightThought

粉丝: 1w+
资源: 633

最新资源

资源上传下载、课程学习等过程中有任何疑问或建议，欢迎提出宝贵意见哦~我们会及时处理！点击此处反馈

feedback-tip