朴素贝叶斯分类算法在数据预测中的应用
摘 要:朴素贝叶斯分类方法是数据库分类知识挖掘领域的一项
基本技术,并具有广泛的应用。使用贝叶斯分类算法实现了对经
典数据集 Iris 的分类。实践表明,朴素贝叶斯分类是一种有效的
数据挖掘分类算法。
关键词:数据挖掘;朴素贝叶斯分类;数据预测;鸢尾花(Iris)
数据集
1 数据挖掘
许多人把数据挖掘视为另一个常用的术语:数据中的知识
发现。数据挖掘就是从大量的、不完全的、有噪声的、模糊的、
随机的数据中提取隐含在其中的、人们事先不知道的 ,但又是潜
在的、有用的信息和知识的过程。
本文利用数据挖掘中的朴素贝叶斯分类技术来研究鸢尾
花数据集中有关于鸢尾花分类问题。以鸢尾花数据集为对象,尝
试通过数据挖掘中的朴素贝叶斯分类技术对数据进行分析,实现
对鸢尾花所属分类进行预测,发现鸢尾花所属分类与鸢尾花各项
数据之间的联系,有助于对鸢尾花的培养进行管理。
2 朴素贝叶斯分类算法
n 维特征向量来描述 n 个属性假设每个数据样本用一个
的 值 , 即 X={x\-1,x\-2,...,x\-n} , 假 设 有 m 个 类 , 分 别 用
C\-1,C\-2,...,C\-m 表示。给定的一个未知的数据样本 X(没有标