
IRIS 数据集的 Bayes 分类实验
一、 实验原理
1) 概述
模式识别中的分类问题是根据对象特征的观察值将对象分到
某个类别中去。统计决策理论是处理模式分类问题的基本理论之
一,它对模式分析和分类器的设计有着实际的指导意义。
贝叶斯(Bayes)决策理论方法是统计模式识别的一个基本方法,
用这个方法进行分类时需要具备以下条件:
➢ 各类别总体的分布情况是已知的。
➢ 要决策分类的类别数是一定的。
其基本思想是:以 Bayes 公式为基础,利用测量到的对象特征
配合必要的先验信息,求出各种可能决策情况(分类情况)的后
验概率,选取后验概率最大的,或者决策风险最小的决策方式(分
类方式)作为决策(分类)的结果。也就是说选取最有可能使得对
象具有现在所测得特性的那种假设,作为判别的结果。
常用的 Bayes 判别决策准则有最大后验概率准则(MAP),极大
似然比准则(ML),最小风险 Bayes 准则,Neyman-Pearson 准则
(N-P)等。
2) 分类器的设计
对于一个一般的 c 类分类问题,其分类空间:
表特性的向量为:
其判别函数有以下几种等价形式:
a)
� �
� �
iji
wwijcjwwxwPxwP ������� ,且, ,,2,1
1
�
��
,
b)
� �
� �
� �
� �
ijji
wwijcjwPwxpwPwxp ����� ,且, ,,2,1
i
�
��
c)
� �
� �
� �
� �
� �
i
i
j
j
i
wwijcj
wP
wP
wxp
wxp
xl ������ ,且, ,,2,1 �
�
�
d)
� �
� �
� �
� �
ijjii
wwijcjwPwxnpwPwxp ������� ,且, ,,2,1lnlnln �
��
3) IRIS 数据分类实验的设计
➢ IRIS 数据集:
评论0
最新资源