没有合适的资源?快使用搜索试试~ 我知道了~
用身高和体重数据进行性别分类的实验报告.pdf
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 58 浏览量
2023-05-21
20:50:04
上传
评论
收藏 637KB PDF 举报
温馨提示
试读
25页
用身高和体重数据进行性别分类的实验报告.pdf
资源推荐
资源详情
资源评论
.
.
用身高和体重数据进展性别分类的实验报告〔二〕
一、 根本要求
1、试验非参数估计,体会与参数估计在适用情况、估计结果方面的异同。
2、试验直接设计线性分类器的方法,与基于概率密度估计的贝叶斯分类器进展
比拟。
3、体会留一法估计错误率的方法和结果。
二、具体做法
1、在第一次实验中,挑选一次用身高作为特征,并且先验概率分别为男生 0.5,
女生 0.5 的情况。改用 Parzen 窗法或者 k
n
近邻法估计概率密度函数,得出贝叶斯
分类器,对测试样本进展测试,比拟与参数估计根底上得到的分类器和分类性能
的差异。
2、同时采用身高和体重数据作为特征,用 Fisher 线性判别方法求分类器,将该
分类器应用到训练和测试样本,考察训练和测试错误情况。将训练样本和求得的
决策边界画到图上,同时把以往用 Bayes 方法求得的分类器也画到图上,比拟结
果的异同。
3、选择上述或以前实验的任意一种方法,用留一法在训练集上估计错误率,与
在测试集上得到的错误率进展比拟。
三、原理简述及程序框图
1、挑选身高(身高与体重)为特征,选择先验概率为男生 0.5 女生 0.5 的一组用
Parzen 窗法来求概率密度函数,再用贝叶斯分类器进展分类。
以身高为例
jz*
.
.
本次实验我们组选用的是正态函数窗,即
(u)
1
1
exp
u
2
,窗宽为
2
2
d
,〔d 表示维度〕。因为区
h
N
h / N
〔h 是调节的参量,N 是样本个数〕
V
N
h
N
N
1 1
x x
i
域是一维的,所以体积为
V
N
h
n
。Parzen 公式为
P
N
x
N
i1
V
N
h
N
。
1
N1
1
x x
i
故女生的条件概率密度为
p1
N1
i1
VN1
h
n
1
1
N 2
1
x x
i
男生的条件概率密度为
p2
N 2
i1
VN 2
h
n
2
根据贝叶斯决策规那么
g
x
p
x w
1
p
w
1
p
x w
2
p
w
2
知
如果
p1* p p2*(1 p), x
1
,否那么,
x
2
。
流程图如下:
2、要求是同时采用身高和体重数据作为特征,用 Fisher 线性判别方法求分类器,
将该分类器应用到训练和测试样本,考察训练和测试错误情况。将训练样本和求
得的决策边界画到图上,同时把以往用 Bayes 方法求得的分类器也画到图上,比
拟结果的异同。
说明,取男生和女生的先验概率分别为 0.5,0.5。在设计贝叶斯分类器时,首先求
各类样本均值向量,及
m
i
T
1
N
i
x
x,i 1,2
,然后求各个样本的来内离散度矩阵,
i
及
s
i
x m
i
x m
i
,i 1,2
, 再 求 出 样 本 的 总 类 内 离 散 度 ,
及
xw
i
1
m
1
m
2
求出把二维 X 空
s
p
1
s
1
p
2
s
2
,
根据公式
s
间投影到一维 Y 空间的最好的投影方向。再求出一维 Y 空间中各类样本均值
1
m
i
'
N
i
y
y,i 1,2
,
其中
y
* x
,
本次实验的分界阈值我们用如下方法
i
jz*
.
.
得到:
y
0
N
1
m
1
' N
2
m
2
'
,最后,将测试样本中的值代入,求出 y,并将其与
N
1
N
2
y0 来进展比拟来分类。
根据课本对 Fisher 线性判别法的介绍,得到的算法流程图如下:
3、选择上述或以前实验的任意一种方法,用留一法在训练集上估计错误率,与
在测试集上得到的错误率进展比拟。
这里我们选择 Fisher 线性判别法,用留一法来估计它在训练集上的错误率,并将
结果与 Fisher 线性判别法对测试集进展判别时得到的错误率进展比拟。
具体流程图如下:
四、实验结果及分析总结
1、得到结果如下表
以身高作为特征
h=4
估计方法
女生 男生
先验 先验
男生
错误
女生
错误
个数
8
4
2
30
38
82
总错
误
男生
错误
率
16%
13.6%
32%
女生
错误
率
8.8%
8%
4%
10%
12.67%
27.33%
总错
误率
概率 概率 个数
Parzen 窗法
0.25
0.5
0.75
0.75
0.5
0.25
22
34
80
jz*
.
.
最大似然
Bayes
0.25
0.5
0.75
0.75
0.5
0.25
20
27
60
6.667%
9%
20%
以身高与体重作为特征
h=7
估计方法
女生 男生
先验 先验
概率 概率
Parzen 窗法
0.25
0.5
0.75
最大似然 Bayes
0.25
0.5
0.75
0.75
0.5
0.25
0.75
0.5
0.2
男生
错误
个数
7
38
2
8
29
59
女生
错误
个数
22
2
46
6
3
1
29
40
48
14
32
60
总错
误
男生
错误
率
14%
15.2%
18.4%
3.2%
11.6%
23.6%
8.8%
4%
4%
12%
6%
2%
9.67%
13.33%
16%
4.67%
10.67%
20%
女生错
误率
总错误
率
分析:通过比拟可知,在用最大似然估计这种参数估计方法和 Parzen 这种非参
数估计方法来进展分类时,最大似然估计判别的错误率低。
2、得到结果如下
〔1〕、用 Fisher 线性判别方法求分类器,将分类器应用到训练和测试样本上,比
jz*
.
.
拟其错误率
判别
对象
测试样
本
训练样
本
分析:用训练样本得到的分类器测试测试样本时错误率低,测试结果较好,但测
试训练样本时,其错误率较高,测试结果不好。
〔2〕、将训练样本和求得的决策边界画到图上
先验概略为 0.5,0.5
从图中我们可以直观的比拟出对训练样本 Fisher 判别比最大似然 Bayes 判别效果
更好。
3、留一法测试结果如下:
判别
对象
jz*
男生错
误个数
女生错
误个数
总错误 男生错
误率
女生错
误率
总错误
率
27 2 29 10.8% 4% 9.67%
8 4 12 16% 8% 12%
男生错
误个数
女生错
误个数
错误率
剩余24页未读,继续阅读
资源评论
hhappy0123456789
- 粉丝: 58
- 资源: 5万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功