没有合适的资源?快使用搜索试试~ 我知道了~
1183710113-许健-Lab3-Report1
需积分: 0 0 下载量 171 浏览量
2022-08-03
14:05:40
上传
评论
收藏 1.78MB PDF 举报
温馨提示
试读
18页
1. 根据输的超参数 2. 根据初始化的均值向量给出训练样本的个划分,计算各个训练样本到各个均指向量的距离, 3. 根据新的簇划分,重新计算每个簇的均值向量,如
资源详情
资源评论
资源推荐
2020
年
春
季学
期
计
算
学
部
《
机
器
学
习
》
课
程
Lab3
实
验
报
告
姓
名
许
健
学
号
1183710113
班
号
1837101
电
⼦
邮
件
941197279@qq.com
⼿
机
号
码
18945062342
1
实
验
⽬的
实
现
⼀个
k-means
算
法
和
混
合
⾼
斯
模
型
,
并
且
⽤
EM
算
法
估
计
模
型
中
的
参
数
。
2
实
验
要
求
及
实
验
环
境
2.1
实
验
要
求
测
试
:
⽤
⾼
斯
分
布
产
⽣
k
个
⾼
斯
分
布
的
数
据
(
不
同
均
值
和
⽅
差
)(
其
中
参
数
⾃
⼰
设
定
)
。
(
1
)
⽤
k-means
聚
类
,
测
试
效
果
;
(
2
)
⽤
混
合
⾼
斯
模
型
和
你
实
现
的
EM
算
法
估
计
参
数
,
看看
每
次
迭
代
后
似
然
值
变
化
情
况
,
考
察
EM
算
法
是
否
可
以
获
得
正
确
的
结
果
(
与
你
设
定
的
结
果
⽐
较
)
。
应
⽤
:
可
以
UCI
上
找
⼀个
简
单
问
题
数
据
,
⽤
你
实
现
的
GMM
进
⾏
聚
类
。
2.2
实
验
环
境
Windows 10, Python 3.8.5, Jupyter notebook
3
实
验
原
理
本
实
验
分
为两
部
分
:
K-means
和
GMM
,
这
两
部
分
都
是
属
于
EM
算
法
,
而
EM
算
法
主
要
分
为两
步
:
E
步
:
求
期望
M
步
:
求
最
⼤
似
然
E
步
是
调
整
分
布
,
M
步
是
根
据
E
步
得
到
的
分
布
求
得当
前
分
布
下
取
到
最
⼤
似
然
时
的
参
数
,
然
后
更
新
参
数
,
再
次
进
⼊
E
步
根
据
得
到
的
参
数
调
整新
的
分
布
,
如
此
往
复
循
环
,
直
到
参
数
收
敛
。
3.1 K-means
给
定
训
练
样
本
,
和
划分
聚
类
的
数
量
,
给
出
⼀个
簇
划分
,
使
得
该
划分
的
平
⽅
误
差
最
小
化
,
即
使
下
式
取
最
小
值
:
其
中
, ,
它
是
簇
的
均
值
向
量
。
刻
画
了
簇
内
样
本
围
绕
簇
的
均
值
向
量
的
紧
密
程
度
,
越
小
簇
内
样
本
的相
似
度
越
⾼
。
具
体
迭
代
过
程
如
下
:
1.
根
据
输
⼊
的
超
参
数
⾸
先
初
始
化
⼀
些
向
量
(
可
以从
现
有
的
向
量
中
挑
选
),
作
为
各
簇
的
均
值
向
量
。
2.
根
据
初
始
化
的
均
值
向
量
给
出
训
练
样
本
的
⼀个
划分
,
计
算
各
个
训
练
样
本
到
各
个
均
指
向
量
的
距
离
,
找
出
距
离
最
近
的
均
值
向
量
,
并
将
该
样
本
分
⾄
该
均
值
向
量
所
代
表
的
簇
。
3.
根
据
新
的
簇
划分
,
重
新
计
算
每
个
簇
的
均
值
向
量
,
如
果
新
的
均
值
向
量
与
旧
的
均
值
向
量
差
小
于
,
则
认
为
算
法
收
敛
;
否
则
,
更
新
均
值
向
量
,
回
到
第
2
步
重
新
迭
代
求
解
。
K-means
算
法
的
流
程
图
如
下
:
Start
输
⼊
期望
的
聚
类
数
K
随
机
选
取
K
个
样
本
为
初
始
聚
类
中
⼼
遍
历
样
本
,
根
据
样
本
到
每
个
中
⼼
的
距
离
确
定它
的
标
签
根
据
得
到
的
标
签
重
新
计
算
样
本
中
⼼
聚
类
中
⼼
收
敛
?
End
yes
no
K-means
实
现
:
def kmeans(X, k, epsilon=1e-5):
"""
K-means
算
法
实
现
,
算
得
分
类
结
果
和
中
⼼
"""
center = np.zeros((k, X.shape[1]-1))
for i in range(k):
1
2
3
4
5
6
3.2 GMM
多
元
⾼
斯
分
布
⽣
成
的
维
随
机
变
量
的
密
度
函
数
为
:
其
中
为
维
的
均
值
向
量
,
为
的
协
⽅
差
矩
阵
。
给
定
训
练
样
本
集
,
它
是
⼀个
的
矩
阵
,
为
样
本
数
量
,
为
单
个
样
本
的
维
度
数
量
。
对
于
⼀个
样
本
,
我
们
可
以
认
为
它
是
由
多
个
对
应
维
度
的
多
元
⾼
斯
分
布
所
⽣
成
,
所
以
⾼
斯
分
布
的
线
性
叠
加
来
表
征
数
据
,
假
设
数
据
由
个
⾼
斯
分
布
混
合
⽣
成
:
其
中
和
是
第
个
⾼
斯
分
布
的
均
值
和
协
⽅
差
矩
阵
,
为
相
应
的
混
合
系
数
,
满
⾜
。
因
此
,
我
们
也
可
以
认
为
该
数
据
的
⽣
成
相
当
于从
个
⾼
斯
分
布
中
挑
选
出
⼀个
所
⽣
成
,
我
们
设
维
⼆
值
变
量
,
这
个
变
量采
⽤
了
“ ”
表
⽰
⽅
法
,
其
中⼀个
特
定
的
元
素
等
于
1
,
其
余
所
有
的
元
素
等
于
0
。
于
是
的
值
满
⾜
且
,
则
加
权
平
均
概
率
值
可
以
表
征
的
分
布
,
也
就
是
说
的
先
验
分
布
为
:
而
在
看
到
的
情
况
下
的
后
验
概
率
为
:
center[i,:] = X[np.random.randint(0, high=X.shape[0]),:-1]
while True:
distance = np.zeros(k)
#
根
据
中
⼼
重
新
给
每
个
点
贴
分
类
标
签
for i in range(X.shape[0]):
for j in range(k):
distance[j] = np.linalg.norm(X[i,:-1] - center[j, :])
X[i, -1] = np.argmin(distance)
#
根
据
每
个
点
新
的
标
签
计
算
它
的
中
⼼
new_center = np.zeros((k, X.shape[1]-1))
count = np.zeros(k)
for i in range(X.shape[0]):
new_center[int(X[i, -1]), :] += X[i, :-1] #
对
每
个
类
的
所
有
点
坐
标
求
和
count[int(X[i, -1])] += 1
for i in range(k):
new_center[i, :] = new_center[i, :] / count[i] #
对
每
个
类
的
所
有
点
坐
标
求
平
均
值
if np.linalg.norm(new_center - center) < epsilon: #
⽤
差
值
的
⼆
范
数
表
⽰
精
度
break
else:
center = new_center
return X, center
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
剩余17页未读,继续阅读
坐在地心看宇宙
- 粉丝: 24
- 资源: 330
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0