自实1701_李星毅_L4习题1
需积分: 0 180 浏览量
更新于2022-08-08
收藏 249KB DOCX 举报
Logistic 回归、Fisher 判别函数、K 均值聚类法
Logistic 回归是机器学习中的一种常用算法,它主要用于二分类问题。Logistic 回归的误差函数为:
𝐸𝑖𝑛 𝑤 =1𝑁∑𝑁1 ln (1 + exp ( ― 𝑦𝑛𝑤𝑇𝑥𝑛))
其中,𝑦𝑛取值为+1或-1,𝑤是参数向量,𝑥𝑛是输入向量,𝑁是样本数量。
推导出该误差函数的梯度表达式需要使用链式法则和求和的性质。对于每个样本,将误差函数展开:
𝐸𝑖𝑛 𝑤 = ln (1 + exp ( ― 𝑦𝑛𝑤𝑇𝑥𝑛))
然后,对于每个样本,计算梯度:
∂𝐸𝑖𝑛 𝑤/∂𝑤 = - 𝑦𝑛𝑥𝑛 / (1 + exp ( ― 𝑦𝑛𝑤𝑇𝑥𝑛))
接着,对所有样本求和:
∂𝐸𝑖𝑛 𝑤/∂𝑤 = - ∑ 𝑦𝑛𝑥𝑛 / (1 + exp ( ― 𝑦𝑛𝑤𝑇𝑥𝑛))
Fisher 判别函数是一种常用的降维方法,它可以将高维空间中的数据投影到低维空间中,从而使数据更易于分类。Fisher 判别函数的目的是找到一个投影方向,使得投影后的数据点之间的距离最大化。
Fisher 判别函数的公式为:
𝑊 = arg max |𝑆𝑏/𝑆𝑤|
其中,𝑆𝑏是between-class covariance matrix,𝑆𝑤是within-class covariance matrix。
在给定的例子中,我们需要使用 Fisher 判别函数法来求出最佳投影方向 𝑊。计算每一类的中心:
𝜇1 = (5+7+10+11.5+14+12)/6
𝜇2 = (35+39+34+37)/4
然后,计算类内离差阵:
𝑆𝑤 = 𝑆1 + 𝑆2
其中,𝑆1和𝑆2是每一类的covariance matrix。
接着,计算类间离差阵:
𝑆𝑏 = (𝜇1 - 𝜇2)(𝜇1 - 𝜇2)ᵀ
计算投影方向 𝑊:
𝑊 = 𝑆𝑤⁻¹𝑆𝑏
K 均值聚类法是一种常用的聚类算法,它可以将数据分成多个类别。K 均值聚类法的步骤为:
1. 随机初始化类心
2. 将每个样本分配到最近的类心
3. 更新类心
4. 重复步骤2和3直到类心收敛
在给定的例子中,我们需要使用 K 均值聚类法将数据聚类成 3 类。随机初始化三类的类心。然后,对每个样本计算其所属的类别,并更新类心。重复这个过程直到类心收敛。
在这个例子中,我们可以看到,使用 K 均值聚类法可以将数据聚类成三类,每类的类心分别为:
𝜇1 = (2.5, 6.5)
𝜇2 = (5.5, 4.5)
𝜇3 = (7.5, 3.5)
这个例子展示了 Logistic 回归、Fisher 判别函数和 K 均值聚类法的应用,它们都是机器学习中常用的算法,可以用于解决分类和聚类问题。
恽磊
- 粉丝: 29
- 资源: 297
最新资源
- 基于二阶自抗扰ADRC的轨迹跟踪控制,对车辆的不确定性和外界干扰具有一定抗干扰性,基于carsim和simulink仿真 跟踪轨迹为双移线,效果良好,有对应复现资料,是学习自抗扰技术快速入门很好的资料
- 基于python的网页自动化工具项目全套技术资料100%好用.zip
- MATLAB【逆变器二次调频模型】 微电网分布式电源逆变器DROOP控制二次调频模型,加入二次控制实现二次调频控制,及二次调压控制,程序可实现上图功能,工况有所改变 需要matlab2021A版
- 抢购软件:快速复制信息
- 单机无穷大系统发生各类(三相短路,单相接地,两相接地,两相相间短路)等短路故障,各类(单相断线,两相断线,三相断线)等断线故障,暂态稳定仿真分析
- 微信文章爬虫项目全套技术资料100%好用.zip
- 基于动态窗口算法的AGV仿真避障 可设置起点目标点,设置地图,设置移动障碍物起始点目标点,未知静态障碍物 动态窗口方法(DynamicWindowApproach) 是一种可以实现实时避障的局部规划算
- Power Quality Disturbance:基于MATLAB Simulink的各种电能质量扰动仿真模型,包括配电线路故障、感应电机启动、变压器励磁、单相 三相非线性负载等模型,可用于模拟各种
- 数据爬虫项目全套技术资料100%好用.zip
- 聊天系统项目全套技术资料100%好用.zip