没有合适的资源?快使用搜索试试~ 我知道了~
山东大学2018机器学习期末考试题1
需积分: 0 1 下载量 17 浏览量
2022-08-08
23:00:24
上传
评论
收藏 523KB DOCX 举报
温馨提示
试读
5页
4.对模型进行了过度训练 1. 获取和使用更多的数据(数据集增强)——解决过拟合的根本性方法 2. 采用合适的模型(控制模型的复杂度) 3. 降低特征的数量:
资源详情
资源评论
资源推荐
名词解释(5' * 4)
1. 机器学习/数据挖掘
数据挖掘:是通过对(大规模)观测数据集的分析,寻找确信的关系,并将数据以一种可理解的
且利于使用的新颖方式概括数据的方法.
机器学习:如果说计算机程序可以从经验E中学习有关某类任务T和绩效指标P的信息,则该
计算机程序是否可以通过经验E来提高在任务T中的绩效(由P衡量)
2. 主动学习/无监督学习/有监督学习/强化学习/半监督学习/在线学习/(课本P13)
主动学习通过一定的算法查询最有用的未标记样本,并交由专家进行标记,然后用查询到
的样本训练分类模型来提高模型的精确度。
深度学习(英语:deep learning)是机器学习的分支,是一种以人工神经网络为架构,对
资料进行表征学习的算法。
3. ID3(决策树算法。)(C4.5/CART算法)
ID3算法(Iterative Dichotomiser 3 迭代二叉树3代)是一个由Ross Quinlan发明的用于决
策树的算法。以信息增益为标准来选择划分属性。
C4.5算法是由Ross Quinlan开发的用于产生决策树的算法。该算法是对Ross Quinlan之前
开发的ID3算法的一个扩展。C4.5算法以增益率为标准来选择最有划分属性。C4.5算法产生的
决策树可以被用作分类目的,因此该算法也可以用于统计分类。
4. 神经网络/支持向量机(VC维)/集成学习/K-means
神经网络:(人工)神经网络是模仿大脑学习过程的计算模型,它们具有神经元的基本特
征及其在大脑中的相互连接,通常情况下,计算机会编程来模拟这些特征。
VC维:VC维被定义为算法可以破碎(shatter)的最大点集的基数,在这里破碎(shatter)意为若
对于一个假设空间H,如果存在m个数据样本能够被假设空间H中的函数按所有可能的2^h种形式分开,
则称假设空间H能够把m个数据样本破碎(shatter)
集成学习:
K-means:k均值聚类算法(k-means clustering algorithm)是一种迭代求解的聚类分析算法
神经网络的特点:大规模并行处理、结实、自适应和组织、足以模拟非线性关系、硬件
激活函数:
批量学习:在批处理学习中,在呈现所有N个训练样本之后,对多层感知器的突触权重进行调整。一次代
表所有N个样本的训练过程称为训练的一个时期。因此,批处理学习的成本函数由平均误差能量Eav定
义。
高工-老罗
- 粉丝: 20
- 资源: 314
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0