没有合适的资源?快使用搜索试试~ 我知道了~
常用机器学习算法优缺点分析.pdf
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 6 浏览量
2022-06-14
16:05:22
上传
评论
收藏 560KB PDF 举报
温馨提示
试读
15页
常用机器学习算法优缺点分析.pdf常用机器学习算法优缺点分析.pdf常用机器学习算法优缺点分析.pdf常用机器学习算法优缺点分析.pdf常用机器学习算法优缺点分析.pdf常用机器学习算法优缺点分析.pdf常用机器学习算法优缺点分析.pdf常用机器学习算法优缺点分析.pdf
资源推荐
资源详情
资源评论
常用机器学习算法优缺点分析
编辑导语:机器学习是当下数据分析领域的一个热点内容,我们日常工作中多多
少少都会涉及到一些。但在机器学习领域,算法并不能完全解决所有的问题。本
文梳理了有监督学习和无监督学习的两个方面,列举了其中几种算法,总结它们
的优缺点,分享给你。
机器学习无疑是当前数据分析领域的一个热点内容,其理论和方法已经广泛应
用于解决工程应用的复杂问题,很多人在平时的工作中都或多或少会用到机器学
习的算法。在机器学习领域,没有算法能完美地解决所有问题。比如说,神经网
络并不是在任何情况下都能比决策树更有优势,反之亦然。它们要受很多因素的
影响,比如你的数据集的规模或结构。
其结果是,在用给定的测试集来评估性能并挑选算法时,你应当根据具体的问
题来采用不同的算法。例如,如果模型要求可解释性较强,首先想到的就是逻辑
(线性)回归,如果模型要求准确度较高且速度较快,首先想到的是 Xgboost,
如果数据量巨大且很稀疏,首先想到怎么用神经网络解决此问题。
因此,如何选择机器学习算法、选择哪一个算法以及算法建模时该注意哪些问
题成了工程师的一个难题,本文的目的总结了常用机器学习算法优缺点,供大家
在工作、学习甚至面试中参考。机器学习主要分为有监督学习和无监督学习,本
文从这两方面进行了梳理。
1 / 15
一、有监督算法
有监督学习是指模型学习时有特定目标,即目标是人工标注的,主要用做分类
或者回归。常用的有监督学习主要有 knn、逻辑(线性)回归、决策树、随机森
林、adaboost、GBDT、xgboost、svm、朴素贝叶斯、人工神经网络等算法。
1. 最近邻算法——KNN
KNN 可以说是最简单的分类算法,和另一种机器学习算法 K 均值算法有点像,
但有着本质区别(K 均值算法是无监督算法)。KNN 的全称是 KNearestNeighbors,
意思是 K 个最近的邻居,KNN 的原理就是当预测一个新的值 x 的时候,根据它距
离最近的 K 个点是什么类别来判断 x 属于哪个类别。
KNN 算法的优点:
理论成熟,简单易用,相比其他算法,KNN 算是比较简洁明了的算法,工程上非
常容易实现;模型训练时间快,训练时间复杂度为 O(n),KNN 算法是惰性的;
对数据没有假设,准确度高,对异常值不敏感。
KNN 算法的缺点:
对内存要求较高,因为该算法存储了所有训练数据;
2 / 15
KNN 每一次分类都会重新进行一次全局运算,且对于样本容量大的数据集计算量
比较大(一般涉及到距离计算的模型都会有这种缺点,如后面讲的 SVM、密度聚
类等)。
2. 逻辑(线性)回归
逻辑回归是分类模型,线性回归是回归模型,逻辑回归和线性回归原理相似,
逻辑回归其实仅为在线性回归的基础上,套用了一个逻辑函数。
线性回归的损失函数为均方误差类损失,逻辑回归的损失函数为交叉熵损失。
逻辑回归的损失函数为什么选择交叉熵损失而不选择均方误差是面试中经常
问道的问题,这里简单说一下:使用 MSE 作为损失函数的话,它的梯度是和 sigmod
函数的导数有关的,如果当前模型的输出接近 0 或者 1 时,就会非常小,接近 0,
使得求得的梯度很小,损失函数收敛的很慢。
但是我们使用交叉熵的话就不会出现这样的情况,它的导数就是一个差值,误
差大的话更新的就快,误差小的话就更新的慢点,这正是我们想要的逻辑(线性)
回归的优点:
可解释行强。本人认为这是逻辑(线性)回归最大的优点,应该是机器学习算法
中可解释最强的,因为它训练的参数即为每个特征的权重,并且能够定位到每个
样本的可解释,而且它的输出为概率值;
计算量小,速度很快,存储资源低,工程上实现简单,广泛应用于工业界。
3 / 15
剩余14页未读,继续阅读
资源评论
apple_51426592
- 粉丝: 9548
- 资源: 9658
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功