java版商城源码R
中的机器学习
内容
数据预处理
一种。
处理丢失的数据
编码分类数据
将数据集拆分为训练集和测试集
特征缩放
去
回归
回归模型
优点
缺点
线性回归
适用于任何大小的数据集,提供有关特征相关性的信息
线性回归假设
多项式回归
适用于任何大小的数据集,适用于非线性问题
需要选择正确的多项式次数以获得良好的偏差/方差权衡
支持向量回归
(SVR)
易于适应,在非线性问题上效果很好,不受异常值的影响
强制应用特征缩放,不为人所知,更难理解
决策树回归
可解释性,无需特征缩放,适用于线性/非线性问题
在太小的数据集上结果不佳,容易发生过拟合
随机森林回归
强大而准确,在许多问题上表现良好,包括非线性
没有可解释性,容易出现过拟合,需要选择树的数量
简单线性回归
一种。
导入数据集
(Salary_Data.csv)
将数据集拆分为训练集和测试集
将简单线性回归拟合到训练集
预测测试集结果
可视化训练和测试集结果
可视化训练集结果
可视化测试集结果
去
多元线性回归
一种。
湾多元线性回归
-
向后消除:
C。
多元线性回归
-
自动向后消除:
导入数据集
(50_Sta