没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论
1
任务 6.1 回归算法
任务概述
数值预测是对连续值函数进行预测的一类数据挖掘任务,通过构造相关的预
测模型对连续数值进行预测。与分类问题相同之处在于数值预测也是有标号的学
习问题,即监督学习问题,与之不同在于数值预测对连续的变量进行学习和预测,
而分类对于离散的目标进行学习和分类。
回归分析是最常用的统计学数值预测方法,它是在分析现象自变量和因变量
之间相关关系的基础上,建立变量之间的回归方程,并将回归方程作为预测模型,
根据自变量在预测期的数量变化来预测因变量的值。
回归分析主要解决以下几个方面的问题:
① 确定几个特定的变量之间是否存在相关关系, 如果存在的话, 找出它们
之间合适的数学表达式。
② 根据一个或几个变量的值, 预测或控制另一个变量的取值, 并且可以知
道这种预测或控制能达到何种精确度。
③ 进行因素分析。例如在对于共同影响一个变量的许多变量(因素)之间,
找出哪些是重要因素,哪些是次要因素,这些因素之间又有什么关系等等。
回归分析有很广泛的应用, 例如实验数据的一般处理, 经验公式的求得,
因素分析, 产品质量的控制, 气象及地震预报, 自动控制中数学模型的制定等
等。
多元回归分析是研究多个变量之间关系的回归分析方法,按因变量和自变量
的数量对应关系可划分为一个因变量对多个自变量的回归分析(简称为“一对多”
回归分析)及多个因变量对多个自变量的回归分析(简称为“多对多”回归分
析),按回归模型类型可划分为线性回归分析和非线性回归分析。
以下内容分别以线性回归和决策树回归为例进行回归算法方面案例的讲解。
通过本任务的学习:
(1)能够构建线性回归模型对工业大数据进行分析。
(2)能够构建决策树回归模型对工业大数据进行分析。
2
任务实现
6.1.1 线性回归建模
线性回归算法假设每个影响因素与目标之间是线性关系,并通过特征选择,
得到关键影响因素的线性回归系统。该算法是利用数理统计中回归分析,来确定
两种或两种以上变量间相互依赖的定量关系的一种统计方法,通过凸优化的方法
进行求解。在实际业务中应用十分广泛。
图 6-1-1 线性回归图标
数据格式:
① 必须设置类属性(输出),且类属性(输出)必须是连续型(数值);
② 非类属性(输入)可以是连续型(数值)也可以是离散型(名词)。
参数说明:
图 6-1-2 线性回归-参数说明
3
具体参数说明参见表 6-1:
表 6-1 线性回归参数说明
参数
类型
描述
数据标准化
下拉框
设置数据标准化的方法,字符型,取值范围:
无处理,归一化,标准化,默认值为无处理
取值区间下限
文本框
设置归一化取值区间下限,浮点型,取值范围:
[0,∞),默认值为 0
取值区间上限
文本框
设置归一化取值区间上限,浮点型,取值范围:
[0,∞),默认值为 1
正则化参数
文本框
正则化参数控制机器的复杂度,浮点型,取值
范围:[0,∞),默认值为 0.01
收敛容差
文本框
设置终止迭代的误差界,浮点型,取值范围:
[0,∞),默认值为 0.000001
最大迭代次数
文本框
设置最大迭代次数,整型,取值范围:[1,∞),
默认值为 100
罚函数类型
下拉框
设置惩罚函数类型,0 对应 L2 罚函数,1 对应 L1
罚函数,(0,1)之间对应 L1 和 L2 的组合罚函数。
浮点型,取值范围:[0,1],默认值为 0
求解方法
下拉框
选择线性回归的求解方法,文本型,取值范围:
Auto,L-BFGS,Normal (Normal->加权最小二
乘法,L-BFGS->牛顿法,Auto->算法自动选取
(L-BFGS,Normal)中的一种)。默认值为 Auto
是否显示变量
重要性
复选框
用户选择是否分析每个变量对于回归结果的影
响程度,如果选择是,则在洞察中显示参与建
模的每个变量对于模型的贡献程度情况
4
本案例使用的数据集是某水厂投药控制系统实时采集的数据信息,数据均为
瞬时测量值,包括历史原水水质数据、原水流量数据、沉淀池浊度和混凝剂投加
量(PAC 耗)数据等,共 6166 个样本。
数据文件:投药量数据.csv。
数据集说明(共 137 行,6 列)
表 6-2 数据集字段说明
字段名称
数据样例
数据类型
字段描述
时间
2013/8/20
1:00
字符型
瞬时测水时间
原水 PH
7.15
数值型(DOUBLE)
未处理水 PH 值
原水浊度
720.53
数值型(DOUBLE)
未处理水的浊度
出水浊度
0.78
数值型(DOUBLE)
沉淀池出水浊度
取水量
19560
数值型(INT)
原水的流速
PAC 耗
0.27
数值型(DOUBLE)
混凝剂投加量,即 PAC 的
消耗
具体操作如下:
步骤 1:建模区分别拖入“文件输入”节点、“设置角色”节点和”线性回
归”节点,构建如下模型,如图 6-1-3 所示:
图 6-3 线性回归-构建模型
剩余16页未读,继续阅读
资源评论
知识世界
- 粉丝: 355
- 资源: 1万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功