科技资讯
2014 NO.29
SCIENCE & TECHNOLOGY INFORMATION
信 息 技 术
22
科技资讯 SCIENCE & TECHNOLOGY INFORMATION
回归分析是数据分析中使用很多的一
种方法。回归分析是定量的给出变量间的
变化规律,它不仅提供变量间的回归方程,
而且可以判断所建立回归方程的有效性。
在方程有效性的前提下,可以用方程做预
测和控制,并了解预测和控制的精度。多元
回归分析预测法,是指通过对两个或两个
以上的自变量与一个因变量的相关分析,
建立预测模型进行预测的方法。当自变量
与因变量之间存在线性关系时,称为多元
线性回归分析。
MINITAB软件是现代质量管理统计的
领导者,全球六西格玛实施的共同语言,它
以无可比拟的强大功能和简易的可视化操
作获得了广大质量学者和统计专家的青
睐。MINITAB软件是为质量改善、教育和
研究应用领域提供统计软件和服务,是质
量管理和六西格玛实施软件工具,更是持
续质量改进的良好工具软件。
1 多元线性回归分析的一般模型
多元线性回归分析的一般模型为:设
p
xxx ,,,
21
Λ
是
) 2 (
p
个自变量( 解释变
量),
是因变量,多元线性回归模型的理
论假设是
εββββ +++++=
pp
xxxy Λ
22110
,
),0(~
2
σε N
,
其中,
p
ββββ ,,,,
210
Λ
是 1
个未知参
数,
0
β 称为回归常数,
p
βββ ,,,
21
Λ
称为回归
系数,
),0(~
2
σε N
为随机误差。
2 MINITAB 软件建立模型
下面通过一个实例来详细讲解,如何
运用MINITAB软件进行多元线性回归。现
抽取20个家庭调查资料的部分变量,数据
见表1,试对父母身高与儿子身高进行回归
分析。
使用MINITAB软件, 输入表1中数据,
选择指令“统计>回归>回归”,在出现界
面输入相应的变量名;打开“图形”窗 ,选择
“四合一”及在“残差与变量”中填入各自变
量名称;打开“存储”窗 ,选择“残差”、“标准
化残差”及“拟合值”,点击“确定”后 ,得到
输出结果。
MINITAB输出结果:
回归方程:
儿子身高=-23.7+0.303父亲身高+0.
880母亲身高+0.0593锻炼次数
S=1.11974 R-sq=96.33% R-sq(调整)
=95.65%
回归方程拟合出来以后,我们要解决
以下几个问题:(1)给出方程显著性检验,从
总体上判定回归方程有效与否。(2)给出方
程总效果好坏的度量。(3)在回归方程效果
显著时,对各个回归系数进行显著性检验,
将效应不显著的自变量删除,以优化模型,
这点在多元回归中尤为重要。(4)残差诊断,
检验数据是否符合回归的基本假定,检验
整个回归模型与数据拟合的是否很好,可
否进一步改进回归方程来优化现有模型。
3 MINITAB 输出结果分析
如何判断整个回归方程是否有意义?
就要进行回归方程显著性检验,也就是要
检验下列问题:H
0
:模型无意义,H
1
模型有
意义。本例(表3)ANOVA表中P =0<0.05,
所以拒绝H
0
:模型无意义,接受H
1
模型有意
义。说明在显著性水平a=0.05下,线性回归
方程总效果是显著的。
如果实际观测值与拟合出来的回归线
多元线性回归分析实例分析
王华丽
(湖北文理学院数学与计算机科学学院 湖北襄阳 441052)
摘 要:多元线性回归是简单线性回归的推广,研究的是一个变量与多个变量之间的依赖关系。作为质量统计软件领域的领导者,MINITAB
是一个精确的、强大的、使用方便的统计软件。多元回归分析预测法,是指通过对两个或两个以上的自变量与一个因变量的相关分析,建立
预测模型进行预测的方法。当自变量与因变量之间存在线性关系时,称为多元线性回归分析。该文通过一个具体实例介绍如何运用MINITAB
软件,建立儿子身高与父母身高、年锻炼次数的多元线性回归模型,并对MINITAB的输出结果进行分析,得出方程效果良好的结论。
关键词:MINITAB软件 多元线性回归 显著性 实例分析
中图分类号:O212 文献标识码:A 文章编号:1672-3791(2014)10(b)-0022-02
编号 父亲身高(cm ) X 1 母亲身高(cm ) X 2 年参加锻炼次数 X 3 儿子身高(cm ) Y
1 172 163 90 176
2 171 159 70 172
3 169 158 50 170
4 171 161 65 174
5 167 159 50 169
6 172 163 100 177
7 172 160 60 171
8 170 162 70 173
9 175 166 110 182
10 179 166 100 183
11 176 164 90 180
12 171 159 80 174
13 167 158 60 172
14 176 163 70 177
15 172 162 70 175
16 181 169 90 186
17 174 167 80 182
18 170 161 70 174
19 183 169 120 187
20 176 165 110 182
表 1 父母身高与儿子身高
项 系数 系数标准误 T 值 P 值
常量 - 23.7 18.9 - 1.25 0.228
父亲身高 0.303 0.137 2.22 0.042
母亲身高 0.880 0.181 4.85 0.000
锻炼次数 0.0593 0.0215 2.76 0.014
表 2 回归系数显著性检验表
来源 自由度 Adj SS Adj MS F值 P 值
回归 3 527.139 175.713 140.14 0.000
父亲身高 1 6.159 6.159 4.91 0.042
母亲身高 1 29.521 29.521 23.54 0.000
锻炼次数 1 9.578 9.578 7.64 0.014
误差 16 20.061 1.254
合计 19 547.200
表 3 ANOVA 分析表
(下转 24 页)
DOI:10.16661/j.cnki.1672-3791.2014.29.001
评论0
最新资源