没有合适的资源?快使用搜索试试~ 我知道了~
(2)求出的方程是否有意义 (3)剩余标准差参考答案:(1)设要求的回归方程为:y = b0 + b1x1 + b2x2 则由表格数据可计算:由可得b1 = 0
资源详情
资源评论
资源推荐
一、某地 29 名 13 岁儿童身高(cm),体重(kg)和肺活量(L)数据见“homework-
6.1-data.txt”,求:
(1)由身高,体重推算肺活量的回归方程;
(2)求出的方程是否有意义;
(3)剩余标准差
参考答案:
(1)设要求的回归方程为:y = b
0
+ b
1
x
1
+ b
2
x
2
则由表格数据可计算:
由
可得 b1 = 0.005017,b2 = 0.054061,b0 = -0.5657
结论:回归方程为 y = -0.5657 + 0.0050x
1
+ 0.0541x
2
(2)检验方程是否有意义,需做 F 检验
H
0
:β
1
=0,β
2
=0
H
1
:β
1
,β
2
不都等于 0
自由度
平方和
均方
U
2
3.0758
1.5379
Q
26
2.5578
0.0984
Lyy
28
5.6336
计算 F=15.6327,查表,F
0.01(2.26)
=5.53,F>F
0.01(2.26)
,所以 P<0.01,因此拒绝 H
0
,认为
方程有意义。
(3)剩余标准差:
结论:剩余标准差是 0.3137.
R code:
>a<-read.table("./data.txt",header = T,sep = "\t")
>ff<-lm(a[,3]~a[,1]+a[,2])
>summary(ff)
Version:1.0 StartHTML:0000000107 EndHTML:0000001535 StartFragment:0000000127
EndFragment:0000001517
Call:
lm(formula = a[, 3] ~ a[, 1] + a[, 2])
Residuals:
Min 1Q Median 3Q Max
-0.54117 -0.25524 -0.00266 0.22039 0.55425
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -0.565664 1.240127 -0.456 0.65208
a[, 1] 0.005017 0.010575 0.474 0.63920
a[, 2] 0.054061 0.015984 3.382 0.00228 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.3137 on 26 degrees of freedom
Multiple R-squared: 0.546, Adjusted R-squared: 0.511
F-statistic: 15.63 on 2 and 26 DF, p-value: 3.485e-05
所以
(1)回归方程为:y=-0.565664+0.005017x
1
+0.054061x
2
(2)因为 F=15.63,p=3.485e-05<0.01,所以方程有意义。
(3)剩余标准差为 0.3137.
二、某农场通过试验取得早稻收获量与春季降雨量和春季温度的数据如下:
收获量
y(kg/mm
2
)
降雨量
x
1
(mm)
温度
x
2
(℃)
2250
25
6
3450
33
8
4500
45
10
6750
105
13
7200
110
14
7500
115
16
8250
120
17
数据见“homework-6.2-data.csv”
建立早稻收获量对春季降雨量和春季温度的二元线性回归方程,计算各回归系数的置
信区间,并对回归模型的线性关系和回归系数进行检验(α=0.05)。
参考答案:
1、多元线性回归的汇总输出:
> a <- read.table('homework-6.2-data.csv',sep = ',',header = TRUE
)
> fit<-lm(y~x1+x2,data=a)
> summary(fit)
Call:
lm(formula = y ~ x1 + x2, data = a)
Residuals:
1 2 3 4 5 6
-275.101 90.464 216.483 140.280 150.676 -316.599
7
-6.203
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -0.591 505.004 -0.001 0.9991
x1 22.387 9.601 2.332 0.0801 .
x2 327.672 98.798 3.317 0.0295 *
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 261.4 on 4 degrees of freedom
Multiple R-squared: 0.9913, Adjusted R-squared: 0.987
F-statistic: 228.4 on 2 and 4 DF, p-value: 7.532e-05
根据 R 输出结果,得到的多元线性回归方程为:
y= -0.591+22.387x
1
+327.672x
2
2、各回归系数的置信区间:
> confint(fit,level=0.95)
2.5 % 97.5 %
(Intercept) -1402.707516 1401.52552
x1 -4.268921 49.04184
x2 53.364699 601.97873
降雨量 x
1
的置信区间为(-4.268921,49.04184),含义是在温度不变的条件下,降雨
量每变动 1mm,收获量的平均变动在-4.268921 到 49.04184 kg/mm
2
之间。
温度 x
2
的置信区间为(53.364699,601.97873),含义是在降雨量不变的条件下,温
度每变动 1℃,收获量的平均变动在 53.364699 到 601.97873 kg/mm
2
之间。
3、线性关系检验是检验因变量 y 与 k 个自变量之间的关系是否显著,也称总体显著性
检验。具体步骤如下:
第 1 步 提出假设:
第 2 步 计算检验统计量 F:
第 3 步 做出决策。给定显著水平 α,根据分子自由度=k,分母自由度=n-k-1 计算出统
计量的 P 值。若 P< α,拒绝原假设,表明 y 与 k 个自变量之间的线性关系显著。
根据以上 R 输出结果,检验统计量 F= 228.4,显著水平 P= 7.532e-05< 0.05,拒绝 H
0
,
即收获量 y 与降雨量 x
1
和温度 x
2
之间的线性关系显著。
4、要判断每个自变量对因变量的影响是否都显著,需要对各回归系数 β
i
分别进行 t 检
验,具体步骤如下:
第 1 步 提出假设。对于任意参数 β
i
( i=1,2,…,k),有
第 2 步 计算检验的统计量 t:
其中: 是回归系数 的抽样分布的标准差。
第 3 步 做出决策。给定显著性水平 α,根据自由度= n-k-1 计算出统计量的 P 值。若
P< α,则拒绝原假设,表明回归系数 β
i
显著。
根据 R 输出结果,降雨量 x
1
和温度 x
2
的回归系数相应的显著水平分别为 0.0801 和
0.0295,只有温度对应的显著性水平小于 0.05 通过检验,这表明影响收获量的自变量
中,只有温度对收获量的影响显著,而降雨量对收获量的影响不显著。
剩余17页未读,继续阅读
chenbtravel
- 粉丝: 16
- 资源: 296
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0