没有合适的资源?快使用搜索试试~ 我知道了~
概率论与数理统计第十章回归分析.pdf
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 107 浏览量
2022-07-03
14:24:58
上传
评论
收藏 1.79MB PDF 举报
温馨提示
试读
27页
概率论与数理统计第十章回归分析.pdf概率论与数理统计第十章回归分析.pdf概率论与数理统计第十章回归分析.pdf概率论与数理统计第十章回归分析.pdf概率论与数理统计第十章回归分析.pdf概率论与数理统计第十章回归分析.pdf概率论与数理统计第十章回归分析.pdf概率论与数理统计第十章回归分析.pdf概率论与数理统计第十章回归分析.pdf
资源推荐
资源详情
资源评论
第十章 回归分析
回归分析方法是数理统计中的常用方法之一,是处理多个变量之间相关关系的一种
数学方法.
第一节 回归分析的概述
在客观世界中变量之间的关系有两类,一类是确定性关系,例如欧姆定律中电压 U
与电阻 R、电流 I 之间的关系为 U=IR,如果已知这三个变量中的任意两个,则另一个
就可精确地求出.另一类是非确定性关系即所谓相关关系.例如,正常人的血压与年龄有
一定的关系,一般来讲年龄大的人血压相对地高一些,但是年龄大小与血压高低之间的
关系不能用一个确定的函数关系表达出来.又如施肥量与农作物产量之间的关系,树的高
度与径粗之间的关系也是这样.另一方面,即便是具有确定关系的变量,由于试验误差的
影响,其表现形式也具有某种程度的不确定性.
具有相关关系的变量之间虽然具有某种不确定性,但通过对它们的不断观察,可以
探索出它们之间的统计规律,回归分析就是研究这种统计规律的一种数学方法.它主要解
决以下几方面问题.
(1)从一组观察数据出发,确定这些变量之间的回归方程.
(2)对回归方程进行假设检验.
(3) 利用回归方程进行预测和控制.
实用文档
回归方程最简单的也是最完善的一种情况,就是线性回归方程.许多实际问题,当自
变量局限于一定范围时,可以满意地取这种模型作为真实模型的近似,其误差从实用的
观点看无关紧要 .因此,本章重点讨论有关线性回归的问题 .现在有许多数学软件如
Matlab,SAS 等都有非常有效的线性回归方面的计算程序,使用者只要把数据按程序要
求输入到计算机,就可很快得到所要的各种计算结果和相应的图形,用起来十分方便.
我们先考虑两个变量的情形.设随机变量
y
与
x
之间存在着某种相关关系.这里
x
是
可以控制或可精确观察的变量,如在施肥量与产量的关系中,施肥量是能控制的,可以
随意指定几个值
x
1
,
x
2
,…,
x
n
,故可将它看成普通变量,称为自变量,而产量
y
是随机变量,
无法预先作出产量是多少的准确判断,称为因变量.本章只讨论这种情况.
由
x
可以在一定程度上决定
y
,但由
x
的值不能准确地确定
y
的值.为了研究它们的
这种关系,我们对(
x
,
y
)进行一系列观测,得到一个容量为
n
的样本(
x
取一组不完全相同
的值):(
x
1
,
y
1
),(
x
2
,y
2
),…,(
x
n
,
y
n
),其中
y
i
是
x
=
x
i
处对随机变量
y
观察的结果.每对(
x
i
,
y
i
)在直
角坐标系中对应一个点,把它们都标在平面直角坐标系中,称所得到的图为散点图.如图
10-1.
图 10-1
由图 10-1a 可看出散点大致地围绕一条直线散布,而图 10-1b 中的散点大致围绕
实用文档
一条抛物线散布,这就是变量间统计规律性的一种表现.
如果图中的点像图 10-1a 中那样呈直线状,则表明
y
与
x
之间有线性相关关系,
我们可建立数学模型
y
=
a
+
bx
+
ε
(10.1)
来描述它们之间的关系.因为
x
不能严格地确定
y
,故带有一误差项
ε
,假设
ε
~
N
(0,
σ
2
),
相当于对
y
作这样的正态假设,对于
x
的每一个值有
y
~
N
(
a
+
bx
,
σ
2
),其中未知数
a
,
b
,
σ
2
不依赖于
x
,(10.1)式称为一元线性回归模型(Univariable linear regression model).
在(10.1)式中,
a
,
b
,
σ
2
是待估计参数.估计它们的最基本方法是最小二乘法,这将在
下节讨论.记和是用最小二乘法获得的估计,则对于给定的
x
,方程
ˆ
(10.2)
ˆ
a
ˆ
bxy
称为
y
关于
x
的线性回归方程或回归方程,其图形称为回归直线.(10.2)式是否真正描述
了变量
y
与
x
客观存在的关系,还需进一步检验.
实际问题中,随机变量
y
有时与多个普通变量
x
1
,
x
2
,…,
x
p
(
p
>1)有关,可类似地建立
数学模型
y
=
b
0
+
b
1
x
1
+…+
b
p
x
p
+
ε
,
ε
~
N
(0,
σ
2
), (10.3)
其中
b
0
,
b
1
,…,
b
p
,
σ
2
都是与
x
1
,
x
2
,…,
x
p
无关的未知参数.(10.3)式称为多元线性回归模型,
和前面一个自变量的情形一样,进行
n
次独立观测,得样本:
(
x
11
,
x
12
,…,
x
1
p
,
y
1
),…,(
x
n
1
,
x
n
2
,…,
x
np
,
y
n
)
实用文档
有了这些数据之后,我们可用最小二乘法获得未知参数的最小二乘估计,记为0,1,…,
p
,
得多元线性回归方程
ˆ
b
ˆ
x
ˆ
=
b
y
0 1 1
ˆ
x b
p p
(10.4)
同理,(10.4)式是否真正描述了变量
y
与
x
1
,
x
2
,…,
x
p
客观存在的关系,还需进一步
检验.
第二节 参数估计
1.一元线性回归
最小二乘法是估计未知参数的一种重要方法,现用它来求一元线性回归模型(10.1)
式中
a
和
b
的估计.
最 小 二 乘 法 的 基 本 思 想 是 : 对 一 组 观 察 值 (
x
1
,
y
1
),(
x
2
,
y
2
), … ,(
x
n
,
y
n
), 使 误 差
ε
i
=
y
i
-(
a
+
bx
i
)的平方和
Q
(
a
,
b
) =
i
y
i
a bx
i
(10.5)
2
2
i1 i1
n n
达到最小的
a
和
b
作为
a
和
b
的估计,称其为最小二乘估计 (Least squares
estimates).直观地说,平面上直线很多,选取哪一条最佳呢?很自然的一个想法是,当
点(
x
i
,
y
i
),
i
=1,2,…,
n
,与某条直线的偏差平方和比它们与任何其他直线的偏差平方和都要
小时,这条直线便能最佳地反映这些点的分布状况,并且可以证明,在某些假设下,和
实用文档
是所有线性无偏估计中最好的.
根据微分学的极值原理,可将
Q
(
a
,
b
)分别对
a
,
b
求偏导数,并令它们等于零,得到方程
组:
n
Q
a
2
y
i
a bx
i
0,
i1
(10.6)
n
Q
2
y a bx
x 0.
i i i
i1
b
即
n
n
na
x
i
b
y
i
,
i1
i1
(10.7)
n n n
x
a
x
2
b x y .
i i
i
i
i1 i1 i1
(10.7)式称为正规方程组.
由于
x
i
不全相同,正规方程组的参数行列式
n
x
i1
n
i
n
n
2 2
≠0.
n x x n (x x )
i i i
n
x
i
2
i1
i1
i1
i1
i1
x
n
i
n
2
故(10.7)式有惟一解
n
(x
i
x )( y
i
y)
ˆ
i1
,
b
n
(10.8)
(x x)2
i
i1
ˆ
.
ˆ
y
ˆ
bx
a
于是,所求的线性回归方程为
ˆ
.
(10.9)
ˆ
a
ˆ
bxy
实用文档
剩余26页未读,继续阅读
资源评论
xxpr_ybgg
- 粉丝: 6441
- 资源: 3万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功