没有合适的资源?快使用搜索试试~ 我知道了~
Matlab统计回归详解.doc
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 161 浏览量
2022-07-06
04:16:08
上传
评论 1
收藏 577KB DOC 举报
温馨提示
试读
14页
Matlab统计回归详解
资源推荐
资源详情
资源评论
统计回归
一、一元线性回归
回归分析中最简单的形式是
xy
10
��
��
,
yx,
均为标量,
10
,
��
为回归系
数,称一元线性回归。这里不多做介绍,在线性回归中以介绍多元线性回归分析
为主。
二、多元线性回归(regress)
多元线性回归是由一元线性回归推广而来的,把
x
自然推广为多元变量。
mm
xxy
���
���� �
110
(1)
2�m
,或者更一般地
)()(
110
xfxfy
mm
���
���� �
(2)
其 中
),,(
1 m
xxx ��
,
),,1( mjf
j
��
是 已 知 函 数 。 这 里
y
对 回 归 系 数
),,,(
10 m
����
��
是线性的,称为多元线性回归。不难看出,对自变量
x
作变量代换,
就可将(2)化为(1)的形式,所以下面以(1)为多元线性回归的标准型。
1.1 模型
在回归分析中自变量
),,,(
21 m
xxxx ��
是影响因变量
y
的主要因素,是人们
能控制或能观察的,而
y
还受到随机因素的干扰,可以合理地假设这种干扰服从
零均值的正态分布,于是模型记作
�
�
�
�����
),0(~
2
110
��
����
N
xxy
mm
�
(3)
其中
�
未知。现得到
n
个独立观测数据
),,,(
1 imii
xxy �
,
mnni �� ,,,1 �
,由(3)
得
�
�
�
�
�����
niN
xxy
i
iimmii
,,1),,0(~
2
110
�
�
��
����
(4)
记
�
�
�
�
�
�
�
�
�
�
�
nmn
m
xx
xx
X
�
����
�
1
111
1
1
,
�
�
�
�
�
�
�
�
�
�
�
n
y
y
Y �
1
(5)
T
n
][
1
���
��
,
T
m
][
10
����
��
(4)表示为
�
�
�
��
),0(~
2
��
��
N
XY
(6)
1.2 参数估计
用最小二乘法估计模型(3)中的参数
�
。
由(4)式这组数据的误差平方和为
�
�
����
n
i
T
i
XYXYQ
1
2
)()()(
����
(7)
求
�
使
)(
�
Q
最小,得到
�
的最小二乘估计,记作
�
ˆ
,可以推出
YXXX
TT 1
)(
ˆ
�
�
�
(8)
将
�
ˆ
代回原模型得到
y
的估计值
mm
xxy
���
ˆˆˆ
ˆ
110
���� �
(9)
而这组数据的拟合值为
�
ˆ
ˆ
XY �
,拟合误差
YYe
ˆ
��
称为残差,可作为随机误差
�
的估计,而
� �
� �
���
n
i
n
i
iii
yyeQ
1 1
22
)
ˆ
(
(10)
为残差平方和(或剩余平方和),即
)
ˆ
(
�
Q
。
1.3 统计分析
不加证明地给出以下结果:
(i)
�
ˆ
是
�
的线性无偏最小方差估计。指的是
�
ˆ
是
Y
的线性函数;
�
ˆ
的期
望等于
�
;在
�
的线性无偏估计中,
�
ˆ
的方差最小。
(ii)
�
ˆ
服从正态分布
))(,(~
ˆ
12 �
XXN
T
���
(11)
(iii)对残差平方和
Q
,
2
)1(
�
��� mnEQ
,且
)1(~
2
2
�� mn
Q
�
�
(12)
由此得到
2
�
的无偏估计
22
ˆ
1
�
�
��
�
mn
Q
s
(13)
2
s
是剩余方差(残差的方差),
s
称为剩余标准差。
(iv)对总平方和
�
�
��
n
i
i
yyS
1
2
)(
进行分解,有
UQS ��
,
�
�
��
n
i
i
yyU
1
2
)
ˆ
(
(14)
其中
Q
是由(10)定义的残差平方和,反映随机误差对
y
的影响,
U
称为回归平
方和,反映自变量对
y
的影响。
1.4 回归模型的假设检验
因变量
y
与自变量
m
xx ,,
1
�
之间是否存在如模型(1)所示的线性关系是需
要检验的,显然,如果所有的
|
ˆ
|
j
�
),,1( mj ��
都很小,
y
与
m
xx ,,
1
�
的线性关
系就不明显,所以可令原假设为
),,1(0:
0
mjH
j
���
�
当
0
H
成立时由分解式(14)定义的
QU,
满足
)1,(~
)1/(
/
��
��
� mnmF
mnQ
mU
F
(15)
在显著性水平
�
下有
�
�1
分位数
)1,(
1
��
�
mnmF
�
,若
)1,(
1
���
�
mnmFF
�
,接
受
0
H
;否则,拒绝。
注意 拒绝
0
H
只说明
y
与
m
xx ,,
1
�
的线性关系不明显,可能存在非线性关
系,如平方关系。
还有一些衡量
y
与
m
xx ,,
1
�
相关程度的指标,如用回归平方和在总平方和中
的比值定义
S
U
R �
2
(16)
]1,0[�R
称为相关系数,
R
越大,
y
与
m
xx ,,
1
�
相关关系越密切,通常,
R
大于
0.8(或 0.9)才认为相关关系成立。
1.5 回归系数的假设检验和区间估计
当上面的
0
H
被拒绝时,
j
�
不全为零,但是不排除其中若干个等于零。所以
应进一步作如下
m
个检验
),,1( mj ��
:
0:
)(
0
�
j
j
H
�
由(11)式,
),(~
ˆ
2
jjjj
cN
���
,
jj
c
是
1
)(
�
XX
T
对角线上的元素,用
2
s
代替
2
�
,由(11)~(13)式,当
)(
0
j
H
成立时
)1(~
)1/(
/
ˆ
��
��
� mnt
mnQ
c
t
jjj
j
�
(17)
对给定的
�
,若
)1(||
2
1
���
�
mntt
j
�
,接受
)(
0
j
H
;否则,拒绝。
(17)式也可用于对
j
�
作区间估计(
mj ,,1,0 ��
),在置信水平
�
�1
下,
j
�
的置信区间为
])1(
ˆ
,)1(
ˆ
[
2
1
2
1
jjjjjj
csmntcsmnt ������
��
��
��
(18)
其中
1��
�
mn
Q
s
。
1.6 利用回归模型进行预测
当回归模型和系数通过检验后,可由给定的
),,(
0010 m
xxx ��
预测
0
y
,
0
y
是
随机的,显然其预测值(点估计)为
mm
xxy
001100
ˆˆˆ
ˆ
���
���� �
(19)
给定
�
可以算出
0
y
的预测区间(区间估计),结果较复杂,但当
n
较大且
i
x
0
接近
平均值
i
x
时,
0
y
的预测区间可简化为
]
ˆ
,
ˆ
[
2
1
0
2
1
0
suysuy
��
��
��
(20)
其中
2
1
�
�
u
是标准正态分布的
2
1
�
�
分位数。
对
0
y
的区间估计方法可用于给出已知数据残差
iii
yye
ˆ
��
),,1( ni ��
的置信
区间,
i
e
服从均值为零的正态分布,所以若某个
i
e
的置信区间不包含零点,则认
为这个数据是异常的,可予以剔除。
1.7 Matlab 实现
Matlab 统计工具箱用命令 regress 实现多元线性回归,用的方法是最小二
乘法,用法是:
b=regress(Y,X)
其中 Y,X 为按(5)式排列的数据,b 为回归系数估计值
m
���
ˆ
,,
ˆ
,
ˆ
10
�
。
剩余13页未读,继续阅读
资源评论
老帽爬新坡
- 粉丝: 81
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功