没有合适的资源?快使用搜索试试~ 我知道了~
【老生谈算法】matlab数学建模之回归分析.doc
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
5星 · 超过95%的资源 1 下载量 57 浏览量
2022-07-03
11:23:21
上传
评论
收藏 541KB DOC 举报
温馨提示
试读
12页
【老生谈算法】matlab数学建模之回归分析.doc
资源推荐
资源详情
资源评论
-141-
第十二章 回归分析
前面我们讲过曲线拟合问题。曲线拟合问题的特点是,根据得到的若干有关变量的
一组数据,寻找因变量与(一个或几个)自变量之间的一个函数,使这个函数对那组数
据拟合得最好。通常,函数的形式可以由经验、先验知识或对数据的直观观察决定,要
作的工作是由数据用最小二乘法计算函数中的待定系数。从计算的角度看,问题似乎已
经完全解决了,还有进一步研究的必要吗?
从数理统计的观点看,这里涉及的都是随机变量,我们根据一个样本计算出的那些
系数,只是它们的一个(点)估计,应该对它们作区间估计或假设检验,如果置信区间
太大,甚至包含了零点,那么系数的估计值是没有多大意义的。另外也可以用方差分析
方法对模型的误差进行分析,对拟合的优劣给出评价。简单地说,回归分析就是对拟合
问题作的统计分析。。
具体地说,回归分析在一组数据的基础上研究这样几个问题:
(i)建立因变量
y
与自变量
m
xxx ,,,
21
�
之间的回归模型(经验公式);
(ii)对回归模型的可信度进行检验;
(iii)判断每个自变量
),,2,1( mix
i
��
对
y
的影响是否显著;
(iv)诊断回归模型是否适合这组数据;
(v)利用回归模型对
y
进行预报或控制。
§1 多元线性回归
回归分析中最简单的形式是
xy
10
��
��
,
yx,
均为标量,
10
,
��
为回归系数,
称一元线性回归。它的一个自然推广是
x
为多元变量,形如
mm
xxy
���
���� �
110
(1)
2�m
,或者更一般地
)()(
110
xfxfy
mm
���
���� �
(2)
其 中
),,(
1 m
xxx ��
,
),,1( mjf
j
��
是 已 知 函 数 。 这 里
y
对 回 归 系 数
),,,(
10 m
����
��
是线性的,称为多元线性回归。不难看出,对自变量
x
作变量代
换,就可将(2)化为(1)的形式,所以下面以(1)为多元线性回归的标准型。
1.1 模型
在回归分析中自变量
),,,(
21 m
xxxx ��
是影响因变量
y
的主要因素,是人们能控
制或能观察的,而
y
还受到随机因素的干扰,可以合理地假设这种干扰服从零均值的
正态分布,于是模型记作
�
�
�
�����
),0(~
2
110
��
����
N
xxy
mm
�
(3)
其中
�
未知。现得到
n
个独立观测数据
),,,(
1 imii
xxy �
,
mnni �� ,,,1 �
,由(3)
得
�
�
�
�
�����
niN
xxy
i
iimmii
,,1),,0(~
2
110
�
�
��
����
(4)
记
-142-
�
�
�
�
�
�
�
�
�
�
�
nmn
m
xx
xx
X
�
����
�
1
111
1
1
,
�
�
�
�
�
�
�
�
�
�
�
n
y
y
Y �
1
(5)
T
n
][
1
���
��
,
T
m
][
10
����
��
(4)表为
�
�
�
��
),0(~
2
��
��
N
XY
(6)
1.2 参数估计
用最小二乘法估计模型(3)中的参数
�
。
由(4)式这组数据的误差平方和为
�
�
����
n
i
T
i
XYXYQ
1
2
)()()(
����
(7)
求
�
使
)(
�
Q
最小,得到
�
的最小二乘估计,记作
�
ˆ
,可以推出
YXXX
TT 1
)(
ˆ
�
�
�
(8)
将
�
ˆ
代回原模型得到
y
的估计值
mm
xxy
���
ˆˆˆ
ˆ
110
���� �
(9)
而这组数据的拟合值为
�
ˆ
ˆ
XY �
,拟合误差
YYe
ˆ
��
称为残差,可作为随机误差
�
的
估计,而
� �
� �
���
n
i
n
i
iii
yyeQ
1 1
22
)
ˆ
(
(10)
为残差平方和(或剩余平方和),即
)
ˆ
(
�
Q
。
1.3 统计分析
不加证明地给出以下结果:
(i)
�
ˆ
是
�
的线性无偏最小方差估计。指的是
�
ˆ
是
Y
的线性函数;
�
ˆ
的期望等于
�
;在
�
的线性无偏估计中,
�
ˆ
的方差最小。
(ii)
�
ˆ
服从正态分布
))(,(~
ˆ
12 �
XXN
T
���
(11)
(iii)对残差平方和
Q
,
2
)1(
�
��� mnEQ
,且
)1(~
2
2
�� mn
Q
�
�
(12)
由此得到
2
�
的无偏估计
22
ˆ
1
�
�
��
�
mn
Q
s
(13)
2
s
是剩余方差(残差的方差),
s
称为剩余标准差。
-143-
(iv)对总平方和
�
�
��
n
i
i
yyS
1
2
)(
进行分解,有
UQS ��
,
�
�
��
n
i
i
yyU
1
2
)
ˆ
(
(14)
其中
Q
是由(10)定义的残差平方和,反映随机误差对
y
的影响,
U
称为回归平方和,
反映自变量对
y
的影响。
1.4 回归模型的假设检验
因变量
y
与自变量
m
xx ,,
1
�
之间是否存在如模型(1)所示的线性关系是需要检验
的,显然,如果所有的
|
ˆ
|
j
�
),,1( mj ��
都很小,
y
与
m
xx ,,
1
�
的线性关系就不明
显,所以可令原假设为
),,1(0:
0
mjH
j
���
�
当
0
H
成立时由分解式(14)定义的
QU,
满足
)1,(~
)1/(
/
��
��
� mnmF
mnQ
mU
F
(15)
在显著性水平
�
下有
�
�1
分位数
)1,(
1
��
�
mnmF
�
,若
)1,(
1
���
�
mnmFF
�
,接
受
0
H
;否则,拒绝。
注意 拒绝
0
H
只说明
y
与
m
xx ,,
1
�
的线性关系不明显,可能存在非线性关系,
如平方关系。
还有一些衡量
y
与
m
xx ,,
1
�
相关程度的指标,如用回归平方和在总平方和中的比
值定义
S
U
R �
2
(16)
]1,0[�R
称为相关系数,
R
越大,
y
与
m
xx ,,
1
�
相关关系越密切,通常,
R
大于 0.8
(或 0.9)才认为相关关系成立。
1.5 回归系数的假设检验和区间估计
当上面的
0
H
被拒绝时,
j
�
不全为零,但是不排除其中若干个等于零。所以应进
一步作如下
m
个检验
),,1( mj ��
:
0:
)(
0
�
j
j
H
�
由(11)式,
),(~
ˆ
2
jjjj
cN
���
,
jj
c
是
1
)(
�
XX
T
对角线上的元素,用
2
s
代替
2
�
,
由(11)~(13)式,当
)(
0
j
H
成立时
)1(~
)1/(
/
ˆ
��
��
� mnt
mnQ
c
t
jjj
j
�
(17)
对给定的
�
,若
)1(||
2
1
���
�
mntt
j
�
,接受
)(
0
j
H
;否则,拒绝。
(17)式也可用于对
j
�
作区间估计(
mj ,,1,0 ��
),在置信水平
�
�1
下,
j
�
的置
信区间为
剩余11页未读,继续阅读
资源评论
- m0_706350602023-09-01资源使用价值高,内容详实,给了我很多新想法,感谢大佬分享~
阿里matlab建模师
- 粉丝: 3297
- 资源: 2784
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功