Matlab与统计分析
一、 回归分析
1、多元线性回归
1.1 命令 regress( ), 实现多元线性回归,调用格式为
[b,bint,r,rint,stats]=regress(y,x,alpha)
其中因变量数据向量Y和自变量数据矩阵x按以下排列方式输人
1
1
x
1
x
11
x
21
x
n1
x
12
x
22
x
n 2
x
1k
x
2 k
,
x
nk
y
1
y
2
y
y
n
对一元线性回归,取k=1即可。alpha为显著性水平(缺省时设定为0.05),输出向量b,bint
为回归系数估计值和它们的置信区间,r,rint为残差及其置信区间,stats是用于检验回归
模型的统计量,有三个数值,第一个是
R
, 其中R是相关系数,第二个是F统计量值,第
三个是与统计量F对应的概率P,当
P
时拒绝
H
0
,回归模型成立.
注:1、两组数据的相关系数在概率论的标准定义是:
R= E{(x - E{x}) * (y - E{y})} / (sqrt({(x - E{x})^2) * sqrt({(y - E{y})^2))
E{}求取期望值。也就是两组数据协方差与两者标准差乘积的商。如果|R|=1说明两者相关,
R=0说明两者不相关.
1、F是方差分析中的一个指标,一般方差分析是比较组间差异的。 F值越大,P值越小,表
示结果越可靠.
1.2 命令 rcoplot(r,rint),画出残差及其置信区间.
1.3 实例 1
已知某胡八年来湖水中COD浓度实测值(v)与影响因素湖区工业产值(x1)、总人口数(x2 )、
捕鱼量(x3 )、降水量( x4)资料,建立污染物Y的水质分析模型.
Step 1 输入数据
2
评论0