一、回归系数和皮尔逊相关系数
假设存在回归方程:y=ax+εy,其中 εy表示误差项
1、 回归系数:度量一个变量对另一个变量的线性影响大小。eg:用 y 和 x 进行线性回
归,得到的 x 的系数即为回归系数,记为 ryx
,由上式知道
ryx = a
2、 皮尔逊相关系数:用来度量两个变量之间的相关性(或联系的紧密程度),其取值
是[-1,1],如果越靠近正负 1,表明两个变量之间的线性关系越明显,越接近 0,表
明两个变量之间几乎没有线性关系。当其为 0 时,表示两个变量之间不存在线性关
系
3、 优点:
① 皮尔逊相关系数可以消除两个变量量纲影响,可以用来衡量两个变量线性相关
的程度
② 逐步回归,可以筛选并剔除引起多重共线性的变量,经过逐步回归可以使得最
后保留在模型中得解释变量既是最重要的,又没有严重多重共线性!
二、灰色关联和多元线性回归:
1、 灰色关联:根据因素之间发展趋势的相似或相异程度,即“灰色关联度”作为衡量因
素间关联程度的一种方法!
优点:弥补了数理统计方法作系统分析所导致的遗憾,对样本量的多少和样本无规
律都同样适用,而且计算量小,十分方便,更不会出现量化结果与定性分析不符的
情况!
缺点:要使用该方法,系统必须是灰色系统,其中灰的含义是信息不完全性(部分
性)和非唯一性,后者是灰色系统的重要特征,非唯一性原理在决策上的体现是灰
靶思想,即体现的是决策多目标,方法多途径,处理态度灵活机动!
2、 多元线性回归:
缺点:有时在回归分析中,选用何种因子和该因子采用何种表达式只是一种推测,
这影响了因子的多样性和不可预测性,使得回归分析在某些情况下会受到限制!另
外由于自变量个数多,计算相当麻烦!