第十章 相关分析
10.1 相关分析的概念和相关分析过程
10.2 两个变量间的相关分析
10.3 偏相关分析
10.4 距离分析
9/19/2022
10.1.1相关分析的概念
研究变量间密切程度的一种常用统计方法
1、线性相关分析:研究两个变量间线性关系的
程度。用相关系数r来描述。(详见下面)
2、偏相关分析:它描述的是当控制了一个或几个
另外的变量的影响条件下两个变量间的相关性,如
控制年龄和工作经验的影响,估计工资收入与受教
育水平之间的相关关系
3、相似性测度:两个或若干个变量、两个或两组
观测量之间的关系有时也可以用相似性或不相似性
来描述。相似性测度用大值表示很相似,而不相似
性用距离或不相似性来描述,大值表示相差甚远
线性相关分析
研究两个变量间线性关系的程度。相关系数是描述这种
线性关系程度和方向的统计量,用r表示。
如果变量Y与X间是函数关系,则r=1或r=-1;如果变量Y
与X间是统计关系,则-1<r<1, 如果x,y变化的方向一致
,如身高与体重的关系,则称为正相关,r>0,如果x,y
变化的方向相反,如吸烟与肺功能的关系,则称为负相
关,r<0; 而r=0表示无线性相关,一般地,
|r|>0.95 存在显著性相关;
|r|�0.8 高度相关;
0.5� |r|<0.8 中度相关;
0.3� |r|<0.5 低度相关;
|r|<0.3 关系极弱,认为不相关
线性相关分析(续)
相关系数的计算有三种:Pearson、
Spearman和Kendall
Pearson相关系数:对定距变量的数据进行
计算,公式P207
Spearman和Kendall相关系数:对分类变量
的数据或变量值的分布明显非正态或分布
不明时,计算时先对离散数据进行排序或
对定距变量值排(求)秩。公式P208
评论10