没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论
SPSS 操作中的各种检验统计量和判别准则
(一) 专题 1 统计描述
1. 均值 Mean :表示某变量所有取值的集中趋势或平均水平。
均值标准误差(S.E.mean),描述样本均值和总体均值之间平均差异程度的统计量。
Analyze->Descriptive Statistics,选择 Frequence->Statistics。
2. 中位数(Median): 把一组数据按递增/减的顺序排列,处于中间位置的变量值就是中位
数。它代表一种位置,不会受到极端数值的影响,具有较高的稳健性。若 N 为偶数,中位
数是 N/2 和 N/2+1 位置上的两个数值的平均数。
Analyze->Descriptive Statistics,->Frequencies。选择 Median。
3. 众 数 ( Mode ) : 一 组 数 据 中 出 现 次 数 最 多 的 变 量 值。众数描述数据的集中趋势 。
Analyze->Descriptive Statistics,->Frequencies。
4. 全距(Range): 数据的最大值和最小值之间的绝对差。在相同样本容量下的两组数据,
全距大的一 组数据 会比全 局小的 一组数 据更分 散。 Analyze->Descriptive Statistics , -
>Frequencies
5. 方差(Variance)和标准差(Standard Deviation):方差和标准差越大,说明变量之间的
差 异 越 大 , 距 离 平 均 数 这 个 中 心 的 离 散 趋 势 越 大 。 Analyze->Descriptive Statistics-
>Descriptives
6. 四分位数(Quartiles)、十分位数( Deciles)、百分位数( Percentiles)。Q3 到 Q1 的
距离的一般称为四分位差。四分位差越小,说明数据越集中。若 n+1 恰好不是 4 的倍数,
则四分位数是与该数的小数相邻的两个整数位上的标志值的平均数,权数取决于整数位的
距离,越近,权数越大。如 2.75 项,则 Q1=0.25*第 2 项+0.75×第 3 项。
Analyze->Descriptive Statistics->Frequencies
7. 频数 Frequency: 一个变量在各个变量值上的个案数。它可以得到变量取值的分布情况。
Analyze->Descriptive Statistics->Frequencies
8 峰度(Kurtosis):峰度是描述某变量所有取值分布形态陡缓程度的统计量。峰度为 0 说
明数据分布和正态分布的陡缓程度相同;峰度大于 0 表明比正态分布的高峰更陡峭,为尖
峰。峰度小于 0,说明比正态分布的高峰平坦,为平顶峰。
8 偏度(Skewness):描述变量取值分布的对称性。该统计量是与正态分布比较的量。偏度
=0,说明数据分布形态与正态分布的偏度相同;偏度>0,为正偏或右偏,即有一条长尾
巴拖在右边;偏度小于 0,表示负偏或左偏,有一条长尾巴拖在左边。而偏度的绝对值数
值越大表示分布形态的斜偏程度越大。
10 标准化 Z 分数:计算公式 。将原始数据直接转换为 Z 分数,常常出现负数和
带小数点的值。对 Z 分数进一步转换,使之称为正数。T 分数。 .
Analyze->Descriptive Statistics ->Descriptives
11 探索分析:
探索内容:首先检查数据是否有错误,然后获得数据分布特征;最后对数据规律进行初
步观察。
探索分析方法:获得统计量和图形。
正态分布检验:Q-Q 图。斜线为正态分布的标准线。
方差的齐次性检验:Levene 检验,若 Sig〈0.05,则拒绝方差相同假设。
Analyze->Descriptive Statistics ->Explore
12. 交叉联列表分析:
检验的零假设:H
0
:行列间彼此独立,不存在显著的相关关系。若 Sig<a (a=0.05,显著
性水平),则拒绝零假设,认为行列变量之间彼此相关。
(1) 卡方检验 。零假设 H
0
:行列变量之间独立。
(2) Contingency coefficient:列联系数
(3) Phi and Cramer’s V: 系数,(0~1)。
Data->Weight Cases, 选择权重变量,在 Analyze->Descriptive Statistics->Crosstabs,选择
Statistics。
13 多选项分析
Analyze->Multiple Response, ->Define Sets, 选中多选项变量,Variables are Coded As
选中编码方式。
(二) 专题 2 均值比较和 T 检验
T 检验法主要应用在两个样本间的比较。
两组以上的均数比较,使用方差分析。
1.2 Means 过程
定义:Means 过程是按照用户指定条件,对样本进行分组计算均数和标准差。(还可以执行
单因素方差分析和相关分析)
例如:按性别计算各组的均数和标准差。
用户可以指定一个或多个变量作为分组变量。如果分组变量为多个,还应指定这些分组变
量之间的层次关系(可以是同层次的或多层次的)。同层次:将按照各分组变量的不同取值
分别对个案进行分组;多层次:将首先按第一分组变量分组,然后对各个分组下的个案
按照第二组分组变量进行分组。
计算公式:
Analyze->Compare Means(比较平均值),选择 Mean(平均值). 将观测变量 y 放入 Dependent
List(因变量列表)中,将分组变量放入 Independent list(自变量列表)中,点击选项对话框,在
Statistics For First Layer(第一层的统计数据)中,若选中 Anova table and eta(Anova 表和 eta) ,
则将为第一层次的分组计算方差和分析。
1.3 单一样本 T 检验
定义:单样本 T 检验是检验某个变量的总体均值和某指定值之间是否存在显著差异。
前提:样本总体服从正态分布。
零假设 H
0
:总体均值和指定检验值之间不存在显著差异。若 SIG<=a(显著性水平),拒绝
H
0
,
认为总体均值和检验值之间存在显著差异。
计算公式:T 统计量
其中:分子是样本均值和检验值的差。总方差未知,用样本方差 S 代替。n 为样本数。
Analyze->Compare Means(比较均值)->One-Sample T test(单样本 T 检验),将固定值填
入 Test value(检验值),将观察变量加入到 Test variable(检验变量)中。
点击选项,在 One-Sample Test(单样本 T 检验)对话框中,95% confidence interval of the
difference 包括 95%的置信区间。若 Sig >a,说明不能拒绝 H
0
,认为样本均值和总体均值无
显著变化。
1.4 两独立样本 T 检验
定义:独立样本是指两个样本之间彼此独立,没有任何关联。两个独立样本各自接受相同
的
测量,研究的目的是了解两个样本之间是否存在显著差异。
前提:两个样本相互独立;样本来自的两个总体服从正态分布。
零假设 H
0
: 两总体均值之间不存在显著差异。
计算过程:
(1) 利用 F 检验判断两总体方差是否相同;
采用 Levene F 方法检验两总体方差是否相同。利用 F 统计量,根据 Sig 和显著性水平
a 比较。若 Sig<a,拒绝 H
0
, 说明存在显著差异,即方差不相同。
(2) 根据第一步结果,进行 T 检验。
总体方差未知且相等,计算公式如下:自由度(n
1
+n
2
-2)
其中,
估计标准误差:
总体方差未知且不相等,计算公式如下:修正后的自由度 f
其中,
估计标准误差:
若待检验的两样本均值差异小,t 值较小,则说明两个样本的均值不存在显著差异;
反之,t 值越大,说明两样本均值存在显著差异。
若 Sig<a,拒绝 H
0
,认为两总体均值间存在显著差异;反之,认为两均值之间无显著
差异。
Analyze->Compare Means(比较均值)->Independent-samples(独立样本 T 检验),将观察
变量加入 Test Variables(检验变量),在 Define Groups(定义组) 按钮中,->use specified
values(使用指定的值)。
在 Independent samples test (独立样本 T 检验)表中,观察 F 检验的 Sig 值,T 检验的 Sig
值。
1.5 两配对样本 T 检验
定义:根据样本数据对样本来自的两配对总体的均值是否有显著性差异进行推断。一般用
于同一研究对象(或两配对对象)分别给予两种不同的处理的效果比较,以及同一研究对
象(或两配对对象)处理前后的效果比较。前者推断两种效果有无差别,后者推断某种处理
是否有效果。
前提:两个样本应是配对的。样本来自的两个总体应服从正态分布。
零假设 H
0
:两总体均值之间不存在显著差异。
基本思想:首先求出每对观察值的差值,得到差值序列;然后对差值求均值;最后检验差
值序列的均值,即平均差是否与零有显著差异。如果平均差和零有显著差异,则认为两总
体均值间存在显著差异;否则,认为两总体均值间不存在显著差异。
计算公式:
其中,分子为配对样本差值序列的平均差。
若 T 检验的 t 值对应的 Sig<=a, 拒绝 H
0
,认为两总体均值之间存在显著差异。
Analyze->Compare Means(比较均值)->Pared-Samples T test(成对样本 T 检验),将配对
变量加入 Paired Variables(配对变量)中。
在 Paired Samples Test()表中,将分别分析 t 值和 Sig 值,确定配对样本是否有显著差异。
若有,说明经过技术革新后,结果有效果。
(三) 专题 3 方差分析—F 检验
定义:用方差分析比较多个样本均数,可有效地控制第一类错误。方差分析以 F 命名其统
计量,故方差分析又称为 F 检验。
目的:推断两组或多组资料的总体均数是否相同,检验两个或多个样本均数的差异是否有
统计学意义。
造成结果差异原因:一类是不可控的随机因素的影响,是人为很难控制的一类影响因素,
即随机变量;另一类是研究中人为施加的可控因素对结果的影响,即控制变量。
基本思想:通过分析研究中不同变量的变异对总变异的贡献大小,确定控制变量对研究结
果影响力的大小。通过方差分析,分析不同水平的控制变量是否对结果产生了显著影响。
如果控制变量的不同水平对结果产生了显著影响,那么它和随机变量共同作用,必然
使得结果有显著变化;
如果控制变量的不同水平对结果没有显著的影响,那么结果的变化主要是由随机变量
起作用,和控制变量的关系不大。
根据控制变量的个数,可以将方差分析分为单因素方差分析(但一个控制变量可以有
多个观察水平)和多因素方差分析(多个控制变量)。
1.1 单因素方差分析
定义:单因素方差分析测试某个控制变量的不同水平是否给观察变量造成了显著差异。对
于
两组以上的均数比较,必须使用方差分析(当然方差分析也可以用于两组均数比较)。
严格的前提条件:在不同水平下,各总体均值服从方差相同的正态分布,即方差齐。
研究问题:不同水平下各个总体的均值是否有显著差异的问题。
推断方法:计算采用 F 统计量,进行 F 检验。
总的变异平方和:SST=SSA+SSE
组间(Between Groups)离差平方和:SSA——控制变量引起的离差
组内(Within Groups)离差平方和:SSE——随机变量引起的离差
其中 s 为水平数,n
j
为第 j 个水平下的样本容量。
当 为真时:
剩余34页未读,继续阅读
资源评论
syblogs
- 粉丝: 527
- 资源: 26
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功