(一)基本理论
分类变量包括无序分类变量、有序分类变量、多选题变量集。
对于分类变量的描述统计,主要是对分类变量各水平值分别进行频数和比例
计算,再进步计算所需的一些相对频数指标。
一、单分类变量的统计描述
1. 频数分布
分类变量的分析,首先要了解:各类别的样本数(频数),以及占总样本量
的百分比;对有序分类变量,还需要了解:累积频数、累积百分比。
2. 集中/离散趋势
观察原始频数,或者使用众数。对于分类变量,集中/离散趋势是一体的。
3. 相对频数指标
(1)比(Riatio)
两个有关指标之比 A/B, 用来反映相对的大小关系,例如,月销售额/销售人
数;
(2)构成比
用于描述事物内部各构成部分所占的比重,例如,百分比、累积百分比;
(3)率(Rate)
率是具有时间概念或速度、强度意义的指标,表示某个时期内某事件发生的
频率或强度,例如速率、频率、费率、发病率等。
二、多分类变量的联合描述
列联表。例如,r×c 二维列联表:
(1)共 n 个样本;
(2)按两种属性 A、B,属性 A 有 r 个水平值:A
1
, …, A
r
; 属性 B 有 c 个水平
值:B
1
, …, B
c
. 属性 A=A
i
,属性 B=B
j
的样本数为 n
ij
.
(3)n
i.
= “属性 A=A
i
”的合计数,n
.j
= “属性 B=B
j
”的合计数。
注:多分类变量对应高维列联表。
三、多选题的统计描述
多选题是调查问卷的常见题型,因为多选题是回答同一个大问题,所以不能
割裂开来单独分析,需要做汇总处理。
1. 应答人数(Count)
选择各题项的人数,原始频数;
2. 应答人数百分比
选择该项的人数占总人数的百分比,可以反映该选项在人群中的受欢迎程
度;
3. 应答人次(Response)
选择各选项的总人次,1 个受访者选择 2 个选项,即 2 人次;
4. 应答次数百分比
在做出的所有选择中,选择该项的人次占总人次数的比例。
(二)SPSS 实现
有某调查问卷的数据文件(部分):