7
二元 logistic 回归
7.1 导读
线性回归的因变量 Y 必须为连续变量,但当我们研究的因变量为分类变量时,因为不
再是随机变量,不符合正态分布,因此不能采用线性回归,此时应该使用Logistic 回归。
Logistic 回归分析也用于研究变量之间的影响关系,即 X 对 Y 的影响情况,此处涉及的
Y 是分类数据。结合 Y 的具体情况,Logistic 回归分析可以分为三种,分别是二元 Logistic
回归、多元无序 Logistic 回归和多元有序 Logistic 回归。Logistic 回归分析的分类情况如下
图:
如果因变量Y 仅有两个类别,分别是有无之类的分类数据,则属于二元 Logistic 回归分析
。如果因变量 Y 有两个以上的类别,并且类别之间没有高低、顺序关系,比如血型“A 型、B 型
、AB 型和 O 型”,则可以使用多元无序 Logistic 回归分析。如果因变量 Y 的类别有两个以
上的类别,并且类别之间有高低、顺序关系,如伤痛级别“轻度、中度、重度”,则可以使用
多元有序Logistic 回归分析
问卷研究中,二元Logistic 回归使用频率最高,该方法简单易懂,多元无序Logistic 回
归和多元有序Logistic 回归则相对复杂。本次仅对二元Logistic 回归进行说明。
温馨提示:
在进行二元 Logistic 回归(包括其他 Logistic 回归)分析前,建议先通过单因素分析(t
检验、卡方检验等)考察所有自变量与因变量之间的关系,筛掉一些可能无意义的变量,再
进行多因素分析,这样可以保证结果更加可靠。同时为了防止一些有意义的自变量被单因素分
析剔除,单因素分析时将检验水准设为 P<0.01,只要小于 0.01,就认为有意义,然后进行多
因素分析。
7.2 操作步骤
问题:性别、学历、独生子女对去新疆就业意愿的影响?
性别:1=男,2=女;
学历:1=研究生,2=本科生;
独生子女:1=是,2=否;