Logistic 回归模型
赵耐青
复旦大学公共卫生学院
1
数据分析的背景
• 计量资料单因素统计分析
– 对于两组计量资料的比较,一般采用t检
验或秩和检验。
– 对于两个变量的相关分析采用Pearson相
关分析或Spearman相关分析
• 考虑多因素的影响,对于应变量(反应变量
)为计量资料,一般可以考虑应用多重线性
回归模型进行多因素分析。
2
数据分析的背景
• 单因素的分类资料统计分析,一般采用
Pearson �
2
进行统计检验,用Odds Ratio
及其95%可信区间评价关联程度。
• 考虑多因素的影响,对于反应变量为分
类变量时,用线性回归模型P=a+bx就不
合适了,应选用Logistic回归模型进行统
计分析。
3
Logistic回归模型
• 按研究设计分类
– 非配对设计:非条件Logistic回归模型
– 配对的病例对照:条件Logistic回归模型
• 按反应变量分类
– 二分类Logistic回归模型(常用)
– 多分类无序Logistic回归模型
– 多分类有序Logistic回归模型
4
基础知识
• 通过下例引入和复习相关概念
• 例如:研究患某疾病与饮酒的关联性
• 患病率 P
1
=a/m
1
P
2
=b/m
2
5