没有合适的资源?快使用搜索试试~ 我知道了~
基于Logistic回归的胃癌预测研究_孙明娟1
需积分: 0 2 下载量 111 浏览量
2022-08-04
14:15:21
上传
评论
收藏 2.14MB PDF 举报
温馨提示
试读
2页
[摘要]胃癌是世界范围内最常见的恶性肿瘤疾病之一,发病率居我国恶性肿瘤第二位,死亡率排在前三位。因此,探究引发胃癌疾病的致病因素以及建立合理有效的疾病诊断模型对
资源推荐
资源详情
资源评论
.
126
.
产学研理论与实践
科技经济导刊 2019,27(28)
Technology and Economic Guide
基于 Logistic 回归的胃癌预测研究
孙明娟
( 延安大学数学与计算机学院,陕西 延安 716000)
[摘要]胃癌是世界范围内最常见的恶性肿瘤疾病之一,发病率居我国恶性肿瘤第二位,死亡率排在前三位。因此,探究引发胃
癌疾病的致病因素以及建立合理有效的疾病诊断模型对个人及医疗机构就显得尤为重要。建立 Logistic 胃癌预测模型对胃癌数据
进行分析,采用逐步回归分析法进行变量筛选;对模型参数的估计采用极大似然法,得到患胃癌概率的 Logistic 回归方程,并进
行预测。通过对比预测精度和误分类精度的值可以发现 ,Logistic 胃癌预测模型适用于对胃癌进行预测研究。
[ 关键词 ] 极大似然估计;Logistic 回归;预测
[ 中图分类号 ]O212 [ 文献标识码 ]A [ 文章编号 ] 2096-1995(2019)28-0126-02
随着人民生活水平的不断提升,工作和生活的压力随之而
来。工作上的熬夜加班应酬以及生活中的暴饮暴食不规律作息
也是屡见不鲜,由此引发大大小小的胃部疾病,也引起了越来
越多人的关注与重视,探究引发胃癌疾病的致病因素,建立合
理有效的疾病诊断模型对个人及医疗机构是非常重要的。
本文通过建立 Logistic 回归模型,对标准化后的胃癌数据
进行分析,采用逐步回归法选取解释变量,对回归模型参数的
估计选用极大似然法,得到了预测患胃癌概率的 Logistic 回归
方程。
1 Logistic 回归及逐步回归法
1.1 Logistic 回归
对
p
元线性回归模型
2
0 11
, 0, ,
pp
y x xED
εε
ββ β ε σ
= + ++ + = =
(1)
其中未知参数
01
,,
ββ β
p
称为偏回归系数,显然有
0 11 2 2
()
pp
Ey x x x
ββ β β
= + + ++
(2)
式 (2) 称为
y
对
12
,,,
p
xx x
的回归函数。
当因变量是一个二元变量,只取0与1两个值时,
( ) { 1}=Ey Py p= =
是因变量,对其做 Logit 变换,得
0 11 2 2
ln
1
pp
p
xx x
p
ββ β β
= + + ++
−
(3)
称为 Logistic 线性回归。
极大似然估计就是选取
012
,,,,
p
βββ β
的估计值
使得式 (3) 达到极大。由此得到的 Logistic 回归
模型为 :
(4)
1.2 变量选取方法
回归自变量的选取是建立回归模型的一个关键问题所在。
在对一个实际问题进行建模时我们往往最开始遇到的问题就是
对自变量的筛选。逐步回归分析法是将自变量一个一个选入而
后进行回归分析。对已经选入的变量进行显著性检验。将其中
显著性较低的自变量剔除。当从选取自变量或者在回归方程中
剔除一个自变量是逐步回归分析的一步。将这个步骤反复执行,
一直到既没有显著的自变量选入回归方程,也没有不显著自变
量从回归方程中剔除为止。
2 基于 Logistic 回归的胃癌预测模型
2.1 数据的分析和处理
本文收集了某一地区是否患胃癌的数据。该数据集共有
400 条是否患胃癌的记录,每一条是否患病记录都包含个人情
况属性变量和个人标签变量。个人情况属性变量包含了有关人
类生活习惯、年龄、性别、遗传、内在因素五个方面的 11 项指标。
分别是是否过度饮酒、是否经常吸烟、是否长期食用烟熏,盐
腌和霉变食物、是否过度肥胖、精神状况、睡眠质量、是否经
常加班熬夜、是否坚持锻炼身体、是否有胃癌或食管癌家族史、
性别、年龄。个人标签变量是对个人健康的定义,有“健康”
和“疾病”两种。
2.2 Logistic 胃癌预测模型
2.2.1 变量筛选
运用 SPSS 软件对原始数据集进行逐步回归后筛选出的变
量列于表 1:
表 1 Logistic 回归变量选择结果
从表 1 可看出,筛选出的变量有 : 是否过度肥胖(
x
1
),
是否经常吸烟(
x
2
),是否经常喝酒(
x
3
),是否经常吃烟熏
等不健康食物(
x
4
),精神状况(
x
5
),是否遗传(
x
9
)。
项目来源:陕西省教育厅自然科学基金(18JK0877);延安大学自然科学基金(YD2015-10)。
资源评论
张博士-体态康复
- 粉丝: 29
- 资源: 307
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功