数学建模论文肾炎诊断资源-CSDN文库

数学建模论文

5星 · 超过95%的资源需积分: 12 5 浏览量 2009-08-14 11:07:09 上传评论 1 收藏 563KB DOC 举报

资源推荐

资源详情

资源评论

肾炎的诊断

摘要

本文是一个这是一个判别类型的问题，在医学上是一个诊断问题，即从

样本个体的若干个量化特征来判断肾炎与否。我们针对这些信息根据 logistic

回归分析的相关功能，建立 logistic 回归分析判别模型。对于样本属性为肾炎

与否，这是一个二值响应的问题，我们采用二类样本判别分析方法，即响应变

量只有两个值，肾炎时就是 1，健康的时候就是 0。用 logistic 模型回归分析

处理二类样本判别时，选取阈值 0.5，使预报值在阈值 0.5 上下波动，当预报

值大于 0.5 时则说明样本属性为健康，当预报值小于 0.5 时则说明样本属性为

肾炎。同时利用连接函数 logit 将二值响应和影响到样本属性的多因素有机的结

合起来，使模型函数化，运用最大似然估计得到函数中的参数，得到一个模型

表达式，然后利用这个模型进行判别。在消除 logistic 回归模型分析中各变量

存在的多重共线性上面，我们采用主成分分析法，同样在最后利用得到的新模

型进行判别。

问题一中通过建立的模型对样本进行检验得出总预测准确率为 90%，对问

题二中待判别的样本个体进行模型检测时有 17 个肾炎患者，13 个正常人；问

题三中对样本进行检验得出总预测准确率为 90.91%,对问题四中待判别的样本

个体进行模型检测时有 17 个肾炎患者，13 个正常人；综合问题二和问题四，

就判别准确率而言，医生应该在检测的时候根据模型中对侧重元素所反映的信

息量对样本属性起主要作用的元素进行检测，这样便可以减少检测指标。

关键字判别 logistic 回归分析二值响应二类样本判别分析

阈值连接函数主成分分析

i:被化验的个体；

j:被化验的特征，即元素的种类；

: 代表不同化验特征组合值：

：第 i 个个体的第 j 个特征值，统计学上叫做协变量；

：第 i 个个体肾炎属性，可取 0 和 1，0 代表没有患肾炎，1 代表患有肾炎；

m：样本中用于分析求解的个体数目；

p ：特征量为 x 时属性为肾炎的概率；

：模型中各变量的系数（j=0,1,2,3,4,5,6,7）;

:主成分分析之中的主因子（i (1,2,3,4,5,6,7)）

问题分析

（1）分析题意可知这是一个判别类型的问题，在医学上是一个诊断问题，即

从样本个体的若干个量化特征来判断肾炎与否。在统计学上，这是一个

所谓的二值响应问题，也称为二类样本判别分析方法，即响应变量只有

两个值，肾炎时就是 1，健康的时候就是 0；

（2）问题中已经分别给定 30 个肾炎病人和 30 个健康人的训练样区的 7 个特

征 Zn，Cu，Fe，Ca，Mg，K，Na 的含量数据，根据这些数据确定一

个评判模型，然后利用这个模型来协助医生诊断待确定肾炎属性样本个

体，最重要的是要保证模型诊断精确度，确保在实际运用中的可信度和

可行性，从而有效的预测和判定样本个体的类别属性；

（3）由于在化验的过程中，根据问题本身及有关经验，人们罗列出来可能与

因变量有关的特征量往往太多（问题中研究的数据中有 7 个），其中有

些变量对因变量可能影响很小或者根本没有影响，如果在最后的指标中

把这些变量都包含起来，不但计算量大，而且估计和预报的精度也会降

低，也会使这个指标在应用时的费用不必要的增高，因此我们在模型中

对进入模型中的特征量做精心的选择是十分必要的；

（4） Logistic 模型是一种非线性的回归分析模型,它通常是用于预测和判定未

知单元的类别属性。Logistic 模型这些功能恰好切合以上问题，先根据

训练样区,计算出样本个体的肾炎属性与各因子之间的关系式,进而得到

肾炎概率分布表达式,选取一定的阈值（0.5）,最终在需要化验的样本区

域里面确定每个样本的肾炎属性；

（5）在建立 Logistic 模型后，还要消除 logistic 回归模型分析中各变量存在

的多重共线性，即对所选取的特征量进行分类选择，选择出能够反映影

响人们患肾炎的关键或主要因素；

剩余19页未读，继续阅读

内容反馈

cst2825023

2014-06-09

很好，结构完整

fminsearch

粉丝: 2
资源: 4

最新资源

资源上传下载、课程学习等过程中有任何疑问或建议，欢迎提出宝贵意见哦~我们会及时处理！点击此处反馈

feedback-tip