---
Topic:
- 公共卫生
Field:
- 机器学习/分类
, - 数据挖掘
Ext:
- .csv
DatasetUsage:
- 760537
---
## **背景描述**
糖尿病是一种影响全球数百万人的慢性疾病,对公共健康构成重大威胁。准确预测糖尿病的发病风险对于早期干预和预防至关重要。通过机器学习模型分析影响糖尿病的主要因素,可以帮助医疗从业者更好地了解病因和风险因素,从而制定有效的预防和治疗策略。
本数据集来自Kaggle,包含了患者的各项健康指标及其是否患有糖尿病的标签。数据集的主要目标是通过机器学习模型预测糖尿病的发病风险,并分析影响糖尿病的主要健康因素。
## **数据说明**
| 字段名 | 说明 |
| --- | --- |
| PatientID | 患者ID |
| Age | 年龄(岁) |
| Gender | 性别,0:男,1:女 |
| Ethnicity | 种族,0:白种人,1:非裔美国人,2:亚洲人,3:其他|
| SocioeconomicStatus | 社会经济地位,0:低,1:中,2:高 |
| EducationLevel | 教育水平,0:无,1:高中,2:学士学位,3:更高 |
| BMI | 体质指数(体重(kg)/身高(m)^2) |
| Smoking | 吸烟状况 |
| AlcoholConsumption | 饮酒量 |
| PhysicalActivity | 每周体育活动时间(分钟) |
| DietQuality | 饮食质量 |
| SleepQuality | 睡眠质量 |
| FamilyHistoryDiabetes | 家族糖尿病史 |
| GestationalDiabetes | 妊娠糖尿病 |
| PolycysticOvarySyndrome | 多囊卵巢综合症 |
| PreviousPreDiabetes | 既往糖尿病前期 |
| Hypertension | 高血压 |
| SystolicBP | 收缩压(mm Hg) |
| DiastolicBP | 舒张压(mm Hg) |
| FastingBloodSugar | 空腹血糖浓度 |
| HbA1c | 糖化血红蛋白 |
| SerumCreatinine | 血清肌酐 |
| BUNLevels | 血尿素氮 |
| CholesterolTotal | 总胆固醇水平 |
| CholesterolLDL | 低密度脂蛋白胆固醇水平 |
| CholesterolHDL | 高密度脂蛋白胆固醇水平 |
| CholesterolTriglycerides | 甘油三酯 |
| AntihypertensiveMedications | 降压药使用情况 |
| Statins | 他汀类药物使用情况 |
| AntidiabeticMedications | 降糖药物使用情况 |
| FrequentUrination | 尿频 |
| ExcessiveThirst | 过度口渴 |
| UnexplainedWeightLoss | 不明原因的体重减轻 |
| FatigueLevels | 疲劳水平 |
| BlurredVision | 视力模糊 |
| SlowHealingSores | 伤口愈合缓慢 |
| TinglingHandsFeet | 手脚刺痛 |
| QualityOfLifeScore | 生活质量评分 |
| HeavyMetalsExposure | 重金属暴露情况 |
| OccupationalExposureChemicals | 职业化学品暴露情况 |
| WaterQuality | 水质是否存在污染 |
| MedicalCheckupsFrequency | 定期体检频率 |
| MedicationAdherence | 药物依从性 |
| HealthLiteracy | 健康素养 |
| Diagnosis | 糖尿病诊断(0=否,1=是) |
| DoctorInCharge | 主管医生 |
## **数据来源**
https://www.kaggle.com/datasets/rabieelkharoua/diabetes-health-dataset-analysis
## **问题描述**
**影响因素分析:** 分析不同健康指标(如空腹血糖、血压、BMI、胆固醇水平等)对糖尿病发病风险的影响。
**糖尿病风险预测:** 构建机器学习模型预测糖尿病的发病风险,帮助医疗从业者进行早期干预和预防。
计算机毕设工作室
- 粉丝: 1427
- 资源: 174
最新资源
- Android平台下,将Html文本转换为PDF格式并输出
- 一个Python小程序,用于生成并打印一个乘法表 这个程序可以帮助初学者理解循环结构和字符串格式化
- 学生作业-轮播图和待办,该项目为html前端项目,主要实现轮播图和待办事件录入和一键清除功能 涉及html、js、css
- 校园表白墙网站源码、表白墙网站制作、网页表白墙源码
- sqlite3.lib x86-64 debug 静态库
- 基于java和mysql实现的图书管理系统源码+文档说明(大作业&课设)
- 2024年中证500股票交易数据
- jquery实现的网页版扫雷小游戏源码.zip
- 西门子变频器 SINAMICS STARTER V5.6 HF1 软件 STARTER V56 STARTERV56HF1 ISO 006
- 用Python开发 Telegram 接口:涵盖用户登录、好友列表及聊天功能-含可运行代码及解释说明
- GTA5-1.66版本中文内置修改器.2023.3.4日-更新1.66-版本
- C#实现的OPC DA转OPC UA服务器软件
- Richdad(穷爸爸富爸爸现金流游戏)卷1
- Richdad(穷爸爸富爸爸现金流游戏)卷2
- 基于双路神经网络的滚动轴承故障诊断 融合了原始振动信号 和 二维信号时频图像 的多输入(多通道)故障诊断方法 单路和双路都可 时频图像算法可选小波变,短时傅里叶变,马尔可夫变迁场,格拉姆角场
- mariadb数据库二进制包安装脚本
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈