基于餐厅消费数据的隐形资助研究-校内数模竞赛源码+PDF论文资料.zip_基于餐厅消费数据的隐形资助研究资源-CSDN文库

共70个文件

xlsx：33个

png：17个

csv：5个

版权申诉

毕业设计

源码

5星 · 超过95%的资源 131 浏览量 2024-03-01 21:58:02 上传评论 2 收藏 137.76MB ZIP 举报

资源推荐

资源详情

资源评论

收起资源包目录

基于餐厅消费数据的隐形资助研究_校内数模竞赛源码+资料.zip （70个子文件）

MathModeling-Sharing-主main

数学建模竞赛的通知.doc 149KB

【1】数学建模竞赛论文及程序

程序

计算极差、四分位点.m 1KB

数据剔除.m 702B

程序清单.txt 623B

问题1.3 画出聚类3年变化.py 703B

问题二 xgboost预测.py 2KB

计算消费波动性.m 723B

附件

附件9 问题2待补全标签数据_基于第二问模型改进前 .xlsx 22KB

问题4 学生贫困程度得分.csv 93KB

附件 1-3 第一学年聚类结果以及特征详表.xlsx 2.19MB

问题4 资助金额表.csv 2KB

附件4-7与附件1-3的合并.xlsx 78KB

食物种类消费均价.xlsx 20KB

论文 .pdf 1.59MB

【3】问题2 训练模型、预测贫困度

附件9 问题2待补全标签数据 .xlsx 22KB

全体学生三个学年贫困程度.xlsx 121KB

问题二 xgboost预测.py 2KB

附件8 已知贫困标签.xlsx 639KB

附件9 问题2待补全标签数据 - 副本.xlsx 16KB

特征重要性.png 71KB

题目.docx 18KB

【5】问题4 熵权法综合评价

综合得分表.csv 93KB

描述3类群体的差异.xlsx 639KB

资助金额表.csv 2KB

第三学年-综合评价.xlsx 804KB

资助合理性.xlsx 22KB

三类贫困等级的消费特征.xlsx 10KB

【4】问题3

【2】附件4-7的数据合并——特征提取.xlsx 51KB

重新预测附件9.xlsx 16KB

【2】附件4-7与附件1-3的合并.xlsx 78KB

Figure_1.png 84KB

使用说明.txt 1KB

【2】问题1

晚餐消费均价_trend.png 46KB

消费极差_trend.png 39KB

日消费波动性_trend.png 44KB

下四分位点_trend.png 46KB

数据集聚类标注.csv 833KB

中餐消费均价_trend.png 46KB

全年消费次数_trend.png 58KB

聚类结果.xlsx 2.19MB

早餐消费次数_trend.png 53KB

最高值_trend.png 36KB

聚类数对比图.png 70KB

早餐消费均价_trend.png 45KB

excel剔除数据时所用VB代码.txt 1KB

全年消费波动性_trend.png 44KB

晚餐消费次数_trend.png 60KB

上四分位点_trend.png 45KB

次消费均价_trend.png 43KB

中餐消费次数_trend.png 56KB

三个群体三年变化.xlsx 14KB

论文.pdf 1.58MB

数据处理

附件3 第三年- 已剔除.xlsx 16.64MB

【2】附件4-7的数据合并——特征提取.xlsx 51KB

附件4-7合并.xlsx 13.73MB

附件1第一年已剔除.xlsx 20MB

B.docx 19KB

附件2 第二年已剔除.xlsx 10.99MB

【1】附件1-3的特征提取 5415位同学三年的消费特征——.xlsx 2.12MB

原始题目+数据

附件5 100001-200000.xlsx 2.9MB

附件1第一年三餐消费数据.xlsx 23.17MB

附件3 第三年三餐消费数据.xlsx 20.82MB

附件7 300001-331258.xlsx 932KB

附件0 性别标签.xlsx 76KB

附件9 问题2待补全标签数据.xlsx 18KB

附件2 第二年三餐消费数据.xlsx 20.09MB

B.docx 16KB

附件8 已知贫困标签.xlsx 65KB

附件6 200001-300000.xlsx 2.91MB

附件4 1-100000.xlsx 2.96MB

2023 校内大学生数学建模竞赛

承诺书

我们仔细阅读了大学生数学建模竞赛的竞赛规则.

我们完全明白，在竞赛开始后参赛队员不能以任何方式（包括电话、电子邮

件、网上咨询等）与队外的任何人（包括指导教师）研究、讨论与赛题有关的问

题。

我们知道，抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他

公开的资料（包括网上查到的资料），必须按照规定的参考文献的表述方式在正

文引用处和参考文献中明确列出。

我们郑重承诺，严格遵守竞赛规则，以保证竞赛的公正、公平性。如有违反

竞赛规则的行为，我们将受到严肃处理。

参赛队员：

1.姓名：学号：班级：

2.姓名：学号：班级：

3.姓名：学号：班级：

日期 2023 年 5 月 27 日

基于餐厅消费数据的隐形资助模型——XGBoost 预测模型

摘要

本文探讨了一种新型的隐性资助模型——基于大学生餐厅消费数据的隐形

资助模型。在当前社会中，精准资助的重要性日益凸显。特别是对于高校家庭经

济困难学生，如何准确识别他们并提供有效的援助，是当前高等教育贫困援助工

作的关键问题。我们利用大数据技术，通过统计和分析大学生的餐厅消费数据，

建立隐性资助模型。该模型将能够根据学生的消费数据，评估其经济贫困程度，

然后精准地给予援助。助力教育路上的精准扶贫。

在构建模型之前，我们首先对数据进行了必要的处理，并对两类数据集进行

特征提取，总计提取到 20 多个特征，用于后续的模型构建。

在解决问题 1 时，我们采用了 k-means 聚类算法，通过肘部法则取 k 值为

3，对第一学年的学生进行聚类，类别 1 的学生是消费最低但最稳定的群体。类

别 3 的学生是消费最高但最不稳定的群体，他们可能是经济状况较好或者更愿

意消费的学生。类别 2 的学生在这两者之间，消费水平和消费稳定性都中等。

然后我们计算了这些群体的三年的消费特征的均值，绘制图表，来体现这些

群体三年来的消费特征变化。三个群体的学生在三年的时间里，其消费均价都在

上升，而消费次数在下降，这可能表明他们的消费能力在提高，同时他们的消费

习惯也变得更加稳定。

在解决问题 2 时，我们构建了 XGBoost 模型，同时使用交叉验证、启发式算

法寻优来提高模型的精确度。利用附件 8 的数据进行模型训练，对附件 9 中的同

学进行预测。并且对全体同学第二三学年的贫困程度进行预测。模型准确度达到

0.76，效果很好。

在解决问题 3 时，我们将附件 4-7 中提取到的新的特征一起纳入模型的指

标体系中，优化我们的XGBoost 模型，使得模型准确率达到了 0.84，提升了 10.53%。

更重要的是，新的模型对贫困等级为 1、2 的学生预测准确度翻了几十倍之多。

在解决问题 4 时，我们利用熵权法对第三学年学生的各个指标赋权重，并进

行综合评价，计算其综合得分。得到每个学生的贫困程度得分后，我们将资助金

额进行线性插值，得到贫困程度在前 80 位的同学的资助金额分配，最终贫困程

度第一的同学分配资助金额 2987 元，排名第 80 的同学分配资助金额 500 元。

总体来看，这种基于大学生餐厅消费数据的隐形资助模型，既体现了大数据

时代的特点，也充分考虑了教育援助的精准性和公平性。同时，它也尊重了学生

的隐私权，真正做到了以人为本，关心每一个学生的需要。因此，这种模型具有

广阔的应用前景，值得我们深入探讨和研究。

关键词：隐形资助 k-means 聚类 XGBoost 综合评价线性插值

一、问题重述

1.1 问题背景

在当前社会中，精准资助的重要性日益凸显。特别是对于高校家庭经济困难

学生，如何准确识别他们并提供有效的援助，是当前高等教育贫困援助工作的关

键问题。这里，我们要探索的是一种新的、具有革命性的隐性资助模型——基于

大学生餐厅消费数据的隐形资助模型。

近年来，大数据技术的发展为社会各行业带来了颠覆性的变化，教育领域也

不例外。大数据能够为我们提供丰富的信息，从而在各种问题的处理中更加精确、

深入。在这个背景下，我们意识到，大学生餐厅的消费数据，也许能够成为揭示

学生经济状况的重要窗口。这些数据反映了学生的日常消费行为，而消费行为往

往与家庭经济状况密切相关。

基于这种观察，我们决定利用大数据技术，通过统计和分析大学生的餐厅消

费数据，建立一个隐性资助模型。该模型将能够根据学生的消费数据，评估其经

济贫困程度，然后精准地给予援助。更重要的是，这种方式的资助，不需要公开

学生的个人信息，也无需进行评比，既能保护家庭经济困难学生的隐私，又能够

更公正、更公平地实施教育援助。

1.2 问题重述

1. 数据处理与群体特征分析：附件 0 提供了学生的性别信息。附件 1-3 提

供了学生不同学年的日三餐餐厅消费金额数据记录，附件 4-7 提供了部分同学的

饮食种类信息。首先，需要对这些数据进行预处理（如删除不相关数据、缺失值

处理、特征提取等）。然后，基于处理后的数据，建立模型来挖掘不同的代表性

群体，定量分析这些群体在三个学年中的主要消费行为特征变化规律和饮食种类

变化规律。

2. 贫困程度预测：附件 8 给出了部分同学在第一学年结束后其他方式认定

的贫困程度等级。这个等级是粗粒度的，等级 2 是准确的（可能不全），其他等

级可能存在一些偏差。需要建立数学模型，根据学生的消费行为（附件 1-3 的数

据）预测贫困程度，并补全附件 9。然后，结合第一问的研究结果，预测学生在

第二学年和第三学年的贫困程度，并分析相关变化。

3. 改进贫困程度预测模型：在第二问的基础上，结合附件 4-7 的饮食种类

数据，改进贫困程度预测模型，并比较预测结果的变化。

4. 构建差异化资助额度分配算法：基于前面对贫困生本质特征的挖掘，构

建一个差异化（细粒度）的资助额度分配算法。以第三学年为例，给出具体的分

配结果。分配对象是附件 4-7 中涉及的同学，资助总金额为 10 万元，资助人员

为 80 名。然后对资助结果的公平性和合理性进行评估。

二、问题分析与模型假设

2.1 问题分析

在开始解题之前，我们首先对数据进行了预处理，以及特征提取。从附近 1-

3 中提取出全体学生三年来的消费特征，从附件 4-7 中提取出部分学生的消费金

额特征及食物种类特征，用于后续的模型构建。

对问题一，我们采用 k-means 算法，对第一学年的学生进行聚类，然后计算

这些群体的三年的消费特征的均值，绘制图表，来体现这些群体三年来的消费特

征变化。

对问题二，我们构建 XGBoost 模型，同时使用交叉验证、启发式算法寻优

来提高模型的精确度。利用附件 8 的数据进行模型训练，对附件 9 中的同学进行

预测。并且对全体同学第二三学年的贫困程度进行预测。

对问题三，我们将附件 4-7 中提取到的新的特征一起纳入模型的指标体系中，

使得模型的预测更加准确。

对问题四，我们利用熵权法对第三学年学生的各个指标赋权重，并进行综合

评价，计算其综合得分。得到每个学生的贫困程度得分后，我们将资助金额进行

线性插值，得到贫困程度在前 80 位的同学的资助金额分配。

2.2 模型假设

⚫ 假设每位同学的餐厅消费记录都是自己本人的真实消费记录，不考虑为

同学带饭、餐卡丢失被盗刷等情况。

⚫ 假设通过熵权法得出的权重能够有效地反映各个特征的重要性。

⚫ 假设学生的贫困程度（综合评价得分）和他们应得的资助金额之间存在

线性关系。即学生的贫困程度每增加一个单位，学生应得的资助金额也

会增加一个固定的单位。

⚫ 在应用熵权法时，假设所提起到的各个特征是独立的，即它们之间没有

基于餐厅消费数据的隐形资助研究-校内数模竞赛源码+PDF论文资料.zip

基于餐厅消费数据的隐形资助研究校内数模竞赛分享.zip

数模竞赛《Python基于餐厅消费数据的隐形资助研究》+源代码+设计资料+论文

基于图像识别的隐形眼镜镜片缺陷检测matlab源码+详细项目说明.tar

基于数据挖掘的隐性知识显性化及其构建.pdf

2017研究生数学建模竞赛试题——C组

2021高考历史精选资料包(解题技巧+资料干货).zip

基于Matlab图像识别技术的隐形眼镜镜片边缘缺陷检测+源代码+文档说明.zip

基于k-means聚类分析，XGBoost模型，熵权法的隐形资助模型.zip

ECSHOP隐形眼镜网站模板.zip源码ECSHOP网站模板打包下载

整站源码_ECSHOP隐形眼镜网站模板.zip

半导体行业报告：布局之年，寻找隐形龙头（112页）.zip

基础化工行业7月份投资策略：盘点化工行业的“隐形冠军”-0716-国信证券-26页.pdf

20210809-东方证券-浙江自然-605080-“垂直一体化+深度绑定大客户”的户外隐形龙头.pdf

科创板中期投资策略：多维寻找隐形冠军-0816-银河证券-24页.pdf

医疗服务行业口腔产业链专题研究系列：从口腔上游龙头数据看隐形矫正高端需求增长-0311-广发证券-14页.pdf

行业资料-建筑装置-带隐形轨道可移动教学板.zip

行业文档-设计装置-教学用隐形黑板.zip

34个经典javaweb项目实例.zip

毕业设计 springBoot人力资源管理系统+毕业论文+前后端源代码

项目源码：基于Hadoop+Spark招聘推荐可视化系统 大数据项目 计算机毕业设计

基于spring boot的小区物业管理系统源码+论文+答辩ppt

毕业设计：舆情监测系统（SpringBoot+NLP）

计算机毕业设计：Flask股票数据采集分析可视化系统 python+爬虫+金融数据

毕业设计-基于JAVA的springboot超市进销存系统(源代码+论文）

人脸识别系统OpenCV+dlib+python（含数据库）Pyqt5界面设计 项目源码 毕业设计

基于深度学习的课堂行为识别和考试作弊检测系统的设计与实现（python源码）

基于51单片机的智能电子秤系统设计(含代码仿真及论文)

最新资源

项目源码：基于Hadoop+Spark招聘推荐可视化系统大数据项目计算机毕业设计

人脸识别系统OpenCV+dlib+python（含数据库）Pyqt5界面设计项目源码毕业设计