# 校园消费行为大数据分析
## 安装依赖与程序
### 安装依赖
```
pip install -r requirments.txt
```
### 程序运行说明
- 根据上面的指示安装依赖。
- 创建`data`文件夹,把[数据文件]放到`data`目录下。
- **先运行`init.py`,不能先运行其他两个文件。**
##### 为什么不提供jupyter格式?
- 之所以不提供jupyter版本而使用原生python环境是因为jupyter的图片和输出都会被保留在jupyter文件中,无法分离程序和输出,导致git维护体验不好。
- 我们的py文件经过了处理,在一些支持py文件以jupyter模式运行的IDE和编辑器中有非常好的体验,比如pycharm、vscode。
##### 运行的结果不稳定?
是这样的,在`model.py`的最后几个例子中,我们并没有做从模型二到模型三的衔接,加上k-means算法不是很稳定,所以,有个参数每次运行的时候需要手动调节。
在当前版本的201行`group_label = 2`,这个参数根据上面的3D图来决定取值,我们需要找的是三项指标都在最底层的那一类,然后把它的编号修改到这行的赋值中去。
## 材料
校园一卡通是集身份认证、金融消费、数据共享等多项功能于一体的信息集 成系统。在为师生提供优质、高效信息化服务的同时,系统自身也积累了大量的 历史记录,其中蕴含着学生的消费行为以及学校食堂等各部门的运行状况等信 息。很多高校基于校园一卡通系统进行“智慧校园”的相关建设,例如《扬子晚 报》2016年1月27日的报道:《南理工给贫困生“暖心饭卡补助”》。
不用申请,不用审核,饭卡上竟然能悄悄多出几百元......记者昨天从南京理 工大学独家了解到,南理工教育基金会正式启动了“暖心饭卡”项目,针对特困 生的温饱问题进行“精准援助”。
项目专门针对贫困本科生的“温饱问题”进行援助。在学校一卡通中心,教 育基金会的工作人员找来了全校一万六千余名在校本科生9月中旬到11月中旬的 刷卡记录,对所有的记录进行了大数据分析。最终圈定了500余名“准援助对 象”。
南理工教育基金会将拿出“种子基金”100万元作为启动资金,根据每位贫 困学生的不同情况确定具体的补助金额,然后将这些钱“悄无声息”的打入学生 的饭卡中,保证困难学生能够吃饱饭。
<p align="right">《扬子晚报》2016年1月27日:南理工给贫困生“暖心饭卡补助”</p>
## 题目
本赛题提供国内某高校校园一卡通系统一个月的运行数据,请使用附件数据 分析和建模,分析学生在校园内的学习生活行为,为改进学校服务并为相关部门 的决策提供信息支持。
1. 分析学生的消费行为和食堂的运营状况,为食堂运营提供建议。
2. 根据学生的整体校园消费行为,选择合适的特征,构建模型,分析每一类 学生群体的消费特点。
3. 构建学生消费细分模型,为学校判定学生的经济状况提供参考意见。
## 数据获取
[数据集下载地址]已经放在里面了
## 数据说明
包含3张数据表,分别为data1.csv、data2.csv、data3.csv,对应于学生ID表、消费记录表和门禁记录表。
### 数据集各字段说明
#### data1.csv
|字段名|描述|
|-|-|
|Index|序号|
|CardNo|校园卡号。每位学生的校园卡号都唯一 Sex 性别。分为“男”和“女”|
|Major|专业名称|
|AccessCardNo|门禁卡号。每位学生的门禁卡号都唯一|
#### data2.csv
|字段名|描述|
|-|-|
|Index|流水号。消费的流水号|
|CardNo|校园卡号。每位学生的校园卡号都唯一|
|PeoNo|校园卡编号。每位学生的校园卡编号都唯一|
|Date|消费时间|
|Money|消费金额。单位:元|
|FundMoney|存储金额。单位:元|
|Surplus|余额。单位:元|
|CardCount|消费次数。累计消费的次数|
|Type|消费类型|
|TermNo|消费项目的编码|
|TermSerNo|消费项目的序列号|
|conOperNo|消费操作的编码|
|OperNo|操作编码|
|Dept|消费地点|
#### data3.csv
|字段名|描述|
|-|-|
|Index|序号|
|AccessCardNo|门禁卡号。每位学生的门禁卡号都唯一|
|Date|进出时间|
|Address|进出地点|
|Access|是否通过。分为“0”和“1”|
|Describe|描述。分为“禁止通过-没有权限”和“允许通过”|
程序员张小妍
- 粉丝: 1w+
- 资源: 3594
最新资源
- 基于WebRTC DataChannel的hlsjs-p2p-engine视频加速插件设计源码
- 对称双向半桥LLC谐振变器双向运行仿真模型 模型采用闭环PI控制,频率控制方法 输出效果好,效率高 如展示图所示 matlab simulink
- 基于Vue框架的初中数学题库微信小程序前端设计源码
- 基于STC8单片机的斥候模块命令端口通信程序库C语言设计源码
- matlab simulink多风电场协调的惯性,下垂控制一次调频,风电渗透率可调,目前为20% 所有参数均设计好,可直接运行 可加入超速减载,变桨控制,频率二次跌落转速回复设计 多个风电场协调
- 网链输送机sw18可编辑全套技术资料100%好用.zip
- 网链螺旋冷却输送塔sw18可编辑全套技术资料100%好用.zip
- 托盘自动供料机sw18可编辑全套技术资料100%好用.zip
- 三相光储充变流器,双路MPPT输入,MPPT工作范围150-1100V,THD值小于3%,功率因数在-0.8-0.8之间,支持50Hz 60Hz,最大并网功率为三相10kw,电网电压范围为300-4
- 多智能体编队与避障 #人工势场#多智能体#编队#避障#拓扑结构#队形变
- 基于Java与微信小程序的财大快递代取平台设计源码
- 基于Vue框架的机房信息集中管理系统设计源码
- 三轴示教 可编程 触摸屏程序 功能强大 触摸屏 PLC 程序 汇川plc 三轴简易示教系统,学习性强,程序简单易用 支持工艺路径保存,可以保存四组工艺路径 每个工艺路径支持示教
- 永磁同步电机,基于扩展卡尔曼滤波算法无传感器仿真模型,s函数编写算法,基于matlab simulink搭建
- 物料混合操作平台sw20可编辑全套技术资料100%好用.zip
- 蜗轮箱齿轮电动机升降机sw21可编辑全套技术资料100%好用.zip
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈