学生校园消费行为分析报告
目录
一 背景 ...............................................................................................3
二 分析目的........................................................................................3
三 数据处理........................................................................................3
1,数据清洗 ............................................................................3
2,信息关联 ............................................................................4
3,对食堂的就餐情况分析并进行数据可视化 .......................4
4,对学生消费行为分析并建立模型 ......................................8
四 小结 .............................................................................................12
一 背景
某项目针对贫困本科生的“温饱问题”进行援助。在学校一卡通
中心教育基金会的工作人员来找了全校一万六千余名在校本科生 9
月中旬到 11 月中旬的刷卡记录,对所有的记录进行了大数据分析。
最终固定 500 余名“准援助对象”。可见,对学生校园消费行为分析
具有重要意义。在这背景下,我们为获得某校的 18 级学生 2019 年四
月份的消费情况来进行目标分析。
二 分析目的
1. 分析学生的消费行为和食堂的运营状况,为食堂运营提供建议。
2. 构建学生消费细分模型,为学校判定学生的经济状况提供参考意见。
三 数据处理
1,数据清洗
data1.csv、data2.csv 对应学生 ID 表、消费记录表。使用
data1.csv、data2.csv,根据实际项目需求对数据进行清洗,去除缺
失值所在列的数据 TerSerNo、ConOperNo 对项目无影响可直接删除,
对数据清洗为保证数据的有效性。进行描述统计,转换时间类型为
datatime,删除异常时间点(这里我们认为 5 点以前为异常时间点,
该 时 间 段 内 学 校 不 可 能 有 消 费 记 录 等 ) , 保 存 清 洗 后 数 据 为
task1_X1,task1_X2。
2,信息关联
对学生个人信息表和消费记录表进行关联。由数据说明表中可知
每 个 学 生 的 校 园 卡 号 CardNo 唯 一 , 根 据 CardNo 关 联
task1_X1,task1_X2 合并为 task1_X3。关联后的 task1_X3 的数据正
是我们主要探究的 18 级学生四月份的消费情况。
3,对食堂的就餐情况分析并进行数据可视化
(1)绘制各食堂就餐人次的占比饼图,分析学生早中晚餐的就餐地
点是否有显著差别。以时间间隔接近的多次刷卡记录视为一次就餐行
为。
根据 task1_X2 的数据提取各食堂的消费记录,我们认为 6-8 点为
早餐时间,11-13 点为午餐时间,17-19 点为晚餐时间。绘制的饼图
如下: