云计算与大数据分析_数据挖掘、机器学习_对乘客进行当前、潜在价值分析,特征分析,乘坐预测等_多属性数据集、部分代码
本数据集可以用于对航空公司的客户进行当前、潜在价值分析,特征分析,乘坐预测,剖析生命周期。 本数据集共有6+w的数据,每位乘客为一个样本,包含该乘客的63个属性,属性包括乘客的基本信息--工作地域、年龄、性别等,还包括乘机次数、乘机频率、乘积积分、参与非乘机积分等等,该数据集含有一个时间宽度长达2年的观测1期及其属性数据。 如此丰富全面周到的数据集可以使使用者尽可能的发挥专长,进行预期设计比等,使用多种数据挖掘技术来挖掘更多知识点,比如建立乘客流失模型、乘客细分和乘客价值评估、乘客生命周期预测。 适用于数据挖掘初学者,机器学习挖掘者,课程教学设计,毕业设计,项目设计,适用于老师们教学,学生们在学校中的课程项目训练和学习成果展示。 并附带了部分代码,代码包括数据EDA,清洗,数据标准化,数据建模,是一套数据挖掘的流程,可以根据结果自定义实现结果可视化,都是比较基础的代码。 代码注意事项:因为软件的升级,例如pycharm,部分旧版软件可以运行,更新后的软件也只需要稍微改一下pandas中的格式输出语句即可,比如csv文件输出不可以再用excel,百度一搜即可。
0
170
4.31MB
2022-05-28
22