目录
一. 题目背景....................................................................................................................................3
1.选题背景..................................................................................................................................3
2.研究意义..................................................................................................................................3
3.题目描述..................................................................................................................................4
4.选题数据..................................................................................................................................4
二. 现有研究状态............................................................................................................................5
三. 运用的技术手段和方法............................................................................................................7
3.1 EDA(探索性数据分析)..................................................................................................7
3.2 异常值的处理.......................................................................................................................7
3.3 合并训练集和测试集...........................................................................................................8
3.4 删除多余的列.......................................................................................................................8
3.5 缺失值的处理.......................................................................................................................8
3.6 数据类型转换.......................................................................................................................8
3.7 数据对数化处理...................................................................................................................9
3.8 得到数据特征的重要性并做成 DataFrame 形式...............................................................9
3.9 对数据特征重要性数值进行可视化...................................................................................9
3.10 对数据进行合并.................................................................................................................9
3.11 取出处理后的测试集数据...............................................................................................10
3.12 使用机器学习模型对数据进行预测..............................................................................10
四. 数据分析..................................................................................................................................10
4.1 EDA(探索性数据分析)................................................................................................10
4.2 异常值处理.........................................................................................................................11
4.3 合并训练集和测试集.........................................................................................................15
4.4 删除多余的列.....................................................................................................................16
4.5 缺失值处理.........................................................................................................................16
4.6 数据类型转换.....................................................................................................................20
4.7 数据对数化处理.................................................................................................................21
4.8 得到数据特征的重要性并做成 DataFrame 形式.............................................................23
4.9 对数据特征重要性数值进行可视化................................................................................24
4.10 对数据进行合并...............................................................................................................25
4.11 取出处理后的测试集数据...............................................................................................27
4.12 使用机器学习模型对数据进行预测...............................................................................27
4.13 有意义的方面...................................................................................................................29
五. 项目总结..................................................................................................................................31
六. 参考文献..................................................................................................................................33
2 / 34
评论0