数值数据分析流 框架 python code案例
数据分析流框架理解
1、需求
2、y量化
3、x选择
4、描述
4.1图形
4.2统计量
5、预分析(特征工程,流程化和模块化)
5.1、异常值
单变量异常值
多变量异常值
5.2、缺失值
单变量缺失值
多变量缺失值
5.3、特征筛选
单变量特征筛选
多变量特征筛选
5.4、共线性 scipy.optional
单变量
多变量
5.5、变换
单变量
多变量
5.6、编码
单变量编码
多变量编码
6、建模(大模型:机器学习)
小数据算法:8 statsmodel 小数据
大数据算法:20 sklearn 大数据
7、修正
7.1、残差
7.2、假设(清晰清楚)
8、模型评估
8.1、残差
8.2、业务
9、应用
9.1、主次归因
9.2、规则归因
9.3、内衍
9.4、外推
10、可视化
———————————————
原文链接:https://blog.csdn.net/u010591976/article/details/106367307