最终项目:预测幸福
可以使用某些因素来预测一个国家的幸福分数吗?
与饮酒有关的x,y,z因子可以预测幸福吗? 幸福=输出列,从聚类中排除变量列表什么是最可预测的变量? 线性回归聚类将帮助定义可能与幸福相关的子组
数据源:
用于构建数据框的Kaggle数据集:
用于教程或方法研究的网站:
任务:
问题
合并数据集-Jupyter笔记本,按国家/地区了解了解变量是什么?线性回归模型比较2列,幸福永远是比较列之一吗? 坡度告诉您2列之间的相关性聚类分析-将2列进行分组比较,以比较是否存在相关性-比较2列-形成聚类,然后观察幸福感
假设
结论...可视化
下一步:
规范化数据
通过相关矩阵运行
选择相关值> 0.5或<-.5的列
通过集群运行它们
选择簇数的弯头法
通过幸福感评分为每个数据点着色
确定每个集群的趋势
多元线性回归