在这里,这是您必须要做的必不可少的“泰坦尼克计划”,任何人都可以合法地将您称为数据科学家。 说真的,我很想参加一场kaggle比赛
项目概况:
在测试装置上达到了77.51%的准确性。 很难知道排行榜有多好,因为排行榜上充满了100%准确率的人。 我必须假设他们获得如此高分的方法是...让我们说这是非常规的。
数据是从正在进行的kaggle比赛中获取的
广泛的EDA和功能工程。
使用Logistic回归,梯度提升和支持向量聚类。
使用GridSearchCV和RandomizedSearchCV进行超参数优化。
特征重要性探索
模型堆叠集成方法。
詹姆斯·卡梅隆电影(James Cameron Movies)炙手可热。
使用的代码和资源:
Python版本: 3.7
包装:熊猫,numpy,sklearn,matplotlib,seaborn,lightgbm,
特征: