没有合适的资源?快使用搜索试试~ 我知道了~
titanic_dataset:进行中-此分析着重于基于titanic崩溃的数据集。 我们被要求查看数据并创建一个机器学习模型,...
共27个文件
png:20个
csv:3个
gitignore:1个
需积分: 11 2 下载量 173 浏览量
2021-02-27
08:37:10
上传
评论
收藏 911KB ZIP 举报
温馨提示
titanic_dataset 目的 如上图中的Kaggle所述,此挑战的目的是检查有关泰坦尼克号沉没的数据,以建立生存能力的预测模型。 我将在自己对此数据集的分析中尝试回答以下问题: 财富决定了您生存的可能性吗? 如果是的话多少钱? 年龄是一个人的生存率的决定因素吗? 探索性数据分析 分析的这一部分着重于使自己熟悉数据,并针对任何潜在问题或特殊考虑对数据进行探索。 一个很好的起点是查看训练数据的列及其各自的数据类型。 这确保了所有收集到的数据将能够被相应地操纵。 我们可以立即确定数据中的一些关键点。 “年龄”和“机舱”列中有大量缺失值 列通常可以分为两大类-数字数据类型和分类数据 某些列可能需要从我们的训练数据中删除,因为它们可能无助于我们确定生存率的算法-例如Name和PassengerId 解决这些问题中的第一点,有助于量化“年龄”和“机舱”列中的数据百分比为空 如
资源推荐
资源详情
资源评论
收起资源包目录
titanic_dataset-main.zip (27个子文件)
titanic_dataset-main
titanic_data_analysis.twbx 63KB
Images
Sex_pivot.PNG 2KB
SibSp_distribution.PNG 7KB
survivor_rate_by_sex.PNG 19KB
pclass_Sex_pivot_table.PNG 16KB
survived_distribution.PNG 6KB
Age_boxplot.PNG 4KB
age_description.PNG 5KB
age_range_survival_rates.PNG 14KB
survivor_rate_by_Pclass.PNG 8KB
titanic_purpose.PNG 37KB
tableau_dashboard_1.PNG 239KB
Nulls_heatmap.PNG 7KB
training_data_datatypes.PNG 15KB
Age_distribution.PNG 6KB
Pclass_pivot.PNG 4KB
No_nulls_heatmap.PNG 6KB
survivors_by_diff_col.PNG 38KB
training_data_percent_missing.PNG 9KB
Price_distribution_by_class.PNG 13KB
titanic_clip_art.png 22KB
README.md 5KB
Data
train.csv 59KB
test.csv 28KB
gender_submission.csv 3KB
.gitignore 2KB
titanic_notebook.ipynb 4.47MB
共 27 条
- 1
资源评论
Matt小特
- 粉丝: 30
- 资源: 4540
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- Image_1713714819368.png
- 数据可视化 matplotlib 实例.docx
- Python 使用 Matplotlib 绘制甘特图的实践.docx
- matplotlib 中的 cmap 参数介绍.docx
- 基于matlab的毕业设计基于Matlab使用LQR实现车辆轨迹跟踪源码.zip
- 基于Matplotlib 的高互动性可视化系统设计与实现
- matplotlib 数据可视化报告.docx
- 传统网页UI设计在移动应用开发中的应用研究.pdf
- 基于pytorch实现BERT+BiLSTM+CRF实现中文命名实体识别源码.zip
- 校园帮项目,毕业设计/课程设计/javaWeb/SSM
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功