泰坦尼克号数据_泰坦尼克号数据分析报告 891名乘客中遇难乘客有549⼈,占61.6%,⽣还乘客342⼈,占38.4%.各等级船舱乘客⼈数 各等级船舱乘客⼈数 Pclass_count=titanic_data['Pclass'].value_counts().sort_index() #⽤Bar_pie()函数作条形图和饼状图 Bar_pie(Pclass_count) 三等船舱乘客最多,占55.1%;⼀等船舱次之占24.2%;⼆级船舱乘客最少,占20.7%.男⼥乘客分布情况 男⼥乘客分布情况 Sex_count=titanic_data['Sex'].value_counts() print(Sex_count) Bar_pie(Sex_count) male 577 female 314 Name: Sex, dtype: int64 男乘客有577⼈,占64.8%;⼥乘客有314⼈,占35.2%.乘客年龄分布情况 乘客年龄分布情况 In [84]: #乘客年龄分布直⽅图 #创建figure、subplot,并⽤hist作条形图 fig_Age=plt.figure(figsize=(10,5)) ax_Age=fig_Age.add_subplot(1,2,1) titanic_data['Age'].hist(bins=10,color='g',alpha=0.3,grid=False) #设置x轴刻度标签 ax_Age.set_xticks([0,10,20,30,40,50,60,70,80,90,100]) #添加标题,x轴标签,y轴标签 ax_Age.set_title('Hist plot of Age') ax_Age.set_xlabel('Age') ax_Age.set_ylabel('number of people') #乘客年龄分布箱线图 #作箱线图 plt.subplot(122) titanic_data.boxplot(column='Age',showfliers=False) #添加y轴标签 plt.ylabel('Age') plt.title('boxplot of Fare') titanic_data['Age'].describe() count 891.000000 mean 29.544332 std 13.013778 min 0.000000 25% 22.000000 50% 29.000000 75% 35.000000 max 80.000000 Name: Age, dtype: float64 乘客年龄⼤概成正态分布,平均年龄29岁多,最⼤的80岁,最⼩的不到1岁(利⽤int()取整,不到1岁的为0).兄弟姐妹、配偶在船上的 兄弟姐妹、配偶在船上的 乘客分布情况条形图 乘客分布情况条形图 #创建figure、subplot,⽤plot()作柱状图 fig_SibSp=plt.figure(figsize=(10,5)) ax_SibSp=fig_SibSp.add_subplot(1,2,1) SibSp_count=titanic_data['SibSp'].value_counts() SibSp_count.plot(kind='bar') #添加标题,x轴标签,y轴标签 ax_SibSp.set_title('Bar plot of SibSp') ax_SibSp.set_xlabel('number of SibSp') ax_SibSp.set_ylabel('number of people') #拥有各 数量的兄弟姐妹、配偶的乘客⽐例条形图 plt.subplot(122) SibSp_count.div(SibSp_count.sum()).plot(kind='bar') #添加标题,x、y轴 标签 plt.title('Ratio of people in SibSp') plt.xlabel('SibSp') plt.ylabel('ratio') 在船上没有兄弟姐妹配偶的乘客较多,占68.2%.⽗母、孩⼦在船上的乘客分布条形图 ⽗母、孩⼦在船上的乘客分布条形图 Parch_count=titanic_data['Parch'].value_counts() #创建figure、subplot,⽤plot()作柱状图 fig_Parch=plt.figure(figsize=(10,5)) ax_Parch=fig_Parch.add_subplot(1,2,1) Parch_count.plot(kind='bar') #添加标题,x、y轴标签 ax_Parch.set_title('Bar plot of Parch') ax 泰坦尼克号作为历史上最著名的海难之一,其沉船事件中的乘客生存状况一直是人们关注的焦点。通过对泰坦尼克号上891名乘客数据的分析,我们可以揭示出许多有关这场灾难的细节,包括乘客的存活比例、船舱等级分布、性别比例、年龄分布以及家庭成员在船上的情况等。本文将基于《泰坦尼克号数据分析报告》所提供的数据,对这些统计维度进行详细的探讨。 报告中提到,在891名乘客中,549人不幸遇难,而342人生还。这一数据直观地说明了泰坦尼克号事件的高致命性,仅有38.4%的乘客能够生还。这种生存率的低下,不仅反映出当时救生设施的匮乏,也反映出灾难发生时的紧急应对措施的不足。 在对船舱等级分布的分析中,我们发现三等船舱的乘客人数最多,占据了半数以上,而一等船舱和二等船舱的乘客人数则相对较少。这种分布模式可能与当时社会经济状况的分布相对应,也提示了社会经济地位可能对乘客的生存机会产生了重要影响。在灾难面前,经济条件较好的乘客可能更容易获得生存资源,如救生艇等。 性别比例方面,报告指出男性乘客有577人,女性乘客有314人,男性占比显著高于女性。然而,历史数据显示,在类似的灾难事件中,女性乘客往往拥有更高的生存率。这可能是因为社会文化因素,在紧急情况下,妇女和儿童往往被优先救助。尽管如此,泰坦尼克号事件中女性乘客的生存率是否明显高于男性,还需要结合其他因素进行深入分析。 年龄分布的统计结果表明,泰坦尼克号上的乘客年龄结构呈现一种近似正态分布的态势,平均年龄约为29.5岁,最小年龄不到1岁,而最大年龄则达到了80岁。年龄结构的分布特点对于理解灾难的受害者群体具有参考价值。年轻和健康的乘客可能有更多的机会逃生,而年老体弱的乘客可能在逃生过程中面临更多困难。 在家庭成员分布方面,报告指出大部分乘客在船上没有兄弟姐妹或配偶。这一结果可能意味着这些乘客在面临灾难时缺乏来自家庭成员的帮助和支持。此外,报告还提供了关于父母和孩子在船上的分布数据,但具体细节未在文中给出,这一部分分析对于理解家庭在灾难中的影响同样重要。 通过对泰坦尼克号乘客数据的分析,我们可以看到,灾难中的生存概率与多种因素相关联。例如,社会经济地位、性别、年龄以及家庭成员的存在与否,都可能影响一个人在灾难中的存活机会。这些发现对于研究灾难对不同群体的影响提供了宝贵的视角,同时也对制定更合理的救援策略提供了理论依据。 此外,本报告在数据可视化方面做得非常出色。通过条形图、饼状图和箱线图等直观的图形展示数据,不仅有助于分析者更好地理解数据,也使得报告的受众可以快速把握数据背后的信息。这些数据可视化技术不仅对数据科学的初学者和专业人士来说是有力的工具,对公众来说也是一次生动的数据科普教育。 总而言之,《泰坦尼克号数据分析报告》通过全面的统计分析,不仅揭示了泰坦尼克号事件中乘客的生存状况,也提供了一个关于数据探索和解释的优秀案例。对于历史学家、数据科学家以及救援策略制定者来说,这份报告都具有重要的参考价值。
- 粉丝: 198
- 资源: 3万+
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 散装物料卸船机step全套技术开发资料100%好用.zip
- MSS市场专项考试题库
- (174756810)跨年烟花代码python
- (175424836)JSP企业电子投票系统(源代码+论文+开题报告+外文翻译+文献综述).rar
- (175470002)JSP企业电子投票系统(源代码+论文+开题报告+外文翻译+文献综述)
- (175759628)贪吃蛇.zip
- (175833246)JSP企业电子投票系统(源代码+论文+开题报告+外文翻译+文献综述).rar.tar.gz
- 自行车、汽车、猫、狗、人类、入侵者检测39-YOLO(v5至v11)、COCO数据集合集.rar
- (175860660)基于51单片机直流电压电流表设计LCD1602液晶实训仿真
- (175931624)基于jsp的投票管理系统源码数据库论文.doc
- 在ARM9核心板KNM1001上实现uIP FTP及TFTP客户端
- (176056440)zotero 插件分享 茉莉花压缩包
- Overview of the Scalable Video Coding Extension of the H.264/AVC Standard
- 汽车之家计量学分析.zip
- (176074624)EPLAN P8部件库:包含低压电气控制系统设计常用品Pai型号 导入单个文件很小几十M,简单易用
- (176333852)《数据库原理及应用教程(微课版)》关系数据库思维导图源文件