没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
试读
27页
近期对疫情数据进行可视化的内容比较多,今天我来用 Python 可视化申请Plotly对国外的疫情发展情况进行可视化,以项目实战的形式,在分析和了解国外疫情变化趋势的同时,加深大家对 Plotly 的学习应用。疫情的数据来源于开源项Akshare,由于使用该项目获取数据时,有时不太稳定,可能会遇到连接失败的情况,所以,这里我提供了保存好的数据供大家使用。
资源推荐
资源详情
资源评论
38 用 Python 可视化神器 Plotly 动态演示全球疫情变化趋
势
近期对疫情数据进行可视化的内容比较多,今天我来用 Python 可视化申请 Plotly 对国外的疫情发展情况进行可
视化,以项目实战的形式,在分析和了解国外疫情变化趋势的同时,加深大家对 Plotly 的学习应用。
在开始之前,我们先来看看最终制作的部分效果图,如果你觉得有兴趣,不妨继续往下看。
Figure 38.1: img-2
动态效果请 点击此处链接
38.1 数据来源
国内的疫情,目前已逐步受到控制,各项指标已开始明显好转,但国外的情况,看起来不是太乐观,已有的作业也
没有抄好,所以,本次我们主要来可视化分析国外疫情的发展情况。
疫情的数据来源于开源项目 Akshare,由于使用该项目获取数据时,有时不太稳定,可能会遇到连接失败的情况,
所以,这里我提供了保存好的数据供大家使用。
360
Chapter 38. 用 Python 可视化神器 Plotly 动态演示全球疫情变化趋势 Python 数据之道
38.2 准备工作
照例,还是先介绍下我运行的环境
• Mac 系统
• Anaconda(Python 3.7)
• Jupyter Notebook
本次使用到的 Python 库包括 akshare, pandas, plotly 等,导入如下:
1 import akshare as ak
2 import pandas as pd
3 import plotly
4 from plotly.offline import iplot, init_notebook_mode
5 import plotly.express as px
6 from datetime import datetime
7
8 init_notebook_mode()
接着,我们读取已获得的数据,已保存的数据是截至 3 月 7 日的。
1 # 从 akshare 获 取 数 据
2 # df_all_history = ak.epidemic_history()
3
4 # 从 csv 文 件 获 取 数 据
5 df_all_history = pd.read_csv('epidemic_all_20200307.csv',index_col=0)
6
7 df_all_history
从上面获取的数据,有些数据格式需要加以调整,对于日期,我们这里会组织两列数据,一列是时间格式的日期
(['date']),一列是字符串格式的日期 (['dates'])。这样设置的原因,是因为我们后续分别需要用到这两种格式的
日期。
1 df_all = df_all_history
2
3 # 将 字 符 串 格 式 的 日 期 另 保 存 为 一 列
4 df_all['dates'] = df_all_history['date']
5
6 # 将 字 符 串 格 式 的 日 期 转 换 为 日 期 格 式
7 df_all['date'] = pd.to_datetime(df_all['date'])
38.3 获取国外的疫情数据
上面的数据,是全球的数据,我们可以把其中属于中国的剔除,就可以得到国外的数据了。
1 # 国 外 , 按 国 家 统 计
2 df_oversea = df_all.query("country!=' 中 国 '")
3 df_oversea.fillna(value="", inplace=True)
4
Chapter 38. 用 Python 可视化神器 Plotly 动态演示全球疫情变化趋势 Python 数据之道
5 df_oversea
先来用 plotly express 看下国外疫情分国家的整体走势。
1 fig_oversea = px.line(df_oversea, x='dates', y='confirmed',
2 line_group='country',
3 color='country',
4 color_discrete_sequence=px.colors.qualitative.D3,
5 hover_name='country',
6 )
7
8 fig_oversea.show()
Figure 38.2: img-1
从上图可以看出,国外的疫情发展情况,大部分国家从 2 月 10 日期,发展趋势较为明显,因此,后面我们重点分
析这段时间之后的情况。
1 # 现 有 数 据 演 示 从 2020 年 2 月 10 日 开 始
2 df_oversea_recent = df_oversea.set_index('date')
3 df_oversea_recent = df_oversea_recent['2020-02-10':]
4 df_oversea_recent
由于部分国家的数据不是从 2020 年 2 月 10 日开始记录的,所以要补充数据。我们可以手动新建一个 excel 数据
表,将补充日期的数值填充为 0 。
我这里主要补充的是伊朗的数据,因为伊朗实现是发展太快了,必须纳入分析的范围内。其他国家,如果有需要补
充的,后续可以继续完善。
1 # 由 于 部 分 国 家 , 数 据 不 是 从 2020 年 2 月 10 日 开 始 的 , 所 以 要 补 充 数 据 , 数 值 为 0
2 # 数 据 在 excel 表 格 中 进 行 补 充 , 这 里 进 行 读 取
3
4 df_oversea_buchong = pd.read_excel('epidemic_buchong.xlsx')
5 df_oversea_buchong['dates'] = df_oversea_buchong['date'].apply(lambda x:x.
strftime('%Y-%m-%d'))
Chapter 38. 用 Python 可视化神器 Plotly 动态演示全球疫情变化趋势 Python 数据之道
6 df_oversea_buchong.set_index('date', inplace=True)
7 df_oversea_buchong.fillna(value="", inplace=True)
8 print(df_oversea_buchong.info())
9 df_oversea_buchong
将需要补充的数据弄好后,我们可以合并上面这两部分数据,一起进行分析。
1 # 合 并 补 充 数 据
2
3 df_oversea_recent_new = df_oversea_recent.append(df_oversea_buchong)
4
5 df_oversea_recent_new.sort_index(inplace=True)
6
7 df_oversea_recent_new
得到合并的数据后,首先,我们用气泡图来对变化情况进行可视化,这里用的是 plotly express 的散点图。
plotly express 现在已经合并到 plotly 中,个人觉得跟 plotly 原生内容的协同性相对 culinks 要好用点。
1 # -*- coding: utf-8 -*-
2 """
3 @Author: Lemon
4 @ 出 品 : Python 数 据 之 道
5 @Homepage: liyangbit.com
6 """
7
8 fig_oversea_recent = px.scatter(df_oversea_recent_new, x='dead', y='confirmed',
9 size='confirmed', text='country', color='
country',
10 color_discrete_sequence=px.colors.qualitative.
Light24,
11 animation_frame='dates',animation_group='
country',
12 hover_name='country',
13 range_x=[-10,260],
14 range_y=[0,8000],
15 size_max=50,
16 template='plotly_white',
17 )
18
19 fig_oversea_recent.show()
Chapter 38. 用 Python 可视化神器 Plotly 动态演示全球疫情变化趋势 Python 数据之道
Figure 38.3: img-2
从上面这个动态图可以清晰的看出,当前,在海外的国家中,韩国、伊朗、意大利三个国家最为严重。这三个国家
中,就增长趋势而言,伊朗和意大利又比韩国要更明显,目前韩国的增长有所放缓,而伊朗和意大利还处于快速增长的
过程中,后续情况不容乐观。
此外,在这个图中,另外还有几个国家值得关注,日本,除去钻石号之外,从数据来看,本土的增长目前还算是在
稍微较好的范围内。反倒是,德国、法国、西班牙,个人觉得已成逐步壮大之势,不得不防。
而且,由于整个欧盟国家之间,人员是自由流通的,现在看来,整个欧盟很可能会成为疫情的重灾区,其影响巨大。
上图左下角的这些国家的走势,我们可以拉近来看,走势如下,这样,对于德国、法国、西班牙就会看的更明显了。
Figure 38.4: img-4
这里,还有一个国家,就是美国,虽然从数据以及增长情况来看,好像美国还好,但恐怕实际情况,要糟糕很多。
剩余26页未读,继续阅读
资源评论
好知识传播者
- 粉丝: 987
- 资源: 4203
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功