学习记录之新冠疫情可视化 学习目的 1.爬丁香园数据 2.可视化 *** 2.1.展示全国疫情地图 ***2.2.展示湖北疫情分布图 ***2.3.展示疫情增长趋势图 *一. 数据准备(根据爬丁香园网得到两个数据) 这里是爬虫丁香园的数据 爬虫的程序:模拟浏览器–>往目标站点发送请求–>接收响应数据–>提取有用的数据–>保存到本地。 爬虫的过程: 1.发送请求:这里用到requests模块,其作用是python实现的简单易用的http库,官网地址是: http://cn.python-requests.org/zh_CN/latest/) 2.获取响应数据(服务器返回的数据) 3.解析并提取数 学习记录之新冠疫情可视化,主要目的是通过爬取丁香园网站上的疫情数据,进行数据分析和可视化展示,以便更好地理解和跟踪疫情的发展。在这个过程中,涉及到的主要知识点包括数据爬取、数据解析、数据存储以及数据可视化。 数据爬取是整个过程的基础。在Python中,我们通常使用`requests`模块来发送HTTP请求,它是一个简洁且易于使用的库,能够模拟浏览器向目标网站发送请求。在本例中,我们使用`requests.get()`方法获取丁香园网站的疫情数据。爬虫程序还包括接收服务器返回的响应数据,并利用`re`模块(正则表达式)来解析和提取所需信息。正则表达式是一种强大的文本处理工具,能帮助我们从HTML页面中定位和提取特定的数据。 接着,提取到的数据需要被保存到本地,便于后续处理。在Python中,可以使用`json`模块将数据转换为Python对象,然后将其写入到JSON文件中。这样做的好处是,JSON格式数据既易于阅读,又方便与其他编程语言交换数据。 在数据准备阶段,我们得到了两个数据集:一个是全国的疫情数据,另一个是新增病例的数据。这些数据可以用来绘制不同类型的图表,例如全国疫情地图、湖北疫情分布图以及疫情增长趋势图。这些可视化图表有助于我们直观地了解疫情在各个地区的分布情况和变化趋势。 1. 全国疫情地图的展示:可以使用地图库,如`folium`或`geopandas`,结合地理信息数据,将疫情数据与省份或城市的地理位置对应起来,形成颜色编码的地图,展示不同区域的感染情况。 2. 湖北疫情分布图:对于湖北省内的疫情分布,可以通过条形图或者热力图来表示,突出显示受影响最严重的地区。 3. 疫情增长趋势图:可以使用折线图或柱状图,展示每日新增病例、累计病例等数据随时间的变化,帮助分析疫情的发展速度和走势。 在进行数据可视化时,可以使用Python的可视化库,如`matplotlib`、`seaborn`或`plotly`等,它们提供了丰富的图形选项和交互性,使得数据展示更加生动和有意义。 总结来说,学习新冠疫情可视化涉及的关键技术包括网络爬虫(requests、re模块)、数据解析(json模块)、数据存储以及数据可视化(如matplotlib、seaborn等库)。通过掌握这些技能,可以有效地获取和展示疫情数据,从而对疫情态势有更深入的理解。
- 粉丝: 2
- 资源: 917
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
评论5