[English](README%20-%20en.md)
本教程的b站视频地址:https://www.bilibili.com/video/BV1A5411a7xz
本教程的github地址:https://github.com/ni1o1/pygeo-tutorial
本教程的gitee地址(国内访问快):https://gitee.com/ni1o1/pygeo-tutorial
由于网速或者各种问题,网页打开本教程可能会出现图片或文件显示不能,因此建议各位下载教程到本地后用jupyter notebook打开教程观看
# 如何使用本教程
本教程是在python的Jupyter notebook上编写,有些python的基础环境需要配置:
1. Python环境: Python3.6/3.7均可,这里推荐装一个Anaconda,点击[这个链接](https://www.anaconda.com/distribution/)下载安装(Python是个编程语言,Anaconda是一个打包了数据分析常用功能的Python平台,安装Anaconda就已经包含Python本体)
关于如何使用anaconda的Jupyter notebook可以看[这个链接](https://blog.csdn.net/m0_37438418/article/details/80620190)
2. 把本教程搞到本地,点击本网页右上角的Clone or download,用git clone或者直接Download ZIP下载到本地。
3. 安装本教程最核心的包:Python的geopandas包,点击[这个链接](https://geopandas.readthedocs.io/en/latest/install.html#installing-from-source),按照上面的方法安装(比较推荐里面的Installing from source的方法安装)。
4. 打开教程,enjoy!
# 教程目录
## 基础的数据处理
1. [出租车数据的基础处理,由gps生成OD(pandas)](1-taxigps_to_od.ipynb)
2. [出租车数据的集计与基础图表绘制(matplotlib)](2-.ipynb)
3. [出租车数据的地理信息处理(geopandas)](3-.ipynb)
4. [基于出租车GPS的OD期望线绘制与底图添加(plot_map)](4-.ipynb)
5. [绘制数据分布的散点图和热力图(contourf)](5-.ipynb)
6. [结构化数据的存储及处理的思维训练(理论课)](6-.ipynb)
## 用python实现GIS处理
1. [轨道客流可视化!shapely初探](轨道客流可视化!shapely初探.ipynb)
2. [用道路切分地块!shapely的线转面处理!](用道路切分地块!shapely的线转面处理!.ipynb)
3. [利用osmnx与plot_map计算并可视化街道方向_by_YuanLianggg](16-利用osmnx与plot_map计算并可视化街道方向.ipynb)
## 爬虫
1. [爬虫爬API抓取行政区划(urllib)](7-.ipynb)
2. [抓抓抓包!用百度迁徙数据计算人口恢复率](8-.ipynb)
3. [抓微博!微博评论关系可视化(微博api)](抓微博!微博评论关系可视化.ipynb)
## 可视化
1. [基于folium的可交互地图可视化(folium)](9-.ipynb)
2. [基于pyecharts的可交互可视化(pyecharts)](10-.ipynb)
3. [利用pandana可视化城市设施的可达性_by_fff2zrx](15-.ipynb)
4. [好看又高大上的可视化pydeck入门](pydeck-getstart.ipynb)
## 项目
1. [实战项目:怎么当一个优秀的出租车手-1](11-1.ipynb)
2. [实战项目:怎么当一个优秀的出租车手-2](11-2.ipynb)
## 学术课
1. [主成分分析PCA的原理、实现、缺陷及改进](12-.ipynb)
2. [谱聚类的原理及实现](13-.ipynb)
3. [基于自表达性的深度子空间聚类](14-.ipynb)
4. [社区发现!Fast unfolding算法分析出租车社区](Fastunfolding.ipynb)
# 教程说明
大数据时代到来,随着数据的逐步开放,数据工作者们或多或少都要接触到时空数据。
>小旭学长曾经说:The data is data since it's data.
是的!数据处理是一门艺术!在处理时空数据的时候,你不仅要数据处理,还需要会GIS,最重要的它是一门艺术,要用你的审美,要出很好看的可视化图!
以前,我要用sql数据库处理数据,导出到excel画图表,再导出到arcgis出图,一套流程下来得开好几个软件,工作效率极低。
>上次老师跟我说:小旭啊,我们这个项目你给我出800张图吧,我这周五就要。这个其实画出来也没什么用,主要是想放我们项目文本的附录里显示我们的工作量
我当场把桌子掀起来,画你妹!老子这博不读了
不,以上是做梦,现实情况是: 我微笑着说,好的老师,我通宵画
现在,python出现了,有了python里面的pandas,geopandas,matplotlib包,只需要用python就能实现数据的批量计算,批量出gis图等等。
哇!太棒了!简直是读研、读博、设计院画图、数据分析、闲着没事、居家旅行时候都必须会的技能,别说800张图了,电脑空间有多少我就能生成多少图,包您满意
通过本教程,你将从头开始,会学到一些时空数据的处理技巧,用python进行数据清洗,数据集计,数据整合,可视化!教程的后半段介绍了几个常用的python可视化包,最后是实战项目
本教程的可视化效果图展示
<img src="resource/map-example.png" style="width:600px">
<img src="resource/heatmap-example.png" style="width:600px">
<img src="resource/metro-example.png" style="width:600px">
<img src="resource/boxplot-example.png" style="width:600px">
<img src="resource/lineplot-example.png" style="width:600px">
# 使用数据
本教程的数据来源(公开数据集可直接下载):
[深圳出租车数据](https://www.cs.rutgers.edu/~dz220/data.html)
Urban Data Release V2
Taxi GPS Data Format: 22223,2013-10-22 08:49:25,114.116631,22.582466,0
Taxi ID, Time, Latitude, Longitude, Occupancy Status, Speed; Occupancy Status: 1-with passengers & 0-with passengers;
# 学习本教程需要的基础
在学习本教程之前,强烈建议各位已经掌握了python的最基础的编程语法。如果你还没有掌握,下面建议你完成:
[小甲鱼的python入门视频(看到35P)](https://www.bilibili.com/video/av27789609?from=search&seid=5111701058031824734)
另外,推荐课程:
1. [imooc的Python数据分析-基础技术篇教程](https://www.imooc.com/learn/843)
2. [udacity的数据分析入门课程](https://classroom.udacity.com/courses/ud170/)
3. [coursera的机器学习课程](https://www.coursera.org/learn/machine-learning)
4. [莫烦PYTHON的pytorch动态神经网络课程](https://morvanzhou.github.io/tutorials/machine-learning/torch/)
# 友情链接
[小旭学长的Echarts作品](https://gallery.echartsjs.com/explore.html?u=bd-167860219&type=work#sort=rank~timeframe=all~author=all)
# 贡献者
<h3 class="border-bottom p-2 lh-condensed"><a data-hovercard-type="user" data-hovercard-url="/users/ni1o1/hovercard" href="/ni1o1" class="d-inline-block mr-2 float-left"><img src="https://avatars0.githubusercontent.com/u/53589767?s=60&v=4" class="avatar avatar-user" alt="ni1o1" width="38" height="38"></a><a data-hovercard-type="user" data-hovercard-url="/users/ni1o1/hovercard" class="text-normal" href="https://github.com/ni1o1">ni1o1</a></h3>
<h3 class="border-bottom p-2 lh-condensed"><a data-hovercard-type="user" data-hovercard-url="/users/fff2zrx/hovercard" href="/fff2zrx" class="d-inline-block mr-2 float-left"><img src="https://avatars3.githubusercontent.com/u/49057245?s=60&v=4" class="avatar avatar-user" alt="fff2zrx" width="38" height="38"></a><a data-hovercard-type="user" data-hovercard-url="/users/fff2zrx/hovercard" class="text-normal" href="https://github.com/fff2zrx">fff2zrx</a></h3>
<h3 class="border-bottom p-2 lh-condensed"><a data-hovercard-type="user" data-hovercard-url="/users/YuanLianggg/hovercard" href="/YuanLianggg" class="d-inline-block mr-2 float-left"><img src="https://avatars3.githubusercontent.com/u/67161516?s=60&v=4" class="avatar avatar-user" alt="YuanLianggg" width="38" height="38"></a><a data-hovercard-type="user" data-hovercard-url="/users/YuanLianggg/hovercard" class="text-normal" href="/YuanLianggg">YuanLianggg</a></h3>
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
时空数据分析是一种处理具有时间和空间属性的数据的方法。它在许多领域中都有广泛的应用,包括地理信息系统(GIS)、气象学、交通规划等。Python是一种功能强大的编程语言,提供了丰富的库和工具,可用于分析和处理各种类型的数据,包括时空数据。 在时空数据分析中,我们首先需要导入和读取数据。Python提供了许多库,如pandas和geopandas,可以用于导入和读取各种类型的数据文件。pandas是一种数据处理库,geopandas是在其基础上构建的,专门用于处理地理信息系统(GIS)数据。一旦我们导入了数据,我们可能需要对其进行一些清洗和处理,以便进行进一步的分析。数据清洗可以包括删除缺失值、处理异常值、合并数据集等。Python的pandas库提供了丰富的功能,可以轻松地进行这些操作。数据可视化是时空数据分析的重要环节,它可以帮助我们更好地理解数据并发现潜在的模式和趋势。Python的matplotlib库提供了丰富的绘图功能,可以用于创建各种类型的图表和地图。通过可视化数据,我们可以更直观地呈现数据的时空分布和变化。时空数据分析涉及对时间和空间属性进行统计和建模。理解和利用时空数据
资源推荐
资源详情
资源评论
收起资源包目录
用python分析时空数据的教程 (153个子文件)
sz.cpg 5B
metroline2.cpg 5B
grid.cpg 5B
TaxiOD.csv 33.37MB
busline.csv 3.55MB
taxi_od_grid.csv 2.6MB
shanghai_food.csv 2.14MB
taxi-price.csv 1.95MB
shanghai_bus.csv 1.62MB
shanghai_hospital.csv 1.19MB
shanghai_school.csv 930KB
shanghai_hotpot.csv 387KB
幼儿园.csv 332KB
大学.csv 314KB
中学.csv 137KB
小学.csv 131KB
shanghai_Theatr_Cinema.csv 120KB
shanghai_urban.csv 59KB
metrostop2.csv 6KB
metrodata-sample.csv 2KB
shenzhen_osmroad.dbf 6.79MB
grid.dbf 748KB
区县界_area.dbf 11KB
区县界_area.dbf 5KB
sz.dbf 1KB
metroline2.dbf 420B
1_p2vrLlFxdJgGZxCGO5WBmA.gif 65KB
shanghai_net.h5 10.97MB
微博评论关系图.html 158KB
广东疫情地图.html 6KB
5-scatterplot-contourfplot_en.ipynb 5.92MB
8-folium_en.ipynb 5.31MB
16-利用osmnx与plot_map计算并可视化街道方向.ipynb 1.91MB
4-.ipynb 1.9MB
4-taxigps_data_OD_plot_en.ipynb 1.9MB
用道路切分地块!shapely的线转面处理!.ipynb 1.58MB
5-.ipynb 1.55MB
15-.ipynb 1.47MB
3-.ipynb 1.31MB
3-taxigps_data_geo_processing_en.ipynb 1.31MB
11-2.ipynb 1.25MB
12-.ipynb 844KB
2-plot_figures_by_matplotlib_and_seaborn_en.ipynb 676KB
2-.ipynb 675KB
轨道客流可视化!shapely初探.ipynb 608KB
14-.ipynb 537KB
Fastunfolding.ipynb 440KB
17-get_bus_geo_info_manually.ipynb 438KB
8-.ipynb 296KB
13-.ipynb 183KB
11-1.ipynb 80KB
抓微博!微博评论关系可视化.ipynb 78KB
1-taxigps_to_od_en.ipynb 65KB
1-taxigps_to_od.ipynb 64KB
7-.ipynb 53KB
pydeck-getstart.ipynb 23KB
10-.ipynb 22KB
9-.ipynb 15KB
6-structure_en.ipynb 13KB
6-.ipynb 13KB
c75c10385343fbf224b69b11929e698464388f4a.jpeg 70KB
7.jpg 131KB
jwd.jpg 95KB
20150314105633589.jpg 79KB
1.jpg 63KB
zhuabao.jpg 52KB
6.jpg 41KB
LICENSE 1KB
README.md 8KB
README - en.md 5KB
._README - en.md 4KB
._README.md 4KB
pydecktrips.png 1.45MB
deckheatmap.png 1.44MB
pydeckgrids.png 1.41MB
deckHexagonLayer.png 1.21MB
heatmap-example.png 1.09MB
map-example.png 1.03MB
yiqing.png 604KB
zhuabao1.png 532KB
pydeckgrid.png 493KB
metro-example.png 378KB
pydeckgrid2.png 292KB
地图2.png 277KB
1_MmMK1SlBqzdwgCg8U-v7mQ.png 274KB
zhuabao6.png 272KB
weibo3.png 253KB
地图v1.png 236KB
广东疫情地图.png 224KB
6_en.png 212KB
weibo4.png 211KB
lineplot-example.png 206KB
1_QlGgbOK9_3W1LnuJKibbOg.png 180KB
zhuabao4.png 173KB
社区发现2.png 154KB
grid_en.png 152KB
grid.png 146KB
1_1JgMfAGmIYbeInlT5LCxLQ.png 137KB
boxplot-example.png 135KB
weibo2.png 113KB
共 153 条
- 1
- 2
资源评论
传奇开心果编程
- 粉丝: 8099
- 资源: 335
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- ### 1、项目介绍 本项目Scrapy进行数据爬取,并使用Django框架+PyEcharts实现可视化大屏 效果如下:
- # 微信小程序-健康菜谱 基于微信小程序的一个查找检索菜谱的应用 ### 效果 !动态图(./res/gif/demo
- zabbix-get命令包资源
- 毕业设计,基于PyQt5实现的可视化界面的Python车牌自动识别系统源码
- 26-朴素贝叶斯分类.rar
- 没有安Matlab 也可以 生成FIR抽头系数工具.py
- python烟花代码.rar
- 实验目的: 1.构建基于verilog语言的组合逻辑电路和时序逻辑电路; 2.掌握verilog语言的电路设计技巧 3.完成如
- 扩展卡尔曼滤波matlab仿真
- 3_base.apk.1
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功