#### 《大数据技术基础》结课作业
## 基于Spark对全国历史气象数据的分析
- **获取气象数据**
- 从[www.data.gov](http://www.data.gov/)下载气象数据
- 数据集整合了来自大约30个不同数据源的每日气候观测。包含了全球90,000多个陆基台站的台站测量数据,从中只取出中国站点的数据。
- ![image-20200817203416072](charts/data_info.png)
- **用****PySpark****处理数据**
- **将所有文件读为一个****RDD** rdd = sc.wholeTextFiles("file:///" + os.getcwd() + "/china/")
- **数据清洗 ** 去除字母, -9999等无效数据
- **进行计算、排序等操作** 计算出最大值,最小值,平均值,并按照年份排序。最终得出各个站点以及全国每年的主要气象数据的统计结果。
- **将结果存入数据库中** 得出的结果和stations.txt文件中站点的主要信息分别存入MySQL数据库中。
- 数据可视化
主要运用了Python的第三方库matplotlib和pyecharts
![](charts/全国历年气温变化曲线.png)
![](charts/全国2018年各气象站降水量分布图(单位_mm).png)
<h4 align="center">Thanks</h4>
``` python3
MySQL数据库的地址改为本机loaclhost或者127.0.0.1,密码为自己的密码
```
没有合适的资源?快使用搜索试试~ 我知道了~
基于Spark对全国历史气象数据的分析文档+源码+优秀项目+全部资料.zip
共63个文件
md:35个
txt:8个
png:7个
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 56 浏览量
2024-12-17
12:38:09
上传
评论
收藏 2.46MB ZIP 举报
温馨提示
【资源说明】 基于Spark对全国历史气象数据的分析文档+源码+优秀项目+全部资料.zip 【备注】 1、该项目是个人高分项目源码,已获导师指导认可通过,答辩评审分达到95分 2、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 3、本项目适合计算机相关专业(人工智能、通信工程、自动化、电子信息、物联网等)的在校学生、老师或者企业员工下载使用,也可作为毕业设计、课程设计、作业、项目初期立项演示等,当然也适合小白学习进阶。 4、如果基础还行,可以在此代码基础上进行修改,以实现其他功能,也可直接用于毕设、课设、作业等。 欢迎下载,沟通交流,互相学习,共同进步!
资源推荐
资源详情
资源评论
收起资源包目录
基于Spark对全国历史气象数据的分析文档+源码+优秀项目+全部资料.zip (63个子文件)
CSDN
软件
项目授权码.txt 268B
BigData-Spark-master
答辩.pdf 1.64MB
data
china_stations.txt 19KB
readme.txt 31B
.history
README_20200518070517.md 76B
README_20200518070957.md 84B
README_20200518073517.md 107B
README_20200518070510.md 66B
README_20200518070949.md 77B
README_20200518070417.md 32B
README_20200518070457.md 33B
README_20200518070522.md 83B
README_20200518071009.md 86B
README_20200518072849.md 102B
README_20200518073947.md 104B
README_20200518074657.md 110B
README_20200518074700.md 116B
README_20200518070955.md 79B
README_20200518073538.md 102B
README_20200518070507.md 54B
README_20200518073539.md 102B
README_20200518070520.md 82B
README_20200518070459.md 36B
README_20200518074705.md 134B
README_20200518074701.md 119B
README_20200518070523.md 83B
README_20200518073949.md 107B
README_20200518070515.md 75B
README_20200518071001.md 83B
README_20200518070503.md 48B
README_20200518071003.md 86B
README_20200518070509.md 60B
README_20200518072126.md 101B
README_20200518070953.md 78B
code
readme_20200518070417.txt 30B
readme_20200518071204.txt 32B
readme_20200518071207.txt 32B
readme_20200518071146.txt 30B
README_20200518070450.md 33B
README_20200518072125.md 101B
README_20200518072121.md 95B
.idea
vcs.xml 180B
misc.xml 288B
BigData.iml 284B
inspectionProfiles
Project_Default.xml 3KB
profiles_settings.xml 174B
modules.xml 266B
.gitignore 176B
charts
全国2018年各气象站最高气温分布图(单位_℃).png 189KB
全国2018年各气象站最低气温分布图(单位_℃).png 190KB
data_info.png 359KB
全国2018年各气象站降水量分布图(单位_mm).png 204KB
全国历年气温变化曲线.png 87KB
全国历年平均降水量变化曲线.png 77KB
全国2018年各气象站平均气温分布图(单位_℃).png 198KB
README.md 19B
README.md 1KB
code
show.py 3KB
show_map.py 6KB
stations_to_mysql.py 1KB
year_all_stations.py 4KB
year_china.py 5KB
readme.txt 32B
共 63 条
- 1
资源评论
Yuki-^_^
- 粉丝: 3100
- 资源: 1817
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 第七章:循环控制语句 包含循环写星星 循环写乘法表 循环累加计算
- 图神经网络进行视频字幕的动作知识
- BLE蓝牙单片机CC2540、CC2541带OSAL操作系统的例程-蓝牙从机广播功率配置修改.zip
- BLE蓝牙单片机CC2540、CC2541带OSAL操作系统的例程-看门狗WachDog例程.zip
- chapter7-Pandas数据分析实战.zip
- Python电影票售票系统
- BLE蓝牙单片机CC2540、CC2541带OSAL操作系统的例程-封装蓝牙模块AT指令.zip
- BLE蓝牙单片机CC2540、CC2541带OSAL操作系统的例程-对蓝牙传输的数据进行加密、解密传输.zip
- BLE蓝牙单片机CC2540、CC2541带OSAL操作系统的例程-串口双工收发.zip
- BLE蓝牙单片机CC2540、CC2541带OSAL操作系统的例程-按键操作.zip
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功