没有合适的资源?快使用搜索试试~ 我知道了~
基于spark框架的滴滴出行大数据分析平台设计与实现.doc
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 166 浏览量
2024-11-08
12:27:41
上传
评论
收藏 3.82MB DOC 举报
温馨提示
随着共享经济模式被越来越多市民接受,滴滴出行给很多市民提供了方便,不仅低碳环保,而且有利于城市交通,但在不同时段不同区域也存在供需矛盾,给城市管理者智慧管理带来了挑战。本系统旨在应用大数据先进IT技术,分析挖掘出租车运营数据,开发设计一套出行大数据分析系统,为运营管理者提供决策支持,以提升城市管理水平。 本文系统地阐述了整个滴滴出行大数据分析系统的功能及实现。基于Spark分布式大数据计算框架,采用PySpark API进行数据分析, WEB后台开发采用Python Flask WEB开发框架,前端使用EChart JS库对分析结果进行可视化展示,构建了滴滴出行大数据分析系统。
资源推荐
资源详情
资源评论
1
毕业设计(论文)
题 目 :
基于 Spark 框架的滴滴出行大数据分析
平台设计与实现
姓 名 :
学 号 :
所 属 学 院 :
专 业 班 级 :
指 导 :
职 称:
2
摘 要
随着共享经济模式被越来越多市民接受,滴滴出行给很多市民提供了方便,
不仅低碳环保,而且有利于城市交通,但在不同时段不同区域也存在供需矛盾,
给城市管理者智慧管理带来了挑战。本系统旨在应用大数据先进 IT 技术,分析挖
掘出租车运营数据,开发设计一套出行大数据分析系统,为运营管理者提供决策
支持,以提升城市管理水平。
本文系统地阐述了整个滴滴出行大数据分析系统的功能及实现。基于 Spark 分
布式大数据计算框架,采用 PySpark API 进行数据分析, WEB 后台开发采用 Python
Flask WEB 开发框架,前端使用 EChart JS 库对分析结果进行可视化展示,构建了滴
滴出行大数据分析系统。
关键词:Spark, 分布式, 大数据分析, 出租车
引言
随着移动网络和通讯技术的发展和广泛应用,可以使用这些技术获取出租车
运营过程中产生的 GPS 数据。一方面,从这些数据中挖掘和分析乘客的出行特征,
可以为城市交通管理者和出租车行业管理者在城市交通规划与管理、城市交通流
均衡与车辆调度等方面提供决策依据;另一方面,随着数据量的不断增长,研究如
何快速处理和分析这些海量出租车 GPS 数据也是当前大数据研究中的热点问题。
大数据是近几年广受关注的研究领域,已经提出了多种大数据处理平台框架,其中,
Spark 大数据框架最为流行。Spark 具有处理效率高,成本低,数据后期处理工作简
单等特点,相较 Hadoop 平台处理框架克服了 MapReduce 延迟高、运行时间长等缺
点。因此,本文将 Spark 大数据并行计算框架用于滴滴出租车出行数据的分析挖掘,
从中提取和分析出租车乘客的出行特征。
Abstract
As the sharing economy model is accepted by more and more citizens, Didi
Chuxing has provided convenience to many citizens. It is not only low-carbon and
environmentally friendly, but also conducive to urban transportation. However, there
are also supply-demand contradictions in different regions at different times, giving
city managers wisdom. Management poses challenges. This system aims to apply big
data advanced IT technology, analyze and mine taxi operation data, develop and
design a travel big data analysis system, and provide decision support for operation
managers to improve the level of urban management.
This paper systematically expounds the functions and implementation of the
entire Didi Chuxing big data analysis system. Based on the Spark distributed big data
computing framework, the PySpark API is used for data analysis, the WEB background
development uses the Python Flask WEB development framework, and the front end
uses the EChart JS library to visualize the analysis results, and the Didi Chuxing big
data analysis system is built.
Keywords: Spark, Distributed, Big Data Analysis, Taxi
I
目 录
目 录 ..........................................................................................................................................I
第 1 章 绪论 .........................................................................................................................1
1.1 研究背景及意义 ..................................................................................................1
1.2 国内外研究现状 ..................................................................................................2
1.3 研究内容................................................................................................................2
1.4 论文组织结构.......................................................................................................3
第 2 章 系统总体分析.......................................................................................................4
2.1 系统可行性分析........................................................................................................4
2.2 总体需求分析.............................................................................................................4
2.3 分布式存储 .................................................................................................................5
2.4 分布式计算 .................................................................................................................7
第 3 章 数据库详细设计 ..................................................................................................9
3.1 数据库设计规范........................................................................................................9
3.2 数据库表设计.............................................................................................................9
第 4 章 系统实现..............................................................................................................12
4.1 用户登录及注册.......................................................................................................12
4.2 出行轨迹可视化.......................................................................................................13
4.3 出租车上车点热力图..............................................................................................14
4.4 出租车下车点热力图..............................................................................................15
4.5 出租车行程数量分析..............................................................................................16
4.6 OD 分析......................................................................................................................17
剩余31页未读,继续阅读
资源评论
源码空间站11
- 粉丝: 4402
- 资源: 620
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功