没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论
I
摘要
随着社会的不断发展,互联网数据时代的到来,数据的背后是什么,数据有什么用,
怎么用庞大的数据来呈现出数据的价值,让我们一起去揭开它神秘的面纱。
本次以外卖配送分析及可视化系统爬取为例,介绍网络爬虫的基本原理,Python 环
境的搭建,PyCharm scrapy 模块的爬虫数据的运用,把获取到的数据进行清洗、整合,
储存数据到 MySQL,然后进行数据可视化的呈现,简单对呈现的图进行数据分析。
关 键 词:Python;MySQL;PyCharm;爬虫;数据分析;数据呈现。
Abstract
With the continuous development of society and the arrival of the Internet data age, what
is behind data, what is its purpose, and how to use massive data to present its value, let's
uncover its mysterious veil together.
This time, taking the ocean hydrological data feature analysis and prediction system
crawling as an example, it introduces the basic principles of web crawler, the building of
Python environment, the use of crawler data in the PyCharm sketch module, cleaning and
integrating the acquired data, storing the data to MySQL, and then presenting data
visualization to simply analyze the data presented.
Keywords: Python; MySQL; PyCharm; Reptiles; Data analysis; Data presentation.
目录
摘要 .....................................................................I
Abstrac .................................................................II
1 绪论.........................................................................................................................................1
1.1 背景及意义 ......................................................................................................................2
II
1.1.1 背景............................................................................................................................3
1.1.2 目标及意义................................................................................................................3
1.2 应用现状 ..........................................................................................................................4
1.3 主要板块 ..........................................................................................................................4
1.4 主要方法及技术路线 ......................................................................................................5
1.4.1 主要方法....................................................................................................................5
1.4.2 技术路线....................................................................................................................6
1.4.3 实现途径.....................................................................................................................7
2 开发环境及技术......................................................................................................................8
2.1 软件硬件设备 ..................................................................................................................8
2.1.1 其他............................................................................................................................9
2.2 开发环境与工具 ............................................................................................................10
2.2.1 Python 简介 ..............................................................................................................10
2.2.2 爬虫简介..................................................................................................................11
2.2.3 Django 框架简介.....................................................................................................12
2.2.4 MySqL 数据库 .........................................................................................................13
2.2.5 hadoop 简介..............................................................................................................14
2.2.6 hive 简介...................................................................................................................14
3 可行性分析与模块设计.......................................................................................................15
3.1 可行性分析 ....................................................................................................................15
3.1.1 技术可行性分析......................................................................................................16
3.1.2 数据可获得性分析..................................................................................................17
III
3.2 各功能模块设计 ............................................................................................................18
3.2.1 数据获取方法..........................................................................................................19
3.2.2 数据预处理设计......................................................................................................20
5 系统设计...............................................................................................................................22
4.1 系统功能结构图.............................................................................................................21
4.2 系统数据库设计.................................................................................................................21
4.2.1 数据库 E-R 图 ..........................................................................................................21
4.3 数据库表结构..............................................................................................................21
5 系统实现与结论...................................................................................................................22
5.1 用户功能的实现............................................................................................................22
5.2 管理员功能的实现 .........................................................................................................23
5.3 数据可视化分析看板展示.............................................................................................25
5.4 结论................................................................................................................................26
6 总结........................................................................................................................................29
致 谢 .....................................................................................................................................30
参考文献 31
4
1 绪论
1.1 背景及意义
1.1.1 背景
大数据浪潮,汹涌来袭,与互联网的发明一样,这绝不仅仅是信息技术领域的革命,
更是在全球范围内启动透明外卖配送分析及可视化、加速外卖配送分析及可视化的大数据
创新、引领社会变革的利器。现代管理学之父德鲁克曾经说过:“预测未来最好的方法,
就是去创造未来”。而“大数据战略”,则是当下领航全球的先机。而在过去的数年中,
信息技术在社会、经济、生活等各个领域不断渗透和推陈出新。在移动计算、物联网、云
计算等一系列新兴技术的支持下,社交媒体、众包、虚拟服务等新型应用模式持续拓展着
人类创造和利用信息的范围和形式。当今信息技术的发展及创新正使各个产业发生改变,
在信息爆炸时代产生了海量数据。然而数据背后所隐藏的巨大商业价值正开始被越来越多
的人所重视,那么数据从何而来?
人工缓慢搜集数据,从人力物力上来说都不可行。购买数据是一 个办法,但是目前公
开交易的数据少之又少,很难与多样化的数据需求匹配。因此,对用户来说,如果想获取
全面、有效、 准确的数据, 编写爬虫抓取数据是一种明智之选。
1.1.2 课题研究的意义
目前,与传统数据相比,大数据具有数据量大、种类多、成本低的特点。大数据的意
义不仅局限于互联网产业的发展,而且对数字信息时代的发展起着重要的作用。从而带动
了计算机的发展,在繁忙的时代,紧张的生活节奏中,无疑需要引进先进的信息管理技术,
那么在信息化潮流下,卖配送分析及可视化系统应运而生,肩负起历史时期的使命。
大量复杂的广州美食等信息难于通过传统的方法进行管理;对于管理者来说,繁琐的
信息使他们感到迷茫。外卖配送分析及可视化分析可视化设计与实现正是针对上述的问题
而开发的,通过计算机系统来管理数据信息,可以解决大量信息的查询和相关管理,同时
也为管理者或用户提供便利。这样,使原本独立的外卖配送分析及可视化等信息资料流程
化。
外卖配送分析及可视化实质上就是一个管理信息系统,目前管理信息系统鱼龙混杂,
相关管理工作并不能真正的实现一体化,为了更好的为用户着想,想他们之所需,实现日
常管理工作的整套流程,达到办公的一体化,提高他们的工作效率,这正是我们要做这项
工作的意义所在。
5
1.2 应用现状
近些年,随着越来越多的用户对外卖配送分析及可视化数据价值的认识不断提升,于
是相比于国内,国外的大数据分析系统建设比较早,在早些年就已经很先进,但受其它的
经济危机影响,导致部分国家发展缓慢,但也有些发达国家走群众路线,全面发展大数据
技术。
在国内,线下管理系统已经特别完善,它基于计算机技术,让系统具有信息化、科学
化、自动化等特性。在计算机的辅助下,国内该类系统可提高信息的复用率,对数据的处
理、备份等方面也有了显著的效率提升,这种有效的工作可使用户能更快的做好决定,也
实现了“无纸化”的信息爬取方式。由于其功能特别完善,也导致系统比较庞大,所以在
了解该类系统的功能、操作后,决定开发一款基于 Hadoop 外卖配送分析及可视化系统,它
的功能小,但是操作简单、快速、准确的特点,也体现了设计它的意义。
1.3 主要板块
(1)数据获取板块
数据获取板块功能主要是依据分析目的及要达到的目标,确定获取的数据种类,并使
用直接获取数据文件方式或爬虫方式获取原始数据。
(2)数据预处理板块
数据预处理板块功能是对获取到的数据进行预处理操作:将重复的字段筛选,将过短
并且没有实际意义的数据进行过滤,选择重要字段,标准化处理,异常值处理等预处理操
作。
(3)数据存储板块
数据存储板块主要功能是把经过预处理的数据持久化存储,以便于后续分析。
(4)数据分析板块
数据分析板块主要功能是根据分析目标,找出数据中字段之间的内在关系,与规律。
(5)数据可视化板块
数据可视化板块主要功能是使用适当的图标展现方式,把数据的内在关系、规律展现
出来。
1.4 主要方法及技术路线
1.4.1 主要方法
(1)数据获取;本文中数据的获取方式是直接获取外卖配送分析及可视化分析。
剩余28页未读,继续阅读
资源评论
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 10 kV和35 kV配电网系统的间歇性电弧接地过电压
- 直流无刷电机,外径41mm,径向长23.39mm,转速6000rpm,功率200W,气息长度预留1mm,槽满率67.5%,效率80.7%,最大输出功率320W
- 基于BP神经网络的多个输出数据的回归预测 matlab代码
- 基于高斯过程回归(GPR)的时间序列区间预测
- APA水平泊车算法,matlab和C++联合仿真,内含道路地图生成仿真算法,路径跟踪算法,车辆横向纵向控制算法,倒车路径规划算法,数据处理分析 车辆定位:通过车载传感器获取车辆当前位置和方向 目标
- 适用方向:基于LQR控制算法的直接横摆力矩控制(DYC)的四轮独立电驱动汽车的横向稳定性控制研究 主要内容:利用carsim建模,在simulink中搭建控制器,然后进行联合 实现汽车在高速低附着路
- 大厂FPGA APB verilog源代码,企业级应用源码,适合需要学习ic设计验证及soc开发的工程师 提供databook资料和verilog完整源代码 代码架构清晰、规范,便于阅读理解,可直接
- 特征值、左右特征向量计算,参与因子分析MATLAB代码
- maxwell电机电磁仿真 绕线式感应电机设计,串电阻启动等 电机仿真
- 自动紧急避撞系统(AEB),Carsim与simulink联合仿真; 车辆逆动力学模型; 制动安全距离计算; 定加速度; 可实现前车减速,前车静止,前车匀速纵向避撞;
- 改进A星算法 剔除冗余节点,光滑转折点 对比优化前后路径
- 无位置传感器无刷直流电机,一篇Sci的复现,采用反相电动势观测器的方法进行无位置传感器控制,反相电动势观测值和电机实际输出值很好吻合
- 电动叉车系统设计,重量检测,电机控制 电动随车叉车控制系统设计 程序,仿真,有演示视频 1、电机1-4模拟叉车车轮,四个按键,控制叉车前进、后 、左转、右转 2、电机5、6模拟叉车前叉、后叉;上叉、
- 基于fpga的native接口的DDR3的多功能读写测试 支持单字节读写测试 支持多字节读写测试 支持自动读写测试 带仿真文件,同时上板验证过 可用于学习
- 改进蚁群算法+动态窗口算法全局结合局部路径规划仿真 静态路径规划算法 采用改进蚁群算法,有单独对比代码 动态实时规划 采用动态窗口算法避开未知障碍物 可自行设置地图 未知静态障碍物 移动障碍物
- 并联混合动力电动汽车模型
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功