《大数据内存分析与计算》课程设计报告
设计题目: 基于 S park 的 零售交易数据分析
专 业: 数据科学与大数据技术
指导教师: ***********
学 号: ***********
姓 名: ***********
同组人员: ***********
《大数据内存分析与计算》课程设计报告 目录
目录
1 设计目的.........................................................................................................................................1
1.1 设计背景..............................................................................................................................1
1.2 设计意义..............................................................................................................................1
2 系统分析.........................................................................................................................................2
2.1环境介绍...............................................................................................................................2
2.1.1软件环境....................................................................................................................2
2.1.2硬件环境....................................................................................................................2
2.1.3系统设计原则............................................................................................................2
2.2框架介绍及工作过程...........................................................................................................2
3 概要设计.........................................................................................................................................3
3.1 概要描述..............................................................................................................................3
3.2 概要设计分析......................................................................................................................3
4 详细设计.........................................................................................................................................5
4.1 数据预处理..........................................................................................................................5
4.2 数据分析..............................................................................................................................7
4.2.1 数据导入...................................................................................................................7
4.2.2 数据分析...................................................................................................................7
4.3 可视化方法........................................................................................................................15
4.3.1 可视化方法设计......................................................................................................15
4.3.2 可视化结果展示......................................................................................................16
总结..................................................................................................................................................22
参考文献..........................................................................................................................................23
《大数据内存分析与计算》课程设计报告 第一章 设计目的
设计目的
设计背景
许多企业的生产活动都会产生大量的数据,而对这些数据的深层次挖掘所产生
的数据分析报告,对企业的运营及策略调整至关重要。
在零售业中,连锁公司竞争的实质是管理的竞争。其管理的一个核心目标就是
有目的、高效率的收集、处理、使用各种信息。而信息是建立在数据的基础上的,
也就是说,对管理的对象进行量化处理。数据是对生产的直接记录而信息则是在
数据的基础上人为的反馈及判断,企业策略决策的依据。本次课程设计对一些零售
数据进行了预处理和分析。
设计意义
在本次课程设计中,我们选取了共条数据,对数据进行了预处理,然
后分别从多个方面对数据进行了分类和分析,希望可以通过分析发现一些对零售行
业的概览,并挖掘一些数据之间的关系,在后期对零售的销售模式及销售量,销售
地区等进行调整,让零售业可以更进一步。
1
《大数据内存分析与计算》课程设计报告 第二章 系统分析
系统分析
环境介绍
软件环境
本次作业使用的环境和软件如下:
()操作系统:
():
():
():
():
硬件环境
高性能的电子计算机、大容量的存贮装置,个人电脑(终端)以及联结起来的
网线等,组成信息资源共享的计算机网络等等。
系统设计原则
!系统运行安全可靠,稳定性好;
!系统的可管理性和可维护性好;
!系统展示界面友好美观,操作简便易行,尽量直观的展示数据;
)数据具有规范性,整体性,方便数据之间的比较分析;
框架介绍及工作过程
是一个快速、简洁、轻量级的基于"#的微型$框架,此框架除了
的标准库外,不依赖任何其他模块。安装方法是,打开%&终端,执行如
下命令:
'(
'$
至此,环境搭建过程结束。
2
《大数据内存分析与计算》课程设计报告 第三章 概要分析
概要设计
概要描述
本次课程设计选取的是)**上的一个跨国在线零售业务的交易数据集。旨
在对数据集中的数据进行预处理,并从多个角度对数据进行分析,最后对数据进行
可视化展示。
概要设计分析
本次设计分为三大部分:数据预处理,数据分析和可视化展示。
数据预处理中对数据进行空值的去除已经错误值的纠改。
数据分析从概览和关系两个方面展开:
概览中包含:()客户数最多的十个国家,()销量最高的个国家,
()各个国家的总销售额分布情况,()销量最高的个商品,()商品描
述的热门关键词+,( )退货订单数最多的个国家
关系中包含:()月销售额随时间的变化趋势,()日销量随时间的变化
趋势,()各国的购买订单量和退货订单量的关系,()商品的平均单价与销
量的关系。
可视化展示对数据分析的每个模块只做了对应的可视化图表进行展示。
3
- 1
- 2
- 3
- 4
- 5
- 6
前往页