没有合适的资源?快使用搜索试试~ 我知道了~
课程实验二:大数据离线分析实验1
试读
119页
需积分: 0 11 下载量 116 浏览量
更新于2022-08-03
收藏 5.82MB PDF 举报
【课程实验二:大数据离线分析实验1】是华为技术有限公司设计的一个教学实践项目,旨在让学生深入了解和掌握大数据离线处理的技术与应用。这个实验涵盖了从环境搭建到数据分析的完整流程,通过华为云的多种服务进行操作。
1. **实验介绍**
- 该实验的目的是让学生熟悉大数据离线分析的场景,理解大数据处理的关键环节,以及如何在云端进行这样的工作。
- 实验不仅涉及理论知识,更注重实践操作,帮助学生将理论与实际相结合,提高动手能力。
2. **华为云资源开通**
- **MRS集群**(MapReduce Service)是华为云提供的大数据处理平台,支持Hadoop、Hive、Spark等组件,用于离线数据处理。开通MRS集群是实验的第一步,学生需要在华为云控制台上创建并配置集群,包括选择合适的硬件配置、安装所需的软件服务等。
- **RDS**(Relational Database Service)是华为云的云数据库服务,提供MySQL、SQL Server等多种关系型数据库。在大数据分析中,RDS常用于存储和管理结构化数据,实验中可能需要配置RDS来存储分析结果或作为数据源。
- **OBS**(Object Storage Service)是华为云的对象存储服务,提供大规模、低成本、安全可靠的数据存储。在大数据场景下,OBS可以用来存储大量的原始数据或者处理后的文件,实验中学生需要开通OBS服务来上传下载实验数据。
3. **大数据离线分析开发**
- 实验流程包括数据获取、预处理、分析和结果展示等步骤,学生将学习如何使用Hadoop MapReduce、Spark等工具处理大规模数据。
- 实验数据解释环节,学生需要理解所使用的数据集的结构、含义,以及为何选择特定的数据进行分析,这有助于他们更好地进行数据清洗和特征工程。
- 实验目的不仅在于掌握技术,还在于提升问题解决和决策制定的能力,通过实际操作,学生能够理解大数据在业务中的价值,以及如何利用大数据进行有效的业务洞察。
整个实验设计覆盖了大数据生命周期的关键环节,从数据的获取、存储、处理到结果的解读,涵盖了大数据技术栈中的多个组件。通过这样的实验,学生可以全面地了解和掌握大数据离线分析的流程,为未来在大数据领域的工作或研究打下坚实的基础。
大数据离线分析实验
华为技术有限公司
大数据离线分析实验手册
第1页
目录
1 离线分析实验环境搭建 ..................................................................................................... 4
1.1 实验介绍 ...................................................................................................................................................... 4
1.2 华为云资源开通 ........................................................................................................................................... 4
1.2.1 开通 MRS 集群 ......................................................................................................................................... 4
1.2.2 开通并配置 RDS .................................................................................................................................... 13
1.2.3 开通 OBS 服务 ....................................................................................................................................... 18
2 大数据离线分析开发 ....................................................................................................... 21
2.1 实验介绍 .................................................................................................................................................... 21
2.1.1 关于本实验 ............................................................................................................................................. 21
2.1.2 实验目的 ................................................................................................................................................. 21
2.1.3 实验规划 ................................................................................................................................................. 21
2.2 实验流程 .................................................................................................................................................... 21
2.3 实验数据解释 ............................................................................................................................................ 22
2.3.1 事件日志数据基本格式 ........................................................................................................................... 22
2.3.2 商品点击 ................................................................................................................................................. 23
2.3.3 商品详情 ................................................................................................................................................. 24
2.3.4 商品收藏 ................................................................................................................................................. 25
2.3.5 商品评论 ................................................................................................................................................. 25
2.3.6 启动日志数据基本格式 ........................................................................................................................... 26
2.3.7 启动事件 ................................................................................................................................................. 27
2.3.8 数据库表及字段解释............................................................................................................................... 27
2.4 业务逻辑 .................................................................................................................................................... 29
2.5 实验步骤 .................................................................................................................................................... 29
2.5.1 实验步骤概览 ......................................................................................................................................... 29
2.5.2 数据准备 ................................................................................................................................................. 29
2.5.3 日志数据分层统计 .................................................................................................................................. 37
2.5.4 业务数据库数据分层统计 ....................................................................................................................... 65
大数据离线分析实验手册
第2页
2.5.5 业务宽表 ................................................................................................................................................. 81
2.5.6 ADS 层结果统计 ..................................................................................................................................... 83
2.5.7 数仓结果数据导出到关系型数据库 ......................................................................................................... 87
2.5.8 可视化 .................................................................................................................................................... 92
2.6 思考题 ....................................................................................................................................................... 95
3 云服务资源释放 .............................................................................................................. 96
3.1 释放大数据服务 MRS ................................................................................................................................ 96
3.2 释放云数据库 RDS .................................................................................................................................... 96
3.3 释放对象存储服务 OBS ............................................................................................................................. 96
3.4 释放网络资源 VPC .................................................................................................................................... 97
4 附录 ................................................................................................................................ 99
4.1 弹性服务器如何绑定弹性 IP ...................................................................................................................... 99
4.2 如何查看 Zookeepr 的 IP? ...................................................................................................................... 100
4.3 如何查看 Kafka 实例 Broker 的 IP? ........................................................................................................ 102
4.4 如何查看服务所在区域的 region 值? .................................................................................................... 103
4.5 常用 Linux 命令 ....................................................................................................................................... 105
4.5.1 命令概述 ............................................................................................................................................... 105
4.5.2 vi/vim ..................................................................................................................................................... 105
4.5.3 cd .......................................................................................................................................................... 105
4.5.4 mv ......................................................................................................................................................... 106
4.5.5 curl ........................................................................................................................................................ 107
4.5.6 yum ....................................................................................................................................................... 108
4.5.7 wget ...................................................................................................................................................... 108
4.5.8 ln ........................................................................................................................................................... 109
4.5.9 mkdir ..................................................................................................................................................... 110
4.5.10 chmod ................................................................................................................................................. 110
4.5.11 chown ................................................................................................................................................. 111
4.5.12 ls ......................................................................................................................................................... 112
4.5.13 cp ........................................................................................................................................................ 113
4.5.14 rm ........................................................................................................................................................ 113
4.5.15 cat ....................................................................................................................................................... 114
4.5.16 unzip ................................................................................................................................................... 115
4.5.17 source ................................................................................................................................................. 116
4.5.18 more .................................................................................................................................................... 116
4.5.19 tar ........................................................................................................................................................ 117
4.6 实验 FAQ ................................................................................................................................................. 118
大数据离线分析实验手册
第3页
大数据离线分析实验手册
第4页
1 离线分析实验环境搭建
1.1 实验介绍
本次实验讲述如何安装离线实验所需环境实验。
1.2 华为云资源开通
1.2.1 开通 MRS 集群
步骤 1 购买 MRS 服务。
打开华为云官网 www.huaweicloud.com,点击登录链接完成登录。
剩余118页未读,继续阅读
资源推荐
资源评论
5星 · 资源好评率100%
2022-07-07 上传
5星 · 资源好评率100%
2022-05-12 上传
139 浏览量
188 浏览量
178 浏览量
2021-09-05 上传
2022-11-27 上传
146 浏览量
2021-10-17 上传
2021-08-07 上传
102 浏览量
140 浏览量
2021-08-07 上传
2021-10-12 上传
132 浏览量
2022-03-01 上传
2024-02-02 上传
161 浏览量
2021-05-02 上传
154 浏览量
5星 · 资源好评率100%
134 浏览量
5星 · 资源好评率100%
121 浏览量
5星 · 资源好评率100%
112 浏览量
2023-07-27 上传
资源评论
赶路的稻草人
- 粉丝: 32
- 资源: 330
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功