没有合适的资源？快使用搜索试试~ 我知道了~

文库首页大数据Hive【大数据应用开发】2023年全国职业院校技能大赛赛题第05套

【大数据应用开发】2023年全国职业院校技能大赛赛题第05套

技能竞赛

Hive

0 下载量 168 浏览量 2024-10-08 09:41:16 上传评论收藏 43KB DOCX 举报

温馨提示

试读

19页

【大数据应用开发】2023年全国职业院校技能大赛赛题第05套

资源推荐

资源详情

资源评论

2023 年全国职业院校技能大赛

赛题第 05 套

赛项名称：大数据应用开发

英文名称： Big Data Application Development

赛项组别：高等职业教育组

赛项编号： GZ033

背景描述

工业互联网是工业全要素、全产业链、全价值链的全面连接，是

人、机、物、工厂互联互通的新型工业生产制造服务体系，是互联网

从消费领域向生产领域、从虚拟经济向实体经济拓展的核心载体，是

建设现代化经济体系、实现高质量发展和塑造全球产业竞争力的关键

支撑，工业大数据则是工业互联网实现工业要素互联之后的核心价值

创造者｡随着大数据行业的发展,工业数据收集呈现时间维度不断延

长、数据范围不断扩大、数据粒度不断细化的趋势｡以上三个维度的

变化使得企业所积累的数据量以加速度的方式在增加,最终构成了工

业大数据的集合｡

为完成工业大数据分析工作，你所在的小组将应用大数据技术，

以 Scala 作为整个项目的基础开发语言，基于大数据平台综合利用 H

ive、Spark、Flink、Vue.js 等技术，对数据进行处理、分析及可视

化呈现，你们作为该小组的技术人员，请按照下面任务完成本次工作。

任务 A：大数据平台搭建（容器环境）（15 分）

环境说明：

服务端登录地址详见各任务服务端说明。

补充说明：宿主机及各容器节点可通过 Asbru 工具或 SSH 客户端进

行 SSH 访问。

子任务一：Hadoop 完全分布式安装配置

本任务需要使用 root 用户完成相关配置，安装 Hadoop 需要配置前置环境。

命令中要求使用绝对路径，具体要求如下:

1、从宿主机 /opt 目录下将文件 hadoop-2.7.7.tar.gz 、

jdk-8u212-linux-x64.tar.gz 复制到容器 master 中的/opt/software 路径

中（若路径不存在，则需新建），将 master 节点 JDK 安装包解压到/opt/module

路径中(若路径不存在，则需新建)，将 JDK 解压命令复制并粘贴至客户端桌

面【Release\任务 A 提交结果.docx】中对应的任务序号下；

2、修改容器中/etc/profile 文件，设置 JDK 环境变量并使其生效，配置完毕后

在 master 节点分别执行“java -version”和“javac”命令，将命令行执

行结果分别截图并粘贴至客户端桌面【Release\任务 A 提交结果.docx】中

对应的任务序号下；

3、请完成 host 相关配置，将三个节点分别命名为 master、slave1、slave2，

并做免密登录，用 scp 命令并使用绝对路径从 master 复制 JDK 解压后的安

装文件到 slave1、slave2 节点（若路径不存在，则需新建），并配置

slave1、slave2 相关环境变量，将全部 scp 复制 JDK 的命令复制并粘贴至客

户端桌面【Release\任务 A 提交结果.docx】中对应的任务序号下；

4、在 master 将 Hadoop 解压到/opt/module(若路径不存在，则需新建)目录下，

并将解压包分发至 slave1、slave2 中，其中 master、slave1、slave2 节点

均作为 datanode，配置好相关环境，初始化 Hadoop 环境 namenode，将初始

化命令及初始化结果截图（截取初始化结果日志最后 20 行即可）粘贴至客

户端桌面【Release\任务 A 提交结果.docx】中对应的任务序号下；

5、启动 Hadoop 集群（包括 hdfs 和 yarn），使用 jps 命令查看 master 节点与

slave1 节点的 Java 进程，将 jps 命令与结果截图粘贴至客户端桌面

【Release\任务 A 提交结果.docx】中对应的任务序号下。

子任务二：Flume 安装配置

本任务需要使用 root 用户完成相关配置，已安装 Hadoop 及需要配置前置环

境，具体要求如下：

1、从宿主机/opt 目录下将文件 apache-flume-1.7.0-bin.tar.gz 复制到容器

master 中的/opt/software 路径中（若路径不存在，则需新建），将 Master

节点 Flume 安装包解压到/opt/module 目录下，将解压命令复制并粘贴至客

户端桌面【Release\任务 A 提交结果.docx】中对应的任务序号下；

2、完善相关配置、环境变量，并使环境变量生效，执行命令 flume-ng version

并将命令与结果截图粘贴至客户端桌面【Release\任务 A 提交结果.docx】

中对应的任务序号下；

3、启动 Flume 传输 Hadoop 日志（namenode 或 datanode 日志），查看 HDFS 中

/tmp/flume 目录下生成的内容，将查看命令及结果（至少 5 条结果）截图并

粘贴至客户端桌面【Release\任务 A 提交结果.docx】中对应的任务序号下。

子任务三：Kafka 安装配置

本任务需要使用 root 用户完成相关配置，已安装 Hadoop 及需要配置前置环

境，具体要求如下：

1、从宿主机 /opt 目录下将文件 zookeeper-3.4.6.tar.gz 、

kafka_2.12-2.0.0.tgz 复制到容器 master 中的/opt/software 路径中（若

路径不存在，则需新建），将 Master 节点 Zookeeper、kafka 安装包解压到

/opt/module 目录下，将 kafka 解压命令复制并粘贴至客户端桌面【Release\

任务 A 提交结果.docx】中对应的任务序号下；

剩余18页未读，继续阅读

评论收藏

内容反馈

资源评论

资源反馈

评论星级较低，若资源使用遇到问题可联系上传者，3个工作日内问题未解决可申请退款~

我不懂竞赛

粉丝: 1822
资源: 25

上传资源快速赚钱

我的内容管理展开

我的资源快来上传第一个资源

我的收益

登录查看自己的收益

我的积分登录查看自己的积分

我的C币登录后查看C币余额

我的收藏

我的下载

下载帮助

前往需求广场，查看用户热搜

【大数据应用开发】2023年全国职业院校技能大赛赛题第05套

GZ033 大数据应用开发赛项赛题（师生同赛）

2023年全国职业院校技能大赛-网络系统管理赛项题第5套B模块

mysql-connector-java-5.1.40.tar.gz

Hive练习 1.在Hive中建立数据库hive，该库中建立外部表party，将hdfs的/party.csv导入该表，用命令

Apache atlas使用说明文档.pdf（转载分享请注明出处）

超市销售数据分析.csv

大数据实验六实验报告：熟悉Hive的基本操作

淘宝用户购物行为数据分析项目数据集

基于hive的酒店价格数据可视化分析系统设计和实现 【青岛黄海学院 2024 届毕业设计（论文）】

1、ETL工程师经典面试题.md

电商销售数据复盘用教程数据 hive分析-菜鸟入门

hive-jdbc-uber-2.6.5.0-292.jar

Kettle 9.1和8.2版本

Hive数据仓库之垃圾分类数据分析系统

hive-2.3.3jdbc驱动程序

大数据真实数仓项目完整版.zip

离线数据处理 任务一：数据抽取

mysql-数据库-mysql练习题

数据仓库规范设计.pdf

大屏大数据可视化psd原图

基于大数据技术的用户日志数据分析及可视化平台搭建项目代码及数据集

普元元数据管理系统v6.0管理员手册.pdf

hadoop-基于hive的聊天数据分析报表可视化案例数据源

数据仓库开发实例.pdf

基于Apache Doris的数据中台建设思路规划

大数据开发工程师简历模板

apache-hive-3.1.2-bin.tar.gz

Hive3.1.2编译源码

Hive数据仓库之电商用户数据分析系统

Echarts-配置项手册.zip

最新资源

基于hive的酒店价格数据可视化分析系统设计和实现【青岛黄海学院 2024 届毕业设计（论文）】

离线数据处理任务一：数据抽取