没有合适的资源？快使用搜索试试~ 我知道了~

文库首页移动开发快应用大数据编程期末大作业-Hadoop

大数据编程期末大作业-Hadoop

hadoop

编程语言

0 下载量 105 浏览量 2024-03-11 15:00:14 上传评论收藏 1.23MB DOCX 举报

温馨提示

试读

11页

大数据编程期末大作业一、Hadoop基础操作二、RDD编程三、SparkSQL编程四、SparkStreaming编程

资源推荐

资源详情

资源评论

大数据编程期末大作业

文章目录

大数据编程期末大作业

一、Hadoop 基础操作

二、RDD 编程

三、SparkSQL 编程

四、SparkStreaming 编程

一、Hadoop 基础操作

在 HDFS 中创建目录 /user/root/你的名字例如李四同学 /user/root/lisi

首先我们需要启动 hdfs，我们直接在终端输入如下命令：

1 start-dfs.sh

我们在终端输入如下命令创建目录：

1 hadoop fs -mkdir /user

2 hadoop fs -mkdir /user/root

3 hadoop fs -mkdir /user/root/***(这里是你自己的名字)

上面是逐个创建文件夹，我们还可以使用参数-p 一次性创建多级目录：

1 hadoop fs -mkdir -p /user/root/***

创建本地文件 a.txt,文件内容：You love Hadoop ,并将改文件上传到 HDFS 中第 1 题所创建

的目录中

我们直接在终端的 root 目录下面创建我们的本地文件并输入题目要求的内容：

1 vim a.txt

然后我们再在终端输入上传命令：

1 hadoop fs -put a.txt /user/root/***

查看上传到 HDFS 中的 a.txt 文件的内容

我们直接在终端输入查看命令：

1 hadoop fs -cat /user/root/***/a.txt

在 Hadoop 官方的示例程序包 hadoop-mapreduce-examples-3.1.4.jar 中，包括计算 Pi 值的

测试模块，使用 hadoop jar 命令提交计算 Pi 的 MapReduce 任务

我们首先进入到 hadoop 下的 mapreduce 目录中：

1 cd /usr/local/servers/hadoop/share/hadoop/mapreduce/

然后执行如下命令即可计算 Pi：

1 hadoop jar hadoop-mapreduce-examples-3.1.3.jar pi 5 5

可以看出精度不是很高，上面命令后面的两个数字含义是，第一个 5 是运行 5 次 map 任务，

第二个 5 是每个 map 任务投掷次数，总投掷次数就是两者相乘，想要提高精度就可以让数

字变大，但是很容易出现作业计算失败的异常，这是因为计算内存不够，所以不能调的太大。

二、RDD 编程

现有一份 2019 年我国部分省份高考分数线数据文件 exam2019.csv,共有四个数据字段，字段

说明如表 1 所示：

表 1 高考分数线数据字段说明

字段名称说明

地区省、直辖市或自治区

考生类别考生报考类别，如理科

批次划定的学校级别，如本科批次

分数线达到所属批次的最低分

剩余10页未读，继续阅读

评论收藏

内容反馈

资源评论

资源反馈

评论星级较低，若资源使用遇到问题可联系上传者，3个工作日内问题未解决可申请退款~

电气_空空

粉丝: 3047
资源: 741

上传资源快速赚钱

我的内容管理展开

我的资源快来上传第一个资源

我的收益

登录查看自己的收益

我的积分登录查看自己的积分

我的C币登录后查看C币余额

我的收藏

我的下载

下载帮助

前往需求广场，查看用户热搜

大数据编程期末大作业-Hadoop

福建师范大学精品大数据导论课程系列 (3.1.1)--2.1 《大数据相关技术基础（1）》PPT.pdf

大数据平台与编程实践实验报告

《Linux系统》期末大作业任务书2019（大数据平台搭建） .doc

北京大学网络大数据管理与应用大作业：pagerank

大数据综合实验，基于mapreduce实现的成绩分析系统，引入hadoop作云存储+源代码+文档说明

大数据期末课设~基于spark的气象数据处理与分析

大数据课程的期末项目基于spark、hadoop hdfs、mongodb，使用scala，进行电影推荐+源代码+文档说明

计算机游戏期末大作业Final_Game.zip

大数据技术实践——Spark词频统计

hadoop.doc

spark考试练习题含答案.rar

大数据期末知识点总结.pdf

大一下学期C程序设计期末作业 坦克大战小游戏TankWar.zip

基于Hadoop和MapReduce统计某银行信用卡违约用户数量项目源码+项目说明+数据.zip

java简易商城源码-class-2018-bigdata:CLASS:BigDataProcessing(Fall2018),Hanyang

STM32CubeIDE 1.15.0自动补全插件

Swapface-1.53，全球最好用的AI换脸工具，一键启动一键生成！

开箱即用的28181协议视频平台 基于 GB28181 标准实现的网络视频平台，能够接入摄像机、平台、NVR 等设备、支持视频

Understand-6.4.1142-Windows-64bit

VMware虚拟机修改工具 一键过鲁大师 自由修改虚拟机硬件 拒绝机器码

Markdown工具中文.7z

全国计算机一级WPS Office题库2023年9月最新考试题库下载-大数据押题，命中率极高，考试原题都这里抽

MQTT 协议 5.0 中文版

再见极域（byebye极域）下载

Z-library-setup-latest.exe

bongo cat mver全键盘版（免费可下载，无需积分或rmb）

unity 无绿幕实时抠像

调音师工具箱，内置ToDesk，获取插件列表，Waves清理，优先级，关闭防火墙等等很多实用的功能

BOSS直聘批量打招呼插件免费下载免费用

最新资源

大一下学期C程序设计期末作业坦克大战小游戏TankWar.zip

开箱即用的28181协议视频平台基于 GB28181 标准实现的网络视频平台，能够接入摄像机、平台、NVR 等设备、支持视频

VMware虚拟机修改工具一键过鲁大师自由修改虚拟机硬件拒绝机器码