没有合适的资源?快使用搜索试试~ 我知道了~
Hadoop学习笔记AAAAAAAAAAA
需积分: 0 0 下载量 95 浏览量
2022-11-07
17:25:17
上传
评论 1
收藏 61KB DOCX 举报
温馨提示
试读
72页
Hadoop学习笔记AAAAAAAAAAA
资源推荐
资源详情
资源评论
Hadoop 笔记
基本思想
分布式存储
如果有 1T 数据需要存储? 1.先得将整个数据按照一定规则进行切分 2.将切分后的数据存放在
多台电脑上 3.记录存储位置以及相应数据的信息 4.考虑后续使用时,快速加载并且能够正常
使用
分布式计算
Hadoop 版本为 2.7.6
HADOOP 组件
HDFS:主要用于做数据存储
NameNode
DateNode
SecondaryNameNode
mapreduce:主要用于分布式计算
ApplicationMaster
task
yarn:主要用于做资源调度 (1.X 中和 MapReduce 融合在一起,耦合性太强)
资源调度:在做 数据计算时,需要 CPU、内存、带宽等资源,针对每个计算任务都需要将
任务进行划分开
ResourseManage
Nodemanage
Hadoop 安装
前提条件:三台虚拟机能够使用 Java 环境
1.修改 Linux 中的主机名
vim /etc/hostname
90IP 为 master
91IP 为 node1
92IP 为 node2
修改完成以后执行 reboot 命令重启 当重启链接以后 @符号后内容变更表示更改完成
2.通过 ssh 验证其他节点是否能够连接
在 master 节点上验证
ssh node1
ssh node2
ssh master
# 如果验证中,出现 node1 节点 IP 对应不上,那么请查看 Linux 中 /etc/hosts 文件配置
192.168.111.90 master
192.168.111.91 node1
192.168.111.92 node2
3.免密登录
在 Master 节点上执行
ssh-keygen -t rsa
# 三次回车
+---[RSA 2048]----+
| o .+oO*o|
| o . =+B.|
| . .oE+.+|
| o +o+o=|
| S. + =.**|
| .o = +.*|
| .= . ++|
| .. o.o|
| .. ..o|
+----[SHA256]-----+
发送密钥至所有节点
ssh-copy-id master
ssh-copy-id node1
ssh-copy-id node2
# 发送过后需要验证
ssh node1
解压
上传 hadoop-2.7.6.tar.gz 文件至 /usr/local/soft/
tar -zxvf hadoop-2.7.6.tar.gz -C /usr/local/soft/
文件目录
bin Hadoop 操作命令目录
etc/hadoop :用于存放 Hadoop 配置文件
sbin 用于存放 Hadoop 启动脚本
share/hadoop 用于存放 Hadoop 的 API 及其生成的相关依赖
配置环境变量
vim /etc/profile
# HADOOP_HOME
export HADOOP_HOME=/usr/local/soft/hadoop-2.7.6
export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH
# source 生效
source /etc/profile
修改配置文件
添加从节点
# 位置:/usr/local/soft/hadoop-2.7.6/etc/hadoop/slaves
# 添加
node1
node2
修改 Hadoop 依赖环境 hadoop-env.sh
删除 export JAVA_HOME=${JAVA_HOME}
新加 export JAVA_HOME=/usr/local/soft/jdk1.8.0_171
修改 core-site.xml
# 位置/usr/local/soft/hadoop-2.7.6/etc/hadoop/core-site.xml
在 core-site.xml 标签 configuration 中复制一下内容
<property>
<name>fs.defaultFS</name>
<value>hdfs://master:9000</value> #地址
</property>
<property>
<name>hadoop.tmp.dir</name> #tmp
<value>/usr/local/soft/hadoop-2.7.6/tmp</value>
</property>
<property>
<name>fs.trash.interval</name>#回收机制
<value>1440</value>#删除后保留 1440 分钟
</property>#7 天
修改 hdfs-site.xml
<property>
<name>dfs.replication</name>
<value>1</value>#副本数
</property>
<property>
<name>dfs.permissions</name>#表示文件或目录对应权限
<value>false</value>
</property>
修改 yarn-site.xml
<property>
<name>yarn.resourcemanager.hostname</name>
<value>master</value>
</property>
剩余71页未读,继续阅读
资源评论
张天靖09
- 粉丝: 2
- 资源: 1
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- YOLOV4-TINY权重文件
- 以下是一个使用贪心算法解决多机调度问题的基本步骤0.txt
- 基于大数据的房产估价是近年来随着技术的发展而兴起的一种新型估价方法.txt
- 企业供应链管理系统v3.rar
- 富芮坤FR8016HA蓝牙开发板使用手册+硬件PCB图+封装库+DEMO演示软件源代码.zip
- 基于YOLOv7的芯片表面缺陷检测系统
- 京东物流 数字化供应链综合研究报告2018.rar
- 基于YOLOv7的植物虫害识别&防治系统
- 2000.1-2023.8中国经济政策不确定性指数月度数据.xlsx
- Screenshot_2024-04-21-20-42-15-443_com.tencent.mm.jpg
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功