没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论
大讲台 《大数据搭建葵花宝典》之手把手教你搭建 5 节点 Hadoop 分布式集群(HA)
大讲台 高端 IT 人才在线实训平台
手把手教你搭建 5 节点 Hadoop 分布式集群(HA)
1 目录
1.1 写在前面的话 ................................................................................................. 2
1.2 (一)HDFS 概述 ............................................................................................... 2
1.2.1 基础架构.............................................................................................. 2
1.2.2 HA 架构 ............................................................................................... 2
1.3 (二)YARN 概述 ............................................................................................... 3
1.3.1 基础架构.............................................................................................. 3
1.3.2 HA 架构 ............................................................................................... 4
1.4 (三)规划 ......................................................................................................... 4
1.4.1 主机规划.............................................................................................. 4
1.4.2 软件规划.............................................................................................. 5
1.4.3 用户规划.............................................................................................. 5
1.4.4 目录规划.............................................................................................. 5
1.5 (四)集群安装前的环境检查 ............................................................................. 5
1.5.1 时钟同步.............................................................................................. 5
1.5.2 hosts 文件检查 .................................................................................... 6
1.5.3 禁用防火墙 .......................................................................................... 6
1.6 (五)配置 SSH 免密码通信 ............................................................................... 6
1.7 (六)脚本工具的使用 ........................................................................................ 7
1.8 (七)jdk 安装 .................................................................................................. 11
1.9 (八)Zookeeper 安装...................................................................................... 11
1.10 (九)hadoop 集群环境搭建............................................................................. 13
1.10.1 配置 HDFS ........................................................................................ 14
1.10.2 hdfs 配置完毕后启动顺序................................................................... 17
1.10.3 YARN 安装配置 ................................................................................. 19
大讲台 《大数据搭建葵花宝典》之手把手教你搭建 5 节点 Hadoop 分布式集群(HA)
大讲台 高端 IT 人才在线实训平台
1.1 写在前面的话
本文章我们使用 hadoop2.6.0 版本配置 Hadoop 集群,同时配置 NameNode+HA、
ResourceManager+HA,并使用 zookeeper 来管理 Hadoop 集群。
在开始讲解之前,先告诉大家一个小秘密,本文有对应的配套视频讲解哦,详情参考:
http://www.dajiangtai.com/course/27.do?origin=invite-register&code=a8EYNf
1.2 (一)HDFS 概述
1.2.1 基础架构
1、NameNode(Master)
1)命名空间管理:命名空间支持对 HDFS 中的目录、文件和块做类似文件系统的创建、修
改、删除、列表文件和目录等基本操作。
2)块存储管理。
1.2.2 HA架构
从上面的架构图可以看出,使用 Active NameNode,Standby NameNode 两个节点可以解
决单点问题,两个节点通过 JounalNode 共享状态,通过 ZKFC 选举 Active ,监控状态,
自动备份。
1、Active NameNode
接受 client 的 RPC 请求并处理,同时写自己的 Editlog 和共享存储上的 Editlog,接收
DataNode 的 Block report, block location updates 和 heartbeat。
大讲台 《大数据搭建葵花宝典》之手把手教你搭建 5 节点 Hadoop 分布式集群(HA)
大讲台 高端 IT 人才在线实训平台
2、Standby NameNode
同样会接到来自 DataNode 的 Block report, block location updates 和 heartbeat,同时会从
共享存储的 Editlog 上读取并执行这些 log 操作,保持自己 NameNode 中的元数据
(Namespcae information + Block locations map)和 Active NameNode 中的元数据是同
步的。所以说 Standby 模式的 NameNode 是一个热备(Hot Standby NameNode),一旦
切换成 Active 模式,马上就可以提供 NameNode 服务。
3、JounalNode
用于 Active NameNode , Standby NameNode 同步数据,本身由一组 JounnalNode 节
点组成,该组节点奇数个。
4、ZKFC
监控 NameNode 进程,自动备份。
1.3 (二)YARN 概述
1.3.1 基础架构
1、ResourceManager(RM)
接收客户端任务请求,接收和监控 NodeManager(NM)的资源情况汇报,负责资源的分配与
调度,启动和监控 ApplicationMaster(AM)。
2、NodeManager
节点上的资源管理,启动 Container 运行 task 计算,上报资源、container 情况汇报给 RM
和任务处理情况汇报给 AM。
3、ApplicationMaster
单个 Application(Job)的 task 管理和调度,向 RM 进行资源的申请,向 NM 发出 launch
Container 指令,接收 NM 的 task 处理状态信息。
4、Web Application Proxy
用于防止 Yarn 遭受 Web 攻击,本身是 ResourceManager 的一部分,可通过配置独立进程。
ResourceManager Web 的访问基于守信用户,当 Application Master 运行于一个非受信用
户,其提供给 ResourceManager 的可能是非受信连接,Web Application Proxy 可以阻止这
种连接提供给 RM。
5、Job History Server
NodeManager 在启动的时候会初始化 LogAggregationService 服务, 该服务会在把本机执
行的 container log ( 在 container 结束的时候) 收集并存放到 hdfs 指定的目录下.
ApplicationMaster 会把 jobhistory 信息写到 hdfs的 jobhistory 临时目录下, 并在结束的时候
大讲台 《大数据搭建葵花宝典》之手把手教你搭建 5 节点 Hadoop 分布式集群(HA)
大讲台 高端 IT 人才在线实训平台
把jobhisoty 移动到最终目录, 这样就同时支持了job 的recovery.History 会启动web 和 RPC
服务, 用户可以通过网页或 RPC 方式获取作业的信息。
1.3.2 HA架构
ResourceManager HA 由一对 Active,Standby 结点构成,通过 RMStateStore 存储内部数
据和主要应用的数据及标记。目前支持的可替代的 RMStateStore 实现有:基于内存的
MemoryRMStateStore,基于文件系统的 FileSystemRMStateStore,及基于 zookeeper 的
ZKRMStateStore。 ResourceManager HA 的架构模式同 NameNode HA 的架构模式基本
一致,数据共享由 RMStateStore,而 ZKFC 成为 ResourceManager 进程的一个服务,非
独立存在。
1.4 (三)规划
1.4.1 主机规划
这里我们使用 5 台主机来配置 Hadoop 集群。
djt11/192.16
8.1.171
djt17/192.16
8.1.172
djt13/192.16
8.1.173
djt14/192.16
8.1.174
djt15/192.16
8.1.175
namenode
是
是
否
否
否
datanode
否
否
是
是
是
resourcem
anager
是
是
否
否
否
journalnod
e
是
是
是
是
是
zookeeper
是
是
是
是
是
大讲台 《大数据搭建葵花宝典》之手把手教你搭建 5 节点 Hadoop 分布式集群(HA)
大讲台 高端 IT 人才在线实训平台
Journalnode 和 ZooKeeper 保持奇数个,这点大家要有个概念,最少不少于 3 个节点。
Zookeeper 课程中我们已经讲解过,这里就不再赘叙。
1.4.2 软件规划
软件
版本
位数
说明
jdk
jdk1.7
64 位
最新稳定版本
centos
centos6.5
64 位
zookeeper
Apache
zookeeper3.4.6
稳定版本
hadoop
Apache
hadoop2.6.0
稳定版本
1.4.3 用户规划
每个节点的 hadoop 用户组和用户需要大家自己创建,单节点已经讲过,这里就不耽误大家
时间。
节点名称
用户组
用户
djt11
hadoop
hadoop
djt12
hadoop
hadoop
djt13
hadoop
hadoop
djt14
hadoop
hadoop
djt15
hadoop
hadoop
1.4.4 目录规划
名称
路径
所有软件目录
/home/hadoop/app/
所有数据和日志目录
/home/hadoop/data/
1.5 (四)集群安装前的环境检查
1.5.1 时钟同步
所有节点的系统时间要与当前时间保持一致。
查看当前系统时间
date
Tue Nov 3 06:06:04 CST 2015
如果系统时间与当前时间不一致,进行以下操作。
[root@djt11 ~]# cd /usr/share/zoneinfo/
[root@djt11 zoneinfo]# ls //找到 Asia
[root@djt11 zoneinfo]# cd Asia/ //进入 Asia 目录
[root@djt11 Asia]# ls //找到 Shanghai
[root@djt11 Asia]# cp /usr/share/zoneinf o/Asia/Shanghai /etc/localtime
剩余22页未读,继续阅读
资源评论
挖洞的杰瑞
- 粉丝: 331
- 资源: 420
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功