没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论
⼤数据安装部署⼤数据安装部署 CDH版版
1. Cloudera Manager 流程图流程图
CDH部署流程
1.1 节点⾓⾊分配节点⾓⾊分配
以下节点⾓⾊分配是针对5台机器的,其他情况可⾃⾏调整,保证各服务均衡配置,不要都集中在同⼀个节点上。
CDH节点⾓⾊分配
其他⾓⾊分配
2. 安装准备安装准备
⼤数据安装部署CDH版
1/32
2.1 硬件 要求硬件 要求
CDH集群提供集群保证服务的⾼可⽤性,因此集群必须是3台以上服务器组成,最好是单独的物理服务器,⽽⾮虚
拟机,并且虚拟机和物理机不要混⽤。
基本配置
节点数节点数 内存内存 CPU 磁盘磁盘 ⽹卡⽹卡
3个起 64G起 8核起 1T 起 千兆以上
特别注意:搭建hadoop环境前请先检查好各个机器节点的磁盘挂载情况,
1. 保证数据盘和系统盘是挂载在不同⽬录下的,并且/var/log⽬录最好单独分区挂载,⼤⼩在50G——150G左右,具
体视硬件情况⽽定,但建议不要⼩于50G,CDH 安装组件⼤部分的⽇志路径默认都在/var/log下,如果这⾥设置好,后
⾯很多路径不⽤重新修改,可以保证CDH组件稳定的运⾏;
2. 以上挂载的⽬录检查是否都写⼊了/etc/fstab中,很多新装的机器默认是临时挂载,没有写⼊该⽂件中,当机器重启
后,原来挂载的磁盘⽬录会消失,但数据没有丢失,需要重新mount;
3. 确认机器的系统版本多少,以CentOS为例,现在⽤的⽐较普遍的是CentOS6和CentOS7,系统版本不同,CDH选
择的安装包也不同,要保证整个集群中的操作系统版本⼀致,保证各节点同类软件版本⼀致;
4. 如果有多台机器(因为HDFS分布式存储的要求,建议3台以上),建议在两台不同的机器上分别部署MySQL,⼀
台专门为CDH服务,⼀旦服务正式启动,没有特殊需求,不要去动该台上⾯的MySQL服务,另外⼀台⽤来为业务服
务,当然,如果有RDS,那就没必要⾃⼰⼿动搭建MySQL。
2.2 操作 系统要求操作 系统要求
系统系统 版本版本
RedHat、Centos 6 或者7
2.3 软件 要求软件 要求
CDH 集群搭建需要的安装包包括JDK、Cloudera-Manager RPM包(3个),CDH parcel⽂件(3个)、MySQL或
者MariaDB。
具体版本如下,下表列出的除上述组件外的其他组件可以选择性安装
组件组件 版本版本 类型类型 备注备注
JDK jdk8_91 tar包 Oracle JDK
CM
daemons
5.7.1-
el6.x86_64
rpm
包
cloudera-manager-daemons-5.7.1-1.cm571.p0.8.el6.x86_64.rpm
CM agent 5.7.1-
el6.x86_64
rpm
包
cloudera-manager-agent-5.7.1-1.cm571.p0.8.el6.x86_64.rpm
CM
server
5.7.1-
el6.x86_64
rpm
包
cloudera-manager-server-5.7.1-1.cm571.p0.8.el6.x86_64.rpm
CDH 5.7.1-el6 parce
l包
CDH-5.7.1-1.cdh5.7.1.p0.11-el6.parcel,CDH-5.7.1-1.cdh5.7.1.p0.11-
el6.parcel.sha1,manif est.json
MySQL 5.6.30 tar包 mysql-5.6.30-linux-glibc2.5-x86_64.tar.gz
MariaDB 10.1 zip包
Jstorm 2.1.0 tar包 jstorm_2.1.0.tar.gz
Elasticse
arch
2.3.3 tar包 elasticsearch-2.3.3.tar.gz
⼤数据安装部署CDH版
2/32
Azkaban 3.0 tar包 azkaban2.sql,Azkaban-exec-server-3.0.0.tar.gz,Azkaban-web-server-
3.0.0.tar.gz
Redis 2.8.19 tar包 redis-2.8.19.tar.gz
Kaf ka 0.9.0.0 tar包 kaf ka_2.10-0.9.0.0.tgz
Tomcat 8.5.9 zip包 apache-tomcat-8.5.9
组件组件 版本版本 类型类型 备注备注
注意:如果是centos 7的环境,需要下载对应centos 7的cloudera-daemon,cloudera-manager-agent,cloudera-
manager-server和CDH parcel⼆进制包,官⽹的下载链接如下:
CDH parcel包:http://archive.cloudera.com/cdh5/parcels/
CM RPM包:http://archive.cloudera.com/cm5/
2.4 ⽤户权 限要求⽤户 权 限要求
CDH的安装需要root⽤户权限,且root密码需要配置⼀样的
3. 安装前的检查安装前的检查
3.1 系统 检查系统 检查
针对centos和Redhat的操作系统执⾏以下命令查看版本信息,确保各节点的操作系统版本⼀致且下⾯的命令可以
正常执⾏,这个版本信息会影响下⾯CDH的安装。
3.2 系统 磁盘分区检 查系统 磁盘分区检 查
系统安装和运⾏需要占⽤硬盘空间
"/" 的系统分区要单独挂出,以100G⼤⼩为宜;
推荐把每个物理磁盘挂载在/mnt/disknn (nn为1⾄2位的数字) 上不同的挂载点。建议使⽤ext4⽂件系统。这样
CDH不是说HDFS等服务时可以统⼀选择⽬录;
系统分区的挂载信息需要写⼊ /etc/f stab⽂件,防⽌机器重启后,磁盘挂载信息丢失;
/var/log ⽬录建议单独挂载,建议不低于100G,各种服务的⽇志默认保存在该⽬录下,不单独挂载,会默认
放在根⽬录下,导致根⽬录很快被⽤完;
⼤⼩⼤⼩ 挂载⽬录挂载⽬录 ⽂件系统类型⽂件系统类型
100G / ext4
100G /var/log ext4
1T /mnt/disk1 ext4
1T /mnt/disk2 ext4
3.3 JDK版本 及路径检 查版本 及路径检查
推荐安装JDK8版本,JDK必须⽤Oracle JDK,JAVA_HOME必须设置在 /usr/java ,如果没有该路径,请⾃⾏创
建,并给予755权限
将jdk-8u91-linux-x64.gz拷贝到要安装的⽬录/usr/java解压
cat /etc/redhat-release
$ mkdir -p /usr/java
⼤数据安装部署CDH版
3/32
修改环境变量
新增以下内容
⽣效环境变量,查看JDK版本
3.4 系统内 存检查系统 内 存检查
执⾏下⾯命令查看系统内存
centos6和Redhat6的系统总内存和可⽤内存,单位:g
centos6和Redhat6总内存和可⽤内存
centos7和Redhat7的系统总内存和可⽤内存,单位:g
centos7和Redhat7总内存和可⽤内存
3.5 系统 主机名修改 和系统 主机名修改 和 IP、、 hostname映射配置映射配置
如果主机名已经配置好,则不⽤修改,请记住,主机名不要⽤ localhost 这样的字符串。
如果没有修改,请参考:
(1) centos6/redhat6 修改Linux服务器名
$ chmod 755 /usr/java
$ cp jdk-8u91-linux-x64.gz /usr/java
$ tar -zxf jdk-8u91-linux-x64.gz
$ vi /etc/profile
###JAVA_HOME###
$ export JAVA_HOME=/usr/java/jdk1.8.0_91
$ export CLASSPATH=.:JAVA_HOME/lib:$JAVA_HOME/jre/lib
$ export PATH=$JAVA_HOME/bin:$PATH
##刷新环境变量
$ source /etc/profile
##查看JDK版本
$ java -version
free -g
⼤数据安装部署CDH版
4/32
修改hostname
修改完需要重启机器才能⽣效
最后在终端下执⾏
查看主机的hostname是否改变
注意:修改/etc/sysconf ig/network的hostname,需要重启机器
(2) centos7/redhat7 修改主机名
⽴即⽣效,不需要重启机器
(3) 配置每个集群节点/etc/hosts信息
添加IP和hostname的映射,例如本机IP是192.168.1.1,要设置的主机名是cdh1,则本机的/etc/hosts⽂件需要添
加如下⼀⾏,其他节点类似,同时各个节点的IP和主机名的映射也都要在每个节点添加,最后的形式如下:
3.6 关闭 防⽕墙关闭 防⽕墙
关闭防⽕墙和SELinux
关闭SELINUX
修改 /etc/selinux/conf ig 下的 SELINUX=disabled (重启后永久⽣效)
$ vi /etc/sysconfig/network
NETWORKING=yes HOSTNAME=yourname
$ hostname
hostnamectl set-hostname 你的主机名
$ vi /etc/hosts
127.0.0.1 localhost
192.168.1.1 cdh1
192.168.1.2 cdh2
193.168.1.3 cdh3
$ service iptables stop (临时关闭)
$ chkconfig iptables off (重启后⽣效)
setenforce 0 (临时⽣效)
⼤数据安装部署CDH版
5/32
剩余31页未读,继续阅读
资源评论
yiyezhiqiu425
- 粉丝: 0
- 资源: 1
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 在matlab中通过yalmip平台调用cplex求解器,可用于求解MILP问题,适合于综合能源系统优化求解(注释完全,可直接运
- MT8852B labview 驱动,MT8852B labview 代码,蓝牙测试仪MT8852B代码,蓝牙低功耗测试
- 导照片2.0(只适合索尼微单)
- KMP算法python代码实现与使用场景.docx
- 基于MATLABCPLEX 的机组最优组合,成功求解表格化,图示化的机组组合结果(注释完全,可直接运行)(文档加Matlab源码
- postgresql-9.5.3-1-windows-x64
- 基于大数据和产业互联网的企业数字化转型.rar
- MySQL5与PHP5开发的相册系统源码.zip
- 支持linux CentOS安装 jdk1.8的jenkins
- Clover四叶草引导中文版
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功