没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论
搭建完全分布式 Hadoop 集群
1.1 HDFS 集群搭建
(1)下载解压 Hadoop
首先到官网(地址:https://archive.apache.org/dist/hadoop/common/)下载 Hadoop
稳定版本的安装包,然后上传至 hadoop1 节点下的/home/hadoop/app 目录下并解压,具体
操作如下所示。
[hadoop@hadoop1 app]$ tar -zxvf hadoop-2.9.2.tar.gz //解压
[hadoop@hadoop1 app]$ ln -s hadoop-2.9.2 hadoop //创建软连接
[hadoop@hadoop1 app]$ cd /home/hadoop/app/hadoop/etc/hadoop/ //切换到配置目
录
(2)修改 HDFS 配置文件
1)修改 hadoop-env.sh 配置文件。hadoop-env.sh 文件主要配置跟 Hadoop 环境相关的
变量,这里主要修改 JAVA_HOME 的安装目录,具体操作如下所示。
[hadoop@hadoop1 hadoop]$ vi hadoop-env.sh
export JAVA_HOME=/home/hadoop/app/jdk
2)修改 core-site.xml 配置文件。core-site.xml 文件主要配置 Hadoop 的公有属性,具
体需要配置的每个属性如下所示。
[hadoop@hadoop1 hadoop]$ vi core-site.xml
<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://mycluster</value>
</property>
<!--默认的 HDFS 路径-->
<property>
<name>hadoop.tmp.dir</name>
<value>/home/hadoop/data/tmp</value>
</property>
<!--hadoop 的临时目录,如果需要配置多个目录,需要逗号隔开-->
<property>
<name>ha.zookeeper.quorum</name>
<value>hadoop1:2181,hadoop2:2181,hadoop3:2181</value>
</property>
<!--配置 Zookeeper 管理 HDFS-->
</configuration>
3)修改 hdfs-site.xml 配置文件。hdfs-site.xml 文件主要配置跟 HDFS 相关的属性,具
体需要配置的每个属性如下所示。
[hadoop@hadoop1 hadoop]$ vi hdfs-site.xml
<configuration>
<property>
<name>dfs.replication</name>
<value>3</value>
</property>
<!--数据块副本数为 3-->
<property>
<name>dfs.permissions</name>
<value>false</value>
</property>
<property>
<name>dfs.permissions.enabled</name>
<value>false</value>
</property>
<!--权限默认配置为 false-->
<property>
<name>dfs.nameservices</name>
<value>mycluster</value>
</property>
<!--命名空间,它的值与 fs.defaultFS 的值要对应,namenode 高可用之后有
两个 namenode,mycluster 是对外提供的统一入口-->
<property>
<name>dfs.ha.namenodes.mycluster</name>
<value>nn1,nn2</value>
</property>
<!-- 指定 nameService 是 mycluster 时的 nameNode 有哪些,这里的值也是
逻辑名称,名字随便起,相互不重复即可-->
<property>
<name>dfs.namenode.rpc-address.mycluster.nn1</name>
<value>hadoop1:9000</value>
</property>
<property>
<name>dfs.namenode.http-address.mycluster.nn1</name>
<value>hadoop1:50070</value>
</property>
<property>
<name>dfs.namenode.rpc-address.mycluster.nn2</name>
<value>hadoop2:9000</value>
</property>
<property>
<name>dfs.namenode.http-address.mycluster.nn2</name>
<value>hadoop2:50070</value>
</property>
<property>
<name>dfs.ha.automatic-failover.enabled</name>
<value>true</value>
</property>
<!--启动故障自动恢复-->
<property>
<name>dfs.namenode.shared.edits.dir</name>
剩余13页未读,继续阅读
资源评论
爱好学习的哥哥
- 粉丝: 355
- 资源: 38
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- CM2200系列.pdf
- CM5000系列.pdf
- 大数据实验报告(已提交留档).7z
- CM1100系列.pdf
- CM7000系列(普通版).pdf
- CP2100 系列.pdf
- CP2500 (普通版).pdf
- CP2200系列.pdf
- 汇川H3U收卷机程序案例 收卷机完成藤条的收卷功能: 主机变频器采用力矩模式,排线伺服采用速度模式,定时中断采集主轴速度信号,排线伺服进行速度更随
- CP2500系列(智享版).pdf
- CP1100系列.pdf
- CP5000系列.pdf
- 敏捷实践指南-中文版(可搜索、带页码).pdf
- M9000系列.pdf
- CM9100、9700、M9100、9700系列.pdf
- docx文件转html文件word文件转html
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功