细细品味Hadoop（Hadoop安装及配置）.rar_hadoop

共1个文件

pdf：1个

版权申诉

hadoop

31 浏览量 2022-09-24 21:46:19 上传评论收藏 838KB RAR 举报

资源详情

资源评论

资源推荐

收起资源包目录

细细品味Hadoop（Hadoop安装及配置）.rar （1个子文件）

细细品味Hadoop（Hadoop安装及配置）.pdf 886KB

细细品味 Hadoop

——Hadoop 安装及配置

精

华

集

锦

csAxp

虾皮工作室

http://www.cnblogs.com/xia520pi/

2012 年 2 月 29 日

CentOS 下 Hadoop-0.20.2 集群配置文档

张鹏

一、集群网络环境介绍

集群包含三个节点：1 个 namenode，2 个 datanode，节点之间局域网连接，

可以相互 ping 通。节点 IP 地址分布如下：

Namenode: zhangpeng@192.168.90.91

Datanode1: zhangruixue@192.168.90.94

Datanode2: guanxiansun@192.168.90.205

三台节点上均是 CentOS 系统，并且有一个相同的用户 hadoop(具有管理员权限),

在/home/hadoop/目录下均有一个 hadoopinstall 目录，用于存放 hadoop-0.20.2 安装文件，

目录结构是/home/hadoop/hadoopinstall/hadoop-0.20.2。

在/etc/hosts 上添加主机名和相应的 IP 地址：

192.168.90.129 zhangpeng

192.168.90.94 zhangruixue

192.168.90.205 guanxiansun

二、SSH 无密码验证配置

Hadoop 需要使用 SSH 协议，namenode 使用 SSH 无密码登录并启动 datanode 进程，

同样原理，datanode 上也能使用 SSH 无密码登录到 namenode（这样也能在 datanode 上进

行启动或关闭 hadoop）。

1、安装和启动 SSH 协议

所有机器上安装 SSH 协议并启动服务，在所有机器上执行以下命令:

$ sudo yum install ssh 安装 SSH 协议

$ sudo yum install rsync （rsync 是一个远程数据同步工具，可通过 LAN/WAN 快速

同步多台主机间的文件）

$ ssh sudo /etc/init.d/ssh restart 启动服务

命令执行完毕，各台机器之间可以通过密码验证相互登陆。

2、配置 Namenode 无密码登录所有 Datanode

（1）原理

Namenode 作为客户端，要实现无密码公钥认证，连接到服务端 datanode 上时，需

要在 namenode 上生成一个密钥对，包括一个公钥和一个私钥，而后将公钥复制到

datanode 上。当 namenode 通过 ssh 连接 datanode 时，datanode 就会生成一个随机数并用

namenode 的公钥对随机数进行加密，并发送给 namenode。namenode 收到加密数之后再用

私钥进行解密，并将解密数回传给 datanode，datanode 确认解密数无误之后就允许

namenode 进行连接了。这就是一个公钥认证过程，其间不需要用户手工输入密码。重要过

程是将客户端 namenode 公钥复制到 datanode 上。

（2）Namenod 机器上生成密码对

在 Namenode 节点上执行以下命令:

hadoop@zhangpeng:~$ ssh-keygen -t rsa

Generating public/private rsa key pair.

Enter file in which to save the key (/home/hadoop/.ssh/id_rsa): 默认路径

Enter passphrase (empty for no passphrase): 回车，空密码

Enter same passphrase again:

Your identification has been saved in /home/hadoop/.ssh/id_rsa.

Your public key has been saved in /home/hadoop/.ssh/id_rsa.pub.

这将在/home/hadoop/.ssh/目录下生成一个私钥 id_rsa 和一个公钥 id_rsa.pub。

在 namenode 节点上做如下配置

hadoop@zhangpeng:~/.ssh$ cp id_rsa.pub authorized_keys（namenode 的公钥）

使用 SSH 协议将 namenode 的公钥信息 authorized_keys 复制到所有 DataNode 的.ssh

目录下(.ssh 下最初没有 authorized_keys，如果有，则需要追加)。

hadoop@zhangpeng:~$ scp authorized_keys hadoop@zhangruixue:/home/hadoop/.ssh

hadoop@zhangpeng:~$ scp authorized_keys hadoop@guanxiansun:/home/hadoop/.ssh

这样配置过后，namenode 可以无密码登录所有 datanode，可以通过命令“ssh 节点

ip 地址”来验证。

3、配置 Datanode 无密码登录 Namenode

和 namenode 无密码登录所有 Datanode 原理一样，把 Datanode 的公钥复制到

Namenode 的.ssh 目录下。

hadoop@zhangruixue:~$ scp authorized_keys hadoop@zhangpeng:/home/hadoop/.ssh

hadoop@guanxiansun:~$ scp authorized_keys hadoop@zhangpeng:/home/hadoop/.ssh

这样也能在 Datanode 上关闭和启动 Hadoop 服务。

注意：整个过程中只涉及到创建密钥，复制公钥，添加公钥内容，没有更改配置文

件，实际上须在 Namenode 上编辑配置文件/etc/ssh/sshd_config 开启其公钥验证：

RSAAuthentication yes

PubkeyAuthentication yes

至此，namenode 能无密码验证登陆每个 datanode。每个 datanode 也能无密码验证

SSH 登陆到 namenode。

三、JDK 安装和 Java 环境变量配置

1、CentOS 下安装 JDK 1.6

所有机器上安装 JDK 1.6，在所有机器上执行以下命令：

$ sudo yum install jdk

JDK 默认安装在/usr/java/jdk1.6.0_14 目录里。

2、Java 环境变量配置

在所有机器上执行如下命令：vim /etc/profile。并加入以下内容，配置环境变量

# set java environment

export JAVA_HOME="/usr/java/jdk1.6.0_14/"

export JAVA_HOME="/usr/java/jdk1.6.0_14/jre"

export CLASSPATH=.:$JAVA_HOME/lib:$JRE_HOME/lib:$CLASSPATH

export PATH=$JAVA_HOME/bin:$JRE_HOME/bin:$PATH

保存并退出，执行以下命令使配置生效：

[hadoop@zhangpeng ~]$ source /etc/profile

[hadoop@zhangruixue ~]$ source /etc/profile

[hadoop@guanxiansun ~]$ source /etc/profile

配置完毕，在命令行中使用命令”java -version”可以判断是否成功。

四、Hadoop 集群配置

1、下载 hadoop-0.20.2.tar.gz

在 namenode 上下载 hadoop-0.20.2.tar.gz，将其解压

到/home/hadoop/hadoopinstall 目录下，使用如下命令:

[hadoop@zhangpeng hadoopinstall]$ tar -xvzf hadoop-0.20.2.tar

然后在 hadoopinstall 下创建 tmp 文件夹并把 Hadoop 的安装路径添加

到/etc/profile 中修改/etc/profile 文件(配置 java 环境变量的文件)，将以下语句添加

到末尾，并使其有效(source /etc/profile)：

# set hadoop path

export HADOOP_HOME=/home/hadoop/hadoopinstall/hadoop-0.20.1

export PATH=$HADOOP_HOME/bin:$PATH

2、编辑 Hadoop 的配置文件

（1）配置 hadoop-env.sh

[hadoop@zhangpeng conf]$ vim hadoop-env.sh

末尾加入以下语句

# set java environment

export JAVA_HOME=/usr/java/jdk1.6.0_14/

hadoop 配置文件在 conf 目录下，之前的版本 Hadoop 的配置文件主要是 Hadoop-

default.xml 和 Hadoop-site.xml。由于 hadoop 发展迅速，代码量急剧增加，代码开发分为

了 core,hdfs 和 map/reduce 三部分，配置文件也被分成了三个 core-site.xml、hdfs-

site.xml、mapred-site.xml。

（2）配置 core-site.xml 文件

<name>hadoop.tmp.dir</name>

<value>/home/hadoop/hadoopinstall/tmp</value>

(注意，请先在 hadoopinstall 目录下建立 tmp 文件夹)

<description>A base for other temporary directories.</description>

</property>

<name>fs.default.name</name>

</property>

</configuration>

（3）配置 hdfs-site.xml 文件

<name>dfs.replication</name>

(replication 是数据副本数量，默认为 3，datanode 少于 3 台就会报错)

</property>

（4）配置 mapred-site.xml 文件

<name>mapred.job.tracker</name>

</property>

</configuration>

（5）配置 masters 文件,加入 namenode 的 ip 地址

192.168.90.91

（6）配置 slaves 文件, 加入所有 datanode 的 ip 地址

192.168.90.94

192.168.90.205

将 namenode 上配置好的 hadoop 所在文件夹 hadoopinstall 复制到

datanode 的/home/hadoop/目录下（实际上 masters,slavers 文件时不必要的，复制了也

没问题）。

在 datanode 上修改/etc/profile 文件 (配置 java 环境变量的文件 )，将以下语

句添加到末尾，并使其有效(source /etc/profile)：

# set hadoop path

export HADOOP_HOME=/home/zkl/hadoopinstall/hadoop-0.20.1

export PATH=$HADOOP_HOME/bin:$PATH

评论收藏

内容反馈

版权申诉

朱moyimi

粉丝: 61
资源: 1万+

细细品味Hadoop（Hadoop安装及配置）.rar_hadoop_细细品味Hadoop

评论0

最新资源

细细品味Hadoop（Hadoop安装及配置）.rar_hadoop_细细品味Hadoop

评论0

细细品味Hadoop（Hadoop安装及配置）

Hadoop 的安装与配置

Hadoop安装与配置

细细品味Hadoop_Hadoop集群VSFTP安装配置.rar_hadoop

细细品味Hadoop_Hadoop集群CentOS安装配置.rar_hadoop

大数据技术Hadoop3.x 2021年

细细品味Hadoop_第16期_ZooKeeper简介及安装_V1.2

Hadoop安装和配置

Hadoop安装与配置完整版

Hadoop安装配置

Hadoop安装与配置手册

细细品味Hadoop_Hadoop集群（第5期）_Hadoop安装配置

大数据与云计算培训学习资料 Hadoop集群 细细品味Hadoop_第5期_Hadoop安装配置 共44页.pdf

sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz

hadoop入门最好的文档

hadoop2.7配置文件_winutils.exe_hadoop.dll.rar

细细品味Hadoop_Hadoop集群（第11期副刊）_HBase之旅.pdf

Hadoop_2.2的安装与配置

Hadoop安装配置手册

第2章 Hadoop安装与配置.docx

Hadoop安装配置流程

hadoop_jdk1.8.0_144.rar

Hadoop大数据开发基础_教案.rar

02 Hadoop平台的安装与配置.pptx

sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.zip

细细品味Hadoop_Hadoop集群（第3期）_VSFTP安装配置

最新资源

大数据与云计算培训学习资料 Hadoop集群细细品味Hadoop_第5期_Hadoop安装配置共44页.pdf