Hadoop_HDFS安装和管理.pdf资源-CSDN文库

hadoop

hdfs

需积分: 10 40 浏览量 2013-01-13 10:54:36 上传评论收藏 248KB PDF 举报

资源推荐

资源详情

资源评论

Hadoop HDFS 安装和管理

1. HDFS安装

1.1. 环境准备

由于相对hdfs 的客户端存在相对路径问题，参见《Hadoop HDFS开发参考》

见 http://www.linuxidc.com/Linux/2012-01/50713.htm

，我们修改了hadoop-0.18.1 的源码并进

行了重新编译，代码为forlink-hadoop.tar.gz。

HDFS中，节点分为Namenode 和Datanode，其中Namenode只有一个（可以通过《Hadoop

HDFS系统双机热备方案》（见 http://www.linuxidc.com/Linux/2012-01/50714.ht

m）配置两

台，但同时只能有一台提供服务），Datanode可以有多台。

主机 IP 地址配置

ost2 (Namenode 的主节点) eth0: 192.168.188.202

eth1: 10.0.0.202 (HA 心跳使

用地址)

eth0:0: 192.168.188.201(虚拟

IP)

容量：80G

接口标准：IDE

转速：7200rpm

缓存容量：2M

平均寻道时间：9ms

传输标准：ATA 133

ost3（Namenode 的从节点） eth0: 192.168.188.203

eth1: 10.0.0.203 (HA 心跳使

用地址)

eth0:0: 192.168.188.201(虚拟

IP)

容量：80G

接口标准：IDE

转速：7200rpm

缓存容量：2M

平均寻道时间：9ms

传输标准：ATA 133

ost4（Datanode） eth0: 192.168.188.204

容量：80G

接口标准：IDE

转速：7200rpm

缓存容量：2M

平均寻道时间：9ms

传输标准：ATA 133

1、修改主机名

在所有节点都要执行此操作，在 202 上：

vi /etc/sysconfig/network

NETWORKING=yes

HOSTNAME=ost2

在 203 上为

HOSTNAME=ost3

在 204 上为

HOSTNAME=ost4

www.linuxidc.com

Linux公社(LinuxIDC.com) 是包括Ubuntu,Fedora,SUSE技术，最新IT资讯等Linux专业类网站。

1.5. 数据节点存活性和副本配置

每个数据节点周期性地向名字节点发送心跳信号。网络割裂可能导致一部分数据节点

跟名字节点失去联系。名字节点通过心跳信号的缺失来检测这一情况，并将这些近期不再发

送心跳信号数据节点标记为宕机，不会再将新的 IO 请求发给它们。任何存储在宕机数据节

点上的数据将不再有效。数据节点的宕机可能会引起一些数据块的副本系数低于指定值，名

字节点不断地检测这些需要复制的数据块，一旦发现就启动复制操作。在下列情况下，可能

需要重新复制：某个数据节点节点失效，某个副本遭到损坏，数据节点上的硬盘错误，或者

文件的副本系数增大。

副本数默认配置为 3，即每个文件在三个节点上保存副本，文件的副本数配置在

hadoop-site.xml 中：

<name>dfs.replication</name>

<description>数据需要备份的数量，默认是 3

</description>

</property>

如果把副本数配置为 1，当数据节点发生故障后，该数据节点上保存的数据将丢失。如

果副本数配置为 2，某个数据节点发生故障并不会影响数据可用性，但如果希望继续保存两

个拷贝，需要执行 bin/start-balancer.sh 来实现平衡，可以把这个脚本定时自动执行。

1.6. 拷贝配置到数据节点

将 hadoop 的整体环境从 namenode 拷贝到数据节点上去，这里是 ost4

scp -r /home/hdfs/hdfsinstall/ ost4:/home/hdfs/

1.7. 日志配置

1 名字节点日志

Hadoop 中，名字节点会产生 hadoop-hdfs-namenode-ost2.log 和

hadoop-hdfs-secondarynamenode-ost2.log 日志，其中 ost2 为节点名，hdfs 为超级用户名。名

字节点的日志由运行在 ost2 上的进程写入。

由于名字节点采用了 ha 方式部署，因此需要把名字节点的日志保存在共享位置。即对

于 ost2，修改 hadoop-env.sh，把日志保存在 drbd 盘上：

export HADOOP_LOG_DIR=/mnt/drbd/hdfs/logs

备注：

由于 ost2 和 ost3 采用了 heartbeat 实现 HA 部署，要求两台机器有不同的主机名，而 hdfs

根据主机名创建日志，因此在设备切换时，会产生不同的日志，如

hadoop-hdfs-namenode-ost2.log 和 hadoop-hdfs-namenode-ost3.log，但不影响系统正常运行。

2 数据节点日志

www.linuxidc.com

Linux公社(LinuxIDC.com) 是包括Ubuntu,Fedora,SUSE技术，最新IT资讯等Linux专业类网站。

剩余20页未读，继续阅读

评论收藏

内容反馈

fangdexsdn

粉丝: 0
资源: 2

Hadoop_HDFS安装和管理.pdf

4.Hadoop入门进阶课程_第4周_HDFS原理及操作.pdf

Hadoop_HDFS系统双机热备方案.pdf

大数据技术Hadoop3.x 2021年

Hadoop_HDFS和MapReduce架构浅析_郝树魁.pdf

Hadoop HDFS_Shell命令详解.pdf

Hadoop HDFS和MapReduce架构浅析.pdf

Day05_HDFS深入及Hadoop HA.pdf

Hadoop HDFS文件系统技术概述.pdf

大数据与云计算培训学习资料 Hadoop集群 细细品味Hadoop_第8期_HDFS初探之旅 共29页.pdf

《Hadoop大数据开发实战》教学教案—03HDFS分布式文件系统.pdf

12.Hadoop入门进阶课程_第12周_Flume介绍与安装.pdf

Hadoop技术HDFS简介共10页.pdf.zip

hadoop之hdfs介绍共4页.pdf.zip

hadoop-hdfs.pdf

大数据技术之Hadoop（HDFS).pdf

hadoop 2.9.0 hdfs-default.xml 属性集

福建师范大学精品大数据导论课程系列 (5.3.1)--4.2 HDFS的简要介绍.pdf

Hadoop集群pdf文档

Java第十五届蓝桥杯大赛软件JavaB组真题

SwitchHosts

安卓期末大作业（AndroidStudio开发），垃圾分类助手app，分为前台后台，代码有注释，均能正常运行

Notepad++安装包

2024北森能力测评题库.7z

微信小程序源码-合集1.rar

Java面试八股文2023最新版

Linux Centos7 升级最新版OpenSSH-9.6p1 有脚本（支持离线）

ruoyi-vue-pro 芋道源码项目的表结构

JDK1.8 windows 64位

myeclipse 10.7.1 windows 安装包

最新资源

大数据与云计算培训学习资料 Hadoop集群细细品味Hadoop_第8期_HDFS初探之旅共29页.pdf