没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论











Hadoop 伪分布模式安装
大
中
小
实验目的
1、了解 Hadoop 的 3 种运行模式
2、熟练掌握 Hadoop 伪分布模式安装流程
3、培养独立完成 Hadoop 伪分布安装的能力
实验原理
Hadoop 由 Apache 基金会开发的分布式系统基础架构,是利用集群对大量数据进
行分布式处理和存储的软件框架。用户可以轻松地在 Hadoop 集群上开发和运行
处理海量数据的应用程序。Hadoop 有高可靠,高扩展,高效性,高容错等优点。
Hadoop 框架最核心的设计就是 HDFS 和 MapReduce。HDFS 为海量的数据提供了存
储,MapReduce 为海量的数据提供了计算。此外,Hadoop 还包括了 Hive,
Hbase,ZooKeeper,Pig,Avro,Sqoop,Flume,Mahout 等项目。
Hadoop 的运行模式分为 3 种:本地运行模式,伪分布运行模式,完全分布运行
模式。
(1)本地模式(local mode)
这种运行模式在一台单机上运行,没有 HDFS 分布式文件系统,而是直接读写本
地操作系统中的文件系统。在本地运行模式(local mode)中不存在守护进程,
所有进程都运行在一个 JVM 上。单机模式适用于开发阶段运行 MapReduce 程序,
这也是最少使用的一个模式。
(2)伪分布模式
这种运行模式是在单台服务器上模拟 Hadoop 的完全分布模式,单机上的分布式
并不是真正的分布式,而是使用线程模拟的分布式。在这个模式中,所有守护进
程(NameNode,DataNode,ResourceManager,NodeManager,SecondaryNameNode)
都在同一台机器上运行。因为伪分布运行模式的 Hadoop 集群只有一个节点,所
以 HDFS 中的块复制将限制为单个副本,其 secondary-master 和 slave 也都将运
行于本地主机。此种模式除了并非真正意义的分布式之外,其程序执行逻辑完全
类似于完全分布式,因此,常用于开发人员测试程序的执行。本次实验就是在一
台服务器上进行伪分布运行模式的搭建。
(3)完全分布模式

这种模式通常被用于生产环境,使用 N 台主机组成一个 Hadoop 集群,Hadoop 守
护进程运行在每台主机之上。这里会存在 Namenode 运行的主机,Datanode 运行
的主机,以及 SecondaryNameNode 运行的主机。在完全分布式环境下,主节点和
从节点会分开。
实验环境
Linux Ubuntu 14.04
实验内容
在只安装 Linux 系统的服务器上,安装 Hadoop2.6.0 伪分布模式。
实验步骤
1.此步为可选项,建议用户创建一个新用户及用户组,后续的操作基本都是在此
用户下来操作。但是用户亦可在自己当前非 root 用户下进行操作。 创建一个用
户,名为 zhangyu,并为此用户创建 home 目录,此时会默认创建一个与 zhangyu
同名的用户组。
view plain "copy
1. sudo useradd -d /home/zhangyu -m zhangyu
为 zhangyu 用户设置密码,执行下面的语句
view plain "copy
1. sudo passwd zhangyu
按提示消息,输入密码以及确认密码即可,此处密码设置为 zhangyu
将 zhangyu 用户的权限,提升到 sudo 超级用户级别
view plain "copy
1. sudo usermod -G sudo zhangyu
后续操作,我们需要切换到 zhangyu 用户下来进行操作。
view plain "copy
1. su - zhangyu
2.首先来配置 SSH 免密码登陆

SSH 免密码登陆需要在服务器执行以下命令,生成公钥和私钥对
view plain "copy
1. ssh-keygen -t rsa
此时会有多处提醒输入在冒号后输入文本,这里主要是要求输入 ssh 密码以及密
码的放置位置。在这里,只需要使用默认值,按回车即可。
view plain "copy
1. zhangyu@b6b1577cfbc8:/apps$ ssh-keygen -t rsa
2. Generating public/private rsa key pair.
3. Enter file in which to save the key (/home/zhangyu/.ssh
/id_rsa):
4. Created directory '/home/zhangyu/.ssh'.
5. Enter passphrase (empty for no passphrase):
6. Enter same passphrase again:
7. Your identification has been saved in /home/zhangyu/.ssh/
id_rsa.
8. Your public key has been saved in /home/zhangyu/.ssh/id_
rsa.pub.
9. The key fingerprint is:
10.b3:00:c6:75:86:d6:8b:17:45:c6:7d:a1:74:aa:16:a7 zhangyu@b6b157
7cfbc8
11.The key's randomart image is:
12.+--[ RSA 2048]----+
13.| .oo++.. o. |
14.| . .ooo....+. |
15.| +. . o. +. |
16.| . .. o = |
17.| ..S E |
18.| . + |
19.| . |
20.| |
21.| |
22.+-----------------+
23.zhangyu@b6b1577cfbc8:/apps$
此时 ssh 公钥和私钥已经生成完毕,且放置在~/.ssh 目录下。切换到~/.ssh 目
录下
view plain "copy
1. cd ~/.ssh

可以看到~/.ssh 目录下的文件
view plain "copy
1. zhangyu@b6b1577cfbc8:~/.ssh$ ll
2. 总用量 16
3. drwx------ 2 zhangyu zhangyu 4096 11 月
1 06:37 ./
4. drwxr-xr-x 51 zhangyu zhangyu 4096 11 月
1 06:37 ../
5. -rw------- 1 zhangyu zhangyu 1675 11 月
1 06:37 id_rsa
6. -rw-r--r-- 1 zhangyu zhangyu 402 11 月
1 06:37 id_rsa.pub
7. zhangyu@b6b1577cfbc8:~/.ssh$
下面在~/.ssh 目录下,创建一个空文本,名为 authorized_keys
view plain "copy
1. touch ~/.ssh/authorized_keys
将存储公钥文件的 id_rsa.pub 里的内容,追加到 authorized_keys 中
view plain "copy
1. cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
下面执行 ssh localhost 测试 ssh 配置是否正确
view plain "copy
1. ssh localhost
一次使用 ssh 访问,会提醒是否继续连接
view plain "copy
1. zhangyu@b6b1577cfbc8:~/.ssh$ ssh localhost
2. The authenticity of host 'localhost (127.0.0.1)' can't b
e established.
3. ECDSA key fingerprint is 72:63:26:51:c7:2a:9e:81:24:55:5c:4
3:b6:7c:14:10.
4. Are you sure you want to continue connecting (yes/no)?
yes
剩余15页未读,继续阅读
资源评论

~O2
- 粉丝: 5
- 资源: 6

上传资源 快速赚钱
我的内容管理 收起
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助

会员权益专享
安全验证
文档复制为VIP权益,开通VIP直接复制
