Hadoop3.1.3安装和单机/伪分布式配置

preview
需积分: 0 11 下载量 7 浏览量 更新于2024-06-21 收藏 10.77MB DOC 举报
实验项目名称: Hadoop3.1.3安装和单机/伪分布式配置 一、 实验目的和要求 Hadoop3.1.3安装和单机/伪分布式配置 二、 实验原理 1.Hadoop单机配置(非分布式) Hadoop 默认模式为非分布式模式(本地模式),无需进行其他配置即可运行。非分 布式即单 Java 进程,方便进行调试。 2. Hadoop伪分布式配置 Hadoop 可以在单节点上以伪分布式的方式运行,Hadoop 进程以分离的 Java 进程来运行,节点既作为 NameNode 也作为 DataNode,同时,读取的是 HDFS 中的文件。 ### Hadoop3.1.3安装与单机/伪分布式配置知识点详解 #### 一、实验目的和要求 - **掌握Hadoop3.1.3的安装与配置**:包括单机模式和伪分布式模式。 - **理解Hadoop的工作原理**:特别是其在不同模式下的运行机制。 - **熟悉Hadoop的常用操作**:如文件上传、数据处理等。 #### 二、实验原理 ##### 1. Hadoop单机配置(非分布式) - **定义**:Hadoop的默认模式是非分布式模式,即本地模式。在这种模式下,所有的Hadoop进程都在同一个Java进程中运行。 - **特点**: - 方便进行调试。 - 单进程运行,便于快速测试代码。 - **适用场景**:适用于开发阶段,进行简单的功能验证和调试。 ##### 2. Hadoop伪分布式配置 - **定义**:Hadoop可以在单个节点上以伪分布式模式运行,这意味着虽然只有一个物理节点,但是不同的Hadoop组件(如NameNode和DataNode)会分别运行在不同的Java进程中。 - **特点**: - 模拟了分布式环境。 - 有助于测试和调试Hadoop应用程序。 - **适用场景**:适合于小型测试环境,能够模拟部分分布式特性,进行初步的功能性和性能测试。 #### 三、主要仪器设备、试剂或材料 - **操作系统**:Ubuntu 18.04 64位。 - **软件工具**:Hadoop 3.1.3。 - **辅助工具**:SSH、Java环境。 #### 四、实验方法与步骤 ##### (一) 创建Hadoop用户 - **步骤**: 1. 在Ubuntu系统中创建一个名为`hadoop`的新用户。 2. 设置用户密码。 3. 赋予`hadoop`用户管理员权限。 4. 注销当前用户,使用新创建的`hadoop`用户登录。 ##### (二) 更新APT - **步骤**: 1. 使用`hadoop`用户登录。 2. 更新APT以确保后续安装的软件版本最新。 ##### (三) 安装SSH、配置SSH无密码登录 - **步骤**: 1. 安装SSH服务器。 2. 配置SSH无密码登录: - 通过`ssh-keygen`生成密钥。 - 将公钥添加到授权文件中。 - 测试SSH无密码登录功能。 ##### (四) 安装Java环境 - **步骤**: 1. 安装Java。 2. 配置JAVA_HOME环境变量。 3. 验证JAVA_HOME设置是否正确。 ##### (五) 安装Hadoop 3.1.3 - **步骤**: 1. 将Hadoop安装到`/usr/local/`目录下。 2. 检查Hadoop是否可用。 ##### (六) Hadoop单机配置(非分布式) - **步骤**: 1. 运行示例程序,如grep示例。 2. 观察程序执行结果,验证Hadoop单机模式下的基本功能。 ##### (七) Hadoop伪分布式配置 - **步骤**: 1. 修改配置文件`core-site.xml`和`hdfs-site.xml`。 2. 对`core-site.xml`进行配置: - 设置Hadoop的FS默认文件系统为HDFS。 - 设置HDFS的地址。 3. 对`hdfs-site.xml`进行配置: - 设置DataNode的存储位置。 - 设置NameNode的存储位置。 4. 格式化NameNode。 5. 启动Hadoop服务。 #### 五、总结 通过上述步骤,我们不仅完成了Hadoop 3.1.3的安装和配置,还深入理解了Hadoop在单机模式和伪分布式模式下的工作原理。这种实践不仅有助于加深对Hadoop技术栈的理解,还能提高解决实际问题的能力。对于初学者来说,这是一个很好的学习起点,为后续更复杂的分布式环境部署打下了坚实的基础。