YARN.Essentials
YARN Essentials是关于Apache Hadoop的YARN(Yet Another Resource Negotiator)组件的详细介绍。该文档详细介绍了YARN的核心设计思想、架构组成、安装步骤、生态系统集成以及在集群中的管理与维护。以下是文档所涉及知识点的详细介绍: 1. YARN的需求与重设计理念 文档从Hadoop 1.x版本或传统MapReduce的局限性讲起,指出传统MapReduce在资源管理和作业调度上的不足。随后介绍了YARN作为Hadoop的现代操作系统,旨在解决这些问题,提供更为灵活和高效的资源管理能力。其中,YARN的设计目标包括资源抽象、资源隔离、容错性、扩展性和安全性的提升。 2. YARN架构 这部分内容详细讲述了YARN的核心组件,包括ResourceManager(资源管理器)、ApplicationMaster(应用主节点)和NodeManager(节点管理器)。此外,还介绍了YARN的调度策略,如FIFO、公平调度器和容量调度器。文章还涉及了YARN架构的最新发展。 3. YARN的安装 文档详细介绍了如何在不同模式下安装YARN:单节点安装、伪分布式安装和完全分布式安装。提到了安装前的先决条件、平台和软件要求,并指导用户如何启动和停止Hadoop与YARN集群。同时,还涵盖了集群的监控、历史服务器、从属文件的管理以及Web界面的操作。 4. YARN与Hadoop生态系统 这里首先介绍了Hadoop 2.x的发布,对Hadoop 1.x及其MapReduce API的简要介绍,以及MRv1与MRv2的对比。接着,文档讨论了YARN在Hadoop中的作用,以及MapReduce API的向后兼容性和org.apache.hadoop.mapred API的二进制兼容性与源代码兼容性。文档还通过实例演示了MRv1和MRv2的使用方法,包括输入文件的准备、作业的执行和结果的查看。 5. YARN的管理 这一部分详细介绍了YARN的容器管理,包括容器的分配和应用配置。深入讲解了YARN的调度策略,包括FIFO、公平调度器和容量调度器。同时,还涉及了YARN的多租户应用支持、管理工具的使用、集群节点的添加与移除,以及集群的运维和性能调优。 文档的综述部分往往提供了对章节内容的精要总结,以帮助读者巩固和回顾本章所学知识。整体而言,YARN Essentials不仅适合于希望深入理解YARN内在工作原理的读者,也是对于那些期望在现有Hadoop集群中部署和管理YARN的系统管理员的实用指南。
剩余284页未读,继续阅读
- wangtong4082016-07-01到处找这个资料, 终于找到了~
- 粉丝: 14
- 资源: 62
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助