没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
试读
12页
23、hadoop集群中yarn运行mapreduce的内存、CPU分配调度计算与优化 网址:https://blog.csdn.net/chenwewi520feng/article/details/130457270 本文介绍在hadoop集群中,不适用默认的参数情况下,yarn的cpu和内容配置。 本文依赖是hadoop集群正常运行。 本文分为3个部分,即概述、cpu和内存配置。
资源推荐
资源详情
资源评论
@TOC
本文介绍在hadoop集群中,不适用默认的参数情况下,yarn的cpu和内容配置。
本文依赖是hadoop集群正常运行。
本文分为3个部分,即概述、cpu和内存配置。
一、概述
hadoop yarn支持内存与CPU两种资源的调度方式。
YARN作为一个资源调度器,应该考虑到集群里面每一台机子的计算资源,然后根据application申
请的资源进行分配Container。
Container是YARN里面资源分配的基本单位,具有一定的内存以及CPU资源。
在YARN集群中,平衡内存、CPU、磁盘的资源的很重要的,根据经验,每两个container使用一块磁盘
以及一个CPU核的时候可以使集群的资源得到一个比较好的利用。
主要涉及参数有
yarn.nodemanager.resource.memory-mb
yarn.scheduler.minimum-allocation-mb
yarn.scheduler.maximum-allocation-mb
yarn.app.mapreduce.am.resource.mb
yarn.app.mapreduce.am.command-opts
mapreduce.map.memory.mb
mapreduce.reduce.memory.mb
mapreduce.map.java.opts
mapreduce.reduce.java.opts
二、内存分配计算
本文介绍2种配置方式,即通过已知的硬件资源进行人工计算和由辅助工具进行计算。需要说明的是,该
计算仅是方向性的计算,可以确保不出现大资源浪费或因配置不当导致环境不可用情况。即便本文的2种
配置方式,结果还是不同的。
此处计算的就是根据已有的硬件配置(即cpu核心数、磁盘个数、内存数)计算该环境中有多少
contaiers和每个contaier有多少内存。
1、人工计算
关于 内存 相关的配置可以参考hortonwork公司的文档 Determine HDP Memory Configuration
Settings 来配置集群。
YARN以及MAPREDUCE所有可用的内存资源应该要除去操作系统运行需要的以及其他的hadoop的一些
程序需要的,总共剩余的内存=操作系统内存+HBASE内存。
可以参考下面的表格确定应该保留的内存:
计算每台机子最多可以拥有多少个container,可以使用下面的公式:
containers = min ( 2CORES, 1.8DISKS, Total available RAM / MIN_CONTAINER_SIZE)
说明:
CORES:机器CPU核数
DISKS:机器上挂载的磁盘个数
Total available RAM :每节点可用内存,即减去操作系统和hbase需要的内存所剩余的内存
MIN_CONTAINER_SIZE:指container最小的容量大小,这需要根据具体情况去设置,可以参考下
面的表格。不过需要保持单位一致,即用MB或GB进行计算。
每个container的平均使用内存大小计算方式为:
RAM-per-container = max (MIN_CONTAINER_SIZE, Total Available RAM / containers )
通过上面的计算,YARN以及MAPREDUCE可以这样配置:
剩余11页未读,继续阅读
资源评论
一瓢一瓢的饮alanchanchn
- 粉丝: 2842
- 资源: 69
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功