YARN 的工作机制
1、YARN 是资源协调者(主管 cup、内存)
2、 Client. Node manager
(AM container)( container map task)
Node manager
Resource Manager
Job submission
Client Node manager
3、Application Master:单个任务的管理者
4、Container:储存容器,相当于一台独立的服务器,里面装了任务运行所需要的资源,
如内存,cpu,磁盘,网络。
5、客户端可以多个;集群上可以运行多个 AM;
每个 Node Manager 上可以有多个 Container.
6、流程:客户端向 Resource Manager 提交一个任务,Resource Manager 则会找一
个 节 点 NodeManager 开 启 一 个 Container , application master; Container
,application master 向 Resource Manager 申请它运行这个任务需要多少资源;刚好
Date Node 有对应的节点,则开启 container MapTask;最后将结果写到磁盘上。