Hadoop-MapReduce-学习资料及文档.zip资源-CSDN文库

共10个文件

png：6个

xls：1个

dat：1个

版权申诉

14 浏览量 2023-10-02 14:46:13 上传评论收藏 253KB ZIP 举报

资源推荐

资源详情

资源评论

收起资源包目录

package

Hadoop-MapReduce-学习资料及文档.zip （10个子文件）

folder

Hadoop-MapReduce-学习资料及文档

mapreduce框架的规范.png 50KB

wordcount的伪代码.png 60KB

日志格式.jpg 54KB

打开流的调用流程.png 59KB

wc流程.xls 9KB

打开流的关键代码.png 86KB

yarn提交job的源码流程.png 89KB

HTTP_20130313143750.dat 2KB

YARN中提交job的详细流程.png 62KB

MR执行笔记.txt 816B

1.执行MR的命令： hadoop jar <jar在linux的路径> <main方法所在的类的全类名> <参数> 例子： hadoop jar /root/wc1.jar cn.itcast.d3.hadoop.mr.WordCount hdfs://itcast:9000/words /out2 2.MR执行流程 (1).客户端提交一个mr的jar包给JobClient(提交方式：hadoop jar ...) (2).JobClient通过RPC和JobTracker进行通信，返回一个存放jar包的地址（HDFS）和jobId (3).client将jar包写入到HDFS当中(path = hdfs上的地址 + jobId) (4).开始提交任务(任务的描述信息，不是jar, 包括jobid，jar存放的位置，配置信息等等) (5).JobTracker进行初始化任务 (6).读取HDFS上的要处理的文件，开始计算输入分片，每一个分片对应一个MapperTask (7).TaskTracker通过心跳机制领取任务（任务的描述信息） (8).下载所需的jar，配置文件等 (9).TaskTracker启动一个java child子进程，用来执行具体的任务（MapperTask或ReducerTask） (10).将结果写入到HDFS当中

内容反馈

版权申诉

小小哭包

粉丝: 1899
资源: 3860

最新资源

资源上传下载、课程学习等过程中有任何疑问或建议，欢迎提出宝贵意见哦~我们会及时处理！点击此处反馈

feedback-tip