需求:
统计乘用车辆和商用车辆的数量和占比
输出结果:
乘用车辆 66478 0.9447326161410888
商用车辆 3889 0.05526738385891114
注意:数据的第11列的取值有:
非营运: 代表个人车辆
其它都为营运车辆: 公路客运, 幼儿校车, 警用。。。
步骤:
1. map:映射输出所有的乘用车辆和商用车辆的记录
combiner( 可选 )
2. reduce:
a. 统计乘用车辆和商用车辆的数量,写入一个map的映射中. key:车辆类型 value:数量, 同时定一个成员变量,记录车辆总和
reduce(){
// 求和 , 每个类型 数量, 存到 map
}
b. 重写reduce 中的cleanup ( reduce的作业的最后一步完成的) 方法,计算乘用车辆和商用车辆各自的销售数量和比例,输出到hdfs中.
context.write
******* 因为是要算各类型的车所占的比例,必须要等所有的reduce结束后才能算,所以reduce中不能输出,只能将输出写到cleanup()中
3. reduce 的数目一定要设置为1, 不能>1, 因为如果大1的话,则每个reduce只对自己的 Map统计比例,那么都会是 100%.
没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论
收起资源包目录
基于mapreduce计算框架的数据分析.zip (350个子文件)
access.log.10 2.89MB
access.log.10 2.89MB
access.log.10 2.89MB
access.log.10 2.89MB
_SUCCESS 0B
_SUCCESS 0B
_SUCCESS 0B
_SUCCESS 0B
_SUCCESS 0B
_SUCCESS 0B
_SUCCESS 0B
_SUCCESS 0B
_SUCCESS 0B
_SUCCESS 0B
_SUCCESS 0B
_SUCCESS 0B
_SUCCESS 0B
_SUCCESS 0B
_SUCCESS 0B
_SUCCESS 0B
_SUCCESS 0B
_SUCCESS 0B
_SUCCESS 0B
_SUCCESS 0B
_SUCCESS 0B
_SUCCESS 0B
_SUCCESS 0B
_SUCCESS 0B
_SUCCESS 0B
_SUCCESS 0B
_SUCCESS 0B
_SUCCESS 0B
_SUCCESS 0B
_SUCCESS 0B
_SUCCESS 0B
_SUCCESS 0B
_SUCCESS 0B
_SUCCESS 0B
_SUCCESS 0B
_SUCCESS 0B
_SUCCESS 0B
_SUCCESS 0B
_SUCCESS 0B
_SUCCESS 0B
_SUCCESS 0B
_SUCCESS 0B
_SUCCESS 0B
_SUCCESS 0B
_SUCCESS 0B
_SUCCESS 0B
_SUCCESS 0B
IPSeeker.class 13KB
Task2$Reduce.class 6KB
Task1$Reduce.class 6KB
KPI.class 6KB
KPI.class 5KB
ReadOutput.class 5KB
CountReducer.class 4KB
Task2.class 4KB
Second$Map.class 4KB
First$Map.class 4KB
Task2$Map.class 4KB
Task1$Map.class 4KB
Single$KPISingleReducer.class 4KB
CountReducer.class 4KB
CountReducer.class 4KB
TPH_Browser_Ratio$KPIBrRAReducer.class 4KB
Total$KPISingleReducer.class 4KB
TPH_Country$KPICounReducer.class 4KB
CountCombiner.class 4KB
Second.class 4KB
First.class 4KB
Three.class 4KB
Task1.class 4KB
Four.class 4KB
Total$KPITotalReducer.class 3KB
Four$Map.class 3KB
Four$Reduce.class 3KB
WeatherMapper.class 3KB
TableLine.class 3KB
TPH_Worm$KPIWormReducer.class 3KB
Three$Map.class 3KB
Task2$Reduce2.class 3KB
CountMap.class 3KB
Second$Reduce.class 3KB
WeatherReducer.class 3KB
App.class 3KB
Total.class 3KB
Single$KPISingleMapper.class 3KB
Total$KPISingleMapper.class 3KB
TableLine.class 3KB
App.class 3KB
TPH_Browser$KPIBrReducer.class 3KB
Weather.class 3KB
CountMap.class 3KB
WcReducer.class 3KB
Task2$Map2.class 3KB
Three$Reduce.class 3KB
App.class 3KB
TPH_Day_Visitor$KPIDayReducer.class 2KB
共 350 条
- 1
- 2
- 3
- 4
资源评论
博士僧小星
- 粉丝: 1884
- 资源: 5877
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 基于pytorch+Unet进行MRI肝脏图像分割源码+数据集+模型.zip
- 在Android Studio中开发一个Android App项目步骤
- 基于yolov8实现进行物体跟踪源码.zip
- Java多线程学习Java多线程学习Java多线程学习Java多线程学习.txt
- 算法数据结构-动态规划算法(Dynamic Programming)超详细总结加应用案例讲解.txt
- 2024最强秋招八股文(精简、纯手打)2024最强秋招八股文(精简、纯手打).txt
- 基于tensorflow多特征融合的微表情识别python源码.zip
- 基于yolov8实现人脸检测的python源码+运行说明.zip
- Micron Memory DDR3 SDRAM 全系列AD集成库(原理图库+PCB封装库).IntLib
- 基于tensorflow多特征融合的微表情识别python源码+详细使用说明.zip
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功