没有合适的资源?快使用搜索试试~ 我知道了~
hdp2WordCountOozie
共7个文件
xml:2个
java:1个
properties:1个
需积分: 5 0 下载量 192 浏览量
2021-05-24
05:06:55
上传
评论
收藏 11KB ZIP 举报
温馨提示
#与oozie工作流程一起工作的字数统计 一个工作示例,展示了如何执行字数统计,使用YARN分布式缓存使用关键字过滤进行字数统计以及作为Oozie工作流进行编排。 ##样本数据集:MusixMatch(〜13.5mb) #以正常字数运行 ##独立MR使用说明: ###### 1)为用户创建目录(如果尚不存在) hdfs dfs -mkdir / user / $ USERNAME ###### 2)为musixmatch数据集制作原始数据文件夹 hdfs dfs -mkdir rawmusixmatch ###### 3)将原始数据集上传到HDFS hdfs dfs -put mxm_dataset_test.txt rawmusixmatch / ###### 4)执行MR作业 纱罐hdp2wordcount-0.0.1-SNAPSHOT.jar hdp2wordco
资源推荐
资源详情
资源评论
收起资源包目录
hdp2WordCountOozie-master.zip (7个子文件)
hdp2WordCountOozie-master
src
hdp2wordcount
WordCount.java 3KB
pom.xml 2KB
README.md 2KB
ooziewc
keywords.txt 84B
workflow.xml 3KB
job.properties 320B
lib
hdp2wordcount-0.0.1-SNAPSHOT.jar 6KB
共 7 条
- 1
资源评论
林John
- 粉丝: 40
- 资源: 4601
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功