文章数
使用 MapReduce 程序在给定文章名称的帮助下确定整个维基百科数据集中的文章数量。
当前目录:- /mnt/CS5331_HomeDirectory/ljuturu/p_project1/art_count
<只有在文件被修改时才运行以下两个命令-编译和创建jar>
javac -classpath $HADOOP_CLASSPATH'/*' -d artcount_classes/ ArticleCount.java jar -cvf artcount.jar -C artcount_classes/ .
来自 HDFS 的输入和在 HDFS 上创建的输出:
输入 - /CS5331_Examples/Programming_Project_Dataset.txt 输出 - /user/ljuturu/art_count/output
运行应用程序:
<运行4个测试
评论0
最新资源