没有合适的资源?快使用搜索试试~ 我知道了~
MapReduce-project
共24个文件
java:9个
xml:4个
txt:2个
需积分: 9 1 下载量 6 浏览量
2021-05-15
10:17:41
上传
评论
收藏 24KB ZIP 举报
温馨提示
MapReduce项目 组:cs132g7 概括 这是我们基本倒排索引的实现。 它实现了一个MapReduce作业,该作业最后给出了单词及其出现在其中的文档的有序列表。 从3月27日更新开始,它现在提供了令牌出现在每个文档中的令牌位置。 应该使用以下命令在hadoop集群上运行它: yarn jar cs132g7_inverted-index.jar Driver /data/wiki_csv /user/cs132g7/output 分解 上次修改时间:2018年3月27日 该代码分为6个文件: 驱动程序 这是执行文件,其中包含输入目录并指定输出目录。 但是,从此实现开始,它执行for循环以在HDFS上添加所有wiki-csv文件。 目前,这是硬编码的; 出于任何原因,在运行yarn jar命令时,/ data / wiki_csv都不被视为正确的路径。 从3月27日更新开
资源推荐
资源详情
资源评论
收起资源包目录
MapReduce-project-master.zip (24个子文件)
MapReduce-project-master
.gitignore 9B
src
main
java.zip 3KB
resources
log4j.properties 219B
java
WrapperTester.java 3KB
StringUtils.java 3KB
Driver.java 2KB
InvertReducer.java 1KB
StringIndexMapper.java 953B
spark
SparkImplementation2.txt 4KB
SparkSearch.java 4KB
BasicSpark.java 826B
SparkImplementation1.txt 3KB
Counter.java 755B
PositionWrapper.java 1KB
main.iml 424B
.classpath 1KB
.settings
org.eclipse.m2e.core.prefs 86B
org.eclipse.jdt.core.prefs 238B
pom.xml 2KB
README.md 5KB
.idea
misc.xml 258B
workspace.xml 17KB
modules.xml 266B
.project 538B
共 24 条
- 1
资源评论
Jeckaijew
- 粉丝: 25
- 资源: 4533
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功