没有合适的资源?快使用搜索试试~ 我知道了~
Big-Data_hadoop_Yelp_Data_Analysis
共88个文件
java:30个
class:22个
jar:8个
需积分: 9 0 下载量 49 浏览量
2021-05-06
13:39:00
上传
评论
收藏 685KB ZIP 举报
温馨提示
大数据--Hadoop--Yelp数据集 文件夹包含5个问题和pdf,其中包含有关五个问题和Yelp数据集的描述 数据集:Yelp数据集: ://www.yelp.com/academic_dataset 经过分析的yelp数据集可得出有关“用户,业务和评论”实体的有用统计信息。数据集存储在Hadoop HDFS中。针对以下概念设计Map Reduce Java程序: 问题1:计数和筛选数据:计算的实体数 问题2:过滤复杂数据:使用公司地址作为过滤列列出公司ID 问题3:计算出的每个企业ID的平均评分,并列出前10名 问题4:减少侧加入和工作链:每个企业的计算平均评分。 使用这些评级列出了排名前10位的企业及其相应数据。 问题5:Map Side Join:将所有业务实体加载到分布式缓存中。 使用地图侧连接列出了位于特定区域中的企业的用户ID和评论文本。
资源详情
资源评论
资源推荐
收起资源包目录
Big-Data_hadoop_Yelp_Data_Analysis-master.zip (88个子文件)
Big-Data_hadoop_Yelp_Data_Analysis-master
Problem 2
ReadMe.txt 589B
Yelp Q2 Filter_Eclipse
src
PaloAltoFilter.java 2KB
bin
PaloAltoFilter.class 2KB
PaloAltoFilter$PaloAltoFilterMapper.class 3KB
.classpath 648B
.settings
org.eclipse.jdt.core.prefs 587B
paloaltofilter.jar 3KB
.project 373B
PaloAltoFilter.java 2KB
paloaltofilter.jar 3KB
Output 9KB
Problem 3
ReadMe.txt 571B
Top10.java 3KB
ValueComparator.java 435B
Output 270B
top10.jar 6KB
Yelp Q3 Top10_Eclipse
src
Top10.java 3KB
ValueComparator.java 435B
bin
Top10.class 2KB
Top10$Top10_Mapper.class 3KB
ValueComparator.class 1KB
Top10$Top10_Reducer.class 4KB
.classpath 648B
.settings
org.eclipse.jdt.core.prefs 587B
.project 372B
top10.jar 6KB
Yelp Data Set.txt 72B
README.md 989B
Problem 4
ReadMe.txt 581B
DetailsMapper.java 916B
ValueComparator.java 437B
Yelp Q4 Reduce Side Join_Eclipse
src
DetailsMapper.java 916B
ValueComparator.java 437B
Top10IdentityMapper.java 590B
Top10Join_Reducer.java 823B
Top10_Join.java 4KB
bin
Top10IdentityMapper.class 2KB
Top10_Join$Top10_Reducer.class 4KB
Top10Join_Reducer.class 3KB
DetailsMapper.class 3KB
Top10_Join$Top10_Mapper.class 3KB
Top10_Join.class 3KB
ValueComparator.class 1KB
.classpath 648B
.settings
org.eclipse.jdt.core.prefs 587B
top10_join.jar 10KB
.project 383B
Top10IdentityMapper.java 590B
Top10Join_Reducer.java 823B
Output 1KB
Top10_Join.java 4KB
Details About Problems & Dataset.pdf 51KB
Problem 1
ReadMe.txt 585B
Output 41B
Yelp Q1 Entity Count_Eclipse
src
EntityCount.java 3KB
bin
EntityCount.class 2KB
EntityCount$EntityCountReducer.class 2KB
EntityCount$EntityCountMapper.class 2KB
.classpath 648B
.settings
org.eclipse.jdt.core.prefs 587B
.project 379B
entitycount.jar 4KB
EntityCount.java 3KB
entitycount.jar 4KB
Problem 5
ReadMe.txt 604B
Mapjoin_reducer.java 821B
ValueComparator.java 437B
Yelp Q5 MapSide Join_Eclipse
src
Mapjoin_reducer.java 821B
ValueComparator.java 437B
BusinessFilterMapper.java 787B
Mapjoin_mapper.java 2KB
MapSideJoin.java 2KB
BusinessFilterReducer.java 486B
bin
BusinessFilterReducer.class 2KB
BusinessFilterMapper.class 2KB
MapSideJoin.class 3KB
Mapjoin_reducer.class 3KB
Mapjoin_mapper.class 4KB
ValueComparator.class 1KB
.classpath 648B
.settings
org.eclipse.jdt.core.prefs 587B
.project 379B
mapsidejoin.jar 9KB
Output 1.19MB
BusinessFilterMapper.java 787B
Mapjoin_mapper.java 2KB
MapSideJoin.java 2KB
BusinessFilterReducer.java 486B
共 88 条
- 1
Hsmiau
- 粉丝: 855
- 资源: 4653
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- (源码)基于Spring Boot和Vue的后台管理系统.zip
- 用于将 Power BI 嵌入到您的应用中的 JavaScript 库 查看文档网站和 Wiki 了解更多信息 .zip
- (源码)基于Arduino、Python和Web技术的太阳能监控数据管理系统.zip
- (源码)基于Arduino的CAN总线传感器与执行器通信系统.zip
- (源码)基于C++的智能电力系统通信协议实现.zip
- 用于 Java 的 JSON-RPC.zip
- 用 JavaScript 重新实现计算机科学.zip
- (源码)基于PythonOpenCVYOLOv5DeepSort的猕猴桃自动计数系统.zip
- 用 JavaScript 编写的贪吃蛇游戏 .zip
- (源码)基于ASP.NET Core的美术课程管理系统.zip
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0