没有合适的资源?快使用搜索试试~ 我知道了~
Big-Data_hadoop_Yelp_Data_Analysis
共88个文件
java:30个
class:22个
jar:8个
需积分: 9 0 下载量 76 浏览量
2021-05-06
13:39:00
上传
评论
收藏 685KB ZIP 举报
温馨提示
大数据--Hadoop--Yelp数据集 文件夹包含5个问题和pdf,其中包含有关五个问题和Yelp数据集的描述 数据集:Yelp数据集: ://www.yelp.com/academic_dataset 经过分析的yelp数据集可得出有关“用户,业务和评论”实体的有用统计信息。数据集存储在Hadoop HDFS中。针对以下概念设计Map Reduce Java程序: 问题1:计数和筛选数据:计算的实体数 问题2:过滤复杂数据:使用公司地址作为过滤列列出公司ID 问题3:计算出的每个企业ID的平均评分,并列出前10名 问题4:减少侧加入和工作链:每个企业的计算平均评分。 使用这些评级列出了排名前10位的企业及其相应数据。 问题5:Map Side Join:将所有业务实体加载到分布式缓存中。 使用地图侧连接列出了位于特定区域中的企业的用户ID和评论文本。
资源详情
资源评论
资源推荐
收起资源包目录
Big-Data_hadoop_Yelp_Data_Analysis-master.zip (88个子文件)
Big-Data_hadoop_Yelp_Data_Analysis-master
Problem 2
ReadMe.txt 589B
Yelp Q2 Filter_Eclipse
src
PaloAltoFilter.java 2KB
bin
PaloAltoFilter.class 2KB
PaloAltoFilter$PaloAltoFilterMapper.class 3KB
.classpath 648B
.settings
org.eclipse.jdt.core.prefs 587B
paloaltofilter.jar 3KB
.project 373B
PaloAltoFilter.java 2KB
paloaltofilter.jar 3KB
Output 9KB
Problem 3
ReadMe.txt 571B
Top10.java 3KB
ValueComparator.java 435B
Output 270B
top10.jar 6KB
Yelp Q3 Top10_Eclipse
src
Top10.java 3KB
ValueComparator.java 435B
bin
Top10.class 2KB
Top10$Top10_Mapper.class 3KB
ValueComparator.class 1KB
Top10$Top10_Reducer.class 4KB
.classpath 648B
.settings
org.eclipse.jdt.core.prefs 587B
.project 372B
top10.jar 6KB
Yelp Data Set.txt 72B
README.md 989B
Problem 4
ReadMe.txt 581B
DetailsMapper.java 916B
ValueComparator.java 437B
Yelp Q4 Reduce Side Join_Eclipse
src
DetailsMapper.java 916B
ValueComparator.java 437B
Top10IdentityMapper.java 590B
Top10Join_Reducer.java 823B
Top10_Join.java 4KB
bin
Top10IdentityMapper.class 2KB
Top10_Join$Top10_Reducer.class 4KB
Top10Join_Reducer.class 3KB
DetailsMapper.class 3KB
Top10_Join$Top10_Mapper.class 3KB
Top10_Join.class 3KB
ValueComparator.class 1KB
.classpath 648B
.settings
org.eclipse.jdt.core.prefs 587B
top10_join.jar 10KB
.project 383B
Top10IdentityMapper.java 590B
Top10Join_Reducer.java 823B
Output 1KB
Top10_Join.java 4KB
Details About Problems & Dataset.pdf 51KB
Problem 1
ReadMe.txt 585B
Output 41B
Yelp Q1 Entity Count_Eclipse
src
EntityCount.java 3KB
bin
EntityCount.class 2KB
EntityCount$EntityCountReducer.class 2KB
EntityCount$EntityCountMapper.class 2KB
.classpath 648B
.settings
org.eclipse.jdt.core.prefs 587B
.project 379B
entitycount.jar 4KB
EntityCount.java 3KB
entitycount.jar 4KB
Problem 5
ReadMe.txt 604B
Mapjoin_reducer.java 821B
ValueComparator.java 437B
Yelp Q5 MapSide Join_Eclipse
src
Mapjoin_reducer.java 821B
ValueComparator.java 437B
BusinessFilterMapper.java 787B
Mapjoin_mapper.java 2KB
MapSideJoin.java 2KB
BusinessFilterReducer.java 486B
bin
BusinessFilterReducer.class 2KB
BusinessFilterMapper.class 2KB
MapSideJoin.class 3KB
Mapjoin_reducer.class 3KB
Mapjoin_mapper.class 4KB
ValueComparator.class 1KB
.classpath 648B
.settings
org.eclipse.jdt.core.prefs 587B
.project 379B
mapsidejoin.jar 9KB
Output 1.19MB
BusinessFilterMapper.java 787B
Mapjoin_mapper.java 2KB
MapSideJoin.java 2KB
BusinessFilterReducer.java 486B
共 88 条
- 1
Hsmiau
- 粉丝: 981
- 资源: 4653
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- C语言中使用OpenGL和SDL实现3D动态圣诞树效果
- 保险费用数据集.zip
- python圣诞树代码动态3d
- Anaconda Python 数据处理与分析工具的安装与配置教程
- C语言编程实现控制台打印2D圣诞树
- 动态直方图均衡化技术在图像对比度增强中的应用研究-论文复现-含代码详细解释
- 电脑视觉检测机项目设备3D图纸和工程图机械结构设计图纸和其它技术资料和技术方案非常好100%好用.zip
- DataOptionError解决办法.md
- 使用HTML和CSS创建静态圣诞树的代码实例
- NSConditionLockException如何解决.md
- KeyError.md
- 大宗商品价格数据集.zip
- 全球互联网使用数据集,互联网使用影响因素数据集,提供了各国互联网使用的全面概览
- ConcurrentModificationException(解决方案).md
- ReferenceError.md
- python通过overpass获取城市所有建筑物经纬度
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0