没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
亚马逊食品分析 考虑一下数据集,该数据集包含从1999年到2012年在Amazon上发布的大约600,000种食品评论。该数据集采用CSV格式,每行包含以下字段: ID, ProductId(产品的唯一标识符), UserId(用户的唯一标识符), ProfileName, 帮助性分子(发现该评论有用的用户数), 帮助性分母(为评论评分的用户数), 得分(介于1到5之间), 时间(以Unix时间表示的审阅时间戳记), 摘要(评论摘要), 文字(评论文字)。 映射结构 JAVA中的项目分别包含在MapReduce中: 一项工作,该工作每年能够按频率顺序生成在评论(摘要字段)中使用最多的十个单词,并为每个单词指示其出现频率,即该单词的出现次数在那一年的评论中。 一项能够为每个产品生成2003年至2012年之间的每一年中获得的平均分数的作业,指示ProductId,然后是
资源推荐
资源详情
资源评论
收起资源包目录
AmazonFoodAnalytic-master.zip (39个子文件)
AmazonFoodAnalytic-master
settings.gradle 41B
hive
log
log_job3 6KB
log_job1 7KB
log_job2 6KB
query
job3.hql 1KB
job1.hql 1KB
job2.hql 1KB
src
test
java
DataParserTest.java 1KB
CSVParserTest.java 1KB
main
resources
job2_result.txt 31KB
job3s_result.txt 54KB
job2s_result.txt 47KB
job3h_result.txt 37KB
job3_result.txt 32KB
job1h_result.txt 1KB
job2h_result.txt 42KB
job1_result.txt 1KB
job1s_result.txt 2KB
java
mapreduce
job1
AmazonFoodAnalytic.java 2KB
AmazonFoodAnalyticMapper.java 2KB
AmazonFoodAnalyticReducer.java 3KB
AmazonFoodConstants.java 577B
job2
AmazonFoodAnalytic.java 2KB
AmazonFoodAnalyticMapper.java 2KB
AmazonFoodAnalyticReducer.java 2KB
job3
AmazonFoodAnalyticMapperTwo.java 1007B
AmazonFoodAnalytic.java 2KB
AmazonFoodAnalyticMapper.java 1KB
AmazonFoodAnalyticReducerTwo.java 993B
AmazonFoodAnalyticReducer.java 1KB
mrspark
job1
AmazonFoodAnalytic.java 4KB
ReviewsConstants.java 4KB
job2
AmazonFoodAnalytic.java 3KB
job3
AmazonFoodAnalytic.java 2KB
AscendingSerializableComparator.java 459B
LICENSE.md 1KB
README.md 7KB
.gitignore 125B
build.gradle 4KB
共 39 条
- 1
资源评论
穆庭秋
- 粉丝: 26
- 资源: 4671
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功