# Cloud-Computing-Course-Closing-Report
云计算课程期末作业
含教程课程报告、整体设计架构图、执行结果图
项目所涉及的环境,零基础搭建教程参考:https://blog.csdn.net/qq_52584391/article/details/128534351
没有合适的资源?快使用搜索试试~ 我知道了~
基于hadoop的电影可视化系统本文电影评分预测系统使用hadoop与centos7搭建的虚拟机系统,有报告 和代码
共69个文件
png:22个
py:12个
txt:8个
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
5星 · 超过95%的资源 7 下载量 164 浏览量
2023-01-08
10:06:25
上传
评论 1
收藏 11.84MB ZIP 举报
温馨提示
本项目以电影数据为主题,基于hadoop伪分布式搭建,结合hive数据仓库调用物理机mysql数据库实现电影相关数据统计、通过Mapreduce编程对hdfs文件系统的文件进行词频统计。使用python进行电影数据采集、处理、分析及数据可视化,融合了python爬虫,Matplotlib绘图、Echarts数据可视化、情感分析、词图云等多个功能,可实现百万级电影数据离线处理与计算。 这次小组作业我们巩固了前面学习的Hadoop环境搭建、mysql数据库相关知识,在此基础上对hive数据仓库、mapreduce工作原理进行学习。通过本次作业我们也学习到了一些linux系统的安装、基本使用、系统架构以及一些常见命令的使用等。通过小组学习,我们各有分工,相互协作,加深了对彼此的了解,学到新的知识。
资源推荐
资源详情
资源评论
收起资源包目录
Cloud-Computing-Course-Closing-Report-main.zip (69个子文件)
Cloud-Computing-Course-Closing-Report-main
数据集
movie.csv 6KB
中国票房数据.csv 984KB
film-csv.txt 20KB
The_Man_of_Property.txt 617KB
6囧妈电影短评.csv 39KB
Centos程序
movie.csv 684KB
mr流程.png 198KB
red_new.py 327B
The_Man_of_Property.txt 617KB
map_new.py 253B
part-00000 177KB
run.sh 464B
movie.md 4KB
windows程序
movie.csv 684KB
scorepredict.py 3KB
3pachong.py 3KB
read 0B
lianxi
movie.csv 6KB
中国票房数据.csv 984KB
color-gray.jpg 136KB
film-csv.txt 20KB
查询top10.txt 73B
background1.png 319KB
6囧妈电影短评.csv 39KB
color.jpg 143KB
result.txt 33KB
SimHei.ttf 9.6MB
pfpredict.py 3KB
score.log 150KB
stopwords.txt 20KB
豆瓣电影top250.sql 86KB
tyc.txt 18KB
7cituyun.py 2KB
movies.dbf 100KB
14movierank.py 862B
5Echarts最近上映电影
js
echarts.min.js 651KB
movie.html 8KB
9wordcount.py 1KB
13movietype.py 2KB
8emotion.py 857B
12director.py 2KB
4douanscore.py 1004B
电票票房预测xls.xls 115KB
豆瓣电影评分预测-加效果.vsd 114KB
报告
云计算-最终提交版.docx 3.45MB
说明书.md 1KB
运行结果
Windows
图12导演与影片类型关系.png 37KB
8情感分析.png 19KB
图13影片类型与票房.png 47KB
图7豆瓣电影词语云.png 115KB
图14电影收入票房top20.png 61KB
图9词频分析.png 41KB
图4豆瓣评分top20.JPG 47KB
centos
命令执行结果截图
4-.png 20KB
2022-12-07 16-15-18 的屏幕截图.png 45KB
建表.png 62KB
hive执行命令结果.png 100KB
hive-select.png 46KB
2-.png 48KB
1-.png 21KB
5-.png 81KB
3-.png 41KB
load-data.png 72KB
7-.png 36KB
hive执行命令.png 149KB
2022-12-07 16-36-17 的屏幕截图.png 49KB
6-.png 64KB
part-00000 177KB
README.md 251B
共 69 条
- 1
小夕Coding
- 粉丝: 5847
- 资源: 461
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 直接插入排序,冒泡排序,直接选择排序.zip
- 在排序2的基础上,再次对快排进行优化,其次增加快排非递归,归并排序,归并排序非递归版.zip
- 实现了7种排序算法.三种复杂度排序.三种nlogn复杂度排序(堆排序,归并排序,快速排序)一种线性复杂度的排序.zip
- 冒泡排序 直接选择排序 直接插入排序 随机快速排序 归并排序 堆排序.zip
- 课设-内部排序算法比较 包括冒泡排序、直接插入排序、简单选择排序、快速排序、希尔排序、归并排序和堆排序.zip
- Python排序算法.zip
- C语言实现直接插入排序、希尔排序、选择排序、冒泡排序、堆排序、快速排序、归并排序、计数排序,并带图详解.zip
- 常用工具集参考用于图像等数据处理
- 音乐展示网页、基于Stenography的图像数字水印添加与提取,以及基于颜色矩和Tamura算法的图像相似度评估算法py源码
- 基于EmguCV(OpenCV .net封装),图像数字水印加解密算法的实现,其中包含最低有效位算法,离散傅里叶变换算法+文档书
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
- 1
- 2
前往页