# 基于spark大数据的音乐推荐
#### 介绍
基于spark编写的音乐推荐大数据作业,使用scala编程,使用python的flash框架作为可视化展示。
Audioscrobbler数据集有趣地方在于仅仅记录播放的历史:“某某某 播放了 什么”。一个播放记录带来的信息量远远小于一个评分数据带来的信息量,但是评分数据总量肯定没有播放历史记录的数据多,当大量播放历史记录放在一起的时候,比评分数据将更有价值。 由这个网站公布的一个2005年的数据集合可以http://www-etud.iro.umontreal.ca/bergstrj/audioscrobbler_data.html上面下载。主要的数据集是 user_artist_data.txt 文件,里面大约包含 141000 唯一的用户和 1.6 百万唯一的artist艺术家,大约 24.2 百万用户播放记录。
#### 软件架构
软件架构说明
hadoop为分布式 + spark +hive
#### 安装教程
1. xxxx
2. xxxx
3. xxxx
#### 使用说明
1. xxxx
2. xxxx
3. xxxx
#### 参与贡献
1. Fork 本仓库
2. 新建 Feat_xxx 分支
3. 提交代码
4. 新建 Pull Request
#### 特技
1. 使用 Readme\_XXX.md 来支持不同的语言,例如 Readme\_en.md, Readme\_zh.md
2. Gitee 官方博客 [blog.gitee.com](https://blog.gitee.com)
3. 你可以 [https://gitee.com/explore](https://gitee.com/explore) 这个地址来了解 Gitee 上的优秀开源项目
4. [GVP](https://gitee.com/gvp) 全称是 Gitee 最有价值开源项目,是综合评定出的优秀开源项目
5. Gitee 官方提供的使用手册 [https://gitee.com/help](https://gitee.com/help)
6. Gitee 封面人物是一档用来展示 Gitee 会员风采的栏目 [https://gitee.com/gitee-stars/](https://gitee.com/gitee-stars/)
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
大数据作业基于spark大数据的音乐推荐系统源码,使用scala编程,使用python的flash框架作为可视化展示。 Audioscrobbler数据集有趣地方在于仅仅记录播放的历史:“某某某 播放了 什么”。一个播放记录带来的信息量远远小于一个评分数据带来的信息量,但是评分数据总量肯定没有播放历史记录的数据多,当大量播放历史记录放在一起的时候,比评分数据将更有价值。 软件架构 软件架构说明 hadoop为分布式 + spark +hive
资源推荐
资源详情
资源评论
收起资源包目录
bigdata-master.zip (14个子文件)
bigdata-master
main.py 3KB
bigdata.scala 17KB
templates
genre-sales.html 3KB
genre-predict.html 3KB
genre.html 3KB
index.html 825B
SparkFlask.py 3KB
README.en.md 951B
static
js
echarts-gl.min.js 790KB
jquery.min.js 86KB
data
genre-year-sales.json 411B
predict.json 818B
genre-sales.json 499B
README.md 2KB
共 14 条
- 1
资源评论
程序员柳
- 粉丝: 6094
- 资源: 1195
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功