大数据作业基于spark大数据的音乐推荐系统源码，使用scala编程，使用python的flash框架作为可视化展示资源-CSDN文库

共14个文件

html：4个

json：3个

py：2个

版权申诉

spark

hadoop

scala

139 浏览量 2024-04-02 15:11:26 上传评论收藏 297KB ZIP 举报

资源推荐

资源详情

资源评论

收起资源包目录

bigdata-master.zip （14个子文件）

bigdata-master

main.py 3KB

bigdata.scala 17KB

templates

genre-sales.html 3KB

genre-predict.html 3KB

genre.html 3KB

index.html 825B

SparkFlask.py 3KB

README.en.md 951B

static

echarts-gl.min.js 790KB

jquery.min.js 86KB

data

genre-year-sales.json 411B

predict.json 818B

genre-sales.json 499B

README.md 2KB

# 基于spark大数据的音乐推荐 #### 介绍基于spark编写的音乐推荐大数据作业，使用scala编程，使用python的flash框架作为可视化展示。 Audioscrobbler数据集有趣地方在于仅仅记录播放的历史：“某某某播放了什么”。一个播放记录带来的信息量远远小于一个评分数据带来的信息量，但是评分数据总量肯定没有播放历史记录的数据多，当大量播放历史记录放在一起的时候，比评分数据将更有价值。由这个网站公布的一个2005年的数据集合可以http://www-etud.iro.umontreal.ca/bergstrj/audioscrobbler_data.html上面下载。主要的数据集是 user_artist_data.txt 文件，里面大约包含 141000 唯一的用户和 1.6 百万唯一的artist艺术家，大约 24.2 百万用户播放记录。 #### 软件架构软件架构说明 hadoop为分布式 + spark +hive #### 安装教程 1. xxxx 2. xxxx 3. xxxx #### 使用说明 1. xxxx 2. xxxx 3. xxxx #### 参与贡献 1. Fork 本仓库 2. 新建 Feat_xxx 分支 3. 提交代码 4. 新建 Pull Request #### 特技 1. 使用 Readme\_XXX.md 来支持不同的语言，例如 Readme\_en.md, Readme\_zh.md 2. Gitee 官方博客 [blog.gitee.com](https://blog.gitee.com) 3. 你可以 [https://gitee.com/explore](https://gitee.com/explore) 这个地址来了解 Gitee 上的优秀开源项目 4. [GVP](https://gitee.com/gvp) 全称是 Gitee 最有价值开源项目，是综合评定出的优秀开源项目 5. Gitee 官方提供的使用手册 [https://gitee.com/help](https://gitee.com/help) 6. Gitee 封面人物是一档用来展示 Gitee 会员风采的栏目 [https://gitee.com/gitee-stars/](https://gitee.com/gitee-stars/)

评论收藏

内容反馈

版权申诉