《Python 数据分析初探》项目报告
基于 Python 数据可视化的网易云音乐歌单分析系统
项目名称:第八组—
基于 Python 数据可视化的网易云音乐歌单分析系统
小组成员: 20033210 熊新(项目展示、数据获取、预处
理、分析)
20101330 邓磊(数据分析、可视化、报告润
色、PPT 润色)
21204404 陈界元(项目报告、数据分析)
21033120 彭端科(项目报告、数据分析)
19201112 李昀衡(项目报告、数据分析)
21142206 代沁(制作 PPT、数据分析)
任课教师:张中伟
《Python 数据分析初探》项目报告
目录
《Python 数据分析初探》项目报告 ...................................................................................... 1
一、项目简介 ............................................................... 1
(一)项目背景 ....................................................................................................................... 1
(二)项目过程 ....................................................................................................................... 1
二、项目设计流程图 ......................................................... 3
(一)基于 Python 数据可视化的网易云音乐歌单分析系统的整体架构 .......................... 3
(二)获取歌单索引页的信息 ............................................................................................... 4
(三)获取歌单详情页的信息 ............................................................................................... 5
(四)歌曲出现次数 TOP10 .................................................................................................. 6
(五)网易云音乐欧美歌单播放 TOP10 .............................................................................. 6
(六)网易云音乐欧美歌单评论 TOP10 .............................................................................. 7
(七)欧美歌单播放数量分布情况 ....................................................................................... 7
(八)网易云音乐欧美歌单标签图 ....................................................................................... 8
(九)歌单介绍词云图 ........................................................................................................... 8
三、项目实现代码 ........................................................... 9
(一)netease_cloud_music_data_analysis.py ........................................................................ 9
(二)music_index.py ........................................................................................................... 11
(三)music_detail.py ........................................................................................................... 13
(四)top_10_song.py ........................................................................................................... 15
(五)top_10_ea_song_playlists.py ...................................................................................... 17
(六)top_10_of_ea_song_collection.py............................................................................... 19
(七)top_10_of_ea_song_comment.py ............................................................................... 21
(八)top_10_ea_song_collection_distribution.py................................................................ 23
(九)top_10_ea_song_playlists_distribution.py .................................................................. 25
(十)label_ea_song.py ......................................................................................................... 26
(十一)music_wordcloud.py ............................................................................................... 28
四、项目分析结果 .......................................................... 30
(一)歌曲出现次数 TOP10 ................................................................................................ 31
(二)网易云音乐欧美歌单播放 TOP10 ............................................................................ 32
(三)网易云音乐欧美歌单评论 TOP10 ............................................................................ 32
(四)欧美歌单播放数量分布情况 ..................................................................................... 33
(五)网易云音乐欧美歌单标签图 ..................................................................................... 34
(六)歌单介绍词云图 ......................................................................................................... 35
(七)音乐歌单运营分析 ..................................................................................................... 35
(八)歌单数据可视化的商业价值 ..................................................................................... 37
《Python 数据分析初探》项目报告
1
一、项目简介
(一)项目背景
随着音乐软件的普及,海量的相关数据被创造。在大数据的时
代,任何大量的数据一旦被利用起来,将会产生巨大的价值。利用
Python 分析歌曲的相关数据来挖掘客户的需求并更进一步的扩大用
户量的例子比比皆是。
考虑到现实的可操作性以及 Python 在数据分析和交互、探索
性计算以及数据可视化等方面都有非常成熟的库。且经过小组测试
可行性,决定利用 Python 对音乐软件歌单进行分析。
(二)项目过程
此次项目利用 Python 对网易云音乐歌单数据的获取,对歌单
数据进行可视化分析。得出歌单的评论、收藏、播放、贡献、分布
的数量图以及词云,并提出歌单优化的建议。
项目利用爬虫对数据获取,后对其进行数据清洗,最终进行数
据可视化。在分析过程中使用 numpy, pandas, matplotlib, time,
requests, squarify, jieba, wordcloud, bs4 第三方模块,最后
以柱状图,词云图 以及标签图来展示歌曲收藏量,播放量等相关分
析结果并结合相关数据优化歌单播放量。
最后我们实现了项目,并对项目进行了测试。
《Python 数据分析初探》项目报告
2
图 1 歌单索引网页调试分析
图 2 歌单详情网页调试分析
《Python 数据分析初探》项目报告
3
二、项目设计流程图
(一)基于 Python 数据可视化的网易云音乐歌单分析系统的整体
架构
图 3 基于 Python 数据可视化的网易云音乐歌单分析系统的整体架构图