没有合适的资源?快使用搜索试试~ 我知道了~
mmd-project:挖掘百万首歌曲数据集
共42个文件
py:14个
ipynb:12个
bak:6个
需积分: 10 2 下载量 101 浏览量
2021-04-29
08:16:17
上传
评论
收藏 313KB ZIP 举报
温馨提示
这是“挖掘海量数据”项目的存储库。 作者:陈远泽,阿历克斯时间:25/10/2016 数据 子,10000首歌曲(压缩后的1.8G)。 项目1:重复检测 使用位置敏感散列和余弦距离。 项目2:歌曲推荐(第1部分) 使用潜在因子模型。 使用替代优化来找到用户歌曲计数矩阵的潜在因子。 项目3:歌曲推荐(第2部分) 使用Gradient Dencent,SGD和mini-batch SGD解决潜在因子问题。 项目4:歌曲排名 计算歌曲相似度,并建立歌曲相似度网络。 使用特定于主题的PageRank对歌曲进行排名。 项目5:歌曲聚类 在project4中使用网络构建加权邻接矩阵。 对它执行频谱聚类,支持归一化和非归一化图拉普拉斯算子。
资源推荐
资源详情
资源评论
收起资源包目录
mmd-project-master.zip (42个子文件)
mmd-project-master
project5
.ipynb_checkpoints
mmdstask5-checkpoint.ipynb 103KB
task5.ipynb 103KB
project4
.ipynb_checkpoints
mmdstask4-checkpoint.ipynb 7KB
mmdstask4.ipynb 7KB
project3
.ipynb_checkpoints
task3-checkpoint.ipynb 65KB
task3.ipynb 51KB
project1
.ipynb_checkpoints
duplication_detection-checkpoint.ipynb 13KB
mmds-checkpoint.ipynb 12KB
Duplication-checkpoint.ipynb 21KB
mmds.ipynb 20KB
config 349B
README~ 933B
PythonSrc
hdf5_utils.py.bak 28KB
enpyapi_to_hdf5.py 12KB
hdf5_getters.pyc 25KB
hdf5_getters.py 21KB
create_aggregate_file.py.bak 3KB
hdf5_utils.py 28KB
hdf5_descriptors.py 4KB
create_summary_file.py 3KB
display_song.py.bak 4KB
__pycache__
hdf5_getters.cpython-35.pyc 22KB
hdf5_to_matfile.py 7KB
enpyapi_to_hdf5.py.bak 12KB
DatasetCreation
dataset_sanity_check.py 5KB
__init__.py 0B
README.txt 220B
cal500_artist_song.txt 16KB
dataset_filestats.py 6KB
dataset_creator.py 45KB
hdf5_to_matfile.py.bak 7KB
create_aggregate_file.py 3KB
create_summary_file.py.bak 3KB
MBrainzDB
__init__.py 0B
README.txt 567B
query.py 10KB
display_song.py 4KB
Duplication.ipynb 11KB
config~ 382B
README 1KB
README.md 993B
project2
task2.ipynb 9KB
共 42 条
- 1
资源评论
FranklinZheng
- 粉丝: 27
- 资源: 4567
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功