小江/基于spark的谷歌应用商店数据分析
在 Linux 上使用 Hadoop 的 HDFS 存储原始数据和结果数据
并使用 Spark 进行数据清洗及分析在
JupyterLab 环境下使用 Python 的库进行可视化
1721352798.6415567
没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论
收起资源包目录
upload.zip (61个子文件)
data.csv 1.29MB
show
Untitled1.ipynb 5KB
visualization.py 7KB
google.py 327B
render.html 9KB
.idea
workspace.xml 3KB
misc.xml 288B
inspectionProfiles
profiles_settings.xml 174B
modules.xml 260B
show.iml 284B
img
review_dist.png 103KB
top_install.png 337KB
rating_reviews_installs.png 104KB
Untitled1.ipynb 72B
top_5_each_category.png 413KB
category_count.png 130KB
price_reviews_installs.png 131KB
rating_dist.png 110KB
Untitled.ipynb 72B
.ipynb_checkpoints
category_count-checkpoint.png 130KB
Untitled-checkpoint.ipynb 72B
rating_dist-checkpoint.png 110KB
top_install-checkpoint.png 336KB
top_5_each_category-checkpoint.png 413KB
rating_reviews_installs-checkpoint.png 104KB
reviews_installs-checkpoint.png 113KB
review_dist-checkpoint.png 103KB
install_dist-checkpoint.png 104KB
Untitled1-checkpoint.ipynb 72B
price_reviews_installs-checkpoint.png 131KB
install_dist.png 104KB
reviews_installs.png 113KB
chromedriver.exe 16.73MB
Untitled2.ipynb 72B
Untitled.ipynb 72B
results
reviews_installs.csv
part-00000-8a476486-edc4-42b0-a1c5-753b144d2cda-c000.csv 274B
_SUCCESS 0B
top_installs.csv
part-00000-44c943c2-d551-4191-8be5-4f2ffd9804f7-c000.csv 8KB
_SUCCESS 0B
rating_distrib.csv
part-00000-65bcdab5-28d4-46c1-b7f8-c058f0086e29-c000.csv 96B
_SUCCESS 0B
category_count.csv
part-00000-d30427b9-e34d-4738-87e5-bf2f078dc99d-c000.csv 531B
_SUCCESS 0B
free_vs_paid.csv
part-00000-75ba63be-6e8e-4be3-9e9b-054dd2e60642-c000.csv 87B
_SUCCESS 0B
reviews_distrib.csv
_SUCCESS 0B
part-00000-ee4db554-66b2-428f-a387-701821c8189d-c000.csv 56B
installs_distrib.csv
part-00000-64c8dbc5-f914-421e-b28e-5a474015fa2c-c000.csv 60B
_SUCCESS 0B
rating_reviews_installs.csv
part-00000-eb6c7fe7-a565-4a69-8578-bdb113a60b97-c000.csv 804B
_SUCCESS 0B
top_5_install_each_category.csv
part-00000-baa16648-1c91-4aef-99a6-8f53ce287c37-c000.csv 6KB
_SUCCESS 0B
price_reviews_installs.csv
part-00000-e1579349-20a3-47e3-a62a-0e62344f511f-c000.csv 1KB
_SUCCESS 0B
.ipynb_checkpoints
Untitled-checkpoint.ipynb 72B
Untitled2-checkpoint.ipynb 72B
visualization-checkpoint.py 7KB
google-checkpoint.py 928B
Untitled1-checkpoint.ipynb 72B
readme.txt 258B
共 61 条
- 1
资源评论
xyq2024
- 粉丝: 2790
- 资源: 5533
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功