# **INFO-SPIDER**
> 一个神奇的工具箱, 拿回你的个人信息.
# **Introduction**
## 开发者回忆录🌈
<details>
<summary>点击展开👉 开发者回忆录🌈</summary>
#### 场景一
小明一如往常打开 Chrome 浏览器逛着论坛,贴吧,一不小心点开了网页上的广告,跳转到了京东商城,下意识去关闭窗口时发现 (**OS:咦?京东怎么知道我最近心心念念的宝贝呢?刚好我正需要呢!**),既然打开了那就看看商品详情吧 (**OS:哎哟不错哦**),那就下单试试吧!
#### 场景二
小白听着网易云音乐的每日推荐歌单无法自拔 (**OS:哇!怎么播放列表里都是我喜欢的音乐风格?网易云音乐太棒了吧!深得我心啊!黑胶会员必须来一个!**),逛着知乎里的“如何优雅的XXX?”,“XXX是怎样一种体验?”,“如何评价XXX?” (**OS:咦?这个问题就是我刚好想问的,原来早已有人提问!什么???还有几千条回答!!进去逛逛看!**)
#### 场景三
小达上班时不忘充实自己,逛着各大技术论坛博客园、CSDN、开源中国、简书、掘金等等,发现首页的内容推荐太棒了(**OS:这些技术博文太棒了,不用找就出来了**),再打开自己的博客主页发现不知不觉地自己也坚持写博文也有三年了,自己的技术栈也越来越丰富(**OS:怎么博客后台都不提供一个数据分析系统呢?我想看看我这几年来的发文数量,发文时间,想知道哪些博文比较热门,想看看我在哪些技术上花费的时间更多,想看看我过去的创作高峰期时在晚上呢?还是凌晨?我希望系统能给我更多指引数据让我更好的创作!**)
看到以上几个场景你可能会感叹科技在进步,技术在发展,极大地改善了我们的生活方式。
但当你深入思考,你浏览的每个网站,注册的每个网站,他们都记录着你的信息你的足迹。
细思恐极的背后是自己的个人数据被赤裸裸的暴露在互联网上并且被众多的公司利用用户数据获得巨额利益,如对用户的数据收集分析后进行定制的广告推送,收取高额广告费。但作为数据的生产者却没能分享属于自己的数据收益。
#### 想法
如果有一个这样的工具,它能帮你拿回你的个人信息,它能帮你把分散在各种站点的个人信息聚合起来,它能帮你分析你的个人数据并给你提供建议,它能帮你把个人数据可视化让你更清楚地了解自己。
> 你是否会需要这样的工具呢? 你是否会喜欢这样的工具呢?
基于以上,我着手开发了 **[INFO-SPIDER](https://github.com/kangvcar/InfoSpider)** 👇👇👇
</details>
## Why INFO-SPIDER
- 个人数据蕴含巨大的价值, 未来的世界核心就是数据, 这是一个万亿级的市场. 众多的公司利用用户数据获得巨额利益, 如对用户的数据收集分析后进行定制的广告推送, 收取高额广告费. 但作为生产数据的最终用户, 却没能分享属于自己的数据收益.
- 个人数据分散在各种各样的公司之间, 经常形成数据孤岛, 多维数据无法融合. 很多优秀的创业公司, 被极大限制. 有算法、有创新,但缺乏合法且高效的途径访问数据.
- [INFO-SPIDER](https://github.com/kangvcar/InfoSpider) 项目旨在提供最全的工具帮助用户安全快捷的从数据寡头拿回自己的数据, 自由选择提供给数据需求方, 挖掘自己数据的金矿, 分享自己数据的价值.
## What is INFO-SPIDER
要想实现个人数据资产化, 如何拿回自己的数据是第一步, 一些数据寡头已经开始提供工具能让用户自由导出数据, 如谷歌公司, 已经提供方式让用户[下载](https://support.google.com/accounts/answer/3024190?hl=en)自己的数据.
这是一个好的开始, 但还不够, 还有很多公司没有提供官方工具或者只能下载很有限的数据. 而目前市面上的数据获取工具要么数据源不全, 要么不开源不透明. 无法保证工具本身不会偷偷窃取用户的数据, 甚至用户的用户名和密码.
[INFO-SPIDER](https://github.com/kangvcar/InfoSpider) 旨在安全快捷的帮助用户拿回**自己的数据**,工具代码开源,流程透明。并提供**数据分析**功能,基于用户数据生成图表文件,使得用户更直观、深入了解自己的信息。
## Features
- 安全可靠:本项目为开源项目,代码简洁,所有源码可见,本地运行,安全可靠。
- 使用简单:提供GUI界面,只需点击所需获取的数据源并根据提示操作即可。
- 结构清晰:本项目的所有数据源相互独立,可移植性高,**所有爬虫脚本在项目的[Spiders](https://github.com/kangvcar/InfoSpider/tree/master/Spiders)文件下**。
- 数据源丰富:本项目目前支持多达24+个数据源,持续更新。
- 数据格式统一:爬取的所有数据都将存储为json格式。
- 个人数据丰富:本项目将尽可能多地为你爬取个人数据,后期数据处理可根据需要删减。
- 数据分析:本项目提供个人数据的可视化分析,目前仅部分支持。
- 文档丰富:本项目包含完整全面的[使用说明文档](https://infospider.vercel.app)和[视频教程](https://www.bilibili.com/video/BV14f4y1R7oF/)
## Screenshot
![screenshot.png](https://i.loli.net/2020/10/26/4NJyMhrsGPwvxgd.png ':size=80%')
## QuickStart
### 依赖安装
1. 安装[python3](https://www.python.org/downloads/)和Chrome浏览器
2. 安装与Chrome浏览器相同版本的[驱动](http://chromedriver.storage.googleapis.com/index.html)
3. 安装依赖库 `./install_deps.sh` (Windows下只需`pip install -r requirements.txt`)
!> 目前该工具箱仅在Windows环境下正常运行, 还未在Linux/MacOS环境下进行测试, 后续更新会兼容多平台.
### 工具运行
1. 进入 tools 目录
2. 运行 `python3 main.py`
3. 在打开的窗口**点击数据源按钮**, 根据提示**选择数据保存路径**
4. 弹出的浏览器**输入用户密码**后会自动开始爬取数据, 爬取完成浏览器会自动关闭.
5. 在对应的目录下可以**查看下载下来的数据**(xxx.json), **数据分析图表**(xxx.html)
?> 👍 每个数据源的爬取可能会生成多个文件, 所以建议为每个数据源新建一个文件夹来保存数据.
?> 数据分析功能还在开发中,暂时只支持部分数据源
!> 😘😘😘 如果你运行程序的过程中出现了错误, 或者爬取不到信息, 你可以通过 GitHub 提交[Issues](https://github.com/kangvcar/InfoSpider/issues)来告诉我们, 我们很乐意不断完善此项目.
## 购买服务
?> ***目前4折限量发售中...***,[去看看](https://mianbaoduo.com/o/bread/aZiTlJo=)
1. InfoSpider 最新维护版本
2. 更全面的个人数据分析
3. 免去安装程序的所有依赖环境,便捷,适合小白
4. 已打包好的程序,双击即可运行程序
5. 手把手教你如何打包 InfoSpider
6. 开发者一对一技术支持
7. ***购买后即可免费获得即将发布的全新2.0版本***
<p align="center">
<img src="https://i.loli.net/2020/10/20/IRbLzEmBv9Ktwp4.jpg" alt="wechat" height=50% width=50%/></br>
<a href="https://mianbaoduo.com/o/bread/aZiTlJo="><b>购买链接</b></a>
</p>
## 数据源
- [x] GitHub
- [x] QQ邮箱
- [x] 网易邮箱
- [x] 阿里邮箱
- [x] 新浪邮箱
- [x] Hotmail邮箱
- [x] Outlook邮箱
- [x] 京东
- [x] 淘宝
- [x] 支付宝
- [x] 中国移动
- [x] 中国联通
- [x] 中国电信
- [x] 知乎
- [x] 哔哩哔哩
- [x] 网易云音乐
- [x] QQ好友
- [x] QQ群
- [x] 生成朋友圈相册
- [x] 浏览器浏览历史
- [x] 12306
- [x] 博客园
- [x] CSDN博客
- [x] 开源中国博客
- [x] 简书
!> 😊 如果没有找到你需要的数据源, 你可以通过 Git
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
【资源说明】 基于集众多数据源于一身的爬虫工具箱,旨在安全快捷的帮助用户拿回自己的数据,工具代码开源,流程透明。支持数据源包括GitHub、QQ邮箱、网易邮箱、阿里邮箱、新浪邮箱、Hotmail邮箱、Outlook邮箱、京东、淘宝、支付宝、中国移动、中国联通、中国电信、知乎、哔哩哔哩、网易云音乐、QQ好友资料齐全+详细文档+源码.zip 【备注】 1、该项目是个人高分项目源码,已获导师指导认可通过,答辩评审分达到95分 2、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 3、本项目适合计算机相关专业(人工智能、通信工程、自动化、电子信息、物联网等)的在校学生、老师或者企业员工下载使用,也可作为毕业设计、课程设计、作业、项目初期立项演示等,当然也适合小白学习进阶。 4、如果基础还行,可以在此代码基础上进行修改,以实现其他功能,也可直接用于毕设、课设、作业等。 欢迎下载,沟通交流,互相学习,共同进步!
资源推荐
资源详情
资源评论
收起资源包目录
基于集众多数据源于一身的爬虫工具箱,旨在安全快捷的帮助用户拿回自己的数据,工具代码开源,流程透明、资料齐全+详细文档+源码.zip (244个子文件)
index.css 601B
.DS_Store 6KB
12306.gif 2.25MB
jd.gif 1.37MB
document.gif 1.36MB
taobao.gif 1.14MB
bilibili.gif 1.12MB
alipay.gif 1.04MB
qqmail.gif 1.02MB
qqqun.gif 1023KB
wechatalbum.gif 769KB
hotmail.gif 753KB
alimail.gif 745KB
sinamail.gif 733KB
wangyimail.gif 686KB
jianshu.gif 452KB
csdn.gif 442KB
cloudmusic.gif 426KB
oschina.gif 369KB
cnblog.gif 358KB
zhihu.gif 354KB
chrome.gif 327KB
github.gif 322KB
.gitignore 54B
topic_wordcloud.html 30KB
postdate_line.html 7KB
index.html 3KB
index.html 973B
favicon.ico 15KB
cnblog.ipynb 7KB
jquery.js 282KB
oschinarun0.js 8KB
cnblogrun2.js 8KB
githubrun5.js 7KB
jianshurun2.js 7KB
FileSaver.js 6KB
index.js 3KB
cnblogrun1.js 2KB
githubrun1.js 733B
githubrun4.js 533B
githubrun3.js 532B
githubrun2.js 528B
jianshurun1.js 409B
cnblogrun0.js 202B
cnblog_article.json 109KB
cnblog_article.json 101KB
taobao_cookies.json 4KB
manifest.json 4KB
LICENSE 34KB
README.md 132KB
README.md 11KB
README_EN.md 7KB
bug_report.md 735B
_coverpage.md 513B
QuickStart.md 210B
feature_request.md 0B
.nojekyll 0B
infospider.png 314KB
tielu2.png 282KB
qqfriend3.png 266KB
alipay2.png 229KB
taobao2.png 214KB
wangyiemail2.png 184KB
jd2.png 183KB
screenshot.png 175KB
hotmail2.png 174KB
liantong2.png 169KB
infospider-logo.png 156KB
alimail2.png 145KB
sina2.png 140KB
qqqun4.png 74KB
qqfriend4.png 73KB
bilibili2.png 69KB
qqmail2.png 66KB
qqqun5.png 64KB
acnblog2.png 58KB
bilibili3.png 49KB
infospider2.png 47KB
yidong2.png 45KB
JetBrains.png 36KB
wechat-moments-album.png 27KB
momentsalbum1.png 27KB
jd4.png 25KB
cnblog3.png 23KB
qqqun6.png 23KB
qqqun7.png 22KB
chrome1.png 21KB
liantong3.png 20KB
qqmail3.png 19KB
sina3.png 19KB
cloudmusic3.png 19KB
wangyiemail3.png 19KB
alimail3.png 19KB
yidong3.png 19KB
github3.png 18KB
jd3.png 18KB
oschina3.png 18KB
momentsalbum2.png 18KB
jianshu3.png 18KB
qqqun3.png 18KB
共 244 条
- 1
- 2
- 3
资源评论
Yuki-^_^
- 粉丝: 3101
- 资源: 2952
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功