### QQSpider
基于 Python 的 QQ 空间爬虫程序
#### 使用
Linux 平台:
- 安装 PhantomJS
Windows 平台:
- 下载 PhantomJS 驱动程序,放在`login`目录下
环境要求:
- Python 3
- PhantomJS 2.1.1
- `pip install -r requirements.txt`
运行方式:
- 修改`main.py`的账号密码
- 修改 `db/db.py` 数据库密码
- `python3 main.py`
#### 特性
#### version 2.1
> 2017.09.10 更新
- add 支持 Linux 平台
- add 支持登录过程出现验证码的情况
- fix 修复一些 bug
#### version 2.0
> 2017.08.27 更新
由于 qq 加密算法改动,通过 qqlib 登录的方式已失效,各种测试后发现变化还挺大的,没摸清加密细节,故删去此模块。改为通过 selenium 登录,加载的是 phantomjs 驱动程序,在网络不畅的情况下可能会比较缓慢
- qqlib 失效,改用 selenium 调用 phantomjs 登录
- 支持 python3
- 修改代码规范,改进一些 bug
部分运行截图
登录
![](https://raw.githubusercontent.com/kylingit/QQSpider/master/screenshot/snipaste08262333.png)
爬取说说
![](https://raw.githubusercontent.com/kylingit/QQSpider/master/screenshot/snipaste08262330.png)
![](https://raw.githubusercontent.com/kylingit/QQSpider/master/screenshot/snipaste08262331.png)
读取当前状态
![](https://raw.githubusercontent.com/kylingit/QQSpider/master/screenshot/snipaste08272248.png)
![](https://raw.githubusercontent.com/kylingit/QQSpider/master/screenshot/snipaste08262332.png)
#### version 1.0
> 2017.07 由于 qq 加密算法改动,qqlib 登录已失效
- 基于 [qqlib](https://github.com/gera2ld/qqlib),通过账号密码登录,支持验证码处理
- cookie 保存功能。第一次登录成功后保存 cookie 到文件,在 cookie 有效期内可以从文件读取 cookie 登录
- 断点续爬。程序运行的时候如果由于异常原因退出,会保存当前爬取的状态,重新运行程序的时候会检测上一次爬取的位置,从当前位置开始继续爬取,避免重复爬取
- 数据统计分析功能。这部分是扩展的,结合可视化软件可以展示一些统计结果
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
### QQSpider 基于 Python 的 QQ 空间爬虫程序 #### 使用 Linux 平台: - 安装 PhantomJS Windows 平台: - 下载 PhantomJS 驱动程序,放在`login`目录下 环境要求: - Python 3 - PhantomJS 2.1.1 - `pip install -r requirements.txt` 运行方式: - 修改`main.py`的账号密码 - 修改 `db/db.py` 数据库密码 - `python3 main.py` #### 特性 -------- 该资源内项目源码是个人的毕设,代码都测试ok,都是运行成功后才上传资源,答辩评审平均分达到96分,放心下载使用! <项目介绍> 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可用于毕设、课设、作业等。 下载后请首先打开README.md文件(如有),仅供学习参考, 切勿用于商业用途。 --------
资源推荐
资源详情
资源评论
收起资源包目录
基于 Python 的 QQ 空间爬虫程序.zip (26个子文件)
code
qq
qq.py 410B
__init__.py 0B
main.py 2KB
screenshot
snipaste08272248.png 82KB
snipaste08262333.png 8KB
snipaste08262332.png 15KB
snipaste08262331.png 28KB
snipaste08262330.png 60KB
messages
__init__.py 0B
get_messages.py 6KB
blogs
__init__.py 0B
get_blogs.py 683B
requirements.txt 25B
moods
__init__.py 0B
get_moods.py 13KB
friends
__init__.py 0B
get_friends.py 5KB
util
__init__.py 0B
util.py 2KB
README.md 2KB
status
__init__.py 0B
status.py 5KB
login
__init__.py 0B
login.py 5KB
db
__init__.py 0B
db.py 2KB
共 26 条
- 1
资源评论
奋斗奋斗再奋斗的ajie
- 粉丝: 1198
- 资源: 2908
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功