没有合适的资源?快使用搜索试试~ 我知道了~
python 多线程爬虫
共6个文件
gitignore:1个
txt:1个
md:1个
需积分: 32 17 下载量 18 浏览量
2017-04-06
17:30:03
上传
评论
收藏 130KB ZIP 举报
温馨提示
爬取结果 user.txt 是爬取的博主用户名结果, source.txt 是视频地址集 原理 根据一个热门博主的 usename, 脚本自动会获取博主转过文章的其他博主的 username,并放入爬取队列中,递归爬取。 申明 这是一个正经的爬虫(严肃脸),爬取的资源跟你第一个填入的 username 有很大关系,另外由于某些原因,导致 tumblr 被墙,所以最简单的方式就是用国外 vps 去跑。
资源推荐
资源详情
资源评论
收起资源包目录
tumblr_spider-master.zip (6个子文件)
tumblr_spider-master
tumblr.py 3KB
snapshoots
results.png 132KB
LICENSE 1KB
requirements.txt 28B
.gitignore 1KB
README.md 786B
共 6 条
- 1
资源评论
GeekyGuru
- 粉丝: 1554
- 资源: 1099
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功