# PySpider v2.0
## 爬取代理ip
起因:我这次是准备爬取‘高匿的ip’,做一个ip库,方便后面的爬虫。这是因为,很多网站或者api接口,都设置了‘访问间隔时间’(一个ip有访问次数的限制,超过次数就需要进入‘冷却CD’)。所以,用我的真实ip,无法高效、快速的爬取内容。
因为工作中使用tornado框架,它带一个很好用的HTTPClient的库,所以这次我就直接用它来完成,爬代理ip的工作。
## 运行
- 安装依赖的库:`pip install -r requirements.txt`
- `python get_proxy.py`
## TODO
升级成异步的爬虫。
没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论
收起资源包目录
Python爬虫的学习历程.zip (29个子文件)
code_resource_010
Spider1.0.py 5KB
Spider v2.5
client_config.py 494B
requirements.txt 35B
spider.py 6KB
README.md 484B
GitHubSpider
github_model.py 1KB
base_spider.py 1KB
tiobe_models.py 1KB
proxy_config.py 3KB
main.py 275B
proxyspider.py 7KB
github_spider.py 6KB
tiobe_spider.py 6KB
tasks.py 333B
config.py 250B
tiobeSpider
.DS_Store 6KB
base_spider.py 1KB
main.py 376B
models.py 1KB
tiobe_spider.py 6KB
tasks.py 226B
config.py 249B
.gitignore 742B
README.md 39B
Spider v2.0
get_proxy.py 1KB
client_config.py 775B
requirements.txt 28B
spider.py 2KB
README.md 640B
共 29 条
- 1
资源评论
LeapMay
- 粉丝: 2w+
- 资源: 2304
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功