# FEAPDER
![](https://img.shields.io/badge/python-3.6-brightgreen)
![](https://img.shields.io/github/watchers/Boris-code/feapder?style=social)
![](https://img.shields.io/github/stars/Boris-code/feapder?style=social)
![](https://img.shields.io/github/forks/Boris-code/feapder?style=social)
[![Downloads](https://pepy.tech/badge/feapder)](https://pepy.tech/project/feapder)
[![Downloads](https://pepy.tech/badge/feapder/month)](https://pepy.tech/project/feapder)
[![Downloads](https://pepy.tech/badge/feapder/week)](https://pepy.tech/project/feapder)
## 简介
1. feapder是一款上手简单,功能强大的Python爬虫框架,内置AirSpider、Spider、TaskSpider、BatchSpider四种爬虫解决不同场景的需求。
2. 支持断点续爬、监控报警、浏览器渲染、海量数据去重等功能。
3. 更有功能强大的爬虫管理系统feaplat为其提供方便的部署及调度
读音: `[ˈfiːpdə]`
![feapder](http://markdown-media.oss-cn-beijing.aliyuncs.com/2023/09/04/feapder.jpg)
## 文档地址
- 官方文档:https://feapder.com
- github:https://github.com/Boris-code/feapder
- 更新日志:https://github.com/Boris-code/feapder/releases
- 爬虫管理系统:http://feapder.com/#/feapder_platform/feaplat
## 环境要求:
- Python 3.6.0+
- Works on Linux, Windows, macOS
## 安装
From PyPi:
精简版
```shell
pip install feapder
```
浏览器渲染版:
```shell
pip install "feapder[render]"
```
完整版:
```shell
pip install "feapder[all]"
```
三个版本区别:
1. 精简版:不支持浏览器渲染、不支持基于内存去重、不支持入库mongo
2. 浏览器渲染版:不支持基于内存去重、不支持入库mongo
3. 完整版:支持所有功能
完整版可能会安装出错,若安装出错,请参考[安装问题](docs/question/安装问题.md)
## 小试一下
创建爬虫
```shell
feapder create -s first_spider
```
创建后的爬虫代码如下:
```python
import feapder
class FirstSpider(feapder.AirSpider):
def start_requests(self):
yield feapder.Request("https://www.baidu.com")
def parse(self, request, response):
print(response)
if __name__ == "__main__":
FirstSpider().start()
```
直接运行,打印如下:
```shell
Thread-2|2021-02-09 14:55:11,373|request.py|get_response|line:283|DEBUG|
-------------- FirstSpider.parse request for ----------------
url = https://www.baidu.com
method = GET
body = {'timeout': 22, 'stream': True, 'verify': False, 'headers': {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/27.0.1453.93 Safari/537.36'}}
<Response [200]>
Thread-2|2021-02-09 14:55:11,610|parser_control.py|run|line:415|DEBUG| parser 等待任务...
FirstSpider|2021-02-09 14:55:14,620|air_spider.py|run|line:80|INFO| 无任务,爬虫结束
```
代码解释如下:
1. start_requests: 生产任务
2. parse: 解析数据
## 参与贡献
贡献之前请先阅读 [贡献指南](./CONTRIBUTING.md)
感谢所有做过贡献的人!
<a href="https://github.com/Boris-code/feapder/graphs/contributors">
<img src="https://contrib.rocks/image?repo=Boris-code/feapder" />
</a>
## 爬虫工具推荐
1. 爬虫在线工具库:http://www.spidertools.cn
2. 爬虫管理系统:http://feapder.com/#/feapder_platform/feaplat
3. 验证码识别库:https://github.com/sml2h3/ddddocr
## 微信赞赏
如果您觉得这个项目帮助到了您,您可以帮作者买一杯咖啡表示鼓励 🍹
也可和作者交个朋友,解决您在使用过程中遇到的问题
![赞赏码](http://markdown-media.oss-cn-beijing.aliyuncs.com/2021/03/16/zan-shang-ma.png)
## 学习交流
<table border="0">
<tr>
<td> 知识星球:17321694 </td>
<td> 作者微信: boris_tm </td>
<td> QQ群号:521494615</td>
</tr>
<tr>
<td> <img src="http://markdown-media.oss-cn-beijing.aliyuncs.com/2020/02/16/zhi-shi-xing-qiu.jpeg" width=250px>
</td>
<td> <img src="http://markdown-media.oss-cn-beijing.aliyuncs.com/2021/07/12/er-wei-ma.jpeg?x-oss-process=style/markdown-media" width="250px" /> </td>
<td> <img src="http://markdown-media.oss-cn-beijing.aliyuncs.com/2024/04/28/17142933285892.jpg" width="250px" /> </td>
</tr>
</table>
加好友备注:feapder
没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论
收起资源包目录
feapder是一款支持分布式、批次采集、任务防丢、报警丰富的python爬虫框架 (243个子文件)
vue.css 12KB
.gitignore 157B
index.html 6KB
favicon.ico 4KB
MANIFEST.in 231B
aliyun_sale.jpg 72KB
stealth.min.js 162KB
docsify.min.js 68KB
search.js 12KB
prism-bash.js 8KB
intercept.js 6KB
docsify-copy-code.min.js 4KB
prism-sql.js 3KB
prism-java.js 2KB
prism-python.js 2KB
docsify-edit-on-github.js 2KB
prism-yaml.js 1KB
ga.js 934B
LICENSE 1KB
cmdline.md 13KB
BatchSpider.md 12KB
feaplat.md 12KB
AirSpider.md 11KB
custom_downloader.md 10KB
配置文件.md 9KB
Spider进阶.md 8KB
BatchSpider进阶.md 8KB
feaplat_bak.md 8KB
浏览器渲染-Playwright.md 8KB
浏览器渲染-Selenium.md 8KB
Spider.md 7KB
爬虫集成.md 6KB
Response.md 5KB
Request.md 5KB
UserPool.md 5KB
10分钟上手.md 5KB
README.md 4KB
usage.md 4KB
BatchParser.md 4KB
README.md 4KB
question.md 4KB
TaskSpider.md 4KB
dedup.md 4KB
MongoDB.md 3KB
报警及监控.md 3KB
BaseParser.md 3KB
功能概览.md 3KB
使用前必读.md 3KB
Item.md 2KB
proxy.md 2KB
MysqlDB.md 2KB
监控打点.md 2KB
pipeline.md 2KB
README.md 2KB
_sidebar.md 2KB
架构设计.md 2KB
UpdateItem.md 2KB
CHECK_DATA.md 2KB
RedisDB.md 1KB
运行问题.md 1KB
logger.md 1KB
setting不生效问题.md 1KB
安装问题.md 800B
CONTRIBUTING.md 614B
feature_request.md 595B
_coverpage.md 460B
_navbar.md 403B
tools.md 294B
bug_report.md 287B
请求问题.md 236B
README.md 81B
README.md 81B
.nojekyll 0B
user_agent.py 127KB
tools.py 73KB
batch_spider.py 48KB
parser_control.py 32KB
redisdb.py 30KB
task_spider.py 27KB
proxy_pool_old.py 22KB
scheduler.py 21KB
request.py 18KB
selenium_driver.py 18KB
metrics.py 16KB
mongodb.py 16KB
item_buffer.py 14KB
spider.py 13KB
response.py 12KB
bloomfilter.py 12KB
setting.py 11KB
mysqldb.py 11KB
gold_user_pool.py 11KB
playwright_driver.py 9KB
setting.py 9KB
setting.py 9KB
normal_user_pool.py 8KB
log.py 8KB
__init__.py 6KB
base_parser.py 6KB
base_user_pool.py 6KB
共 243 条
- 1
- 2
- 3
资源评论
流月up
- 粉丝: 1742
- 资源: 182
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功