# Spiders ReadMe
- videoapp
- [videoapp项目说明](./.github/videoapp.md)
- bilibili
- [bilibili项目说明](./.github/bilibili.md)
- docker_bilibili
- [docker_bilibili项目说明](./.github/docker-bilibili.md)
- scripts
- [scripts文件说明](./.github/scripts.md)
- jsparse
- [jsparse文件说明](./.github/jsparse.md)
### 同时执行所有 spider 的实现
```
1.新建命令文件夹commands,目录下新建crawlall.py
2.需在settings里配置 COMMANDS_MODULE = 'project.commands'
3.命令行中执行启动所有spider:scrapy crawlall
原理:
通过加载用户初始化的 crawler_process.spiders 获取列表下的所有spider的name,然后遍历list 分别crawl
```
### scrapy 命令行实现断点续爬
```
断点续爬 scrapy crawl spider_name -s JOBDIR=crawls/spider_name
详细见开发者文档:
https://doc.scrapy.org/en/latest/topics/jobs.html?highlight=jobdir
```
没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论
收起资源包目录
多个网站数据采集实现_Spiders.zip (181个子文件)
scrapy.cfg 265B
scrapy.cfg 259B
scrapy.cfg 259B
scrapy.cfg 259B
command 176B
comments.csv 1.3MB
Dockerfile 257B
chromedriver.exe 9.17MB
.gitignore 2KB
introduct 4KB
fanyi.min.js 476KB
LICENSE 11KB
bilibili.md 1KB
docker-bilibili.md 955B
README.md 949B
videoapp.md 897B
jsparse.md 601B
scripts.md 545B
README.md 67B
kuaishou.proto 5KB
__init__.py 367KB
kuaishou_pb2.py 66KB
url_file.py 61KB
tbdSpider.py 48KB
kol.py 45KB
qqtv.py 21KB
mgtv.py 14KB
monitor.py 14KB
config.py 14KB
iqiyi.py 12KB
get_baidu_index_example.py 12KB
baidu.py 12KB
url_file.py 11KB
js_xingTu.py 9KB
xd.py 9KB
config.py 9KB
aboutLaunch.py 7KB
middlewares.py 7KB
middlewares.py 7KB
xinmeibao.py 7KB
baiduIndex.py 7KB
aiohttp_websocket.py 6KB
auto_xinGTu.py 6KB
kuaishou.py 6KB
kolVideo.py 5KB
kolVideo.py 5KB
douYuLiveStream.py 4KB
digitalIngClass.py 4KB
kolUser.py 4KB
kolUser.py 4KB
ipCheck.py 4KB
middlewares.py 4KB
meijiexia.py 4KB
__init__.py 4KB
settings.py 4KB
settings.py 4KB
weiboVipInfo.py 4KB
user.py 4KB
youku.py 4KB
user.py 4KB
getResponse.py 4KB
middlewares.py 4KB
settings.py 3KB
items.py 3KB
items.py 3KB
settings.py 3KB
js_youDao.py 3KB
user_info.py 3KB
huYaLiveStream.py 3KB
crawl_bili.py 3KB
getYyInfo.py 3KB
bili_relation.py 3KB
laiteb_websocket_client.py 3KB
dbMongo.py 3KB
db.py 3KB
deal_mongo.py 3KB
bos_filter.py 3KB
bos_filter.py 3KB
main.py 2KB
comment.py 2KB
comment.py 2KB
kol_init.py 2KB
kol_init.py 2KB
__init__.py 2KB
biliNav.py 2KB
bili_redis.py 2KB
redis_init.py 2KB
redis_init.py 2KB
dela_redis_to_big.py 2KB
bos_filter.py 2KB
bili_nav.py 2KB
relationship.py 2KB
relation.py 1KB
dbmongo.py 1KB
distributedGetTitle.py 1KB
pipelines.py 1KB
aiowebsocket_run.py 1KB
init_ks_kol.py 1KB
laiteb_aiowebsocket.py 1KB
dbredis.py 1KB
共 181 条
- 1
- 2
资源评论
好家伙VCC
- 粉丝: 2107
- 资源: 9145
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功