# scrapy_redis_mongodb
基于Python+scrapy+redis的分布式爬虫实现框架
#project start
运行run.py
#scrapy_news.py
主要功能是抓取种子url,保存到redis
#redis_mongo.py
主要是从redis里面读url,解析数据保存到mongodb
(拓展到其他机器,都是从redis里面读url)
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
爬虫python入门 scrapyredismongodb 基于Python+scrapy+redis的分布式爬虫实现框架 project start 运行run.py scrapy_news.py 主要功能是抓取种子url,保存到redis redis_mongo.py 主要是从redis里面读url,解析数据保存到mongodb (拓展到其他机器,都是从redis里面读url)
资源推荐
资源详情
资源评论
收起资源包目录
scrapy_redis_mongodb-master.zip (28个子文件)
scrapy_redis_mongodb-master
scrapy.cfg 284B
.idea
workspace.xml 46KB
misc.xml 215B
inspectionProfiles
profiles_settings.xml 228B
modules.xml 292B
scrapy_redis_mongodb.iml 398B
run.py 115B
.gitignore 14B
README.md 311B
scrapy_redis_mongodb
__init__.py 0B
pipelines.py 3KB
settings.pyc 775B
spiders
__init__.py 161B
master_scrapy_news.py 1KB
scrapy_news.pyc 2KB
TestSpider.py 664B
redis_mongo.pyc 1KB
__init__.pyc 166B
slave_redis_mongo.py 1KB
items.py 643B
middlewares
__init__.py 0B
RandomUserAgent.py 5KB
RandomUserAgent.pyc 5KB
__init__.pyc 170B
__init__.pyc 158B
pipelines.pyc 3KB
settings.py 5KB
items.pyc 788B
共 28 条
- 1
资源评论
码农飞哥
- 粉丝: 15w+
- 资源: 1910
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功