没有合适的资源?快使用搜索试试~ 我知道了~
纯python实现的Web爬虫框架 Scrapy.zip
共466个文件
py:292个
rst:72个
png:9个
需积分: 14 5 下载量 38 浏览量
2019-07-19
04:12:55
上传
评论
收藏 1.27MB ZIP 举报
温馨提示
Scrapy,Python开发的一个快速,高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据。Scrapy用途广泛,可以用于数据挖掘、监测和自动化测试。Scrapy吸引人的地方在于它是一个框架,任何人都可以根据需求方便的修改。它也提供了多种类型爬虫的基类,如BaseSpider、sitemap爬虫等,最新版本又提供了web2.0爬虫的支持。Scratch,是抓取的意思,这个Python的爬虫框架叫Scrapy,大概也是这个意思吧,就叫它:小刮刮吧。 标签:Scrapy
资源推荐
资源详情
资源评论
收起资源包目录
纯python实现的Web爬虫框架 Scrapy.zip (466个子文件)
scrapy.1 2KB
AUTHORS 1KB
html-gzip.bin 8KB
html-zlibdeflate.bin 8KB
html-rawdeflate.bin 8KB
html-br.bin 4KB
Makefile.buildbot 726B
feed-sample1.xml.bz2 1KB
scrapy.cfg 273B
.bumpversion.cfg 124B
setup.cfg 91B
changelog 136B
compat 2B
example-com.conf 3KB
control 880B
copyright 2KB
.coveragerc 72B
localhost.crt 1KB
localhost.ip.crt 1KB
feed-sample6.csv 101B
feed-sample3.csv 81B
feed-sample5.csv 47B
feed-sample4.csv 45B
scrapy.docs 19B
test.egg 2KB
.gitignore 177B
truncated-crc-error.gz 6KB
unexpected-eof.gz 5KB
truncated-crc-error-short.gz 2KB
feed-sample1.xml.gz 1KB
layout.html 1KB
sgml_linkextractor.html 643B
selectors-sample1.html 565B
linkextractor_latin1.html 538B
linkextractor_noenc.html 324B
index.html 246B
item1.html 163B
item2.html 162B
MANIFEST.in 486B
tox.ini 3KB
pytest.ini 135B
INSTALL 156B
scrapy.install 124B
scrapy-logo.jpg 23KB
localhost.ip.key 2KB
localhost.key 2KB
LICENSE 1KB
scrapy.lintian-overrides 106B
Makefile 3KB
scrapy.manpages 16B
CODE_OF_CONDUCT.md 3KB
CONTRIBUTING.md 303B
NEWS 18B
scrapy_architecture.odg 19KB
mitmproxy-ca.pem 2KB
example-com.key.pem 2KB
example-com.cert.pem 2KB
scrapy_architecture.png 90KB
network_02.png 81KB
scrapy_architecture_02.png 53KB
inspector_01.png 53KB
network_03.png 44KB
python-logo-master-v3-TM-flattened.png 11KB
network_01.png 10KB
python-powered-h-50x65.png 3KB
scrapy.png 3KB
test_http_request.py 57KB
test_downloader_handlers.py 40KB
test_spidermiddleware_referer.py 39KB
test_loader.py 30KB
test_feedexport.py 28KB
test_http_response.py 26KB
test_linkextractors.py 25KB
test_downloadermiddleware_httpcache.py 24KB
test_spider.py 24KB
http11.py 21KB
test_utils_url.py 19KB
test_utils_iterators.py 18KB
test_exporters.py 18KB
files.py 17KB
__init__.py 17KB
httpcache.py 17KB
test_pipeline_files.py 16KB
test_pipeline_media.py 16KB
__init__.py 16KB
test_spidermiddleware_output_chain.py 16KB
test_pipeline_images.py 15KB
test_webclient.py 14KB
test_downloadermiddleware_redirect.py 14KB
referer.py 13KB
crawler.py 13KB
engine.py 13KB
exporters.py 12KB
test_crawl.py 12KB
python.py 12KB
test_commands.py 11KB
test_engine.py 11KB
test_linkextractors_deprecated.py 11KB
feedexport.py 11KB
test_scheduler.py 11KB
共 466 条
- 1
- 2
- 3
- 4
- 5
资源评论
weixin_39841848
- 粉丝: 512
- 资源: 1万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功