lojob-spider
Python
Python
共25个文件
py: 19
md: 2
gitignore: 1
LICENSE: 1
txt: 1
cfg: 1
小机灵鬼阅读器爬虫端,使用 scrapy 爬取小说数据,清理数据,支持爬取千夜阁、知轩藏书等网站。演示地址:https://book.gremlins-book.com。
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
本项目是一款基于Scrapy框架的lojob-spider小说数据爬虫设计源码,包含25个文件,其中包括19个Python源文件、2个Markdown文档、1个Git忽略规则文件、1个LICENSE文件、1个文本文件、1个配置文件。该爬虫专门用于小机灵鬼阅读器,支持从千夜阁、知轩藏书等网站爬取小说数据,并进行数据清理。演示地址为:https://book.gremlins-book.com。
资源推荐
资源详情
资源评论
收起资源包目录
upload.zip (25个子文件)
tool
addUuid.py 155B
unique.py 556B
scale.py 594B
merge.py 4KB
do.py 1KB
test.py 544B
doTitle.py 530B
book
__init__.py 0B
pipelines.py 1KB
spiders
zxcs.py 3KB
__init__.py 161B
biqugen.py 566B
qianyege .py 1KB
qianyege-2.py 3KB
biqooge.py 658B
biqg.py 1KB
tool.py 276B
items.py 851B
settings.py 4KB
middlewares.py 4KB
LICENSE 34KB
scrapy.cfg 251B
requirements.txt 2KB
.gitignore 5B
json
bak
readme.txt 290B
共 25 条
- 1
资源评论
lsx202406
- 粉丝: 1834
- 资源: 3858
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 基于 OpenCV打包以并行读取多个 rtsp 相机
- 基于springboot之篮球论坛系统.zip
- tvm4j-core-0.0.1-SNAPSHOT.jar
- 基于springboot之篮球竞赛预约平台.zip
- Python命令行参数处理及argparse应用实例(包含详细的完整的程序和数据)
- Python面向对象与模块化:构建宠物管理系统的实战案例(包含详细的完整的程序和数据)
- 计算机视觉中人脸检测技术的Python实现及其应用(包含详细的完整的程序和数据)
- TestSonya,Qt判断文本编码格式(支持UTF-8、UTF-16LE/BE、GBK等格式)
- LabVIEW编程入门与进阶技术详解
- 基于链表的联系人管理系统的设计与实现(包含详细的完整的程序和数据)
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功