没有合适的资源?快使用搜索试试~ 我知道了~
ScriptSpider:一个java版本的分布式的通用爬虫,可以插拔各个组件(提供默认的)
共34个文件
java:28个
md:2个
xml:2个
5星 · 超过95%的资源 需积分: 9 1 下载量 37 浏览量
2021-05-02
22:28:55
上传
评论
收藏 50KB ZIP 举报
温馨提示
ScriptSpider ScriptSpider(以下简称SS),做一个好用的爬虫框架。 目前的功能已经够大多数情况下使用,ScriptSpider会朝着易用、高度、最新技术的方向发展! 欢迎 Star 和 Fork 我的项目! 项目主页 国外: 国内: 特点 Java开发(学习java的良方) 易理解(中文注释,多样例代码) 易用性(最短一行代码就可以开始爬虫) 代码少(已经默认实现了大部分功能) 基于Jsoup(个性化解析网页方便) 高度扩展性(热插拔组件,可定制每一个流程) 速度快(多线程爬虫,线程池管理,线程池下载,分布式) 分布式(基于redis,mq等,部署简单,速度很快) 使用情况 近12个月maven中央仓库使用情况。 安装 使用maven <dependency> <groupId>com.github.xjtushilei</groupId> <art
资源推荐
资源详情
资源评论
收起资源包目录
ScriptSpider-master.zip (34个子文件)
ScriptSpider-master
pom.xml 5KB
LICENSE 10KB
src
test
java
com
github
xjtushilei
test1.java 99B
main
resources
logback.xml 642B
java
com
github
xjtushilei
example
PriorityQueueSpider.java 4KB
SimpleSpider.java 4KB
MiniSpider.java 393B
MiniRegexSpider.java 526B
RedisSpider.java 3KB
百科名医
页面解析器.java 2KB
百科名医爬虫入口.java 969B
结果保存器.java 1KB
core
scheduler
PreDefine
QueueScheduler.java 1KB
PriorityQueueScheduler.java 1KB
RedisScheduler.java 4KB
Scheduler.java 450B
downloader
PreDefine
HttpClientPoolDownloader.java 540B
Downloader.java 338B
pageprocesser
PreDefine
TextPageProcessor.java 1KB
PageProcessor.java 924B
saver
PreDefine
ConsoleSaver.java 414B
Saver.java 182B
Spider.java 6KB
model
RegexRule.java 3KB
UrlSeed.java 2KB
Page.java 3KB
contentextractor
ContentExtractor.java 2KB
utils
JsonUtils.java 1KB
TimeSleep.java 648B
HttpUtils.java 13KB
RedisUtils.java 2KB
.gitignore 250B
HowToStart.md 19KB
README.md 4KB
共 34 条
- 1
资源评论
- weixin_457293962021-06-16请问下流程图楼主有吗
w4676
- 粉丝: 23
- 资源: 4620
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功