没有合适的资源?快使用搜索试试~ 我知道了~
iticrawler:开源网络爬虫框架
共53个文件
java:46个
xml:2个
license:1个
需积分: 10 0 下载量 72 浏览量
2021-06-03
01:32:51
上传
评论
收藏 80KB ZIP 举报
温馨提示
爬虫 用于网络爬虫的开源框架。 查看如何使用代码: : 在以下位置找到 javadoc: : 特征: - 易于通过流下载使用内容。 - 前沿存储的多种实现,在内存中,在磁盘上,内存磁盘交换和分布式(实验性) 参考: [1]:实现 LFU 缓存驱逐: :
资源推荐
资源详情
资源评论
收起资源包目录
iticrawler-master.zip (53个子文件)
iticrawler-master
pom.xml 7KB
LICENSE 11KB
src
main
resources
log4j2.xml 2KB
crawler.properties 444B
cassandra-template.yaml 36KB
java
com
itiniu
iticrawler
config
DistMapConfig.java 971B
ConfigLoader.java 5KB
ClusterConfig.java 2KB
ConfigSingleton.java 5KB
DistQueueConfig.java 896B
crawler
rotottxt
RobotsTxtUnawareCache.java 606B
DistributedRobotsTxtCache.java 1KB
crawlercommons
RobotRule.java 2KB
SimpleRobotRulesParser.java 23KB
BaseRobotsParser.java 2KB
SimpleRobotRules.java 9KB
RobotRulesMode.java 133B
BaseRobotRules.java 4KB
RobotsTxtCache.java 369B
Page.java 5KB
CrawlController.java 8KB
frontier
CrawledURLCache.java 2KB
DistributedScheduledURLCache.java 2KB
Frontier.java 837B
DistributedFrontier.java 3KB
DistributedCrawledURLCache.java 3KB
ScheduledURLCache.java 630B
Crawler.java 15KB
exceptions
NoCrawlBehaviorProvidedException.java 425B
InputStreamPageExtractionException.java 523B
httptools
inte
IHttpConnectionManager.java 428B
impl
GzipEncodedResponseInterceptor.java 1KB
GzipEncodedRequestInterceptor.java 678B
URLCanonicalizer.java 6KB
URLInfo.java 5KB
HttpPoolingConnectionManager.java 5KB
behaviors
crawler
CrawlBehavior.java 3KB
robotstxt
RobotsTxtBehavior.java 456B
RobotTxtUnawareBehavior.java 631B
RobotTxtAwareBehavior.java 3KB
factories
RobotTxtStorageFactory.java 885B
FrontierFactory.java 829B
util
StorageCluster.java 9KB
CrawledURLStore.java 3KB
enums
PageExtractionType.java 248B
EvictionPolicy.java 137B
RobotsTxtStore.java 3KB
serialization
URLInfoSerializer.java 2KB
SimpleRobotRulesSerializer.java 2KB
ScheduledURLStore.java 3KB
CrawledHostStore.java 2KB
.gitignore 50B
README.md 464B
共 53 条
- 1
资源评论
两只妖精同上树
- 粉丝: 30
- 资源: 4747
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功