没有合适的资源?快使用搜索试试~ 我知道了~
java源码网络爬虫-serritor:Serritor是一个基于Selenium并用Java编写的开源Web爬网程序框架。它可...
共89个文件
java:79个
xml:2个
md:1个
需积分: 9 0 下载量 161 浏览量
2021-05-25
01:41:20
上传
评论
收藏 144KB ZIP 举报
温馨提示
java原始网络爬虫Serritor Serritor是一个基于Java并用Java编写的开源Web爬网程序框架。 它可用于对需要JavaScript呈现数据的动态网页进行爬网。 在构建中使用Serritor 玛文 将以下依赖项添加到pom.xml中: < dependency > < groupId >com.github.peterbencze</ groupId > < artifactId >serritor</ artifactId > < version >2.1.1</ version > </ dependency > Gradle 将以下依赖项添加到您的build.gradle中: compile group : ' com.github.peterbencze ' , name : ' serritor ' , version : ' 2.1.1 ' 手动依赖 页面上提供了独立的JAR文件。 文献资料 包含用法信息和示例 Javadoc可用 快速开始 Crawler抽象类提供了爬虫的基本实现,以最大程度地减少创建自己的爬虫的工作。 扩展类应实现搜寻器的逻辑。 在下面
资源推荐
资源详情
资源评论
收起资源包目录
serritor-master.zip (89个子文件)
serritor-master
.travis.yml 147B
pom.xml 10KB
checkstyle.xml 17KB
LICENSE 11KB
src
test
resources
__files
test-file 55B
mockito-extensions
org.mockito.plugins.MockMaker 17B
keystore.jks 2KB
java
com
github
peterbencze
serritor
internal
CrawlFrontierTest.java 14KB
stats
StatsCounterTest.java 7KB
CrawlDomainTest.java 2KB
crawldelaymechanism
FixedCrawlDelayMechanismTest.java 1KB
AdaptiveCrawlDelayMechanismTest.java 3KB
util
stopwatch
StopwatchTest.java 3KB
CookieConverterTest.java 2KB
CustomCallbackManagerTest.java 7KB
api
helper
UrlFinderTest.java 6KB
TextFinderTest.java 4KB
it
CrawlingIT.java 13KB
web
WebApiIT.java 44KB
TestCrawlerWithWebApi.java 3KB
TestCrawlerWithSecuredWebApi.java 4KB
main
resources
META-INF
services
org.eclipse.jetty.util.security.CredentialProvider 80B
java
com
github
peterbencze
serritor
internal
CrawlDomain.java 3KB
CrawlFrontier.java 8KB
stats
StatsCounterSnapshot.java 5KB
DurationSerializer.java 2KB
StatsCounter.java 9KB
crawldelaymechanism
CrawlDelayMechanism.java 958B
AdaptiveCrawlDelayMechanism.java 3KB
FixedCrawlDelayMechanism.java 1KB
RandomCrawlDelayMechanism.java 2KB
web
SecuredWebApi.java 8KB
socket
WebSocketSessionManager.java 3KB
WebSocketFactory.java 3KB
WebSocketHandlerWrapper.java 5KB
WebApi.java 8KB
http
HttpServlet.java 2KB
auth
BCryptCredential.java 1KB
JwtAuthenticator.java 13KB
JwtUserIdentity.java 2KB
JwtUserPrincipal.java 1KB
BCryptCredentialProvider.java 1KB
dto
ErrorDto.java 2KB
JwtDto.java 2KB
LoginDto.java 2KB
CsrfFilter.java 4KB
JsonErrorHandler.java 3KB
CrawlEvent.java 1KB
CustomCallbackManager.java 4KB
util
KeyFactory.java 2KB
stopwatch
TimeSource.java 997B
Stopwatch.java 3KB
UtcTimeSource.java 1KB
FunctionalReentrantReadWriteLock.java 3KB
CookieConverter.java 2KB
WebDriverFactory.java 4KB
api
CrawlCandidate.java 4KB
PatternMatchingCallback.java 2KB
CompleteCrawlResponse.java 2KB
CrawlStrategy.java 810B
CrawlerState.java 2KB
CrawlerWithSecuredWebApi.java 8KB
Browser.java 1KB
CrawlStats.java 10KB
CrawlDelayStrategy.java 824B
PartialCrawlResponse.java 3KB
web
User.java 4KB
WebApiException.java 1023B
socket
WebSocketHandler.java 3KB
SslContextConfiguration.java 3KB
ServerConfiguration.java 10KB
http
HttpMethod.java 804B
HttpHandler.java 1KB
AccessControlConfiguration.java 8KB
CrawlerWithWebApi.java 5KB
event
RequestRedirectEvent.java 2KB
ResponseSuccessEvent.java 2KB
NetworkErrorEvent.java 1KB
PageLoadTimeoutEvent.java 2KB
NonHtmlResponseEvent.java 2KB
ResponseErrorEvent.java 2KB
CrawlRequest.java 6KB
helper
UrlFinder.java 10KB
JsonReaderWriter.java 5KB
TextFinder.java 6KB
CrawlerConfiguration.java 16KB
Crawler.java 30KB
.gitignore 8B
README.md 4KB
共 89 条
- 1
资源评论
weixin_38745233
- 粉丝: 10
- 资源: 906
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功