gecco爬虫和spring结合使用.zip资源-CSDN文库

共11个文件

java：6个

xml：1个

gitignore：1个

版权申诉

爬虫

毕业设计

数据收集

159 浏览量 2024-03-23 19:53:33 上传评论收藏 7KB ZIP 举报

资源推荐

资源详情

资源评论

收起资源包目录

gecco爬虫和spring结合使用.zip （11个子文件）

WGT-code

pom.xml 5KB

src

test

resources

log4j.properties 268B

java

com

geccocrawler

gecco

spring

MyGithub.java 2KB

App.java 865B

main

java

com

geccocrawler

gecco

spring

ConsolePipeline.java 355B

SpringGeccoEngine.java 712B

SpringPipelineFactory.java 1KB

BeanConfigure.java 435B

LICENSE 1KB

.gitignore 40B

README.md 2KB

# gecco-spring gecco爬虫和spring结合使用。1.2.9版本开始支持spring-boot。spring升级到4.x。 ## Download <dependency> <groupId>com.geccocrawler</groupId> <artifactId>gecco-spring</artifactId> <version>x.x.x</version> </dependency> ![maven](https://img.shields.io/maven-central/v/com.geccocrawler/gecco-spring.svg?style=flat-square) ## 初始化Gecco 加载完成bean后启动Gecco，可以通过继承SpringGeccoEngine类，初始化你的GeccoEngine，需要特别注意的是GeccoEngine需要用非阻塞模式start()运行: @SpringBootApplication @Configuration public class App { @Bean public SpringGeccoEngine initGecco() { return new SpringGeccoEngine() { @Override public void init() { GeccoEngine.create() .pipelineFactory(springPipelineFactory) .classpath("com.geccocrawler.gecco.spring") .start("https://github.com/xtuhcy/gecco") .interval(3000) .loop(true) .start(); } }; } public static void main(String[] args) throws Exception { SpringApplication.run(App.class, args); } } ## 开发Pipeline pipeline的开发和之前一样，唯一不同的是不需要@PipelineName("consolePipeline")定义pipeline的名称，而是使用spring的@Service定义，spring的bean名称即为pipeline的名称。可以参考： @Service("consolePipeline") public class ConsolePipeline implements Pipeline<SpiderBean> { @Override public void process(SpiderBean bean) { System.out.println(JSON.toJSONString(bean)); } } 也可以使用@Configuration和@Bean定义pipeline。如： @Configuration public class BeanConfigure { @Bean(name="consolePipeline") public ConsolePipeline consolePipeline() { return new ConsolePipeline(); } } ## DEMO 参考源代码中测试用例src/test，有详细的例子

评论收藏

内容反馈

版权申诉