没有合适的资源?快使用搜索试试~ 我知道了~
ubk_spider_2015:银联信内部采集程序2015版
共93个文件
java:73个
xml:10个
prefs:4个
需积分: 5 0 下载量 30 浏览量
2021-04-28
07:08:33
上传
评论
收藏 974KB ZIP 举报
温馨提示
##银联信内部采集程序2015版 ###简介 这个主要是采集一些指定网址的新闻。 获取网页用的httpclient。 解析用的jsoup。 主要依赖cssPath。 数据保存在了mysql 中。 到目前为止 已经保存了3000万去重后的数据了。
资源推荐
资源详情
资源评论
收起资源包目录
ubk_spider_2015-master.zip (93个子文件)
ubk_spider_2015-master
src
main
resources
generatorConfig.xml 2KB
applicationContext.xml 2KB
log4j.properties 985B
mybatis.xml 2KB
class.sql 7.21MB
ptf_crawl.sql 7KB
java
com
unbank
quartz
StartCrawlQuartzJobBeanQuartzJobBean.java 836B
process
NewsListWorkShop.java 1KB
WebPageWorkShop.java 1KB
ArticleWorkShop.java 1KB
StoreWorkShop.java 1002B
BaseWorkShop.java 801B
WebsiteInfoQuartzByTimeWorkShop.java 1KB
entity
NewsInfoMiddleWare.java 2KB
filter
nextPage
CnrNextPageFilter.java 2KB
NextPageFilterLocator.java 912B
TianjinweNextPageFilter.java 2KB
FinancenunNextPageFilter.java 2KB
LangyaNextPageFilter.java 1KB
CsNextPageFilter.java 2KB
SinotfNextPageFilter.java 2KB
BuildhrNextPageFilter.java 1KB
CangNextPageFilter.java 1KB
FlleasingNextPageFilter.java 2KB
YuanlinNextPageFilter.java 2KB
NextPageBaseFilter.java 397B
CfiNextPageFilter.java 2KB
CeNextPageFilter.java 3KB
CcidnetNextPageFilter.java 1KB
NextPageFilter.java 397B
HexunNextPageFilter.java 4KB
FilterLocator.java 346B
code
CodingBaseFilter.java 979B
url
URLBaseFilter.java 2KB
title
TitleBySqlFilter.java 1KB
content
ContentBaseFilter.java 9KB
ContentBySQLFilter.java 2KB
mybatis
entity
WebSiteInfo.java 15KB
WebSiteInfoExample.java 42KB
WebsiteParserExample.java 38KB
ArticleInfoExample.java 27KB
WebsiteParser.java 13KB
EveryWebDayNum.java 3KB
ArticleContentExample.java 9KB
EveryDayNum.java 2KB
ArticleInfo.java 9KB
ArticleContent.java 2KB
EveryWebDayNumExample.java 15KB
EveryDayNumExample.java 13KB
dao
WebsiteParserMapper.java 3KB
WebSiteInfoMapper.xml 18KB
WebSiteInfoMapper.java 3KB
ArticleInfoMapper.java 3KB
WebsiteParserMapper.xml 18KB
MyBatisConnectionFactory.java 709B
ArticleContentMapper.java 4KB
EveryWebDayNumMapper.java 3KB
EveryDayNumMapper.java 3KB
EveryWebDayNumMapper.xml 10KB
ArticleInfoMapper.xml 14KB
ArticleContentMapper.xml 10KB
EveryDayNumMapper.xml 9KB
tools
DateTools.java 10KB
MD5.java 1KB
parser
ContentPaser.java 2KB
WebPagePaser.java 2KB
BasePaser.java 600B
TitlePaser.java 1KB
NextPageUrlPaser.java 5KB
NewsDatePaser.java 5KB
worker
WebPageProducer.java 957B
ArticleInfoProducer.java 1KB
ArticleInfoConsumer.java 2KB
NewsListProducer.java 4KB
WebSiteInfoProductor.java 323B
fetch
ImageFetch.java 3KB
DocumentByJsoupFetch.java 623B
HttpClientBuilder.java 7KB
Fetcher.java 6KB
store
ArticleInfoReader.java 1KB
WebsiteParserReader.java 1KB
ArticleInfoStore.java 3KB
WebSiteInfoReader.java 1KB
UnbankQuartzConsole.java 840B
spider
UnbankQuartzByTimeCrawler.java 3KB
.classpath 650B
.settings
org.eclipse.m2e.core.prefs 91B
org.eclipse.core.resources.prefs 93B
org.maven.ide.eclipse.prefs 218B
org.eclipse.jdt.core.prefs 243B
pom.xml 8KB
README.md 278B
.project 773B
共 93 条
- 1
资源评论
起名什么的最烦啦
- 粉丝: 20
- 资源: 4639
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功