没有合适的资源?快使用搜索试试~ 我知道了~
web-crawler:简单的搜寻器,可从url mail-archives.apache.orgmod_mboxmaven-u...
共32个文件
java:20个
prefs:3个
properties:2个
需积分: 5 0 下载量 150 浏览量
2021-05-08
22:38:15
上传
评论
收藏 70KB ZIP 举报
温馨提示
网络爬虫 简单的抓取工具,可从url抓取和下载指定年份的所有邮件: : 。 该项目必须具有一个构建系统,并且该构建系统应创建一个具有定义的应用程序入口点的jar(java -jar crawler-jar-with-dependencies.jar [opts]应该可以工作,假设crawler.jar是由Java创建的jar。构建系统) 工具: Maven JDK Jsoup JUnit Eclipsese IDE 迭代: 时间:1周可交付时间:可下载所有邮件的有效爬虫(编码:3天,测试:2天)。 时间:2周可交付时间:通用爬网程序,如果有任何邮件,它可以从指定的url下载所有邮件。 应用程序输入和输出概述: 对于普通履带 Input : Year in the format of 'YYYY' Validation : Application should v
资源推荐
资源详情
资源评论
收起资源包目录
web-crawler-master.zip (32个子文件)
web-crawler-master
.gitignore 8B
WebCrowlerDesignDocument.doc 74KB
src
main
resources
log4j.properties 750B
crawler.properties 415B
java
com
imaginea
crawler
Crawler.java 173B
dao
MailDao.java 172B
MailDaoImpl.java 1KB
Mail.java 1KB
util
CrawlerUtil.java 3KB
CrawlerConsumer.java 2KB
CrawlerImpl.java 2KB
loader
MailLoadThread.java 554B
DocumentLoader.java 1KB
CrawlerProducer.java 2KB
CrawlerLeg.java 3KB
PageLoader.java 168B
PageLoaderImpl.java 3KB
GenericCrawlerImpl.java 2KB
CrawlerFactory.java 692B
.gitignore 7B
CrawlerMain.java 2KB
test
java
com
imaginea
crawler
dao
MailDaoImplTest.java 2KB
loader
CrawlerLegTest.java 1KB
PageLoaderImplTest.java 1KB
CrawlerImplTest.java 506B
.classpath 1KB
.settings
org.eclipse.m2e.core.prefs 86B
org.eclipse.core.resources.prefs 150B
org.eclipse.jdt.core.prefs 7KB
pom.xml 3KB
README.md 1KB
.project 536B
共 32 条
- 1
资源评论
哈奇明
- 粉丝: 30
- 资源: 4771
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功