没有合适的资源?快使用搜索试试~ 我知道了~
webcrawler:网络爬虫
共16个文件
java:9个
xml:3个
gradle:2个
需积分: 9 0 下载量 69 浏览量
2021-05-24
21:09:23
上传
评论
收藏 13KB ZIP 举报
温馨提示
网络爬虫 建造 gradle build fatJar 跑步 java -jar build/libs/webcrawler-all-1.0.jar startURL depth [poolSize=10] 示例: java -jar build/libs/webcrawler-all-1.0.jar http://ya.ru/ 3 100 待办事项 将parent_id列添加到Page中以进行层次结构构建。 在进行JPA事务之前,请检查URL的全局唯一性。 在生成子项之前,请杀死不是全局唯一的URL。 当深度> 4时,修复“超出了GC开销限制”。
资源推荐
资源详情
资源评论
收起资源包目录
webcrawler-master.zip (16个子文件)
webcrawler-master
settings.gradle 33B
src
test
resources
META-INF
persistence.xml 1KB
java
ru
webcrawler
CrawlerServiceTests.java 634B
SavePageServiceTests.java 927B
LoadPageTaskTests.java 1KB
PageTests.java 1KB
main
resources
META-INF
persistence.xml 1KB
logback.xml 371B
java
ru
webcrawler
CrawlerService.java 3KB
Page.java 4KB
SavePageService.java 3KB
Main.java 498B
LoadPageTask.java 1KB
README.md 476B
.gitignore 44B
build.gradle 1KB
共 16 条
- 1
资源评论
pangchenghe
- 粉丝: 32
- 资源: 4535
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功