没有合适的资源?快使用搜索试试~ 我知道了~
webcrawler:一个简单的Java实现的网络爬虫,支持自动登录
共10个文件
java:6个
md:1个
makefile:1个
需积分: 22 3 下载量 138 浏览量
2021-06-24
11:32:29
上传
评论
收藏 278KB ZIP 举报
温馨提示
第一个网络爬虫 介绍 Webcrawler 是一个简单的网络爬虫。 它实现了自动登录和内容获取的基本功能。 Webcrawler 将首先尝试使用提供的用户名和密码登录 。 如果登录失败,程序将被终止。 登录后,爬虫将开始获取它可以在网站内找到的每个链接。 过滤器用于阻止爬虫获取外部链接。 爬虫的任务是收集隐藏在网络中的5个秘密标志。 一旦找到所有的秘密标志,爬虫就会停止。 安装和使用 运行make安装程序 运行./client运行程序,参数列表如下: 用户名(必填):登录到fakebook的用户名 密码(必填):登录fakebook的密码 执行 这个程序有六个班级。 我这样做的原因是将网络爬虫的功能分离到不同的类中,这样以后的改进会容易得多。 六个班级分别是: WebCrawlerProj2:程序的开始。 读取用户名和密码,启动爬虫,运行爬虫。 程序结束后,它将打印所有找到的秘密标志。
资源推荐
资源详情
资源评论
收起资源包目录
webcrawler-master.zip (10个子文件)
webcrawler-master
Url.java 3KB
webcrawler 70B
WebCrwlerProj2.java 989B
Page.java 4KB
Cookie.java 936B
Makefile 51B
README.md 5KB
jsoup-1.8.1.jar 294KB
HTTPconnection.java 5KB
Crawler.java 9KB
共 10 条
- 1
资源评论
佳同学
- 粉丝: 28
- 资源: 4583
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- AIS2024 valid
- 最入门的爬虫代码 python.docx
- 爬虫零基础入门-爬取天气预报.pdf
- 最通俗易懂的 MongoDB 非结构化文档存储数据库教程.zip
- 以mongodb为数据库的订单物流小项目.zip
- 腾讯云-mongodb数据库, 项目部署.zip
- 腾讯 APIJSON 的 MongoDB 数据库插件.zip
- 理解非关系型数据库和关系型数据库的区别.zip
- 操作简单的Mongodb网页web管理工具,基于Spring Boot2.0支持mongodb集群.zip
- tms-mongodb-web,提供访问mongodb数据的REST API和可灵活扩展的mongodb web 客户端.zip
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功