一个JAVA开发的简单网络爬虫 可以实现对指定站点新闻内容的获取 程序很简单 大家一起学习
┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┓
┃源码站 - 下载文件说明: alixixi.com┃
┣━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┫
┃ 做最好的源码下载网站:源码站,www.alixixi.com ┃
┣━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┫
┃【使用前请您先阅读以下条款,否则请勿使用本站提供的文件!】 ┃
┃ 1) 推荐使用:WinRAR V3.4以上版本解压本站软件 ┃
┃ 2) 本站不保证所提供软件或程序的完整性和安全性。 ┃
┃ 3) 请在使用前查毒 (这也是您使用其它网络资源所必须注意的) 。 ┃
┃ 4) 由本站提供的程序对您网站或计算机造成严重后果的本站概不负责。┃
┃ 5) 本站提供的程序均为网上搜集,如果该程序涉及或侵害到您的版权请┃
┃ 立即写信通知我们。 ┃
┣━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┫
┃ 如果遇到MD5加密文件(一般都是这个),而又不知道密码的, ┃
┃ 请用这组加密的数据1739fddf100746ca替换,那么密码就是:alixixi.com┃
┃ (这个是16位的,32位的是:773164f11739fddf100746ca6b337834) ┃
┣━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┫
┃ 欢迎广大程序作者到本站发布您的作品! ┃
┃ 源码站 - 下载源码就到源码站 ┃
┃ 联系邮箱:wuse#alixixi.com( #替换成@ ) ┃
┗━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┛
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
Java网络爬虫(也称为蜘蛛)是一段用于自动抓取互联网上的数据并进行分析处理的程序代码。这些爬虫通常用于搜索引擎索引、数据挖掘、市场研究或任何需要从大量网页中提取有用信息的场景。 在Java中,编写网络爬虫需要掌握网络编程、HTML解析、多线程以及可能的数据存储和处理等相关知识。下面是一段关于Java网络爬虫源码资源的描述: 这段Java网络爬虫源码资源是一个功能完善且易于扩展的爬虫框架。它采用了模块化设计,使得用户可以轻松地根据自己的需求进行定制和扩展。源码中包含了网络请求模块、HTML解析模块、数据存储模块以及任务调度模块等多个核心组件。 网络请求模块负责发送HTTP请求并获取网页内容。它支持GET和POST等多种请求方式,并可以自动处理重定向、Cookie以及代理等网络相关问题。HTML解析模块则负责将获取的网页内容转换为可操作的DOM树结构,使得用户可以方便地提取所需的信息。 数据存储模块提供了多种数据存储方式,包括文件存储、数据库存储以及内存存储等。用户可以根据自己的需求选择合适的数据存储方式,并将提取到的信息进行持久化保存。
资源推荐
资源详情
资源评论
收起资源包目录
Java网络爬虫(蜘蛛)源码.zip (144个子文件)
._bean 4KB
._bean 4KB
._build 4KB
._classes 4KB
._com 4KB
._com 4KB
._com 4KB
._conf 4KB
._crawler 4KB
._crawler 4KB
._db 4KB
._db 4KB
._dist 4KB
._java 4KB
._lib 4KB
._lib 4KB
._META-INF 4KB
._META-INF 4KB
._nbproject 4KB
._private 4KB
._servlet 4KB
._servlet 4KB
._sohu 4KB
._sohu 4KB
._sohu 4KB
._src 4KB
._test 4KB
._web 4KB
._web 4KB
._WEB-INF 4KB
._WEB-INF 4KB
SohuNews.class 8KB
._SohuNews.class 4KB
._GetNewsServlet.class 4KB
._GetNewsServlet$1.class 4KB
._LinkParser.class 4KB
._LinkDB.class 4KB
._LinkParser$2.class 4KB
._Crawler.class 4KB
._NewsToDB.class 4KB
._LinkParser$1.class 4KB
._LinkFilter.class 4KB
._Crawler$1.class 4KB
._Queue.class 4KB
._SohuNews$1.class 4KB
._NewsBean.class 4KB
._ConnectionManager.class 4KB
LinkParser.class 3KB
ConnectionManager.class 2KB
GetNewsServlet.class 2KB
Crawler.class 2KB
LinkDB.class 2KB
NewsBean.class 1KB
Queue.class 1KB
GetNewsServlet$1.class 969B
SohuNews$1.class 885B
LinkParser$1.class 819B
LinkParser$2.class 796B
Crawler$1.class 779B
NewsToDB.class 453B
LinkFilter.class 203B
mysql-connector-java-5.1.6-bin.jar 687KB
commons-httpclient-3.1.jar 298KB
htmlparser.jar 281KB
htmlparser.jar 281KB
htmllexer.jar 68KB
htmllexer.jar 68KB
commons-codec-1.3.jar 46KB
commons-logging-1.0.4.jar 37KB
._commons-logging-1.0.4.jar 4KB
._commons-codec-1.3.jar 4KB
._commons-httpclient-3.1.jar 4KB
._htmlparser.jar 4KB
._htmllexer.jar 4KB
._htmlparser.jar 4KB
._mysql-connector-java-5.1.6-bin.jar 4KB
._htmllexer.jar 4KB
SohuNews.java 10KB
._SohuNews.java 4KB
._GetNewsServlet.java 4KB
._LinkDB.java 4KB
._LinkFilter.java 4KB
._Queue.java 4KB
._Crawler.java 4KB
._LinkParser.java 4KB
._NewsToDB.java 4KB
._NewsBean.java 4KB
._ConnectionManager.java 4KB
._SohuNewsTest.java 4KB
LinkParser.java 4KB
GetNewsServlet.java 3KB
Crawler.java 2KB
ConnectionManager.java 2KB
NewsBean.java 2KB
LinkDB.java 1KB
SohuNewsTest.java 1KB
Queue.java 620B
NewsToDB.java 270B
LinkFilter.java 231B
._detail.jsp 4KB
共 144 条
- 1
- 2
资源评论
编程小弟
- 粉丝: 1189
- 资源: 72
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功