package com.sgnbs;
import java.io.IOException;
import java.net.URL;
import org.apache.http.HttpEntity;
import org.apache.http.client.ClientProtocolException;
import org.apache.http.client.methods.CloseableHttpResponse;
import org.apache.http.client.methods.HttpGet;
import org.apache.http.impl.client.CloseableHttpClient;
import org.apache.http.impl.client.HttpClients;
import org.apache.http.util.EntityUtils;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
public class HttpClientJsoupTest01 {
//url传入 "http://www.csdn.net/"
public void get(String url) {
CloseableHttpClient client=HttpClients.createDefault(); //定义一个默认的请求客户端
HttpGet get=new HttpGet(url); //定义一个get请求
CloseableHttpResponse response=null; //定义一个响应
try {
response=client.execute(get);
System.out.println(response.getStatusLine().getStatusCode());//打印响应状态码,200表示成功
HttpEntity entity=response.getEntity(); //获取响应实体
String html=EntityUtils.toString(entity); //将实体的内容转换为字符串
System.out.println(html);
/**
* 接下来就利用jsoup来解析前面取得的html,并获取csdn首页的极客头条栏目下的标题
*/
Document document=Jsoup.parse(new URL(url).openStream(), "utf-8", url); //利用Jsoup类的静态方法,将html转换成一个Document对象
Element element=document.select("div.wrap .left .hot_blog ul").first(); //利用select选择器,取得需要的li元素集合
Elements elements= element.select("a"); //取得a链接的集合
for (Element element2 : elements) {
System.out.println("标题:"+element2.attr("title")+" -->> 地址:"+element2.attr("href"));
}
} catch (ClientProtocolException e) {
// TODO Auto-generated catch block
e.printStackTrace();
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}finally {
try {
response.close();
client.close();
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
}
}
没有合适的资源?快使用搜索试试~ 我知道了~
jsoup+httpclient j简单爬虫
共19个文件
jar:12个
java:2个
class:2个
需积分: 10 12 下载量 33 浏览量
2018-07-05
09:43:02
上传
评论
收藏 3.32MB RAR 举报
温馨提示
jsoup+httpclient 简单爬虫,一个jsoup的简单爬虫实例
资源推荐
资源详情
资源评论
收起资源包目录
jsoupTest.rar (19个子文件)
jsoupTest
.project 385B
src
com
sgnbs
HttpClientJsoupTest01Test.java 238B
HttpClientJsoupTest01.java 2KB
lib
servlet-api.jar 86KB
httpcore-4.4.9.jar 318KB
jna-4.4.0.jar 1.04MB
commons-codec-1.10.jar 278KB
jna-platform-4.4.0.jar 2.18MB
httpclient-cache-4.5.5.jar 158KB
httpclient-win-4.5.5.jar 17KB
jsoup-1.11.3.jar 386KB
fluent-hc-4.5.5.jar 31KB
httpmime-4.5.5.jar 41KB
httpclient-4.5.5.jar 748KB
commons-logging-1.2.jar 60KB
.settings
org.eclipse.jdt.core.prefs 598B
.classpath 1KB
bin
com
sgnbs
HttpClientJsoupTest01Test.class 666B
HttpClientJsoupTest01.class 3KB
共 19 条
- 1
资源评论
biaobaohui2700
- 粉丝: 0
- 资源: 1
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功