vHTML 解析器 jsoup
1.1 介绍
jsoup(GitHub 地址、中文文档)是一款 Java 的 HTML 解析器,可直接解析某个
URL 地址、HTML 文本内容。它提供了一套非常省力的 API,可通过 DOM,CSS
以及类似于 jQuery 的操作方法来取出和操作数据。
1.2 示例
Document document = Jsoup.connect("https://www.cnblogs.com/toutou/")
.userAgent("Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537
.36 (KHTML, like Gecko) Chrome/72.0.3626.119 Safari/537.36")
.get();
// System.out.println(document);
Elements elements = document.select("div.box.item");
for(Element element : elements)
{
Elements eleUrl = element.select("div.box-aw a");
String strPrjUrl = eleUrl.attr("href");
setProjUrls.add(strPrjUrl);
// System.out.println(strPrjUrl);
Elements eleTitle = eleUrl.select(".title");
String strTitle = eleTitle.text();
// System.out.println(strTitle);
Elements eleSummary = eleUrl.select(".summary");
String strSummary = eleSummary.text();
// System.out.println(strSummary);
}
vJava 8 Stream
2.1 介绍
评论0
最新资源