下载 >  开发技术 >  Web开发 > Web-Harvest学习笔记.doc

Web-Harvest学习笔记.doc

2009-06-11 上传大小:99KB
Web-Harvest是Web数据挖掘工具。提供一种方法收集目标网页和挖掘有用的数据。为此,使用XSLT,XQUERY,Regular Exp等技术。
其网址在http://web-harvest.sourceforge.net/。
挖掘数据也称为WebScraping或WebDataMining。每个挖掘过程是用户自定义的,通过执行基于xml的配置文件。

例如:

<xpath expression="//a[@shape='rect']/@href">
<html-to-xml>
<http url="http://www.somesite.com/"/>
</html-to-xml>
</xpath>
WebHarverst提供一组数据处理和控制流。Processor组合成管道,构成执行链。也提供了variable context。
综合评分:0
开通VIP 立即下载

评论共有0条

 
[Web-Harvest数据采集之一]Web-Harvest基础-配置文件分析源码 立即下载
积分/C币:3
Web-Harvest学习笔记 立即下载
积分/C币:0
开源PLC学习笔记 立即下载
积分/C币:3
Web-Harvest手册 立即下载
积分/C币:3
j2se学习笔记.doc 立即下载
积分/C币:0
MTK学习笔记.doc 立即下载
积分/C币:3
Java学习笔记.doc 立即下载
积分/C币:3
SSH学习笔记.doc 立即下载
积分/C币:3
网络工程师学习笔记.doc网络工程师学习笔记.doc 立即下载
积分/C币:3
JQUERY学习笔记.doc 立即下载
积分/C币:3

VIP会员动态

0 1 2
关闭
img

spring mvc+mybatis+mysql+maven+bootstrap 整合实现增删查改简单实例.zip

资源所需积分/C币 当前拥有积分 当前拥有C币
5 0 0
点击完成任务获取下载码
输入下载码
为了良好体验,不建议使用迅雷下载
img

Web-Harvest学习笔记.doc

会员到期时间: 剩余下载个数: 剩余C币: 剩余积分:0
为了良好体验,不建议使用迅雷下载
VIP下载
您今日下载次数已达上限(为了良好下载体验及使用,每位用户24小时之内最多可下载20个资源)

积分不足!

资源所需积分/C币 当前拥有积分
您可以选择
开通VIP
4000万
程序员的必选
600万
绿色安全资源
现在开通
立省522元
或者
购买C币兑换积分 C币抽奖
img

资源所需积分/C币 当前拥有积分 当前拥有C币
5 4 45
为了良好体验,不建议使用迅雷下载
确认下载
img

资源所需积分/C币 当前拥有积分 当前拥有C币
5 0 0
为了良好体验,不建议使用迅雷下载
开通VIP
img

资源所需积分/C币 当前拥有积分 当前拥有C币
5 4 45
您的积分不足,将扣除 10 C币
为了良好体验,不建议使用迅雷下载
确认下载
下载
无法举报自己的资源

兑换成功

你当前的下载分为234开始下载资源
你还不是VIP会员
开通VIP会员权限,免积分下载
立即开通

你下载资源过于频繁,请输入验证码

您因违反CSDN下载频道规则而被锁定帐户,如有疑问,请联络:webmaster@csdn.net!

举报

若举报审核通过,可返还被扣除的积分

  • 举报人:
  • 被举报人:
  • 举报的资源分:
  • *类型:
  • *详细原因: