基于扩展锚文本的网页特征识别
基于源网页的信息比目标网页的更具有区别性,提出通过提取源网页扩展的锚文本,进行目标网页特征识 别。 分析了不同位置的扩展锚文本,获取其 XPath 表达式,用于提取网页特征,并通过实验分析其性能。
0
67
203KB
2018-02-07
1