对面向主题的信息采集技术进行了探索性研究。采用基于DOM的信息抽取技术, 建立混合空问模型表示内容和结构特征信息,并通过定义网贞间相似性来识别主题页面。较好的处理了Web信息抽取中主题页面识别的问题,实验结果证明了系统的可行性。
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~