一种基于关键词的近似网页检测算法

资源大小: 166.08KB
资源类型:chm文件
发布人: wowrur   等级:2    
发布日期: 2个月前
Tag: 搜索引擎 网页消重 近似网页
资源分: 8
下载人数: 5

软件说明:

针对海量Web文本信息,利用从网页主题内容提取出来的特征关键词,在倒排索引基础上建立相似度计算模型。对一<br>篇新入库的网页文档,利用所包含的关键词迅速缩小计算范围,提高计算效率。实验结果表明该算法是有效的,小规模评测<br>结果得到较好的效果。<br>

共有评论
网站简介|广告服务|VIP资费标准|银行汇款帐号|网站地图|帮助|联系方式|诚聘英才|English|版权声明|问题报告
北京创新乐知广告有限公司 版权所有, 京 ICP 证 070598 号
世纪乐知(北京)网络技术有限公司 提供技术支持
Copyright©2000-2007, CSDN.NET, All Rights Reserved
GongshangLogo