大型网站为了提高访问效率,通常建立多个镜像站点,这导致获取网站全局的用户访问模式知识变得困难。该文提出一种分布式Web日志挖掘模型DWLMS,并以路径分析技术为例,提出了基于DWLMS的局部频繁路的更新算法LFP和全局频繁路径的更新算法GFP,解决了Web访问信息的异地存储、实时增长、分布式算法通讯量等因素给模式分析过程带来的困难。对提出的算法进行了实现和实际日志数据的测试,结果证明了算法的有效性。
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~