摘 要:分析大规模中文搜索日志中的查询重复性,通过对查询重复率和用户个体查询重复率等数据的统计发现:查询串的查询频率、文 档的点击频率及用户查询频率均符合 Zipf 分布,查询重复率较高。查询历史越长,查询重复率越高。高查询频率用户的查询重复率较高。 以上数据为中文搜索引擎的改进提供了有力的依据。
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~