在信息检索中,Minwise Hash算法用于估计集合的相似度,b位Minwise Hash则通过存储Hash值的b位来估计相似度,从而节省了存储空间和计算时间。基于b位Minwise Hash的理论框架提出了连接位Minwise Hash算法,给出了连接位的相似度无偏估计和存储因子,通过理论证明了连接位Minwise Hash算法不需要损失很大的精度,却可以成倍地减少比对的次数,提升了算法的性能。理论分析和实验验证了此方法的有效性。
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~