软件包nilsimsa是Nilsimsa的Go实现,从code.google.com/p/py-nilsimsa移植而来,但遵循标准库中md5软件包建立的约定
还参考了 blob / master / src / main / java / com / weblyzard / lib / string / nilsimsa / Nilsimsa.java中的Java实现。
关于使用哈希对字符串相似度进行评分的讨论
曹圣德(Deng-Tsao)版权所有。2015。 版权所有。 此源代码的使用受Go标准库所使用的相同BSD样式许可证的约束
来自
Nilsimsa是一种针对垃圾邮件的局部敏感哈希算法,最初于2001年提出cmeclax remailer运算符[1],然后由Damiani等人进行了综述。 在他们2004年题为“基于开放摘要的垃圾邮件检测技术”的论文中。[2]
Nilsims