没有合适的资源?快使用搜索试试~
我知道了~
文库首页
开发技术
其它
simhash:simhash的Java实现
simhash:simhash的Java实现
共2个文件
md:1个
java:1个
Java
需积分: 23
4 下载量
200 浏览量
2021-06-27
09:03:50
上传
评论
收藏
1KB
ZIP
举报
温馨提示
立即下载
simhash simhash算法的Java实现
资源推荐
资源详情
资源评论
Simhash java实现
浏览:30
Java实现simHash算法
Java实现simHash算法
浏览:176
5星 · 资源好评率100%
Java实现simHash算法,对应博客http://www.cnblogs.com/hxsyl/p/4518506.html
java实现中文分词simhash算法
浏览:82
5星 · 资源好评率100%
simhash算法对字符串计算权重时,对中文要做特殊操作,及先分词,请自行下载sanford中文分词jar包及中文分词库
simhash算法的java实现simhash-java.zip
浏览:5
simhash 算法的 java 实现。特点计算字符串的 simhash通过构建智能索引来计算所有字符串之间的相似性,因此可以处理大数据使用使用输入文件和输出文件运行 Maininputfile 的格式(参见 src / test_in):一个文件每行用 utf8 字符集outputfile 格式 start //start flag first line // doc sencode lie
simhash-java Java实现simhash算法的简单实现.zip
浏览:127
simhash-java Java实现simhash算法的简单实现.zip
Simhash4J:Simhash Java单机实现
浏览:17
Simhash-Java实现 依赖 结巴分词:进行文本分词 Murmur3:字符串产生64位Hash值 运行 mvn install mvn exec:java
基于springboot+mybatis+redis+es+bootstrap的搜索实战项目
浏览:9
技术选型 springboot + mybatis + bootstrap + jqgrid + ajax + elasticsearch(用到在整合) + redis(用到在整合) 项目编码: UTF-8 项目名称: poem 数据库名称: poem 项目中包结构: src/main/java com.baizh.xxx .util 工具包
SpringBoot整合并使用Java实现“孤立森林”异常数据过滤算法
浏览:154
实现背景和意义 在物联网应用中,数据的产生大多数都是由传感器采集的,农业物联网更是如此。并且农业物联网中,传感器采集环境更加极端,十分容易发生传感器数据采集异常事件,这些异常的输入随传输协议进入数据库,必然会对本系统的数据库产生污染,影响应用可靠性。所以对异常数据应该采取过滤的方式达到不对应用可靠性产生负面影响的效果。 在我自己的智能水培项目中中,物联网的环境数据由温度、湿度、PH值、EC值、CO
java文本查重工具类封装
浏览:61
5星 · 资源好评率100%
终于重构好代码了,使用模式:模板模式、策略模式、建造者模式、单一职责,弄一个余弦定理、simhash文本查重代码,并使用二叉排序树和平衡二叉树(待测试)来优化查询。百万数据查重秒查
simhash算法库simhash.zip
浏览:124
专门针对中文文档的simhash算法库 简介 此项目用来对中文文档计算出对应的 simhash 值。 simhash 是谷歌用来进行文本去重的算法,现在广泛应用在文本处理中。 详见SimhashBlog 特性 使用 CppJieba 作为分词器和关键词抽取器 使用 jenkins 作为 hash 函数 hpp 风格,所有源码都是 .hpp 文件里面,方便使用。 没有链接,就没有伤害。 依
simhash:一种有效的文本相似度计算算法
浏览:74
simhash高效的文本相似度去重算法实现simhash是什么Google发明的的文本去重算法,适合于大批量文档的相似度计算主要步骤对文本分词,得到N维特征向量(默认为64维)为分词设置权重(tf-idf)为特征向量计算哈希对...
simhash:生成simhash指纹
浏览:150
simhash 生成 32 位 simhash 指纹
Simhash算法及java实现.doc
浏览:195
5星 · 资源好评率100%
Simhash算法及java实现.doc
simple-simhash:非常简单的simhash,采用的hanlp的第三方库进行的分词和词性标注,hash计算是最简单的网上的那些形式,适合用来处理大文本
浏览:33
simple-simhash 非常简单的simhash,采用的hanlp的第三方库进行的分词和词性标注,hash计算是最简单的网上的那些形式,适合用来处理大文本 数据源当然可以自己换成redis 博客介绍
SimHash-java实现及海明距离
浏览:148
计算两个文本的相似度,使用到了Simhash、分词、海明距离等技术
中文文本相似度匹配算法 simHash 海明距离 IK分词
浏览:72
4星 · 用户满意度95%
中文文本相似度匹配算法 simHash 海明距离 IK分词 完整的可运行的示例代码 包含simHash 算法,使用IK 对中文文本进行分词处理
shingling、simhash、bloom filter
浏览:39
4星 · 用户满意度95%
相似项发现主题中的shingling、simhash、bloom filter算法java实现,测试通过,附带测试数据。
SimHash源码.docx
浏览:55
SimHash源码.docx
MySimHash.java
浏览:60
java实现的SimHash算法,用于海量的网页去重和打拼量的文本相似度检测
ai-java-quick:学习使用java实现机器学习、深度学习或自然语言处理等等
浏览:114
使用java实现一些算法,如机器学习,深度学习,数据挖掘之类的 quick-bayes 贝叶斯 quick-text-similarity 文本相似度相关的算法 CosineSimilarity 向量空间余弦相似度 EditDistance 编辑距离 SimHash
SimText:simhash 用于短文本
浏览:157
SimText 基于SimHash的适用于相似短文本监测 ps: 部分代码来自于: commoncrawl/src/main/java/org/commoncrawl/util/shared
simhash.zip
浏览:40
高效的文本相似度去重算法实现 simhash是什么 Google发明的的文本去重算法,适合于大批量文档的相似度计算。 流程介绍 simhash是由 Charikar 在2002年提出来的,为了便于理解尽量不使用数学公式,分为这几步: ...
海量分词java版
浏览:48
4星 · 用户满意度95%
在海量分词研究版做了JNI调用,没有时间限制,功能有分词,词性标注,关键信息提取,语义指纹。
STM32CubeMX安装包(版本:6.9.0) 附带 Java安装包(版本:371) - -2023年7月14日
浏览:47
本资源包含:6.9.0版本的CubeMX安装包 以及 必要的Java环境安装包,具体的安装方法可在我的主页查看CubeMX安装教程篇章。
基于spring boot的小区物业管理系统源码+论文+答辩ppt
浏览:62
3星 · 编辑精心推荐
小区物业管理系统是在Java + MySQL开发环境的基础上开发的。Java是一种服务器端脚本语言,易于学习,实用且面向用户。全球超过35%的Java驱动的互联网站点使用Java。MySQL是一个数据库管理系统,因为它的体积小但速度快,成本低,或者开源受到中小型网站的青睐。因此,Java + MySQL作为一个成熟的开发环境,可以满足小区物业管理系统设计和开发所需的稳定性,安全性和可扩展性要求。系
最新Java JDK 8安装版(Windows 64位)
浏览:37
5星 · 资源好评率100%
资源内容直接来自官网,没有添加任何其它额外内容;旨在便捷地获取最新版的Java API(避免因地域原因被限制访问,因网络原因无法稳定有效下载等情况)
自主研发的软著申请代码文档整理输出工具
浏览:99
5星 · 资源好评率100%
可在软著申请时使用的代码文档整理输出工具,可选择多个特定目录,设置多类型文件,指定选择生成代码文档,可操作性很好,并且在生成word代码文档时,过滤了所有空白行和注释,过滤的注释类型涵盖mysql、java、php、python、js、html、node、vue等所有大类语言。 软件环境:win10、win7、win8、win xp 更新日志: 2022年6月1日:更新了动态进度展示,无响应超时等
Java实现ocr图片识别(PaddleOCR)飞桨
浏览:132
Java实现ocr图片识别(PaddleOCR)飞桨
毕业设计-基于JAVA的springboot超市进销存系统(源代码+论文)
浏览:10
4星 · 用户满意度95%
本超市进销存系统以springboot作为框架,b/s模式以及MySql作为后台运行的数据库,同时使用Tomcat用为系统的服务器。本系统主要包括首页、个人中心、员工管理、客户管理、供应商管理、承运商管理、仓库信息管理、商品类别管理、 商品信息管理、采购信息管理、入库信息管理、出库信息管理、销售订单管理、部门管理、岗位管理等功能,通过这些功能的实现基本能够满足日常超市进销存管理的操作。 通过这个系
收起资源包目录
simhash-master.zip
(2个子文件)
simhash-master
SimHash.java
1KB
README.md
51B
共 2 条
1
评论
收藏
内容反馈
立即下载
资源评论
资源反馈
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~
联系上传者
评论
600Dreams
粉丝: 17
资源:
4629
私信
上传资源 快速赚钱
我的内容管理
展开
我的资源
快来上传第一个资源
我的收益
登录查看自己的收益
我的积分
登录查看自己的积分
我的C币
登录后查看C币余额
我的收藏
我的下载
下载帮助
前往需求广场,查看用户热搜
最新资源
openssl-1.1.1w-1.tar.bz2
初一下册数学中考真题难题
解决未在远程桌面会话中捕获到鼠标,vmguest.iso软件分享给大家
JSP+SQL基于WEB的开放性实验管理系统设计与实现(源代码+论文+开题报告+中英文献+答辩PPT).rar
log4net配置文件!!!!!!!!!!!!!!!!!
河南统计面板数据集(2010-2022年).xlsx
OrcaleDBHelper帮助类!!!!!!!!!!!!
log4net帮助类,用来写日志!!!!!!!!!!!!!
Windows10时间同步源
信呼OA系统2.1.7版源码
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功