没有合适的资源?快使用搜索试试~
我知道了~
文库首页
开发技术
其它
网页排重 -- 简单易行的Charikar算法
网页排重 -- 简单易行的Charikar算法
网页排重
3星
· 超过75%的资源
需积分: 9
66 下载量
21 浏览量
2008-05-12
22:08:44
上传
评论
收藏
26KB
DOC
举报
温馨提示
立即下载
网页排重 -- 简单易行的Charikar算法
资源推荐
资源评论
论文研究-基于特征码的网页排重算法的设计与实现 .pdf
浏览:8
基于特征码的网页排重算法的设计与实现,刘新生,厉锟,在大规模新闻抓取中,大量重复或者近似文章也频繁出现,这影响了抓取系统的性能,同时也降低了新闻抓取质量,所以有必要在系统中
网页排重算法-信息指纹算法.doc
浏览:17
网页排重算法-信息指纹算法.doc
simhashphp:SimHash相似性算法PHP实现
浏览:90
由Moses Charikar创建的该算法提供了一种有效的方法来计算两个文本之间的相似性索引。 Google内部使用它来检测重复的内容。 有关更多信息,请参见 。如何使用它 ? 用安装它: composer require tga/simhash-php ...
SimHashPHP 算法来实现海量文本的相似度计算与快速去重
浏览:115
SimHash 算法来实现海量文本的相似度计算与快速去重。SimHashPHP是一个PHP库,它在PHP中移植了SimHash算法。该算法由Moses Charikar创建,提供了一种有效的方法来计算两个文本之间的相似性指数。
simhash.zip
浏览:40
simhash是由 Charikar 在2002年提出来的,为了便于理解尽量不使用数学公式,分为这几步: 1、分词,把需要判断文本分词形成这个文章的特征单词。 2、hash,通过hash算法把每个词变成hash值,比如“美国”通过hash...
Nearest Neighbor Descent (NN-Descent):精确计算k-最近邻或有效地近似k-最近邻。-matlab开发
浏览:127
给定一个数据集 X、一组查询点 Y 和一个正整数 K,... NN-descent 算法是 Wei Dong、Moses Charikar 和 Kai Li 的发明。 有关详细说明,请参阅他们的原始论文 ( https://www.cs.princeton.edu/cass/papers/www11.pd
The Improvement Algorithm of Binary Quadratic Programming
浏览:129
二次极大化问题的改进算法,艾文宝,张鑫,本文针对形如(P)的二次极大化问题,提出了一种改进算法(定义为AZX)。AZX算法建立在Charikar和Wirth的算法的基础上并利用了半正定规�
simhash:在 Ruby 中实现 Moses Charikar 的 simhashes
浏览:27
就这么简单my_string.simhash(:split_by => //) 这将生成基于 64 位整数的整数,但之前会将字符串拆分为单词。 当您需要根据单词用法计算字符串的相似度时,它很方便。 您可以根据需要拆分字符串:按字母/句子/特定...
Finding Frequent Items in Data Streams-计算机科学
浏览:197
Finding Frequent Items in Data StreamsMoses Charikar?1, Kevin Chen??2, and Martin Farach-Colton31 Princeton University moses@cs.princeton.edu2 UC Berkeley kevinc@cs.berkeley.edu3 Rutgers University ..
simhash:simhash algoritim的实现
浏览:143
辛哈什simhash是Charikar的算法的实现。 simhash是具有有用属性的散列,相似的文档会产生相似的散列。 因此,如果两个文档相似,则文档的相似度之间的汉明距离将很小。 该软件包当前仅实现simhash算法。 将来的工作...
idmlib:所有 iZENECloud 项目的数据挖掘库
浏览:186
首先阅读论文Detecting Near-Duplicates for Web Crawling然后我们可以理解算法。 我们使用了著名的 Charikar simhash 指纹生成方法,并将维度(f)设置为 64。 Ctr 预测。 我们已经实现了和 。 中文查询更正。 ...
Qt 5实现串口调试助手 (源工程文件、0积分下载)
浏览:51
5星 · 资源好评率100%
基于Qt 5实现串口调试助手,程序仅供参考,修改了之前十六进制接收0xA0--0xFF有误的问题,新增了窗口自适应(ui文件设置栅格),文件详情可看博客链接https://blog.csdn.net/m0_51294753/article/details/121405661。
【SystemVerilog】路科验证V2学习笔记(全600页).pdf
浏览:19
5星 · 资源好评率100%
SystemVerilog的听课学习笔记,包括讲义截取、知识点记录、注意事项等细节的标注。 目录如下: 第一章 SV环境构建常识 1 1.1 数据类型 1 四、二值逻辑 4 定宽数组 9 foreach 13 动态数组 16 队列 19 关联数组 21 枚举类型 23 字符串 25 1.2 过程块和方法 27 initial和always 30 func
AutoSAR标准协议4.2.2
浏览:28
5星 · 资源好评率100%
AutoSAR标准协议规范4.2.2,里面包含了AutoSAR组织所规定的AutoSAR架构的标准规范协议原文档。对AutoSAR的学习有一定的借鉴意义
光伏-储能并网系统仿真.rar
浏览:101
5星 · 资源好评率100%
该文件是清华大学储能课的期末大作业。用SIMULINK搭建了一个完整的光伏-储能并网系统。我的博客中介绍了系统实现的具体方法,欢迎查看!
NPPJSONViewer.zip
浏览:122
4星 · 用户满意度95%
NodePad++ JSON格式化插件
GD32替换STM32注意事项.pdf
浏览:50
3星 · 编辑精心推荐
GD32 介绍与 STM32 兼容性汇总。STM32的代码直接在GD32上运行需要小部分的修改。按教程做对应修改就行哈。
XCP协议的规范文档
浏览:198
5星 · 资源好评率100%
XCP协议的原规范文档,主要包含了Part1-5共5个部分,其中第三部分又分为CAN、以太网和Sxl等。对于XCP协议的开发者和学习者有借鉴意义
VS2015安装证书,JavaScript_ProjectSystem.msi,JavaScript_LanguageService.msi
浏览:30
3星 · 编辑精心推荐
vs2015.iso包安装,不然会卡在安装包丢失或损坏
CANoe通过CAPL脚本实现自动测试
浏览:136
现在汽车行业用vector的工具进行自动测试,但是该自动测试模板很少,本案例是分享CAPL脚本自动化测试的模板,和自动控制测试步骤的XML模板,使用过程可以通过本人分享的文档来实现工程的建立到自动测试的完成。通过CAPL脚本+XML控制测试步骤,实现自动测试,生成测试报告。
蓝牙BLE协议中文版.pdf
浏览:169
蓝牙BLE协议中文版,帮助初学者更快掌握协议内容。协议为SIG官方协议的中文版,所有协议内容均与英文原版协议内容保持一致
BaiduOCR.zip
浏览:65
5星 · 资源好评率100%
按键精灵百度文字识别 自定义库 使用说明参考:https://blog.csdn.net/sinat_22215253/article/details/118272746
AD20官方中文教程.pdf
浏览:142
官方提供的入门教材,其中重点讲解了一个简易电路板的开发过程,从元器件的选择,元器件的布置,到最后的产品输出,比较完整的一个实例,适合初次使用软件的开发人员使用。
电路分析基础第二版PDF电子书免费下载
浏览:83
5星 · 资源好评率100%
《21世纪高等院校信息与通信工程规划教材:电路分析基础(第2版)》以电路理论的经典内容为核心,以提高学生的电路理论水平和分析解决问题的能力为出发点,以培养“厚基础、宽口径、会设计、可操作、能发展”,具有创新精神和实践能力人才为目的。《21世纪高等院校信息与通信工程规划教材:电路分析基础(第2版)》较全面地阐述了电路的基本理论,并适当引入电路新技术。内容遵从先易后难,由浅入深,循序渐进的原则。主要包
七参数坐标转换工具(可在WGS84、北京54、西安80、CGCS2000坐标系中任意两个转换)
浏览:26
七参数坐标转换工具(可在WGS84、北京54、西安80、CGCS2000坐标系中任意两个转换),也可以自定义参数转换
完整版 Microsoft.ACE.OLEDB.12.0 驱动下载.rar
浏览:198
5星 · 资源好评率100%
亲测好用,挺不错的资源,大家快来下载吧!挺有用的!需要的话可以来下载哦!Microsoft.ACE.OLEDB.12.0驱动下载,解决 未在本地计算机上注册“Microsoft.ACE.OLEDB.12.0”提供程序,权限问题
CMSIS-DAP使用说明及驱动.rar
浏览:23
仿真器,含有详细的教程,驱动,使用方法等等,keil和IAR安装及支持CMSIS-DAP工具,CoFlash及Hex2bin工具包,DAP仿真器下载程序说明等等
Matlab安装MinGW-w64 C/C++ 编译器
浏览:153
4星 · 用户满意度95%
Matlab安装 MinGW-w64 编译器。 包括下载好的MinGW-w64 C/C++和 简单的安装步骤(Readme.doc)
qt样式表一键生成(花狗Fdog)
浏览:17
5星 · 资源好评率100%
QT样式表一键生成,避免了无穷无尽的百度搜索,一来方便学习,所以参数都写在左下角,方便了解到使用了什么生成了什么,二来不用重复造轮子,调节后,可直接将左下角生成的QSS代码复制到qt的样式表里面即可显示效果。
评论
收藏
内容反馈
立即下载
资源评论
资源反馈
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~
联系上传者
评论
zhangjiaogg
2013-04-15
对我来说用处不大
shuizimuzhongling
粉丝: 7
资源:
179
私信
上传资源 快速赚钱
我的内容管理
展开
我的资源
快来上传第一个资源
我的收益
登录查看自己的收益
我的积分
登录查看自己的积分
我的C币
登录后查看C币余额
我的收藏
我的下载
下载帮助
前往需求广场,查看用户热搜
最新资源
焊接助手_esp32c3_1.54墨水屏V0.6_立创版本.html
仿真环境下DHCP攻防实验的设计与实现.pdf
美国奈飞Netflix公司企业文化《Culture Deck》-文化甲板
免root视频教程(先看文字教程,后看视频教程).mp4
基于光电传感器的暖通空调温湿度智能控制技术.pdf
MongoDB数据库基本操作方法
AI在工程咨询领域的应用及挑战研究.pdf
与光电感应器相关的资源
(第五期)期中考试.doc
人工智能ai相关教学课程快
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功