没有合适的资源?快使用搜索试试~
我知道了~
文库首页
课程资源
Java
信息检索中文本聚类的实现
信息检索中文本聚类的实现
共39个文件
txt:15个
java:9个
class:9个
信息检索
文本聚类
4星
· 超过85%的资源
需积分: 9
70 下载量
117 浏览量
2011-05-14
08:14:32
上传
评论
1
收藏
1.59MB
RAR
举报
温馨提示
立即下载
信息检索中文本聚类的实现 java代码编写
资源详情
资源评论
收起资源包目录
TextClustering.rar
(39个子文件)
TextClustering
.project
390B
bin
cn
edu
hit
ReadFiles.class
3KB
input.txt
446B
Tokeniser.class
2KB
ITokeniser.class
250B
TFIDFMeasure.class
7KB
WawaKMeans.class
3KB
WawaCluster.class
1KB
Program.class
4KB
StopWordsHandler.class
2KB
TermVector.class
1KB
.settings
org.eclipse.jdt.core.prefs
629B
.myeclipse
profiler
Program (1).xml
784B
src
cn
edu
hit
WawaCluster.java
1KB
input.txt
446B
Tokeniser.java
1KB
ReadFiles.java
2KB
ITokeniser.java
170B
StopWordsHandler.java
1KB
TFIDFMeasure.java
6KB
TermVector.java
1KB
WawaKMeans.java
4KB
Program.java
3KB
.classpath
487B
lib
je-analysis-1.5.3.jar
872KB
lucene-core-2.4.0.jar
800KB
dir
file2.txt
28B
file11.txt
46B
file10.txt
27B
file8.txt
23B
file6.txt
47B
file12.txt
38B
file13.txt
39B
file1.txt
40B
file3.txt
22B
file5.txt
28B
file9.txt
46B
file7.txt
22B
file4.txt
16B
共 39 条
1
评论
收藏
内容反馈
立即下载
评论7
查看其他6条评论
去评论
zrd1511
2015-04-16
资源很好,可以运行。我在eclipse下运行的,要把lib文件夹粘贴到项目中来,然后对其中两个jar文件:右键单击->build path就好了。可以看一下http://www.docin.com/p-499116466.html
最新资源
BaseRecyclerViewAdapterHelper4.0使用Java重写
山东大学操作系统实验demo
TiggerRamDiskV6.0-Mac.zip
数据库实验报告三.doc
数据库应用程序设计作业.doc
施工图审查信息化管理平台整体解决方案.doc
visualize1.py
物联网分布式系统应用.pptx
物联网在医疗健康中的应用-第1篇概述.pptx
11_4.ide
linpeikun16
粉丝: 3
资源:
38
私信
上传资源 快速赚钱
前往需求广场,查看用户热搜
相关推荐
搜索文本内容——Java代码的简单实现
NULL 博文链接:https://newjueqi.iteye.com/blog/400870
基于JAVA的文本搜索引擎的设计与实现
本文主要是承接上一个项目文本预处理(资源中已经给出)的数据来作为支撑进行设计与实现的文本搜索引擎,采用的是Lucene工具包来进行实现的,同时还进行了余弦相似度的检测以及K-Means聚类分析,本报告是比较详细的给出了设计与实现步骤以及源代码。 如果需要具体的项目文件以及数据的请加QQ:404125822,
论文研究-Deep Web下基于中文分词的聚类算法.pdf
利用查询接口得到检索页面,对检索页面中的中文信息进行抽取并进行分词处理,对分词的结果进行统计分析,通过引入DF进行降维得到特征项,使用TF/IDF计算得到特征项的权重向量矩阵,对权重矩阵进行聚类从而实现文档的...
基于STC的中文文本聚类算法
提出了一种文档聚类方法,对用户的检索结果中类似的文档进行聚类,提供目录结 构,辅助用户浏览检索结果.首先分析了现有的文本聚类方法,讨论了它们的优势和不足,然后 提 出了 基 于后缓树的中文文本聚类算法,并...
4星 · 用户满意度95%
Java中通过HanLP实现文本分词、提取关键词、聚类(工具资源+实例)
HanLP是由一系列模型与算法组成的工具包,目标是普及自然语言处理在生产环境中的应用。HanLP具备功能完善、性能高效、架构...提供词法分析(中文分词、词性标注、命名实体识别)、句法分析、文本分类和情感分析等功能。
4星 · 用户满意度95%
论文研究-一种改进的基于知网的词语语义相似度算法.pdf
词语语义相似度计算在信息检索、文本聚类、语义消歧等方面有着广泛的应用。针对知网中现有词语语义相似度计算方法未考虑义原距离与义原深度的主次关系进行了研究,通过约束义原深度因素来改进义原相似度算法;另外,...
中文短语相似度计算方法研究及应用
文本相似度计算作为中文信息处理中的一项基础性技术,被广泛应用到文本分类、文本聚类、信息检索等多个领域,长期以来受到了众多学者的关注和研究。在信息大爆炸所带来的大量文本信息的数据堆积中,很大一部分是短文本...
基于STC的中文文本聚类算法 (2006年)
首先分析了现有的文本聚类方法,讨论了它们的优势和不足,然后提出了基于后缀树的中文文本聚类算法,并详细描述了该算法的原理和构造使用过程,及在算法实现的过程中遇到的关键问题及解决方案。
基于Python与spimi的新闻搜索引擎设计与实现
2.5.1 检索概率模型BM25公式 2.5.2 BM25聚类算法 2.6 Flask 2.7 文本预处理 2.7.1 中文文本分词 2.7.2 去停用词 2.7.3 文本向量化 2.8 小结 3 搜索引擎具体实现 3.1 课题内容实现 3.2 新闻爬虫实现 3.2.1...
自然语言处理
为中文自然语言处理而开发的java工具包,也包含为实现...信息检索:文本分类 新闻聚类 中文处理: 中文分词 词性标注 实体名识别 关键词抽取 依存句法分析 时间短语识别 结构化学习:在线学习 层次分类 聚类 精确推理
5星 · 资源好评率100%
firtex-1.0.3_RC_src(Windows版本源代码)
采用标准C++实现,支持Windows,Unix-like 操作系统; 实验和工程的通用平台,不仅是一个检索系统,同时也是一个全文索引和检索框架 多个组件基于插件设计,不仅可以采用C/C++对系统进行扩展,也可以通过内置的跨...
4星 · 用户满意度95%
firtex-1.0.3_RC_src.tar(Linux版本源代码)
采用标准C++实现,支持Windows,Unix-like 操作系统; 实验和工程的通用平台,不仅是一个检索系统,同时也是一个全文索引和检索框架 多个组件基于插件设计,不仅可以采用C/C++对系统进行扩展,也可以通过内置的跨...
5星 · 资源好评率100%
自己动手写搜索引擎(罗刚著).doc
4.1.2 结构化信息提取 54 4.1.3 网页去噪 60 4.1.4 网页结构相似度计算 63 4.1.5 正文提取的工具FireBug 64 4.1.6 正文提取的工具NekoHTML 66 4.1.7 正文提取 68 4.2 从非HTML文件中提取文本 73 4.2.1 TEXT文件 73 ...
5星 · 资源好评率100%
Python 结巴分词实现关键词抽取分析
这个可以追溯到文献检索初期,当时还不支持全文搜索的时候,关键词就可以作为搜索这篇论文的词语。因此,目前依然可以在论文中看到关键词这一项。 除了这些,关键词还可以在文本聚类、分类、自动摘要等领域中有着...
最新Java JDK 8安装版(Windows 64位)
资源内容直接来自官网,没有添加任何其它额外内容;旨在便捷地获取最新版的Java API(避免因地域原因被限制访问,因网络原因无法稳定有效下载等情况)
5星 · 资源好评率100%
阿里巴巴Java开发手册(终极版).pdf
阿里巴巴Java开发手册(终极版).pdf
牛客练习题.txt
JAVA练习题
5星 · 资源好评率100%
aspose-words.zip
aspose-words资源含xml
jdk-8u241-windows-x64.exe
JDK的版本1.8.0 JDK(Java Development Kit) 是 Java 语言的软件开发工具包(SDK)。 SE(JavaSE),standard edition,标准版,是我们通常用的一个版本,从JDK 5.0开始,改名为Java SE。
5星 · 资源好评率100%
jdk11 免费下载 / 版本号 jdk11.0.4.zip
jdk11的官网版本免费下载,官网下载网络延迟大,该文档可直接从官网下载
JDk11API中文帮助文档.zip / 免费下载
jdk11中文帮助文档,免费下载
3星 · 编辑精心推荐
45套java程序员简历模板
有一年经验的模板,也有多年经验的模板,共计java45套简历模板,应对各个时期的java程序员!!!!
4星 · 用户满意度95%
基于SpringBoot+Vue实现增删改查和分页查询DEMO(源码+数据库)
springboot项目,基于SpringBoot+Vue实现增删改查分页DEMO(源码+数据库) 技术栈 数据库:MySQL 后端框架:SpringBoot+Spring Data JPA 前端框架:Vue-ElementUI
java学生成绩管理系统(GUI+Excel).zip
javaSwing编写的学生成绩管理系统,GUI界面,实现了增删改查、表格排序等功能,详情请看我的博客 https://blog.csdn.net/qq_52889967/article/details/118581246
5星 · 资源好评率100%
windows系统Java JDK8安装包
windows系统下的Java JDK8安装包,安装时请参考
基于JavaWeb的SSM的音乐网站(源码+数据库+报告)开源项目.zip
系统测试报告 问题一、环境配置复杂 Spring框架是基于java开发的框架,相比于ThinkPHP框架,单从文件大小来看就相差几十M,配置起来也是非常麻烦。 Spring框架并没有像XAMPP一样的集成环境的软件可以选用,因此数据库和服务器都必须独立安装。Spring框架相比于HTML文件更加支持jsp文件,因此服务器的选择上选择了Tomcat进行开发。数据库需要本地安装并且配置好Mysql。
5星 · 资源好评率100%
javaweb项目 网上订餐系统(完整源码)
完整的javaweb项目,有很大的参考价值,对学习java有很大帮助!
4星 · 用户满意度95%
10.4版本libcms.so文件
10.4版本libcms.so文件,so文件是unix(一个系统的名字)的动态连接库,是二进制文件,作用相当于windows下的.dll文件
5星 · 资源好评率100%
labuladong 的算法小抄最新版.zip
GitHub 上标星 74k 的算法小抄,labuladong 出品,绝壁精品。总共 60 多篇,基于 LeetCode 的题目,涵盖了所有题型和技巧,而且做到了举一反三、通俗易懂,绝不是简单的代码堆砌。
4星 · 用户满意度95%
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论7
最新资源