下载  >  开发技术  >  Java  > jcseg-1.9.7.zip

jcseg-1.9.7.zip 评分

Jcseg是基于mmseg算法的一个轻量级开源中文分词器,同时集成了关键字提取,关键短语提取,关键句子提取和文章自动摘要等功能,并且提供了最新版本的lucene, solr, elasticsearch的分词接口, Jcseg自带了一个 jcseg.properties文件用于快速配置而得到适合不同场合的分词应用,例如:最大匹配词长,是否开启中文人名识别,是否追加拼音,是否追加同义词等! PS:压缩包中含有jcseg-core-1.9.7.jar、jcseg-analyzer-1.9.7.jar、jcseg-1.9.7-javadoc.jar、Jcseg-开发帮助文档.pdf。

...展开详情
所需积分/C币:5 上传时间:2015-12-17 资源大小:804KB
举报 举报 收藏 收藏
分享 分享
jcseg-core-1.9.7.jar

基于mmseg算法的一个轻量级开源中文分词器: Jcseg-1.9.7: 1. 词库优化:增加新词,去掉一些无用词,部分词条词性优化。 2. 增加文章关键字提取:基于textRank算法。 3. 增加文章关键短语提取:基于textRank算法。 4. 增加文章关键句子/文章摘要提取:基于BM25+textRank算法。 5. 增加jcseg-server模块:嵌入jetty,提供了一个高性能的服务器,给关键字提取,关键短语提取,关键句子提取,文章摘要提取,中文分词都提供了restful api,并且标准为json结果输出. 6. 终端测试程序增加关键字/关键短语/关键句子/摘要提取

立即下载
jcseg分词需要的jar

jcseg是使用Java开发的一个开源的中文分词器,使用流行的mmseg算法实现。是一款独立的分词组件,不是针对lucene而开发,但是提供了最新版本的lucene和solr分词接口。jcseg目前最高版本jcseg目前最高版本jcseg目前最高版本jcseg目前最高版本jcseg是使用Java开发的一个开源的中文分词器,使用流行的mmseg算法实现。

立即下载
jcseg-core-1.9.4.jar

分词必备,人名识别准确率达到90%以上。封装好了的jar包

立即下载
Jcseg文档下载

Jcseg文档介绍内容

立即下载
jcseg-1.9.4-src-jar-dict.zip

jcseg-1.9.4-src-jar-dict.zip

立即下载
jcseg-1.9.5-src-jar-dict.zip

中文分词器:jcseg,支持人名识别,mmseg四种过滤算法,分词准确率达到了97%以上。 支持自定义词库。在lexicon文件夹下,可以随便添加/删除/更改词库和词库内容,并且对词库进行了分类。

立即下载
mmseg4j-analysis-1.9.2.jar 修改了4.6以后reset方法bug问题

mmseg4j-analysis-1.9.2.jar 修改了4.6以后reset方法bug问题 mmseg4j-analysis-1.9.2.jar 修改了4.6以后reset方法bug问题

立即下载
分词器mmseg4j 1.9.0.jar

mmseg4j用Chih-Hao Tsai 的MMSeg算法实现的中文分词器,并实现lucene的analyzer和solr的TokenizerFactory以方便在Lucene和Solr中使用。 MMSeg 算法有两种分词方法:Simple和Complex,都是基于正向最大匹配。Complex加了四个规则过虑。官方说:词语的正确识别率达到了 98.41%。mmseg4j已经实现了这两种分词算法。

立即下载
Jcseg开发帮助文档

Jcseg开发帮助文档,jcseg是使用Java开发的一个开源中文分词器,使用流行的mmseg算法实现,并且提供了最高版本的lucene-4.x和最高版本solr-4.x的分词接口.

立即下载
jcseg-core-1.9.6.jar

jcseg-core-1.9.6.jar

立即下载
jcseg中文分词器 1.9.2 解压密码1234

jcseg 是使用 Java 开发的一款开源的中文分词器, 使用 mmseg 算法. 分词准确率高达 98.4%, 支持中文人名识别, 同义词匹配, 停止词过滤... Jcseg 详细功能介绍: (可以略过, 方便查看新版本功能变化) 1。目前最高版本:jcseg-1.9.2。兼容最高版本 lucene-4.x 和最高版本 solr-4.x 2。mmseg 四种过滤算法,分词准确率达到了 98.41%。 3。支持自定义词库。在 lexicon 文件夹下,可以随便添加/删除/更改词库和词库内容,并且对词库进行了 分类。参考下面了解如何给 jcseg 添加词库/新词。 4。(!New) 支持词库

立即下载
jcseg,Jcseg 是基于 mmseg 算法的一个轻量级中文分词器,同时集成了关键字提取,关键短语提取,关键句子提取和文章自动摘要等功能,并且提供了一个基于 Jetty 的 web 服务器,方便各大语言直接 http 调用,同时提供了最新版本的 lucene, solr, elasticsearch 的分词接口!.zip

Jcseg是基于 mmseg 算法的一个轻量级中文分词器,同时集成了关键字提取,关键短语提取,关键句子提取和文章自动摘要等功能,并且提供了一个基于 Jetty 的 web 服务器,方便各大语言直接 http 调用,同时提供了最新版本的 lucene, solr, elasticsearch 的分词接口!Jcseg自带了一个 jcseg.properties 文件用于快速配置而得到适合不同场合的分词应用,例如:最大匹配词长,是否开启中文人名识别,是否追加拼音,是否追加同义词等!

立即下载
html+css+js制作的一个动态的新年贺卡

该代码是http://blog.csdn.net/qq_29656961/article/details/78155792博客里面的代码,代码里面有要用到的图片资源和音乐资源。

立即下载
Camtasia 9安装及破解方法绝对有效

附件中注册方法亲测有效,加以整理与大家共享。 由于附件大于60m传不上去,另附Camtasia 9百度云下载地址。免费自取 链接:http://pan.baidu.com/s/1kVABnhH 密码:xees

立即下载
电磁场与电磁波第四版谢处方 PDF

电磁场与电磁波第四版谢处方 (清晰版),做天线设计的可以作为参考。

立即下载
压缩包爆破解密工具(7z、rar、zip)

压缩包内包含三个工具,分别可以用来爆破解密7z压缩包、rar压缩包和zip压缩包。

立即下载
算法第四版 高清完整中文版PDF

《算法 第4版 》是Sedgewick之巨著 与高德纳TAOCP一脉相承 是算法领域经典的参考书 涵盖所有程序员必须掌握的50种算法 全面介绍了关于算法和数据结构的必备知识 并特别针对排序 搜索 图处理和字符串处理进行了论述 第4版具体给出了每位程序员应知应会的50个算法 提供了实际代码 而且这些Java代码实现采用了模块化的编程风格 读者可以方便地加以改造

立即下载
jdk1.8下载

jdk1.8下载

立即下载
DroidCamX 6.5 电脑端和手机端(2018年版本)

DroidCamX 6.5 适配安卓8.0和win10系统。让你的安卓手机变成摄像头。

立即下载