Jcseg是一个基于mmseg算法的轻量级Java中文分词器,提供关键字提取、关键短语提取、关键句子提取和文章自动摘要等多种功能。此外,它还提供了一个基于Jetty的web服务器,可用于各种语言的http调用,同时也提供了最新版本的lucene、solr、elasticsearch、opensearch的搜索分词接口。这些接口特别适用于搜索引擎和自然语言处理等特殊领域的应用。Jcseg的目标是解决中文分词难的问题,并提供更为复杂的分词功能。值得一提的是,Jcseg是一个开源的分词器,任何人都可以免费使用、学习、修改和分享。如果你需要一个高效、可靠的中文分词器,那么Jcseg绝对是一个不错的选择。
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
Jcseg是什么? Jcseg是基于mmseg算法的一个轻量级中文分词器,同时集成了关键字提取,关键短语提取,关键句子提取和文章自动摘要等功能,并且提供了一个基于Jetty的web服务器,方便各大语言直接http调用,同时提供了最新版本的lucene, solr, elasticsearch/opensearch的分词接口!Jcseg自带了一个 jcseg.properties文件用于快速配置而得到适合不同场合的分词应用,例如:最大匹配词长,是否开启中文人名识别,是否追加拼音,是否追加同义词等! Jcseg核心功能: 中文分词:mmseg算法 + Jcseg 独创的优化算法,七种切分模式。 关键字提取:基于textRank算法。 关键短语提取:基于textRank算法。 关键句子提取:基于textRank算法。 文章自动摘要:基于BM25+textRank算法。 自动词性标注:基于词库+(统计歧义去除计划),目前效果不是很理想,对词性标注结果要求较高的应用不建议使用。 命名实体标注:基于词库+(统计歧义去除计划),电子邮件,网址,大陆手机号码,地名,人名,货币,date
资源推荐
资源详情
资源评论























收起资源包目录



共 2 条
- 1
资源评论


琉底骅网络
- 粉丝: 176
- 资源: 95
上传资源 快速赚钱
我的内容管理 收起
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助


会员权益专享
安全验证
文档复制为VIP权益,开通VIP直接复制
