下载  >  开发技术  >  C#  > 最新版Lucene.Net盘古分词2.0

最新版Lucene.Net盘古分词2.0 评分:

支持全文索引Lucene.Net4.8版本,最新版盘古分词2.0

...展开详情
2018-10-06 上传 大小:2.5MB
举报 收藏
分享

评论 下载该资源后可以进行评论 共1条

ziyouren521125 差评,明明是3.0的
2019-10-23
回复
Lucene.net的四个版本(更新至2018.1.26 )

基于Lucene.net的四个版本(更新至2018.1.26 ) ------------------------------- Lucene.Net.2.9.2.2-支持.net2.0和4.0; Lucene.Net.2.9.4.1 仅支持.net4.0; Lucene.Net.3.0.3 z支持3.5和4.0; Lucene.Net.4.8.0-beta00005支持.net4.5;

立即下载
盘古分词2.3.1.0

盘古分词可以根据词频来解决分词的歧义题目 多元分词 盘古分词提供多重输入解决分词粒度和分词精度衡量的问题 详见eaglet/archive/2008/10/02/.html 中文人名识别 输入:“张三说切实其实实在理” 分词了局:张三/说/的/确实/在理/ 输入“李三买了一张三角桌子” 分词结果:李三/买/了/一张/三角/桌子/ 详见eaglet/archive/2009/08/19/.html 强逼一元分词 输入“张三说的确实在理” 分词结果:中文。张(0,1)/张三(0,5)/三说的(1,1)/三(1,1)/说(2,5)/的(3,5)/确(4,1)/确实(4,5)/实(5,1)/在(6,1

立即下载
新版盘古分词词库

盘古分词词库

立即下载
盘古分词 工具

盘古分词 简介: 盘古分词 是由eaglet 开发的一款基于字典的中英文分词组件 主要功能: 中英文分词,未登录词识别,多元歧义自动识别,全角字符识别能力 主要性能指标: 分词准确度:90%以上 处理速度: 300-600KBytes/s Core Duo 1.8GHz 用于测试的句子: 长春市长春节致词 长春市长春药店 IBM的技术和服务都不错 张三在一月份工作会议上说的确实在理 于北京时间5月10日举行运动会 我的和服务必在明天做好

立即下载
盘古分词字典文件 词库

盘古分词字典文件 词库,将此文件放置于盘古分词根目录,修改PanGu.xml(此文件可以自动生成)文件中<DictionaryPath>Dictionaries</DictionaryPath>此节点的值为Dictionaries即可

立即下载
盘古分词 词典dct

盘古分词 词典 包含 1.ChsDoubleName1.txt 2.ChsDoubleName2.txt 3.ChsSingleName.txt 4.Dict.dct 5.Stopword.txt 6.Synonym.txt 7.Wildcard.txt

立即下载
完整的站内搜索引擎(Lucene.Net+盘古分词)

功能简介 站内搜索使用的技术 Log4Net 日志记录 lucene.NET 全文检索开发包,只能检索文本信息 分词(lucene.Net提供StandardAnalyzer一元分词,按照单个字进行分词,一个汉字一个词) 盘古分词 基于词库的分词,可以维护词库 首先我们新增的SearchHelper类需要将其做成一个单例,使用单例是因为:有许多地方需要使用使用,但我们同时又希望只有一个对象去操作。 其次,使用Lucene.Net需要将被搜索的进行索引,然后保存到索引库以便被搜索,我们引入了“生产者,消费者模式”. 生产者就是当我们新增,修改或删除的时候我们就需要将其在索引库进行相应的

立即下载
最新版lucene.net.4.8.0-beta00005

lucene.net.4.8.0-beta00005最新版,全文索引

立即下载
盘古分词源代码

盘古分词是一个基于 .net framework 的中英文分词组件。主要功能 中文未登录词识别 盘古分词可以对一些不在字典中的未登录词自动识别 词频优先 盘古分词可以根据词频来解决分词的歧义问题 多元分词 盘古分词提供多重输出解决分词粒度和分词精度权衡的问题 中文人名识别 输入: “张三说的确实在理” 分词结果:张三/说/的/确实/在理/ 输入 “李三买了一张三角桌子” 分词结果:李三/买/了/一张/三角/桌子/ 强制一元分词 输入 “张三说的确实在理” 分词结果: 张(0,1)/张三(0,5)/三说的(1,1)/三(1,1)/说(2,5)/的(3,5)/确(4,1)/确实(4,5)/实(5

立即下载