下载 >  开发技术 >  C# > 完整的站内搜索引擎(Lucene.Net+盘古分词)

完整的站内搜索引擎(Lucene.Net+盘古分词) 评分:

功能简介 站内搜索使用的技术 Log4Net 日志记录 lucene.NET 全文检索开发包,只能检索文本信息 分词(lucene.Net提供StandardAnalyzer一元分词,按照单个字进行分词,一个汉字一个词) 盘古分词 基于词库的分词,可以维护词库 首先我们新增的SearchHelper类需要将其做成一个单例,使用单例是因为:有许多地方需要使用使用,但我们同时又希望只有一个对象去操作。 其次,使用Lucene.Net需要将被搜索的进行索引,然后保存到索引库以便被搜索,我们引入了“生产者,消费者模式”. 生产者就是当我们新增,修改或删除的时候我们就需要将其在索引库进行相应的操作,我们将此操作交给另一个线程去处理,这个线程就是我们的消费者,使 用“生产者,消费者模式”是因为:索引库使用前需解锁操作,使用完成之后必须解锁,所以只能有一个对象对索引库进行操作,避免数据混乱,所以要使用生产者,消费者模式 首先我们来看生产者。 代码完善,已经部署到大型电子商务中使用,性能非常好。
...展开详情收缩
2017-03-03 上传大小:24.36MB
分享
收藏 (3) 举报

评论 共3条

suifengjufeng 先下载看看什么东西
2017-11-28
回复
fyhjhdn888 上挡了,内容和标题写的不一致,纯粹是骗分的,大家千万不要下载。
2017-09-04
回复
qq_27073293 没有看到东西 ,不知道是啥玩意
2017-05-13
回复
Lucene.Net+盘古分词器(详细介绍)
lucene.net +盘古分词器 实例

Lucene.Net只是一个全文检索开发包,不是一个成型的搜索引擎 它提供了类似SQLServer数据库正式版中的全文检索功能的索引库 你把数据扔给Lucene.Net,【Lucene.Net只针对文本信息建立索引,所以他只接收文本信息,如果不是文本信息,则要转换为文本信息】它会将文本内容分词后保存在索引库中,当用户输入关键字提交查询时,Lucene.Net从索引库中检索关键字数据,所以搜索速度非常快,适合于用户开发自己站内的搜索引擎 Q:分词 A:即将"不是所有痞子都叫一毛"文本内容通过分词算法 分割成为“不是” “所有” “痞子” “都” “叫” "一毛" 。 但是Lucene.Net

立即下载
lucene.net+盘古分词

lucene.net+盘古分词实现全文搜索,数据匹配,关键词高亮显示等等

立即下载
LuceneNet盘古分词
盘古分词,PanGu.dll

PanGu.dll,盘古分词dll,盘古分词类库

立即下载
盘古分词demo,盘古分词怎么用
最新版Lucene.Net盘古分词2.0

支持全文索引Lucene.Net4.8版本,最新版盘古分词2.0

立即下载
盘古分词、lucene3.0.3搜索的使用示例.zip

盘古分词 lucene3.0.3 使用 示例 可以方便地整合到项目中使用,.net 4.0的。

立即下载
盘古分词字典文件 词库

盘古分词字典文件 词库,将此文件放置于盘古分词根目录,修改PanGu.xml(此文件可以自动生成)文件中<DictionaryPath>Dictionaries</DictionaryPath>此节点的值为Dictionaries即可

立即下载
盘古分词 DictManage.exe

可以通过该工具,对盘古分词的词库进行升级,添加自己想要的词

立即下载
C# 盘古分词

1、 修改字典格式,提高字典加载速度 2、 增加对英文专业名词的支持 如C++,C#等只要加入字典就可以被分出来 3、 增加词频判断功能,在无法取舍时根据词频取舍 4、 增加优先优先词频选项,通过这个选项动态决定分词粒度 需打开 FreqFirst 5、 增加中文人名前后缀统计和根据该统计定位人名的功能 6、 增加中文人名和未登录词出现频率统计功能 7、 增加自动更新字典功能,对超过阈值的人名和未登录词自动插入字典 需打开 AutoInsertUnknownWords 开关 并设置 UnknownWordsThreshold,(不推荐自动插入,推荐手工插入) 8、 增加定期保存字

立即下载
最新整理 盘古分词 dct词库文件 720592条 24.6M

最新整理 盘古分词 dct词库文件 共720592条数据,文件大小:24.6M

立即下载
新版盘古代码+分词词库+分词工具

新版盘古代码+分词词库+分词工具 Pan Gu Segment is a library that can segment Chinese and English words from sentence. 盘古分词是一个中英文分词组件。作者eaglet 曾经开发过KTDictSeg 中文分词组件,拥有大量用户。 作者基于之前分词组件的开发经验,结合最新的开发技术重新编写了盘古分词组件。

立即下载
PanGu盘古分词源码

PanGu_SourceCode_V2.3.1.0 盘古分词源码下载

立即下载
盘古分词字典

发布盘古分词少了一个字典, 那么这个是补过来的。

立即下载
Lucene3.0.3+盘古分词 资源汇总

整理开发Lucene+盘古分词 开发搜索引擎用到的所有必备资源 亲测可用

立即下载
盘古分词 工具

盘古分词 简介: 盘古分词 是由eaglet 开发的一款基于字典的中英文分词组件 主要功能: 中英文分词,未登录词识别,多元歧义自动识别,全角字符识别能力 主要性能指标: 分词准确度:90%以上 处理速度: 300-600KBytes/s Core Duo 1.8GHz 用于测试的句子: 长春市长春节致词 长春市长春药店 IBM的技术和服务都不错 张三在一月份工作会议上说的确实在理 于北京时间5月10日举行运动会 我的和服务必在明天做好

立即下载

热点文章

img

spring mvc+mybatis+mysql+maven+bootstrap 整合实现增删查改简单实例.zip

资源所需积分/C币 当前拥有积分 当前拥有C币
5 0 0
点击完成任务获取下载码
输入下载码
为了良好体验,不建议使用迅雷下载
img

完整的站内搜索引擎(Lucene.Net+盘古分词)

会员到期时间: 剩余下载个数: 剩余C币: 剩余积分:0
为了良好体验,不建议使用迅雷下载
VIP下载
您今日下载次数已达上限(为了良好下载体验及使用,每位用户24小时之内最多可下载20个资源)

积分不足!

资源所需积分/C币 当前拥有积分
您可以选择
开通VIP
4000万
程序员的必选
600万
绿色安全资源
现在开通
立省522元
或者
购买C币兑换积分 C币抽奖
img

资源所需积分/C币 当前拥有积分 当前拥有C币
5 4 45
为了良好体验,不建议使用迅雷下载
确认下载
img

资源所需积分/C币 当前拥有积分 当前拥有C币
4 0 0
为了良好体验,不建议使用迅雷下载
VIP和C币套餐优惠
img

资源所需积分/C币 当前拥有积分 当前拥有C币
5 4 45
您的积分不足,将扣除 10 C币
为了良好体验,不建议使用迅雷下载
确认下载
下载
您还未下载过该资源
无法举报自己的资源

兑换成功

你当前的下载分为234开始下载资源
你还不是VIP会员
开通VIP会员权限,免积分下载
立即开通

你下载资源过于频繁,请输入验证码

您因违反CSDN下载频道规则而被锁定帐户,如有疑问,请联络:webmaster@csdn.net!

举报

  • 举报人:
  • 被举报人:
  • *类型:
    • *投诉人姓名:
    • *投诉人联系方式:
    • *版权证明:
  • *详细原因: