没有合适的资源?快使用搜索试试~
我知道了~
文库首页
网络技术
其它
nutch中文分词
nutch中文分词
nutch
需积分: 10
4 下载量
85 浏览量
2013-07-28
15:00:02
上传
评论
收藏
56KB
DOC
举报
温馨提示
立即下载
nutch应用,nutch中文分词,nutch中文乱码
资源推荐
资源评论
基于Nutch中文分词的研究与实现
浏览:130
作为舆情监测系统的一部分,本文的目标是基于Nutch,同时,结合目前最常用中文分词技术,根据不同的中文分词方法,实验并得出不同分词方法在性能以及使用环境上的优缺点,以此为舆情监测系统选择合适的中文分词方法,为系统下一步的实现打下基础。
nutch的中文分词词库文件
浏览:2
3星 · 编辑精心推荐
用于Nutch的中文分词,效果向单簧管得得好,强烈建议支持这种格式的数据,这是一个里程碑
中文分词方法
浏览:136
1)基于词典的匹配: 前向最大匹配,后向最大匹配 2)基于字的标注: 最大熵模型,条件随机场模型,感知器模型 3)其它方法 与词性标注结合,与句法分析结合
中文对分词
浏览:108
详细讲述了对中文词对的分词算法,对大家会很有帮助!
结巴中文分词
浏览:49
5星 · 资源好评率100%
比较好的Python下的中文分词工具,但是速度不是特别快,可以看看我的博客说明
中文分词词库
浏览:76
5星 · 资源好评率100%
中文分词词库,较全,适合做搜索,输入法等程式
Nutch中文分词插件的编写与配置
浏览:88
Nutch中文分词插件的编写与配置,由于Internet的迅猛发展,使得用户查找信息犹如大海捞针,而搜索引擎则能帮用户很好的解决这个问题。 Nutch是用java语言开发的,基于Lucene的完整的网络搜索引擎,并采用插件机制进行...
Nutch中文分词的设计与实现
浏览:115
给个免费的吧!!大家也都不容易,pdf文件,论文
Nutch中文分词插件的编写与实现.pdf
浏览:98
关于nutch的搜索引擎的中文分词的研究,包括了编写与实现
实验报告(利用Nutch和IKanalyzer构造中文分词搜索引擎)
浏览:66
利用Nutch和IKanalyzer构造中文分词搜索引擎
中文分词技术
浏览:65
c#开发的winform项目,网上搜集的资料。基于.net2.0的轻量级分词组件,分词效率和准确性都较高。KTDictSeg 简介: KTDictSeg 是由KaiToo搜索开发的一款基于字典的简单中英文分词算法
新闻分词_leafk6w_分词_中文分词_
浏览:124
对excel里的新闻标题进行分词,并将分词结果写到excel
SIGHAN-中文分词
浏览:150
中文分词
jieba中文分词
浏览:151
NULL 博文链接:https://java--hhf.iteye.com/blog/2181919
f_中文分词_
浏览:58
该程序实现了基于词典的前向最大匹配算法分词
论文研究-基于Nutch的中文分词插件实现 .pdf
浏览:201
基于Nutch的中文分词插件实现,张文龙,刘一伟,中文分词是中文垂直搜索引擎中的一个关键技术,分词的好坏直接影响提取文本的精确度。Nutch是一个开源的Web搜索引擎,它为英文用户�
基于Java的搜索引擎Nutch中文搜索技术研究
浏览:86
5星 · 资源好评率100%
为了使它能够支持中文搜索,本文在分析了Nutch结构的基础上,采用词表分词技术和前向匹配分词算法对中文信息进行分词,以JavaCC脚本实现上下文相关文法中文分析模块,成功实现了Nutch中文搜索功能。 关键词:搜索...
中文分词工具word-1.0,Java实现的中文分词组件多种基于词典的分词算法
浏览:51
5星 · 资源好评率100%
word分词是一个Java实现的中文分词组件,提供了多种基于词典的分词算法,并利用ngram模型来消除歧义。 能准确识别英文、数字,以及日期、时间等数量词,能识别人名、地名、组织机构名等未登录词。 同时提供了Lucene...
中文分词切分技术研究
浏览:168
本文分析了现有的基于词典的分词算法,在比较各种算法优缺点的基础上提出了将正向匹配算法与逆向匹配 算法所得到的结果集进行叠加,生成粗分结果集的新观点,再对生成的粗分结果集构造非负权有向图,最后应用最短...
nutch开发资料 搜索引擎
浏览:107
3星 · 编辑精心推荐
很好的哦!! ~~~~~~~~~~~~~~~~~~~ 我开发用了很好
中文信息处理中文分词
浏览:191
由于大小所限,将部分.mdb文件删除,如若运行错误,可考虑将.mdb文件复制到其他文件下,使用C++,MFC完成
b_中文分词_
浏览:94
该程序实现了基于词典的后向最大匹配算法的分词
Paoding中文分词
浏览:75
5星 · 资源好评率100%
庖丁解牛中文分词,速度不错,词库也很全面,非常不错!
paoding中文分词
浏览:113
paoding是一个不错的中文分词程序,中文分词是很多NLP需要用到的,希望能对大家有点用
中文分词中文切词分词
浏览:97
3星 · 编辑精心推荐
中文分词源代码,论文全部都有,获得2010界准阴工学院优秀毕业设计 词库高达几十万
Nutch1.0:Nutch1.0修改版(整合中文分词)原始码修改,编译打包-修改
浏览:163
Nutch1.0:Nutch1.0修改版(整合中文分词)原始码修改,编译打包
nutch搜索引擎windows版本修改版
浏览:96
5星 · 资源好评率100%
nutch搜索引擎windows版本,运行bat文件即可,包含中文分词技术,采用IKAnalyzer。jar分词插件,并做了自定义关键分词的修改,可根据自己从事的行业关键字做分词,在此感谢原作者,实现每天晚上1点钟运行爬行工作,...
nutch搜索引擎windows版本part1
浏览:124
5星 · 资源好评率100%
nutch搜索引擎windows版本,运行bat文件即可,包含中文分词技术,采用IKAnalyzer。jar分词插件,并做了自定义关键分词的修改,可根据自己从事的行业关键字做分词,在此感谢原作者,实现每天晚上1点钟运行爬行工作,...
nutch搜索引擎windows版本part2
浏览:37
4星 · 用户满意度95%
nutch搜索引擎windows版本,运行bat文件即可,包含中文分词技术,采用IKAnalyzer。jar分词插件,并做了自定义关键分词的修改,可根据自己从事的行业关键字做分词,在此感谢原作者,实现每天晚上1点钟运行爬行工作,...
评论
收藏
内容反馈
立即下载
资源评论
资源反馈
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~
联系上传者
评论
fangke216
粉丝: 0
资源:
8
私信
上传资源 快速赚钱
我的内容管理
展开
我的资源
快来上传第一个资源
我的收益
登录查看自己的收益
我的积分
登录查看自己的积分
我的C币
登录后查看C币余额
我的收藏
我的下载
下载帮助
前往需求广场,查看用户热搜
最新资源
mmexport1714231897406.jpg
甘晴void的一些相关资源
I LOVE MY SMALL LITTLE CAT的样例音频
c语言基础的一些相关资源
时间复杂度的一些相关资源
main.c
个人Rust学习提纲.7z
MATLAB学习个人笔记总结.7z
D525 6口爱快软路由BIOS芯片组8280 1HBM(ICH8-ME)6口网卡lntel 82583v
SystemVersion.plist文件
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功