Lucene中文分词器包
资源大小: 853.21KB
资源类型:![]()
发布人: linliangyi2006
发布日期: 3个月前
Tag:
Java Lucene 中文分词 共享 开源
资源分: 0
下载人数: 659
软件说明:
来自“猎图网 www.richmap.cn”基于IKAnalyzer分词算法的准商业化Lucene中文分词器。<br>1. 正向全切分算法,42万汉字字符/每秒的处理能力(IBM ThinkPad 酷睿I 1.6G 1G内存 WinXP)<br>2. 对数量词、地名、路名的优化处理<br>3. 对未知词汇采用自识别结合二元切分算法,确保搜索召回率<br>(使用方法请参考IKAnalyzer V1.1版)




共有评论条