HLSeg_JAVA_Example.zip_关键词抽取

共11个文件

jar：4个

xml：2个

java：1个

1.该资源内容由用户上传，如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款（资源遇到问题，请及时私信上传者）

版权申诉

关键词抽取

0 下载量 199 浏览量 2022-09-24 05:01:56 上传评论收藏 398KB ZIP 举报

温馨提示

中文分词支持对输出颗粒的控制，可以输出普通颗粒与用于检索的小颗粒；同时输出词串所在句号、段号、词号、词性等信息。关于分词输出颗粒，我们认为各种应用对分词要求的颗粒度是不同的. 比如自动分类、关键词抽取比搜索需要的分词颗粒度要大, 因为这样表示文本语义特征时效果会更好, 而检索有一个查全率的要求, 就需要把分词单位做的更为细致, 不然就会造成漏查。海量系统现在提供了两种颗粒的规则, 其中, 默认的为大颗粒接口, 主要用于自动分类、信息挖潜、机器翻译、语音合成、人工智能等领域, 用于提升信息分析的有效性和准确性另外一种应用为小颗粒度分词也叫检索优化分词接口, 用于信息检索领域, 用于提升查全率。

资源详情

资源评论

资源推荐

收起资源包目录

HLSeg_JAVA_Example.zip （11个子文件）

JAVA调用样例代码

测试用输入XML

HLSegment.xml 3KB

testHLSeg

depends

commons-httpclient-3.1.jar 298KB

commons-codec-1.5.jar 71KB

commons-logging.jar 54KB

hylanda-reidxclient-1.0.3.jar 3KB

bin

.settings

org.eclipse.jdt.core.prefs 629B

src

testHLSeg.java 2KB

.project 385B

.classpath 584B

HLSegment.xml 735B

样例代码说明.txt 269B

共 11 条

1.\testHLSeg\depends\hylanda-reidxclient-1.0.3.jar 为海量云分词提供的客户端Jar 2.\testHLSeg\depends\ 为依赖的JAR包，应用时，请他们确保在classpath可以搜索到 3.\testHLSeg\ 目录为eclipse的样例工程，可以直接导入eclipse； 4.\测试用输入XML\ 目录内为测试可以参考的XML文件；