1.\testHLSeg\depends\hylanda-reidxclient-1.0.3.jar 为海量云分词提供的客户端Jar
2.\testHLSeg\depends\ 为依赖的JAR包,应用时,请他们确保在classpath可以搜索到
3.\testHLSeg\ 目录为eclipse的样例工程,可以直接导入eclipse;
4.\测试用输入XML\ 目录内为测试可以参考的XML文件;
没有合适的资源?快使用搜索试试~ 我知道了~
HLSeg_JAVA_Example.zip_关键词抽取
共11个文件
jar:4个
xml:2个
java:1个
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 199 浏览量
2022-09-24
05:01:56
上传
评论
收藏 398KB ZIP 举报
温馨提示
中文分词 支持对输出颗粒的控制,可以输出普通颗粒与用于检索的小颗粒;同时输出词串所在句号、段号、词号、词性等信息。 关于分词输出颗粒,我们认为各种应用对分词要求的颗粒度是不同的. 比如自动分类、关键词抽取比搜索需要的分词颗粒度要大, 因为这样表示文本语义特征时效果会更好, 而检索有一个查全率的要求, 就需要把分词单位做的更为细致, 不然就会造成漏查。 海量系统现在提供了两种颗粒的规则, 其中, 默认的为大颗粒接口, 主要用于自动分类、信息挖潜、机器翻译、语音合成、人工智能等领域, 用于提升信息分析的有效性和准确性 另外一种应用为小颗粒度分词也叫检索优化分词接口, 用于信息检索领域, 用于提升查全率。
资源详情
资源评论
资源推荐
收起资源包目录
HLSeg_JAVA_Example.zip (11个子文件)
JAVA调用样例代码
测试用输入XML
HLSegment.xml 3KB
testHLSeg
depends
commons-httpclient-3.1.jar 298KB
commons-codec-1.5.jar 71KB
commons-logging.jar 54KB
hylanda-reidxclient-1.0.3.jar 3KB
bin
.settings
org.eclipse.jdt.core.prefs 629B
src
testHLSeg.java 2KB
.project 385B
.classpath 584B
HLSegment.xml 735B
样例代码说明.txt 269B
共 11 条
- 1
刘良运
- 粉丝: 71
- 资源: 1万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0