# nlp-phrase
根据nlp中互信息以及左右信息得到目标文件夹中的文本的重要短语,然后用solr建立索引。
##新功能列表
* 增加新功能3:增加 eshore.cn.it.main.LinesPhraser 提取短语的时候,如果所有文件是存放在一个文件里面,那么就用这个类,并且这个类可以处理每行以指定分隔符合分割的文件,只处理某一列,最后提取重要短语,保存结果到指定文件中
* 增加新功能2:增加 eshore.cn.it.main.DocsPhraser 目标文件夹中所有文件的短语提取,保存结果到指定文件中
* 增加新功能1:修改 eshore.cn.it.business.IndexAction 可以选择是否建立索引,是否将提取的文件保存到本地指定文本中。
配置类:eshore.cn.it.phrase.ActionConfig.java
里面可以配置需要建立提取关键短语的文本语料库等,请查看该类注释。
程序入口:eshore.cn.it.main
* 1. IndexStart.java 在配置类中配置好参数之后,直接运行此程序,将会自动建立索引到Solr中,格式请查看对应类
* 2. SearchStart.java 查询类,指定字符查询,最后保存到配置类中指定的位置。
具体程序运行结果,请测试即可。
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
增加新功能3:增加 eshore.cn.it.main.LinesPhraser 提取短语的时候,如果所有文件是存放在一个文件里面,那么就用这个类,并且这个类可以处理每行以指定分隔符合分割的文件,只处理某一列,最后提取重要短语,保存结果到指定文件中 增加新功能2:增加 eshore.cn.it.main.DocsPhraser 目标文件夹中所有文件的短语提取,保存结果到指定文件中 增加新功能1:修改 eshore.cn.it.business.IndexAction 可以选择是否建立索引,是否将提取的文件保存到本地指定文本中。 配置类:eshore.cn.it.phrase.ActionConfig.java 里面可以配置需要建立提取关键短语的文本语料库等,请查看该类注释。 程序入口:eshore.cn.it.main IndexStart.java 在配置类中配置好参数之后,直接运行此程序,将会自动建立索引到Solr中,格式请查看对应类 SearchStart.java 查询类,指定字符查询,最后保存到配置类中指定的位置。 具体程序运行结果,请测试即可。
资源推荐
资源详情
资源评论
收起资源包目录
nlp-phrases-master.zip (19个子文件)
nlp-phrases-master
pom.xml 1KB
src
test
java
eshore
cn
it
phrase
TestPhrase.java 2KB
main
java
eshore
cn
it
business
PhraseAction.java 3KB
IndexAction.java 2KB
WriteAction.java 451B
SolrAction.java 2KB
WordSearchAction.java 2KB
phrase
DocumentPhrases.java 1KB
ActionConfig.java 1KB
main
DocsPhraser.java 6KB
SearchStart.java 209B
LinesPhraser.java 5KB
IndexStart.java 171B
data
dictionary.zip 40.16MB
model
README.txt 389B
.gitignore 41B
LICENSE 11KB
.gitignore 227B
README.md 1KB
共 19 条
- 1
资源评论
淘金开源
- 粉丝: 2388
- 资源: 173
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功