没有合适的资源?快使用搜索试试~ 我知道了~
focused-ir-tool:重点信息检索工具
共26个文件
xml:11个
java:4个
properties:4个
需积分: 8 0 下载量 2 浏览量
2021-07-02
23:53:38
上传
评论
收藏 58KB ZIP 举报
温馨提示
重点工具 重点信息检索工具 一种用 Java 编写的工具,允许在已爬网和索引页面上进行聚焦爬网和布尔信息检索。 它使用 Apache Nutch (Lucene) 进行爬网,使用一个插件来强制聚焦,并使用 Apache Solr 进行索引和布尔检索。 jar_dependencies 文件夹包含编译项目所需的 JAR 文件列表。 该项目可以使用ant(1.8.0及以上版本)进行编译。 需要修改 Apache Nutch 源代码以将插件添加到解析管道中。 说明在 apache-nutch 文件夹中给出。 需要设置 Apache Solr 的架构以正确索引网页数据。 apache-solr 文件夹中给出了相同的说明。 如何编译和运行该工具: 通过从 Apache 网站下载 Nutch 的源代码和 Solr 的可执行文件并按照相应文件夹中提到的说明操作,设置 Apache Nutch(版
资源推荐
资源详情
资源评论
收起资源包目录
focused-ir-tool-master.zip (26个子文件)
focused-ir-tool-master
src
SLinkClusterer.java 8KB
MainGUI.java 60KB
KMeansClusterer.java 9KB
nbproject
genfiles.properties 467B
build-impl.xml 76KB
project.properties 11KB
project.xml 508B
private
config.properties 0B
private.properties 153B
private.xml 661B
README.md 2KB
build.xml 3KB
manifest.mf 82B
apache-solr
For 3.X
schema.xml 6KB
INSTRUCTIONS 307B
For 4.X
schema.xml 62KB
jar_dependencies
required_files 2KB
apache-nutch
parse-keyword
ivy.xml 561B
src
java
org
apache
nutch
parse
keyword
KeywordFilter.java 4KB
plugin.xml 576B
build.xml 125B
README.txt 735B
INSTRUCTIONS 425B
nutch-site.xml 554B
build.xml 8KB
regex-urlfilter.txt 2KB
共 26 条
- 1
资源评论
步衫
- 粉丝: 29
- 资源: 4641
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功