没有合适的资源?快使用搜索试试~ 我知道了~
Wikipedia2Lucene:从HDFS导入Wikipedia XML转储到Lucene索引或Elasticsearch,并...

共77个文件
xml:61个
java:8个
properties:2个

需积分: 10 38 浏览量
2021-05-15
07:58:31
上传
评论
收藏 229KB ZIP 举报
温馨提示
维基百科 从HDFS导入Wikipedia XML转储到Lucene索引或Elasticsearch,并基于Lucene的MoreLikeThis查询检索类似的Wikipedia文章。 此应用程序是基于文本的文档相似性度量的实现,该度量被用作的研究中的基准度量。 将Wikipedia文章添加到Elasticsearch索引 用法 java -cp WikiLucene.jar de.tuberlin.dima.mschwarzer.lucene.WikiElasticSearch \ WIKI-XML-DUMP HOST INDEX TYPE [START] [LIMIT] [RESET] 参数 WIKI-XML-DUMP:Wikipedia XML转储的路径(位于HDFS上)。 主机:Elasticsearch NameNode的主机或IP。 索引:Elasticsea
资源推荐
资源详情
资源评论















收起资源包目录









































































































共 77 条
- 1
资源评论


Rainy.凌霄
- 粉丝: 23
- 资源: 4603
上传资源 快速赚钱
我的内容管理 展开
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助


安全验证
文档复制为VIP权益,开通VIP直接复制
