没有合适的资源?快使用搜索试试~ 我知道了~
wikipedia-to-elastic:分析和导出Wikipedia XML转储并将其导出到ElasticSearch以用作知...
共88个文件
java:45个
json:21个
txt:5个
需积分: 37 1 下载量 6 浏览量
2021-05-20
16:33:47
上传
评论
收藏 809KB ZIP 举报
温馨提示
Wikipedia到ElasticSearch 这是基于维基百科的知识资源。 而且还有一种多语言解析机制,可解析Wikipedia,Wikinews,Wikidata和其他Wikimedia .bz2转储到ElasticSearch索引中。 与Intel NLP Framework 集成 有关更多信息和示例,请查看此相关。 支持的语言: {英语,法语,西班牙语,德语,中文} *请注意,关系完整性仅针对英语进行过测试。 其他语言可能需要进行一些调整。 从维基百科中提取关系类型和特征 使用3种不同类型的Wikipedia页面:{重定向/消除歧义/标题},以提取6种不同的语义特征以执行任务,例如识别语义关系,实体链接,跨文档共同参考,知识图,摘要等。 重定向链接-在查看详细信息 消歧链接-在查看详细信息 类别链接-在查看详细信息 链接标题括号-请参阅论文详细信息 信息框-在信息框中查看详
资源推荐
资源详情
资源评论
收起资源包目录
wikipedia-to-elastic-master.zip (88个子文件)
wikipedia-to-elastic-master
gradlew.bat 2KB
gradlew 5KB
LICENSE 11KB
gradle
wrapper
gradle-wrapper.jar 54KB
gradle-wrapper.properties 232B
src
test
resources
is_a_wiki_pages_test.json 644KB
nlp_disambig_wiki_test_text.json 765B
nlp_wiki_test_text.json 26KB
tinywiki-latest-pages-articles.xml.bz2 10KB
nlp_relation_result.json 267B
ellen_part_wiki_test_text.json 6KB
first_paragraph.json 30KB
test_config.json 452B
nlp_disambig_relation_result.json 460B
java
wiki
data
relations
TestBeCompRelationExtraction.java 4KB
TestLinkAndParenthesisRelationExtractor.java 2KB
TestCategoryRelationExtractor.java 2KB
TestWikiPageParser.java 969B
TestRelationsBuilderAndPageParser.java 4KB
elastic
TestSearchOnLive.java 2KB
TestUtils.java 3KB
frequency
TestWordFrequencyAndRep.java 1KB
utils
TestWikiToElasticUtils.java 3KB
main
resources
en_map_settings.json 9KB
lang
fr.json 737B
zh.json 598B
en.json 665B
de.json 715B
es.json 730B
de_map_settings.json 6KB
zh_map_settings.json 9KB
stop_words
fr.txt 602B
de.txt 687B
zh.txt 496B
en.txt 954B
es.txt 1KB
log4j2.xml 762B
mapping.json 2KB
fr_map_settings.json 7KB
es_map_settings.json 6KB
java
wiki
handlers
ElasticPageHandler.java 2KB
ArrayPageHandler.java 1KB
IPageHandler.java 277B
wikidata
WikiDataFeatToFile.java 4KB
data
relations
PartNameRelationExtractor.java 2KB
ExtractorsManager.java 3KB
CategoryRelationExtractor.java 3KB
InfoboxRelationExtractor.java 2KB
IRelationsExtractor.java 187B
BeCompRelationExtractor.java 6KB
LinkAndParenthesisRelationExtractor.java 3KB
RelationType.java 128B
WikipediaParsedPage.java 2KB
WikipediaParsedPageRelations.java 3KB
obj
LinkParenthesisPair.java 633B
BeCompRelationResult.java 1KB
WikipediaParsedPageBuilder.java 1KB
WikiDataParsedPage.java 7KB
WikipediaParsedPageRelationsBuilder.java 2KB
elastic
ElasticBulkDocCreateListener.java 3KB
ElasticDocCreateListener.java 2KB
ElasticAPI.java 16KB
WikiToElasticMain.java 6KB
frequency
WordFrequencyAndRepresentation.java 3KB
WordFrequency.java 1KB
utils
WikiDumpDownloader.java 2KB
SimpleExecutorService.java 3KB
WikiToElasticConfiguration.java 5KB
LangConfiguration.java 2KB
WikiToElasticUtils.java 998B
parsers
WikiPageParser.java 1KB
WikidataJsonParser.java 3KB
MyJsonWikidataParser.java 2KB
IWikidataJsonParser.java 195B
WikidataParseThread.java 6KB
WikipediaSTAXParser.java 8KB
dumps
tinywiki-latest-pages-articles.xml.bz2 10KB
small_wikidata.json.bz2 408KB
docker
elasticsearch.yml 3KB
Dockerfile 867B
prepelasticdump.sh 2KB
build_tmplate.sh 443B
.gitignore 251B
wikidata_conf.json 258B
conf.json 464B
README.md 11KB
settings.gradle 41B
build.gradle 2KB
共 88 条
- 1
资源评论
13338383381
- 粉丝: 19
- 资源: 4647
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功