没有合适的资源?快使用搜索试试~ 我知道了~
Information-Retrieval-News:信息检索系统
共65个文件
xml:19个
bin:13个
java:12个
需积分: 8 0 下载量 92 浏览量
2021-04-29
03:57:56
上传
评论
收藏 58KB ZIP 举报
温馨提示
基于Apache Lucene的新闻文档的信息检索 任务是使用Lucene索引和搜索特定的文档集合。 内容所涉及的内容是从许多来源收集的新闻文章的集合(大部分是):《金融时报》有限公司(1991、1992、1993、1994),《联邦公报》(1994),《外国广播信息服务》(1996)以及《洛杉矶时报》(1989年,1990年)。 您可以从此处下载完整的内容集-https: 编制索引通过第一个任务,您已经了解了如何编制集合索引的基础知识。 现在是时候开始更深入地思考索引编制过程了。 解析后的文档应划分为哪些字段(如果有)? 应该使用哪些停用词删除,词干识别,短语识别和其他分析器? 是否可以使用更复杂的语言建模过程? 查询在任务一中,查询是简单的,预定义的短文本字符串。 但是,在许多TREC任务中,您将获得一个“主题”,而不是定义的查询。 每个主题代表用户的信息需求。 下面是一个示例
资源推荐
资源详情
资源评论
收起资源包目录
Information-Retrieval-News-master.zip (65个子文件)
Information-Retrieval-News-master
luceneTest
gradlew.bat 2KB
gradlew 5KB
.gradle
buildOutputCleanup
cache.properties.lock 2B
built.bin 0B
cache.properties 49B
4.0
taskHistory
taskHistory.lock 17B
taskHistory.bin 22KB
fileSnapshots.bin 19KB
fileHashes
fileHashes.lock 17B
fileHashes.bin 19KB
fileChanges
last-build.bin 1B
4.6
taskHistory
taskHistory.lock 17B
taskHistory.bin 19KB
fileHashes
fileHashes.lock 17B
fileHashes.bin 18KB
fileChanges
last-build.bin 1B
4.5.1
taskHistory
taskHistory.lock 17B
taskHistory.bin 28KB
fileHashes
fileHashes.lock 17B
fileHashes.bin 20KB
resourceHashesCache.bin 18KB
fileChanges
last-build.bin 1B
fileContent
annotation-processors.bin 18KB
fileContent.lock 17B
vcsWorkingDirs
gc.properties 0B
gradle
wrapper
gradle-wrapper.properties 230B
src
main
java
FR94DocumentParser.java 2KB
IndexIterator.java 1KB
DocumentCollection.java 155B
FTDocumentParser.java 2KB
TopicParser.java 1KB
FBISDocumentParser.java 2KB
LATIMESDocumentParser.java 2KB
DocumentQuery.java 143B
ResultGenerator.java 3KB
DocumentCollectionReader.java 3KB
Configuration.java 876B
Main.java 327B
.idea
uiDesigner.xml 9KB
gradle.xml 564B
misc.xml 258B
modules.xml 608B
compiler.xml 288B
workspace.xml 79KB
libraries
Gradle__org_apache_lucene_lucene_sandbox_7_2_1.xml 567B
Gradle__org_apache_lucene_lucene_analyzers_common_7_2_1.xml 612B
Gradle__org_hamcrest_hamcrest_core_1_3.xml 537B
Gradle__org_apache_lucene_lucene_test_framework_7_2_1.xml 602B
Gradle__org_apache_lucene_lucene_codecs_7_2_1.xml 562B
Gradle__org_apache_lucene_lucene_queries_7_2_1.xml 566B
Gradle__org_apache_lucene_lucene_core_7_2_1.xml 552B
Gradle__junit_junit_4_12.xml 481B
Gradle__org_jsoup_jsoup_1_11_2.xml 503B
Gradle__org_apache_lucene_lucene_queryparser_7_2_1.xml 587B
Gradle__com_carrotsearch_randomizedtesting_randomizedtesting_runner_2_5_3.xml 667B
Gradle__junit_junit_4_10.xml 481B
inspectionProfiles
Project_Default.xml 155B
modules
luceneTest.iml 799B
luceneTest_test.iml 2KB
luceneTest_main.iml 2KB
.gitignore 271B
settings.gradle 33B
build
tmp
jar
MANIFEST.MF 25B
build.gradle 790B
README.md 4KB
共 65 条
- 1
资源评论
13338383381
- 粉丝: 15
- 资源: 4648
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 微信小程序源码 车源宝 二手车交易平台 源码下载
- 微信小程序源码 实现 城市切换 demo 根据城市首字母排序城市 选择城市 源码下载
- VMware7.0虚拟机硬盘无法编辑,无法连接到Profile-Driven Storage Service
- arm64内核的mongo镜像
- 基于stm32f103c单片机+MPU6050+0.96英寸OLED显示屏双柄遥控器硬件(原理图+PCB)工程文件.zip
- 整理的关于少儿编程的学习路径,以及如何在小升初,初升高和大学充分的利用起来编程经验的优势
- nhit完整源码+论文学习
- 足球比赛结果统计表2006-2011年大约28W场比赛
- 基于PHP+mysql的社区交流系统(源代码)
- yolov5,SSD 可能使用到的一些代码
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功