没有合适的资源?快使用搜索试试~ 我知道了~
newsindexer-ranking-for-reuters-corpus:这是一个解析、索引和查询路透社新闻语料库的框架。 ...
共94个文件
java:88个
project:1个
classpath:1个
需积分: 10 0 下载量 77 浏览量
2021-06-12
18:10:28
上传
评论
收藏 242KB ZIP 举报
温馨提示
newsindexer-reuters-corpus 排名 这是一个解析、索引和查询路透社新闻语料库的框架。 该框架支持布尔查询。 它还包含基于 tf-idf 的向量相似性模型和 Okapi BM-25 概率模型,用于为用户查询生成一组排序文档。
资源推荐
资源详情
资源评论
收起资源包目录
newsindexer-ranking-for-reuters-corpus-master.zip (94个子文件)
newsindexer-ranking-for-reuters-corpus-master
.project 370B
queries.xlsx 41KB
README.md 313B
Project One.docx 123KB
edu
buffalo
cse
irf14
common
TermIndexDetails.java 2KB
FilterChains.java 2KB
DocMetaData.java 1KB
Month.java 846B
CommonUtilTest.java 2KB
StringUtil.java 2KB
RegExp.java 4KB
CommonConstants.java 2KB
QueryResult.java 748B
CommonUtil.java 10KB
StopWords.java 1KB
QueryRegExp.java 1KB
SearchRunner.java 34KB
index
IndexReader.java 9KB
TermIndex.java 616B
CategoryIndex.java 636B
Posting.java 3KB
NewsDictionary.java 887B
TermDictionary.java 728B
test
IndexerSuite.java 242B
IndexerTest.java 7KB
IndexType.java 139B
PlaceDictionary.java 731B
PostingScoreComparator.java 283B
DocumentIdComparator.java 281B
DocumentDictionary.java 1KB
AuthorDictionary.java 737B
IndexerException.java 275B
CategoryDictionary.java 740B
NewsIndex.java 430B
PostingWrapper.java 1KB
PlaceIndex.java 621B
AuthorIndex.java 626B
IndexWriter.java 10KB
query
Query.java 13KB
QueryExecutor.java 70B
QueryParserException.java 262B
QueryToStringTester.java 1KB
QueryParser.java 846B
analysis
TokenizerException.java 345B
SymbolRule.java 7KB
AnalyzerForNewsDate.java 250B
DateRule.java 23KB
SpecialCharactersRule.java 2KB
Analyzer.java 963B
NumberRule.java 1KB
AnalyzerForPlace.java 244B
Stemmer.java 11KB
AnalyzerForTitle.java 244B
AnalyzerImpl.java 1KB
StemmerRule.java 1KB
AnalyzerForAuthorOrg.java 252B
AnalyzerFactory.java 3KB
TokenFilterFactory.java 2KB
test
AnalysisSuite.java 520B
SpecialCharRuleTest.java 2KB
DateRuleTest.java 4KB
TokenTest.java 3KB
NumberRuleTest.java 1KB
SymbolRuleTest.java 7KB
TFRuleBaseTest.java 1KB
CapitalizationRuleTest.java 1KB
TokenStreamTest.java 6KB
TokenizerTest.java 3KB
StopWordsRuleTest.java 880B
AccentRuleTest.java 1KB
StemmerRuleTest.java 1KB
AnalyzerForAuthor.java 246B
AccentRule.java 786B
CapitalizationRule.java 5KB
AnalyzerForCategory.java 213B
StopWordsRule.java 772B
Tokenizer.java 3KB
AnalyzerForContent.java 248B
TokenFilter.java 1KB
TokenStream.java 6KB
TokenFilterType.java 262B
Token.java 4KB
document
Document.java 2KB
FieldNames.java 244B
ParserException.java 275B
test
DocumentSuite.java 245B
ParserTest.java 4KB
Parser.java 8KB
test
SearchRunnerTest.java 3KB
AllTests.java 446B
Runner.java 2KB
Tester.java 300B
.classpath 391B
.gitignore 37KB
共 94 条
- 1
资源评论
SouravGoswami
- 粉丝: 28
- 资源: 4530
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功