没有合适的资源?快使用搜索试试~ 我知道了~
NewsIndexerIR:从头开始实现基于向量空间模型的完整信息检索系统,其中包括解析原始数据、过滤数据到不同类别、创建索引、...
共75个文件
java:73个
docx:1个
md:1个
需积分: 9 1 下载量 17 浏览量
2021-06-12
09:10:18
上传
评论
收藏 194KB ZIP 举报
温馨提示
##新闻搜索引擎我们从头开始构建了一个完整的信息检索系统,其中包括解析原始数据、将数据过滤到不同类别、创建索引、执行用户查询和计算相关性分数的模块。 该项目受到 Apache Solr 架构的启发,是 UB CSE535 信息检索课程的一部分。 我们已经实现了各种设计模式,例如单例、工厂和解释器设计模式。 我们还特别考虑了字符串处理和标记化的效率。 我们已经使用向量空间模型来计算相关性分数,并且正在研究潜在语义索引来处理同义词和反义词的问题。
资源推荐
资源详情
资源评论
收起资源包目录
NewsIndexerIR-master.zip (75个子文件)
NewsIndexerIR-master
README.md 692B
Project One.docx 123KB
edu
buffalo
cse
irf14
Scorer
ScorerClass.java 4KB
analysis
AnalyzerTerm.java 1KB
TokenFilterDate.java 18KB
TokenFilterFactory.java 2KB
AnalyzerCategory.java 1KB
Token.java 3KB
AnalyzerFactory.java 2KB
AnalyzerPlace.java 1KB
Analyzer.java 964B
AnalyzerAuthorOrg.java 1KB
TokenFilterCapitalization.java 6KB
TokenizerException.java 281B
TokenFilterSpecialChars.java 1KB
TokenFilterStopWord.java 1KB
TokenFilterNumber.java 3KB
TokenFilterStemmer.java 1KB
TokenStream.java 7KB
AnalyzerNewsDate.java 1020B
TokenFilter.java 802B
AnalyzerTitle.java 1KB
TokenFilterSymbol.java 7KB
AnalyzerAuthor.java 1KB
TokenFilterAccent.java 1KB
Stemmer.java 13KB
Tokenizer.java 2KB
test
TFRuleBaseTest.java 1KB
TokenizerTest.java 3KB
SpecialCharRuleTest.java 2KB
StemmerRuleTest.java 1KB
NumberRuleTest.java 1KB
TokenTest.java 3KB
SymbolRuleTest.java 6KB
DateRuleTest.java 3KB
StopWordsRuleTest.java 880B
CapitalizationRuleTest.java 1KB
TokenStreamTest.java 6KB
AccentRuleTest.java 1KB
AnalysisSuite.java 520B
TokenFilterType.java 251B
document
ParserException.java 275B
FieldNames.java 704B
Parser.java 7KB
Document.java 2KB
test
DocumentSuite.java 245B
ParserTest.java 4KB
SearchRunner.java 14KB
Tester.java 300B
index
IndexWriter.java 6KB
Posting.java 1KB
BaseIndexer.java 8KB
IndexReader.java 6KB
IndexType.java 704B
IndexerException.java 275B
test
IndexerTest.java 7KB
IndexerSuite.java 242B
Term.java 3KB
query
QueryParserException.java 233B
Expression.java 862B
QBracket.java 2KB
AndOperator.java 3KB
ExpressionParser.java 12KB
TestExpressionParser.java 400B
NotOperator.java 1KB
QIndexType.java 386B
OrOperator.java 3KB
QTerm.java 8KB
QueryParser.java 766B
test
ExpressionParserTest.java 2KB
Term.java 1KB
Query.java 2KB
Runner.java 1KB
test
SearchRunnerTest.java 1KB
AllTests.java 446B
共 75 条
- 1
资源评论
sleepsoft
- 粉丝: 36
- 资源: 4634
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功