Java多级多类型全文检索-基于Lucene3.3.0资源-CSDN文库

共4个文件

java：3个

jar：1个

Java

全文检索

多文件类型

Lucene

5星 · 超过95%的资源需积分: 9 186 浏览量 2011-09-20 13:55:45 上传评论收藏 1.14MB 7Z 举报

资源推荐

资源详情

资源评论

收起资源包目录

lucene-3.3.0.7z （4个子文件）

lucene-3.3.0

Demo

Constants.java 264B

Searcher.java 2KB

Indexer.java 2KB

lucene-core-3.3.0.jar 1.26MB

package com.dyhx.archive.lucene; import java.io.File; import java.io.FileReader; import java.io.IOException; import org.apache.lucene.analysis.standard.StandardAnalyzer; import org.apache.lucene.document.Document; import org.apache.lucene.document.Field; import org.apache.lucene.index.IndexWriter; import org.apache.lucene.store.FSDirectory; import org.apache.lucene.util.Version; public class Indexer { private static File indexDir = new File(Constants.INDEX_DIR); private static File dataDir = new File(Constants.DATA_DIR); public static void main(String[] args) throws Exception { int numIndexed = index(); System.out.println("Indexing " + numIndexed + " files..."); } @SuppressWarnings("deprecation") public static int index() throws IOException { if (!dataDir.exists() || !dataDir.isDirectory()) { throw new IOException(dataDir + " does not exist or is not a directory"); } IndexWriter indexWriter = new IndexWriter(FSDirectory.open(indexDir), new StandardAnalyzer(Version.LUCENE_33), true, IndexWriter.MaxFieldLength.LIMITED); indexDirectory(indexWriter, dataDir); int numIndexed = indexWriter.numDocs(); indexWriter.optimize(); indexWriter.close(); return numIndexed; } public static void indexDirectory(IndexWriter writer, File dir) throws IOException { File[] files = dir.listFiles(); for (int i = 0; i < files.length; i++) { File f = files[i]; if (f.isDirectory()) { indexDirectory(writer, f); // directory iterator } else { String[] exts = Constants.EXTS.split(","); for (int j = 0; j < exts.length; j++) { if (f.getName().endsWith("." + exts[j])) { indexFile(writer, f); } } } } } private static void indexFile(IndexWriter writer, File file) throws IOException { if (file.isHidden() || !file.exists() || !file.canRead()) { return; } Document doc = new Document(); doc.add(new Field("name", file.getName().substring(0, file.getName().lastIndexOf(".")), Field.Store.YES, Field.Index.ANALYZED)); doc.add(new Field("path", file.getCanonicalPath(), Field.Store.YES, Field.Index.ANALYZED)); doc.add(new Field("parent", file.getParent().substring(file.getParent().lastIndexOf("\\") + 1), Field.Store.YES, Field.Index.ANALYZED)); doc.add(new Field("content", new FileReader(file))); writer.addDocument(doc); } }

评论收藏

内容反馈