Lucene是一個用Java開發的開源全文檢索引擎,官網是:http://lucene.apache.org/ ,Lucene不是一個完整的全文索引應用(與之對應的是solr),而是是一個用Java寫的全文索引引擎工具包,它可以方便的嵌入到各種應用中實現針對應用的全文索引/檢索功能,更多介紹大家自行搜尋。







package com.test.util;

import java.io.BufferedReader;
import java.io.BufferedWriter;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.FilenameFilter;
import java.io.IOException;
import java.io.InputStream; import java.io.InputStreamReader; import java.io.OutputStream; import java.io.OutputStreamWriter; import java.util.ArrayList; import java.util.List; /** * 檔案操作工具類 * */ public class FileUtil { private static Logger2 log = LoggerFactory2.getLogger(FileUtil.class); /** * 獲取檔案的字尾,包括前面的點,如“.jpg”,並自動轉小寫 * @param path * @return */
public static String getExt(String path) { int idx = path.lastIndexOf("."); if (idx < 0) return ""; return path.substring(idx).toLowerCase(); } /** * 遞迴刪除檔案或資料夾 * @param file * @return 返回是否刪除成功,如果檔案本身不存在,也返回true */ public static boolean delete(File file) { boolean flag = true;// 如果檔案本來就不存在那麼預設就是true if (file.isFile()) flag &= file.delete(); else if (file.isDirectory()) { for (File f : file.listFiles()) flag &= delete(f); flag &= file.delete(); } return flag; } /** * 複製單個檔案 * @param src 待複製的檔名 * @param dest 目標檔名 * @param override 如果目標檔案存在,是否覆蓋 * @return 如果複製成功返回true,否則返回false */ public static boolean copy(String src, String dest, boolean override) { File srcFile = new File(src); if (!srcFile.exists()) // 判斷原始檔是否存在 { log.error("原始檔不存在:{}", src); return false; } else if (!srcFile.isFile()) { log.error("原始檔不是一個檔案:{}", src); return false; } File destFile = new File(dest); // 判斷目標檔案是否存在 if (destFile.exists()) { if (override) // 如果目標檔案存在並允許覆蓋 destFile.delete();// 刪除已經存在的目標檔案,無論目標檔案是目錄還是單個檔案 else { log.error("已存在同名檔案且不允許覆蓋:{}", dest); return false; } } else { if (!destFile.getParentFile().exists()) // 如果目標檔案所在目錄不存在,則建立目錄 { if (!destFile.getParentFile().mkdirs()) { log.error("輸出資料夾不存在且自動建立失敗:{}", dest); return false;// 複製檔案失敗:建立目標檔案所在目錄失敗 } } } // 複製檔案 int byteread = 0; // 讀取的位元組數 InputStream in = null; OutputStream out = null; try { in = new FileInputStream(srcFile); out = new FileOutputStream(destFile); byte[] buffer = new byte[1024]; while ((byteread = in.read(buffer)) != -1) out.write(buffer, 0, byteread); return true; } catch (Exception e) { log.error("複製檔案失敗:", e); return false; } finally { try { if (out != null) out.close(); if (in != null) in.close(); } catch (Exception e) { log.error("嘗試關閉流時失敗:", e); e.printStackTrace(); } } } /** * 複製單個檔案,存在則覆蓋 * @param src * @param dest * @return */ public static boolean copy(String src, String dest) { return copy(src, dest, true); } /** * 剪下檔案 * @param src * @param dest * @return */ public static boolean cut(String src, String dest) { return new File(src).renameTo(new File(dest)); } /** * 重新命名檔案 * @param src * @param newName * @return */ public static boolean rename(File src, String newName) { return src.renameTo(new File(src.getParent() + "\\" + newName)); } /** * 重新命名檔案 * @param src * @param newName * @return */ public static boolean rename(String src, String newName) { File file = new File(src); return rename(file, newName); } /** * 從檔案中讀取內容 * @param filePath * @return */ public static String readFile(String filePath, String encoding) { log.debug("開始讀取檔案:{}", filePath); try { FileInputStream fis = new FileInputStream(filePath); BufferedReader br = new BufferedReader(new InputStreamReader(fis, encoding)); String s = ""; StringBuffer sb = new StringBuffer(); while ((s = br.readLine()) != null) sb.append(s+"\n"); br.close(); return sb.toString(); } catch (Exception e) { log.error("讀取檔案失敗:", e); return null; } } /** * 以預設的utf-8編碼讀取檔案 * @param filePath * @return */ public static String readFile(String filePath) { return readFile(filePath, "utf-8"); } /** * 寫入檔案 * @param filePath * @param text * @param encoding * @return */ public static boolean writeFile(String filePath, String text, String encoding) { try { FileOutputStream fos = new FileOutputStream(filePath); BufferedWriter bw = new BufferedWriter(new OutputStreamWriter(fos, encoding)); bw.append(text); bw.close(); return true; } catch (Exception e) { log.error("寫入檔案失敗:", e); return false; } } /** * 寫入檔案,預設utf-8編碼 * @param filePath * @param text * @return */ public static boolean writeFile(String filePath, String text) { return writeFile(filePath, text, "utf-8"); } /** * 遍歷執行者 * @author LXA */ public interface TraverseExecuter { /** * 遍歷某個資料夾時需要內部需要執行的方法 * @param filePath 檔案路徑 * @param fileName 檔名 */ public void execute(String filePath, String fileName); } /** * 遍歷某個資料夾執行一段操作 * @param filePath 資料夾路徑 * @param fileNameFilter 篩選器,為null時不篩選 * @param executer 需要呼叫的方法 */ public static void traverse(String filePath, FilenameFilter fileNameFilter, TraverseExecuter executer) { try { File root = new File(filePath); for(File file : root.listFiles(fileNameFilter)) { String path = file.getAbsolutePath(); if(file.isFile()) executer.execute(path, file.getName()); else if(file.isDirectory()) traverse(path, fileNameFilter, executer); } } catch (Exception e) { e.printStackTrace(); } } /** * 列出某個路徑下的所有檔案,包括子資料夾,如果本身就是檔案,那麼返回自身 * @param filePath 需要遍歷的檔案路徑 * @param fileNameFilter 檔名過濾器 * @return 檔案集合 */ public static List<File> listAllFiles(String filePath, FilenameFilter fileNameFilter) { List<File> files= new ArrayList<File>(); try { File root = new File(filePath); if(!root.exists()) return files; if(root.isFile()) files.add(root); else { for(File file : root.listFiles(fileNameFilter)) { if(file.isFile()) files.add(file); else if(file.isDirectory()) { files.addAll(listAllFiles(file.getAbsolutePath(), fileNameFilter)); } } } } catch (Exception e) { e.printStackTrace(); } return files; } /** * 列出某個路徑下的所有檔案,包括子資料夾,如果本身就是檔案,那麼返回自身 * @param filePath 需要遍歷的檔案路徑 * @return 檔案集合 */ public static List<File> listAllFiles(String filePath) { return listAllFiles(filePath, null); } /** * 遍歷某個資料夾執行一段操作 * @param filePath 資料夾路徑 * @param executer 需要呼叫的方法 */ public static void traverse(String filePath, TraverseExecuter executer) { traverse(filePath, null, executer); } /** * 遍歷某個路徑,刪除其中的空資料夾 * @param filePath */ public static void deleteEmptyFolder(File file) { File[] files = file.listFiles(); if(files == null || files.length == 0) { delete(file); log.info("以下資料夾為空,已刪除:"+file.getAbsolutePath()); } for(File f : files) { if(f.isDirectory()) deleteEmptyFolder(f); } } /** * 遍歷某個路徑,刪除其中的空資料夾 * @param filePath */ public static void deleteEmptyFolder(String filePath) { deleteEmptyFolder(new File(filePath)); } /** * 從一個輸入流寫入到輸出流 * @param is 輸入流 * @param os 輸出流 * @param closeInput 是否關閉輸入流 * @param closeOutput 是否關閉輸出流 * @throws IOException */ public static void writeIO(InputStream is, OutputStream os, Boolean closeInput, Boolean closeOutput) throws IOException { byte[] buf = new byte[1024]; int len = -1; while ((len = is.read(buf)) != -1) os.write(buf, 0, len); if(closeInput) { if(is != null ) is.close(); } if(closeOutput) { if( os != null ) { os.flush(); os.close(); } } } /** * 從一個輸入流寫入到輸出流 * @param is 輸入流 * @param os 輸出流 * @throws IOException */ public static void writeIO(InputStream is, OutputStream os) throws IOException { writeIO(is, os, false, false); } public static void exportHtmlTest(String filePath,String text) throws IOException { FileOutputStream fos = new FileOutputStream(filePath); BufferedWriter bw = new BufferedWriter(new OutputStreamWriter(fos, "UTF-8")); bw.append("<!DOCTYPE html><html><head><title>Title of the document</title></head><body>"); bw.append(text); bw.append("</body></html>"); bw.close(); } } /** * 為了避免過多jar包引用以及某些不需要日記記錄的場合,內部寫一個最簡單的log工具類<br> * 如果複製到其他地方的時候不想帶著幾個log4j的jar包,可以放開本段註釋<br> * 然後把頭部的Logger和LoggerFactory都加上一個2<br> * 注意同一包下Logger2和LoggerFactory2不能重複<br> * @author LXA */ class Logger2 { public void debug(String info, Object... args) { for(int i=0; i<args.length; i++) info = info.replaceFirst("\\{\\}", args[i].toString()); System.out.println(info); } public void error(String info, Throwable throwable) { System.err.println(info); throwable.printStackTrace(); } public void error(String info, String aaa) { System.err.println(info); } public void error(String info) { System.err.println(info); } public void info(String info) { System.out.println(info); } } class LoggerFactory2 { public static <T> Logger2 getLogger(Class<T> cls) { return new Logger2(); } }


package com.test;

import java.io.File;
import java.io.IOException;
import java.nio.file.FileSystems;
import java.util.ArrayList;
import java.util.List;
import java.util.Scanner;

import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.document.TextField;
import org.apache.lucene.index.DirectoryReader;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.index.IndexWriterConfig;
import org.apache.lucene.index.Term;
import org.apache.lucene.queryparser.classic.MultiFieldQueryParser;
import org.apache.lucene.search.BooleanClause;
import org.apache.lucene.search.BooleanQuery;




