從Lucene 4.10.3到Lucene 7.1.0:帶你瞭解版本之間的些許差異

阿新 • • 發佈：2019-01-25

一.環境說明:
※Windows 10 v1709
※IDEA 2017.2.6
※JDK 1.8.0_144
※Lucene 7.1.0
二.哪裡有差異
因本人能力有限,所以也只是放出我在更新版本的時候,專案中用到的需要升級的地方,其他還未研究.
所以,本文主要從

NumericRangeQuery
BooleanQuery
Directory
IndexWriterConfig

這幾個方面來進行說明.

三.NumericRangeQuery
數字範圍查詢,一般用於價格等域的查詢

  /**
     * 測試數字範圍查詢
     *
     * @throws IOException 讀取索引庫異常
     */ 

    @Test
    public void testNumericRangerQuery() throws IOException {
        /*
        版本更新說明:
        在lucene4.10中,關於數字範圍的查詢是使用的NumericRangerQuery
        使用方式:
        Query query = NumericRangerQuery.newFloatRange(域名,較小值,較大值,是否包含較小值,是否包含較大值)
        在lucene6.6中(不知最早在什麼版本,沒有細查),NumericRangerQuery被legacyNumericRangerQuery替代
        在lucene7中(應該是從7開始的),lucene開始使用PointValue來替代之前的Filed.而數字範圍查詢方法也進行了修改,
        Float/Long/IntPoint.newRangeQuery取代了之前的NumericRangeQuery的newFloat/Long/IntRange
        使用方法:
        Query query = Float.newRangeQuery(域名,較小值,較大值);
        而這種查詢方法預設包含範圍的端點值,即查詢的是  較小值<=域名<=較大值
        如果不想包含端點值:
            1.不包含左端點值(即較小值):Query query = Float.newRangeQuery(域名,FloatPoint.nextUp(較小值),較大值);
            2.不包含右端點值(即較大值):Query query = Float.newRangeQuery(域名,較小值,Float.nextDown(較大值));
            3.均不包含:結合1和2即可
         */ 

        Query query = FloatPoint.newRangeQuery("price", FloatPoint.nextUp(108F), FloatPoint.nextDown(488F));
        doQuery(query);
    }

四.BooleanQuery
組合查詢,用於多個查詢條件組合起來一起參與查詢

 /**
     * 測試組合查詢
     *
     * @throws IOException 讀取索引庫異常
     */
    @Test
    public void testBooleanQuery() throws IOException {

        //新建兩條查詢 

        Query query1 = new TermQuery(new Term("description", "spring"));
        Query query2 = FloatPoint.newRangeQuery("price", FloatPoint.nextUp(50F), 110F);

        /*
         1、MUST和MUST表示“與”的關係，即“交集”。
         2、MUST和MUST_NOT前者包含後者不包含。
         3、MUST_NOT和MUST_NOT沒意義
         4、SHOULD與MUST表示MUST，SHOULD失去意義；
         5、SHOUlD與MUST_NOT相當於MUST與MUST_NOT。
         6、SHOULD與SHOULD表示“或”的概念。

        版本更新說明:
        在lucene 4.10.3中,組合查詢還有無參構造方法,可以通過下面這種方式實現組合查詢:

        Query query = new BooleanQuery()
        //新增查詢條件,並指定該條件的判斷級別
        query.add(query1,Occur.MUST);
        query.add(query2,Occur.MUST);

        在lucene7.1中,組合查詢只有一個有參構造方法,並沒有無參構造方法.而是多了一個靜態內部類Builder

        public static class Builder {

            private int minimumNumberShouldMatch;
            private final List<BooleanClause> clauses = new ArrayList<>();

            //大概是4.10.3中的BooleanQuery的無參構造
            public Builder() {}
            //設定最小需要匹配的數
             public Builder setMinimumNumberShouldMatch(int min) {
                 this.minimumNumberShouldMatch = min;
                 return this;
            }

            public Builder add(BooleanClause clause) {
                  if (clauses.size() >= maxClauseCount) {
                     throw new TooManyClauses();
                }
                clauses.add(clause);
                return this;
             }
             //4.10.3中的BooleanQuery的add方法,支援鏈式程式設計(一般使用這個add方法)
            public Builder add(Query query, Occur occur) {
                return add(new BooleanClause(query, occur));
            }
            //返回一個BooleanQuery,用於構造Query
            public BooleanQuery build() {
                 return new BooleanQuery(minimumNumberShouldMatch, clauses.toArray(new BooleanClause[0]));
            }
        }

        7.1中,Occur.MUST等全都放到了BooleanClause中,所以,Occur.MUST等變成了BooleanClause.Occur.MUST等
        所以在lucene中,組合查詢的使用方法:
        Query booleanQuery = new BooleanQuery.Builder().add(query1,BooleanClause.Occur.MUST).add(query2,Boolean.Occur.MUST).build();
         */
        Query booleanQuery = new BooleanQuery.Builder().add(query1, BooleanClause.Occur.MUST).add(query2, BooleanClause.Occur.MUST).build();
        doQuery(booleanQuery);
    }

五.Directory

 /*
        版本變更說明:
        在4.10.3中,FSDirectory.open的引數是file物件,
        可能在6.6以後,開始使用Path類(java.nio.file)
        File物件轉Path的方法:
        File file = new File(檔案路徑);
        Path path = file.toPath();
         */
        File file = new File("D:\\bookIndex\\");
        Directory directory = FSDirectory.open(file.toPath());
        IndexWriter writer = new IndexWriter(directory, config);

六.

  /*
        可能從6.6開始,IndexWriterConfig就不在需要制定版本了
        而且有了無參構造方法,預設使用的分詞器就是StandardAnalyzer.
        即表示,如果你不想更改分詞器,就使用無參構造
         */
        IndexWriterConfig config = new IndexWriterConfig();

好了,大概就是這樣了.
我始終認為,IT從業人員應該經常進行自我更新,包括知識的更新,要保證自己能跟上技術的更新,才能更好的適應新時代的工作要求.

努力吧,少年.

2017/11/16
Lucifer

從Lucene 4.10.3到Lucene 7.1.0:帶你瞭解版本之間的些許差異

一.環境說明: ※Windows 10 v1709 ※IDEA 2017.2.6 ※JDK 1.8.0_144 ※Lucene 7.1.0 二.哪裡有差異因本人能力有限,所以也只是放出我在更新版本的時候,專案中用到的需要升級的地方,其他還未研究.

基於Lucene 7.1.0 實現搜尋引擎

引入lucene 7.1.0 所使用的jar包 <dependency> <groupId>org.apache.lucene</groupId> <artifactId>lucene-core</artifactId>

jboss-as-7.1.0.CR1b域集群和會話復制環境部署

導致 security head process 現在窗口不同的 int 模式前言：我想向您展示如何在域模式下設置JBoss AS7並啟用群集，以便我們可以在節點之間獲得HA（高可用性）和會話復制我們需要準備兩個主機（或虛擬主機）來進行實驗。我們將使用以下兩個主機：

lucene 4.10 檢索mysql資料庫

今天拿到一個需求，需要使用lucene 檢索mysql資料庫的一個通訊錄表，需要支援全文全欄位複合檢索. 使用者的表結構如下（通訊錄mysql表結構）在網上找了一些例子，由於網上這

Kettle 7.1.0.0-12 安裝版無法啟動的問題

1.Kettle無法啟動解決方法：只要修改一下spoon.bat裡記憶體配置： if "%PENTAHO_DI_JAVA_OPTIONS%"=="" set PENTAHO_DI_JAVA_OPTIONS="-Xms2058m" "-Xmx1024m" "-XX:MaxPerm

VMWare-Centos6.10-python3.7.1安裝

1、安裝VMWare14 2、安裝Centos6.10 3、安裝依賴工具 yum install zlib-devel bzip2-devel openssl-devel ncurses-devel #需要root許可權 4、下載python3.xx wget https:/

[再次續]關於opencv2.4.10-3.3.1左右版本的特徵點剔除與顯示問題

在上上一次的文章結尾，我們說了F矩陣還有一種剔除的表達形式這裡我們完成它先介紹一下： 1. 什麼是對極幾何·粗略概念提到對極幾何，一定是對二幅影象而言，對極幾何實際上是“兩幅影象之間的對極幾何”，它是影象平面與以基線為軸的平面束的交的幾何（這裡的基線是指連線

從 Nginx 預設不壓縮 HTTP/1.0 說起

提醒：本文最後更新於 1072 天前，文中所描述的資訊可能已發生改變，請謹慎使用。臨近年關，明顯變忙，部落格也更新得慢了，以後儘量保證周更吧。今天這篇文章屬於計劃之外的更新，源自於白天看到的《一個基於 http 協議的優化》。在這篇文章中，作者描述了這樣一個現象：在移動的 http 請求量和聯

# 從零開始搭建Hadoop2.7.1的分散式叢集

Hadoop 2.7.1 (2015-7-6更新)，Hadoop的環境配置不是特別的複雜，但是確實有很多細節需要注意，不然會造成許多配置錯誤的情況。儘量保證一次配置正確防止反覆修改。網上教程有很多關於Hadoop配置的，但是每一個教程都對應了一個版本資訊，有

MathType 7.1破解版|數學公式編輯器MathType 7.1.0破解版下載(附MathType 7.1.0序列號及註冊碼)

相信大家在電腦上輸入數學公式的時候都會遇到麻煩，因為電腦的輸入法是不能編輯公式的，也別是複雜的曲線函式、對數函式、微積分求解等，這些輸入都非常困難，所以小編推薦您通過這款mathtype軟體製作公式。MathType是由美國Design Science公司推出的一款功能強大，

Apache Qpid Broker-J 7.1.0 釋出，訊息代理工具

Apache Qpid Broker-J 7.1.0 已釋出，Apache Qpid Broker-J 是一個用 Java 編寫的訊息代理，它使用 AMQP 1.0, 0-10, 0-9-1, 0-9 和 0-8 儲存、路由和轉發訊息。該版本帶來了新特性和改進，

在Ubuntu14.04的64位下安裝opencv2.4.13和opencv3.1.0及不同版本間切換的操作

最近幾天，一直在摸索Ubuntu14.04下安裝opencv2和opencv3及不同版本間切換的方法，嘗試了很多網上介紹的方法，也不是他們介紹的不對，只是介紹的安裝方法都很單一，無法完全滿足自己的當前需求，所以搜尋很多相關的部落格文章，結合自己的安裝經驗，覺得有

1 2 3 4 5 6 7 8 9 =110 在左邊數字之間加入運算子（+、-或不加），使得等式成立

1 2 3 4 5 6 7 8 9 = 110; 請看上邊的算式，為了使等式成立，需要在數字間填入加號或者減號（可以不填，但不能填入其它符號）。之間沒有填入符號的數字組合成一個數，例如：12+34+56+7-8+9 就是一種合格的填法；123+4+5+67-8

solr-7.1.0的java介面呼叫

//指定solr伺服器的地址 private final static String SOLR_URL = new String("http://localhost:8983/solr/"); /** * 建立SolrServer物件

編譯安裝GCC 7.1.0

簡介　　主要原因：GCC 7.1釋出，完全支援C++17。 GCC 7.1 Released with Full C++17 Support 　　GCC 7.1中的C++ Front End提供了對當前C++17草案的支援，所支援的特性包括co

Mysql 5.7.1.0 實現主從複製（master-slave）

開始前請保證兩臺主機的防火牆、防毒軟體不會阻止兩臺主機的正常通訊。下面通過6步操作實現主從複製！

【拆分版】Docker-compose構建Elasticsearch 7.1.0叢集

寫在前邊搞了兩三天了，一直有個問題困擾著我，ES叢集中配置怎麼能正確對映到主機上，這邊經常報ClusterFormationFailureHelper master not discovered or elected yet.原因是容器中的ES節點沒有正確的對映到主機上，而且容器內ip是易變的，我該怎麼配置

【拆分版】 Docker-compose構建Logstash多例項，基於7.1.0

【拆分版】Docker-compose構建Logstash多例項寫在最前說起Logstash，這個元件並沒有什麼叢集的概念，與其說是叢集，不如說是各自去收集日誌分析過濾儲存到Elasticsearch中。這裡做個多例項的Logstash，其實本質上只是為Logstash指定好佔用的埠，輸入輸出的配置的掛載

【進階1-4期】JavaScript深入之帶你走進記憶體機制

本期的主題是呼叫堆疊，本計劃一共28期，每期重點攻克一個面試重難點，如果你還不瞭解本進階計劃，文末點選檢視全部文章。如果覺得本系列不錯，歡迎點贊、評論、轉發，您的支援就是我堅持的最大動力。 JS記憶體空間分為棧(stack)、堆(heap)、池(一般也會歸類為棧中)。其中棧存放變數，堆存放複雜物件

[軟體分享]WPS Office 2012個人版(8.1.0.2917)內測版本洩漏

備受大家關注，包括金山在微博上做的一次大型討論，都在說WPS2012版本的新功能，近日，這款產品終於有內測版本洩露出來了，介面部分大家可以參考這篇文章《[軟體資訊]WPS Office 2012引入Ribbon介面》，下面還會放出截圖。自己安裝之後，發現大部分還是英文Tip提示，估計是多語言版本還沒做好，先湊

從Lucene 4.10.3到Lucene 7.1.0:帶你瞭解版本之間的些許差異

相關推薦