1. 程式人生 > >ElasticSearch學習三:搜尋例項含高亮顯示及搜尋的特殊字元過濾

ElasticSearch學習三:搜尋例項含高亮顯示及搜尋的特殊字元過濾

應用說明見程式碼註解。

1.簡單搜尋例項展示:

public void search() throws IOException {
        // 自定義叢集結點名稱
        String clusterName = "elasticsearch_pudongping";

        // 獲取客戶端
        Client client = ESClient.initClient(clusterName);

        // 建立查詢索引,引數productindex表示要查詢的索引庫為productindex
        SearchRequestBuilder searchRequestBuilder = client
                .prepareSearch("productindex");

        // 設定查詢索引型別,setTypes("productType1", "productType2","productType3");
        // 用來設定在多個型別中搜索
        searchRequestBuilder.setTypes("productIndex");

        // 設定查詢型別 1.SearchType.DFS_QUERY_THEN_FETCH = 精確查詢 2.SearchType.SCAN =
        // 掃描查詢,無序
        searchRequestBuilder.setSearchType(SearchType.DFS_QUERY_THEN_FETCH);

        // 設定查詢關鍵詞
        searchRequestBuilder
                .setQuery(QueryBuilders.fieldQuery("title", "Acer"));

        // 查詢過濾器過濾價格在4000-5000內 這裡範圍為[4000,5000]區間閉包含,搜尋結果包含價格為4000和價格為5000的資料
        searchRequestBuilder.setFilter(FilterBuilders.rangeFilter("price")
                .from(4000).to(5000));

        // 分頁應用
        searchRequestBuilder.setFrom(0).setSize(60);

        // 設定是否按查詢匹配度排序
        searchRequestBuilder.setExplain(true);

        // 執行搜尋,返回搜尋響應資訊
        SearchResponse response = searchRequestBuilder.execute().actionGet();

        SearchHits searchHits = response.getHits();
        SearchHit[] hits = searchHits.getHits();
        for (int i = 0; i < hits.length; i++) {
            SearchHit hit = hits[i];
            Map<String, Object> result = hit.getSource();
            // 列印map集合:{id=26, onSale=true, title=巨集基Acer樂3, price=4009.0,
            // description=null, createDate=1380530123140, type=2}
            System.out.println(result);
        }
        System.out.println("search success ..");

    }

說明:

client.prepareSearch用來建立一個SearchRequestBuilder,搜尋即由SearchRequestBuilder執行。

client.prepareSearch方法有引數為一個或多個index,表現在資料庫中,即零個或多個數據庫名,你既可以使用(下面兩個都可以表示在多個索引庫中查詢):

client.prepareSearch().setIndices("index1","index2","index3","index4");

或者:
client.prepareSearch("index1","index2","index3","index4"); 

SearchRequestBuilder常用方法說明:
(1) setIndices(String... indices):上文中描述過,引數可為一個或多個字串,表示要進行檢索的index;

(2) setTypes(String... types):引數可為一個或多個字串,表示要進行檢索的type,當引數為0個或者不呼叫此方法時,表示查詢所有的type;

setSearchType(SearchType searchType):執行檢索的類別,值為org.elasticsearch.action.search.SearchType的元素,SearchType是一個列舉型別的類,
   其值如下所示:
   QUERY_THEN_FETCH:查詢是針對所有的塊執行的,但返回的是足夠的資訊,而不是文件內容(Document)。結果會被排序和分級,基於此,只有相關的塊的文件物件會被返回。由於被取到的僅僅是這些,故而返回的hit的大小正好等於指定的size。這對於有許多塊的index來說是很便利的(返回結果不會有重複的,因為塊被分組了)
   QUERY_AND_FETCH:最原始(也可能是最快的)實現就是簡單的在所有相關的shard上執行檢索並返回結果。每個shard返回一定尺寸的結果。由於每個shard已經返回了一定尺寸的hit,這種型別實際上是返回多個shard的一定尺寸的結果給呼叫者。
   DFS_QUERY_THEN_FETCH:與QUERY_THEN_FETCH相同,預期一個初始的散射相伴用來為更準確的score計算分配了的term頻率。
   DFS_QUERY_AND_FETCH:與QUERY_AND_FETCH相同,預期一個初始的散射相伴用來為更準確的score計算分配了的term頻率。
   SCAN:在執行了沒有進行任何排序的檢索時執行瀏覽。此時將會自動的開始滾動結果集。
   COUNT:只計算結果的數量,也會執行facet。

(4) setSearchType(String searchType),與setSearchType(SearchType searchType)類似,區別在於其值為字串型的SearchType,值可為dfs_query_then_fetch、dfsQueryThenFetch、dfs_query_and_fetch、dfsQueryAndFetch、query_then_fetch、queryThenFetch、query_and_fetch或queryAndFetch;

(5) setScroll(Scroll scroll)、setScroll(TimeValue keepAlive)和setScroll(String keepAlive),設定滾動,引數為Scroll時,直接用new Scroll(TimeValue)構造一個Scroll,為TimeValue或String時需要將TimeValue和String轉化為Scroll;

(6) setTimeout(TimeValue timeout)和setTimeout(String timeout),設定搜尋的超時時間;

(7) setQuery,設定查詢使用的Query;

(8) setFilter,設定過濾器;

(9) setMinScore,設定Score的最小數量;

(10) setFrom,從哪一個Score開始查;

(11) setSize,需要查詢出多少條結果;

檢索出結果後,通過response.getHits()可以得到所有的SearchHit,得到Hit後,便可迭代Hit取到對應的Document,轉化成為需要的實體。

2.搜尋高亮顯示

SearchRequestBuilder中的addHighlightedField()方法可以定製在哪個域值的檢索結果的關鍵字上增加高亮

public void search() throws IOException {
        // 自定義叢集結點名稱
        String clusterName = "elasticsearch_pudongping";
        
        // 獲取客戶端
        Client client = ESClient.initClient(clusterName);    

        // 建立查詢索引,引數productindex表示要查詢的索引庫為productindex
        SearchRequestBuilder searchRequestBuilder = client
                .prepareSearch("productindex");

        // 設定查詢索引型別,setTypes("productType1", "productType2","productType3");
        // 用來設定在多個型別中搜索
        searchRequestBuilder.setTypes("productIndex");

        // 設定查詢型別 1.SearchType.DFS_QUERY_THEN_FETCH = 精確查詢 2.SearchType.SCAN = 掃描查詢,無序
        searchRequestBuilder.setSearchType(SearchType.DFS_QUERY_THEN_FETCH);

        // 設定查詢關鍵詞
        searchRequestBuilder
                .setQuery(QueryBuilders.fieldQuery("title", "Acer"));

        // 查詢過濾器過濾價格在4000-5000內 這裡範圍為[4000,5000]區間閉包含,搜尋結果包含價格為4000和價格為5000的資料
        searchRequestBuilder.setFilter(FilterBuilders.rangeFilter("price")
                .from(4000).to(5000));

        // 分頁應用
        searchRequestBuilder.setFrom(0).setSize(60);

        // 設定是否按查詢匹配度排序
        searchRequestBuilder.setExplain(true);
        
        //設定高亮顯示
        searchRequestBuilder.addHighlightedField("title");
        searchRequestBuilder.setHighlighterPreTags("<span style=\"color:red\">");
         searchRequestBuilder.setHighlighterPostTags("</span>");
        // 執行搜尋,返回搜尋響應資訊
        SearchResponse response = searchRequestBuilder.execute().actionGet();
        
        //獲取搜尋的文件結果
        SearchHits searchHits = response.getHits();
        SearchHit[] hits = searchHits.getHits();
        ObjectMapper mapper = new ObjectMapper();
        for (int i = 0; i < hits.length; i++) {
            SearchHit hit = hits[i];
            //將文件中的每一個物件轉換json串值
            String json = hit.getSourceAsString();
            //將json串值轉換成對應的實體物件
            Product product = mapper.readValue(json, Product.class);  
            
            //獲取對應的高亮域
            Map<String, HighlightField> result = hit.highlightFields();    
            //從設定的高亮域中取得指定域
            HighlightField titleField = result.get("title");  
            //取得定義的高亮標籤
            Text[] titleTexts =  titleField.fragments();    
            //為title串值增加自定義的高亮標籤
            String title = "";  
            for(Text text : titleTexts){    
                  title += text;  
            }
            //將追加了高亮標籤的串值重新填充到對應的物件
            product.setTitle(title);
            //列印高亮標籤追加完成後的實體物件
            System.out.println(product);
        }
        System.out.println("search success ..");

    }

程式執行結果:
[id=8,title=巨集基<span style="color:red">Acer</span>,description=巨集基Acer蜂鳥系列,price=5000.0,onSale=true,type=1,createDate=Mon Sep 30 13:46:41 CST 2013]
[id=21,title=巨集基<span style="color:red">Acer</span>,description=巨集基Acer蜂鳥系列,price=5000.0,onSale=true,type=1,createDate=Mon Sep 30 13:48:17 CST 2013]
[id=7,title=巨集基<span style="color:red">Acer</span>,description=巨集基Acer蜂鳥系列,price=5000.0,onSale=true,type=1,createDate=Mon Sep 30 11:38:50 CST 2013]
[id=5,title=巨集基<span style="color:red">Acer</span>樂0,description=<null>,price=4000.0,onSale=true,type=1,createDate=Mon Sep 30 16:35:23 CST 2013]
[id=12,title=巨集基<span style="color:red">Acer</span>樂1,description=<null>,price=4003.0,onSale=false,type=2,createDate=Mon Sep 30 16:35:23 CST 2013]
[id=19,title=巨集基<span style="color:red">Acer</span>樂2,description=<null>,price=4006.0,onSale=false,type=1,createDate=Mon Sep 30 16:35:23 CST 2013]
[id=26,title=巨集基<span style="color:red">Acer</span>樂3,description=<null>,price=4009.0,onSale=true,type=2,createDate=Mon Sep 30 16:35:23 CST 2013]
[id=33,title=巨集基<span style="color:red">Acer</span>樂4,description=<null>,price=4012.0,onSale=false,type=1,createDate=Mon Sep 30 16:35:23 CST 2013]

從程式執行結果中我們可以看到,我們定義的高亮標籤已經追加到指定的域上了.

當搜尋索引的時候,你搜索關鍵字包含了特殊字元,那麼程式就會報錯

// fieldQuery 這個必須是你的索引欄位哦,不然查不到資料,這裡我只設定兩個欄位 id ,title
String title = "title+-&&||!(){}[]^\"~*?:\\";
title = QueryParser.escape(title);// 主要就是這一句把特殊字元都轉義,那麼lucene就可以識別
searchRequestBuilder.setQuery(QueryBuilders.fieldQuery("title", title));