ES 查詢優化（一）

阿新 • • 發佈：2018-12-08

1、能用term就不用match_phrase

The Lucene nightly benchmarks show that a simple term query is about 10 times as fast as a phrase query, and about 20 times as fast as a proximity query (a phrase query with slop).

term查詢比match_phrase效能要快10倍，比帶slop的match_phrase快20倍。

GET /my_index/my_type/_search
{
    "query": {
        "match_phrase": {
            "title": "quick"
        }
    }
}

變為

GET /my_index/my_type/_search
{
    "query": {
        "term": {
            "title": "quick"
        }
    }
}

2、如果查詢條件與文件排序無關，則一定要用filter，既不用參與分數計算，還能快取資料，加快下次查詢。

比如說要查詢型別為Ford，黃色的，名字包含dev的汽車，一般的查詢語句應該如下：

GET /my_index/my_type/_search
{
    "bool": {
        "must": [
            {
                "term": {
                    "type": "ford"
                }
            },
            {
                "term": {
                    "color": "yellow"
                }
            },
            {
                "term": {
                    "name": "dev"
                }
            }
        ]
    }
}

上述查詢中型別和顏色同樣參與了文件排名得分的計算，但是由於型別和顏色僅作為過濾條件，計算得分至於name的匹配相關。因此上述的查詢是不合理且效率不高的。

GET /my_index/my_type/_search
{
    "bool": {
        "must": {
            "term": {
                "name": "dev"
            }
        },
        "filter": [
        {
            "term": {
                "type": "ford"
            }
        },
        {
            "term": {
                "color": "yellow"
            }
        }]
    }
}

3、如果對查出的資料的順序沒有要求，則可按照_doc排序，取資料時按照插入的順序返回。

_doc has no real use-case besides being the most efficient sort order. So if you don’t care about the order in which documents are returned, then you should sort by _doc. This especially helps when scrolling. _doc to sort by index order.

GET /my_index/my_type/_search
{
    "query": {
        "term": {
            "name": "dev"
        }
    },
    "sort":[
        "_doc"
    ]
}

4、隨機取n條（n>=10000）資料

1）可以利用ES自帶的方法random score查詢。缺點慢，消耗記憶體。

GET /my_index/my_type/_search
{
    "size": 10000,
    "query": {
        "function_score": {
            "query": {
                "term": {
                    "name": "dev"
                }
            },
            "random_score": {
                
            }
        }
    }
}

2）可以利用ES的指令碼查詢。缺點比random score少消耗點記憶體，但比random score慢。

GET /my_index/my_type/_search
{
    "query": {
        "term": {
            "name": "dev"
        }
    },
    "sort": {
        "_script": {
            "type": "number",
            "script": {
                "lang": "painless",
                "inline": "Math.random()"
            },
            "order": "asc"
        }
    }
}

3）插入資料時，多加一個欄位mark，該欄位的值隨機生成。查詢時，對該欄位排序即可。

GET /my_index/my_type/_search
{
    "query": {
        "term": {
            "name": "dev"
        }
    },
    "sort":[
        "mark"
    ]
}

5、range Aggregations時耗時太長

{
    "aggs" : {
        "price_ranges" : {
            "range" : {
                "field" : "price",
                "ranges" : [
                    { "from" : 10, "to" : 50 },
                    { "from" : 50, "to" : 70 },
                    { "from" : 70, "to" : 100 }
                ]
            }
        }
    }
}

如例子所示，我們對[10,50)，[50,70)，[70,100)三個區間做了聚合操作。因為涉及到比較操作，資料量較大的情況下，可能會比較慢。解決方案：在插入時，將要聚合的區間以keyword的形式寫入索引中，查詢時，對該欄位做聚合即可。

假設price都小於100，插入的欄位為mark，mark的值為10-50, 50-70, 70-100。
{
    "aggs" : {
        "genres" : {
            "terms" : { "field" : "mark" }
        }
    }
}

6、查詢空字串

如果是要查欄位是否存在或丟失，用Exists Query查詢即可(exists, must_not exits)。

GET /_search
{
    "query": {
        "exists" : { "field" : "user" }
    }
}

GET /_search
{
    "query": {
        "bool": {
            "must_not": {
                "exists": {
                    "field": "user"
                }
            }
        }
    }
}

這裡指的是欄位存在，且欄位為“”的field。

curl localhost:9200/customer/_search?pretty -d'{
    "size": 5,
    "query": {
        "bool": {
            "must": {
                "script": {
                    "script": {
                        "inline": "doc['\''strnickname'\''].length()<1",
                        "lang": "painless"
                    }
                }
            }
        }
    }
}'

ES 查詢優化（一）

1、能用term就不用match_phrase The Lucene nightly benchmarks show that a simple term query is about 10 times as fast as a phrase query, and about 20 ti

MYSQL一次千萬級連表查詢優化（一）

概述：交代一下背景，這算是一次專案經驗吧，屬於公司一個已上線平臺的功能，這算是離職人員挖下的坑，隨著資料越來越多，原本的SQL查詢變得越來越慢，使用者體驗特別差，因此SQL優化任務交到了我手上。這個SQL查詢關聯兩個資料表，一個是攻擊IP使用者表主

MySQL之查詢效能優化（一）

為什麼查詢速度會慢通常來說，查詢的生命週期大致可以按照順序來看：從客戶端，到伺服器，然後在伺服器上進行解析，生成執行計劃，執行，並返回結果給客戶端。其中“執行”可以認為是整個生命週期中最重要的階段，這其中包括了大量為了檢索資料到儲存引擎的呼叫以及呼叫後的資料處理，包括排序、分組等。在完成這些任務的時候

MySQL優化系列（一）--查詢優化（1）（非索引設計）

一、明確搜尋優化的整體思路以及查詢優化的因素：（1）搜尋優化的整體思路：索引優化，查詢優化，查詢快取，伺服器設定優化，作業系統和硬體優化，應用層面優化（web伺服器，快取）等等。對於一個整體專案而言只有這些齊頭並進，才能實現mysql高效能。（2）查詢優化的因素思路：

效能優化（一）Hibernate 利用快取（一級、二級、查詢）提高系統性能

在hibernate中我們最常用的有三類快取，分別為一級快取、二級快取和查詢快取，下面我們對這三個快取在專案中的使用以及優缺點分析一下。快取它的作用在於提高效能系統性能，介於應用系統與資料庫之間而存在於記憶體或磁碟上的資料。我們程式設

PostgreSQL查詢優化器--邏輯查詢優化--檢視優化（一）

8.1.1 檢視重寫 PostgreSQL有一個模組，稱為規則模組，用以處理規則。規則系統把查詢修改為需要考慮規則的形式，然後把修改過的查詢傳遞給查詢優化器執行。檢視被作為規則的子部分，在此被處理。所以，PostgreSQL通過規則模組（pg_rewrite_query

Mysql數據庫性能優化（一）

效率 dir sort variables 緩存模型 mysql5.6 包含 dpt 參考 http://www.jb51.net/article/82254.htm 今天，數據庫的操作越來越成為整個應用的性能瓶頸了，這點對於Web應用尤其明顯。關於數據庫的性能，這並不只

MySQL索引原理及慢查詢優化（轉）

範圍很難等於 right 事件原理插入 jpg 個人網站轉自：美團點評技術團隊http://tech.meituan.com/mysql-index.html MySQL憑借著出色的性能、低廉的成本、豐富的資源，已經成為絕大多數互聯網公司的首選關系型數據庫。雖然性

NFS部署及優化（一）

linux nfs 文件權限NFS部署及優化（一）一、NFS的基本概念NFS == network file system 網絡文件系統必然通過網絡通信來實現文件的訪問和寫入，所以做這個實驗的話最好有兩臺虛擬機配置:A：一個192.169.50.201為server端B：一個192.169.50.200

Android內存優化（一）DVM和ART原理初探

java虛擬機劃分 cimage beef 靜態由於 jar blank 查找要學習Android的內存優化，首先要了解Java虛擬機，此前我用了多篇文章來介紹Java虛擬機的知識，就是為了這個系列做鋪墊。在Android開發中我們接觸的是與Java虛擬機類似的Dal

mysql性能優化（一）

配置文件 mysql 數據庫網絡信息 mysql性能優化、慢查詢分析、優化索引和配置一.每項的基本思路步驟1.性能瓶頸定位：show命令、慢查詢日誌、explain分析查詢、profiling分析查詢、2.索引及查詢優化3.配置優化二.my

SEO搜索引擎優化（一）

robots 競價排名分享 height for span 抓取瀏覽器頁面什麽是SEO呢　　英文為“Search Engine Optimization”，中文名為“搜索引擎優化”。SEO是指通過對網站進行站內優化和修復(網站Web結構調整、網站內容建設、網站代碼

SQL數據查詢語句（一）

delete 紅色 cnblogs col mage 列名 http font 根據本文所用數據庫為db_Test，數據表為Employee 一.SELECT語句基本結構語句語法簡單歸納為： SELECT select_list [INTO new_table_name

Android OpenGL ES 入門系列（一） --- 了解OpenGL ES的前世今生

target 初始化 vertex 單獨 http hang tex 變化 3d圖轉載請註明出處本文出自Hansion的博客 OpenGL ES (OpenGL for Embedded Systems) 是 OpenGL 三維圖形 API 的子集，

前端性能優化（一）：桌面瀏覽器前端優化策略

data lan ucc 靜態 sync 怎樣拆分打包成 pan 摘要: 前端性能優化是一個很寬泛的概念，本書前面的部分也多多少少提到一些前端優化方法，這也是我們一直在關註的一件重要事情。配合各種方式、手段、輔助系統，前端優化的最終目的都是提升用戶體驗，改善頁面性能，我

jvm優化（一）

方法守護線程 run 參數 main JD 自己 class roo 什麽是jvm？ java程序自己獨立運行環境，包括堆棧、寄存器和java字節碼的指令集。 jvm上可以運行的語言 Java Scala Groovy jvm、jdk和jre jvm：jvm是

JVM學習記錄-線程安全與鎖優化（一）

多線程 image @param decimal 屬於資源分配 try 可能例如前言線程：程序流執行的最小單元。線程是比進程更輕量級的調度執行單位，線程的引入，可以把一個進程的資源分配和執行調度分開，各個線程既可以共享進程資源（內存地址、文件I/O等），又可以獨立

Android繪制優化（一）繪制性能分析

pro -i tco public 繼續但是們的 sched mda 前言一個優秀的應用不僅僅是要有吸引人的功能和交互，同時在性能上也有很高的要求。運行Android系統的手機，雖然配置在不斷的提升，但仍舊無法和PC相比，無法做到PC那樣擁有超大的內存以及高性能的CP

Android內存優化（一）Dalvik虛擬機和ART虛擬機對比

參考 -a 會有 font google 都是 http -s 轉換成 1.概述　　Android4.4以上開始使用ART虛擬機，在此之前我們一直使用的Dalvik虛擬機，那麽為什麽Google突然換了Android運行的虛擬機呢？答案只有一個：ART虛擬機更優秀。 2.D

（轉整）UE4遊戲優化多人大地型遊戲的優化（一）遊戲線程的優化

兼容 source bubuko 又是 mic ini 策略動態 author 施主分享隨緣，評論隨心，@author:白袍小道小道暗語： 1、因為小道這裏博客目錄沒自己整，暫時就用隨筆目錄結構，所以二級目錄那啥就忽略了。標題格式大致都是

ES 查詢優化（一）

相關推薦