1. 程式人生 > >MySQL查詢優化

MySQL查詢優化

mysql

1、簡介

一個好的web應用,最重要的一點是有著優秀的訪問性能。數據庫MySQL是web應用的組成部分,也是決定其性能的重要部分。所以提升MySQL的性能至關重要。

MySQL性能的提升可分為三部分,包括硬件、網絡、軟件。其中硬件、網絡取決於公司的財力,需要白嘩嘩的銀兩,這裏就不說啦。軟件又細分為很多種,在這裏我們通過MySQL的查詢優化從而達到性能的提升。

最近看了一些關於查詢優化的書籍,同時也在網上看一些前輩們寫的文章。

以下是自己整理借鑒關於查詢優化的一些總結:


2、截取SQL語句

1、全面查詢日誌

2、慢查詢日誌

3、二進制日誌

4、進程列表

  SHOW FULL PROCESSLIST;

  。。。


3、查詢優化基本分析命令

  1、EXPLAIN {PARTITIONS|EXTENDED}

  2、SHOW CREATE TABLE tab;

  3、SHOW INDEXS FROM tab;

  4、SHOW TABLE STATUS LIKE ‘tab’;

  5、SHOW [GLOBAL|SESSION] STATUS LIKE ‘’;

  6、SHOW VARIABLES

  。。。。

  ps:我自己都感覺上面都是沒任何營養的東西。下面才是真正的幹貨哈。


4、查詢優化幾個方向

  1、盡量避免全文掃描,給相應字段增加索引,應用索引來查詢

  2、刪除不用或者重復的索引

  3、查詢重寫,等價轉換(謂詞、子查詢、連接查詢)

  4、刪除內容重復不必要的語句,精簡語句

  5、整合重復執行的語句

  6、緩存查詢結果


5、索引優化


  5.1、索引優點:

    1、保持數據的完整性

    2、提高數據的查詢性能

    3、改進表的連接操作(jion)

    4、對查詢結果進行排序。沒索引將會采用內部文件排序算法進行排序,效率較慢

    5、簡化聚合數據操作


  5.2、索引缺點

    1、索引需要占用一定的存儲空間

    2、數據插入、更新、刪除時會受索引的影響,性能會降低。因為數據變更索引也需要進行更新

    3、多個索引,優化器需要耗時則優選擇


  5.3、索引選擇

    1、數據量大時采用

    2、數據高度重復時,不采用

    3、查詢取出數據大於20%,將采用全文掃描,不用索引


  5.4、索引細究

    資料查詢:

    MySQL中的InnoDB、MyISAM都是B-Tree類型索引

    B-Tree包含:PRIMARY KEY, UNIQUE, INDEX, and FULLTEXT

    B-Tree類型索引不支持(即字段使用以下符號時,將不采用索引):

    >, <, >=, <=, BETWEEN, !=, <>,like ‘%**’

    【在此先介紹一下覆蓋索引】

    以我自己理解的方式介紹吧。覆蓋索引並不是像主鍵索引、唯一索引一樣真實存在,它只是對索引應用某些特定場景的一種定義【另一種理解:查詢的列是索引列,因此列被索引覆蓋】。它可以突破傳統的限制,使用以上操作符,且依然采用索引進行查詢。

    因為查詢的列是索引列,所以不需要讀取行,只需要讀取列字段數據就可以了。【例如你看一本書,需要找某一內容,剛好那內容出現在目錄中,那就不用一頁頁翻了,直接在目錄中定位到第幾頁查找】

    如何激活覆蓋索引呢?什麽樣才是特定場景呢?

    索引字段,在select中出現就是了。

    復合索引還可能有其他的特殊場景。例如,三列復合索引,僅需要在select、where、group by、order by中,任意一個地方出現一次復合索引最左邊列就可以激活使用覆蓋索引了。

    查看:

    EXPLAIN中Extra顯示有Using index表示這條語句采用了覆蓋索引。

    結論:

    不建議在查詢的時候使用select*from進行查詢了,應該寫需要用的字段,並且增加相應的索引,以提高查詢性能。

    針對以上操作符實測結果:

    1、以select*from形式,where中是primary key可以通殺【除like】(使用主鍵進行查詢);index則全不可以。

    2、以select 字段a from tab where 字段a《以上操作符》形式測試,結果依然可以使用索引查詢。【采用了覆蓋索引】

    其他索引優化方法:

    1、使用索引關鍵字作為連接的條件

    2、復合索引使用

    3、索引合並or and,將涉及到的字段合並成復合索引

    4、where、和group by涉及字段加索引


6、子查詢優化

  在from中為非相關子查詢,可以上拉子查詢到父層。在多表連接查詢考慮連接代價再選擇。

  查詢優化器對子查詢一般采用嵌套執行的方式,即對父查詢中的每一行,都執行一次子查詢,這樣子查詢會執行很多次。這種執行方式效率很低。

  子查詢轉化為連接查詢優點:

  1、子查詢不用執行很多次

  2、優化器可以根據信息來選擇不同的方法和連接順序

  3、子查詢的連接條件,過濾條件變成父查詢的篩選條件,以提高效率。

  優化:

  子查詢合並,若多個子查詢,能合並的盡量合並。

  子查詢展開,即上拉變成多表查詢(時刻保證等價變化)

  註意:

  子查詢展開只能展開簡單的查詢,若子查詢含有聚集函數、GROUP BY、DISTINCT,則不能上拉。

  select * from t1 (select*from tab where id>10) as t2 where t1.age>10 and t2.age<25;

  select*from t1,tab as t2 where t1.age>10 and t2.age<25 and t2.id>10;

  具體步驟:

  1、from與from合並,修改相應參數

  2、where與where合並,用and連接

  3、修改相應的謂詞(in改=)


7、等價謂詞重寫:

  1、BETWEEEN AND改寫為 >= 、<=之類的。實測:十萬條數據,重寫前後時間,1.45s、0.06s

  2、in轉換多個or。字段為索引時,兩個都能用到索引,or效率相對in好一點

  3、name like ‘abc%’改寫成name>=’abc’ and name<’abd’;

  註意:百萬級數據測試,name沒有索引之前like比後一種查詢快;給字段增加索引後,後面的快一點點,相差不大,因為兩種方法在查詢的時候都用到了索引。

  。。。。


8、條件化簡與優化

  1、將where、having(不存在groupby和聚集函數時)、join-on條件能合並的盡量合並

  2、刪除不必要的括號,減少語法分許的or和and樹層,減少cpu消耗

  3、常量傳遞。a=b and b=2轉換為 a=2 and [email protected]

  4、消除沒用的SQL條件

  5、where等號右邊盡量不出現表達式計算;where中不要對字段進行表達式計算、函數的使用

  6、恒等變換、不等式變換。例:測試百萬級數據a>b and b>10變為a>b and a>10 and b>10優化顯著


9、外連接優化

  即將外連接轉為內連接

  優點:

  1、優化處理器處理外連接比內連接步驟多且耗時

  2、外連接消除後,優化器選擇多表連接順序有更多選擇,可以擇優而選

  3、可以將篩選條件最為嚴格的表作為外表(連接順序最前面,是多層循環體的外循環層),

  可以減少不必要的I/O開銷,能加快算法執行的速度。

  on a.id=b.id與where a.id=b.id的差別,on則表進行連接,where則進行數據對比

  註意:前提必須是結果為NULL決絕(即條件限制不要NULL數據行,語意上是內連接)

  優化原則:

  精簡查詢,連接消除,等效轉換,去除多余表對象連接

  例如:主鍵/唯一鍵作為連接條件,且中間表列只作為等值條件,可以去掉中間表連接


10、其他查詢優化

  1、以下將會造成放棄索引查詢,采用全文掃描

    1.1、where 子句中使用!=或<>操作符  註意:主鍵支持。非主鍵不支持

    1.2、避免使用or

      經測試,並非是使用了or就一定不能使用索引,大多情況下是沒用到索引,但還有少數情況是用到的,因此具體情況具體分析。

      類似優化:

      select * from tab name=’aa’ or name=’bb’;

      =>

      select * from tab name=’aa’

      union all

      select * from tab name=’bb’;

      實測:

      1、十萬數據測試,沒任何索引的情況下,上面比下面的查詢速率快一倍。

      2、三十萬數據測試,aa與bb都是單獨索引情況下,下面的查詢速率比or快一點。

    1.3、避免使用not in

      not in一般不能使用索引;主鍵字段可以

    1.4、where中盡量避免使用對null的判斷

    1.5、like不能前置百分號 like ‘%.com’

      解決:

        1、若必須使用%前置,且數據長度不大,例如URL,可將數據翻轉存入數據庫,再來查。LIKE REVERSE‘%.com’;

        2、使用覆蓋索引

    1.6、使用索引字段作為條件的時候,假若是復合索引,則應該使用索引最左邊前綴的字段名

  2、將exists代替in

    select num from a where num in(select num from b)

    select num from a where exists(select 1 from b where num=a.num)

    一百萬條數據,篩選59417條數據用時6.65s、4.18s。沒做其他優化,僅僅只是將exists替換in。

  3、字段定義是字符串,查詢時沒帶引號,不會用索引,將會進行全文掃描。

  【以下是摘抄於半夜亂彈琴博文http://www.cnblogs.com/lingiu/p/3414134.html,本人沒進行相應的測試】

  4、盡量使用表變量來代替臨時表

  5、避免頻繁創建和刪除臨時表,以減少系統表資源的消耗

  6、如果使用到了臨時表,在存儲過程的最後務必將所有的臨時表顯式刪除,先 truncate table ,然後 drop table ,這樣可以避免系統表的較長時間鎖定

  7、盡量避免使用遊標,因為遊標的效率較差,如果遊標操作的數據超過1萬行,那麽就應該考慮改寫

  8、大數據量,若數據量過大,應該考慮相應需求是否合理。

  9、盡量避免大事務操作,提高系統並發能力。

  。。。。。


11、博文總結

  經過這些天查資料敲代碼的學習,了解到了MySQL的查詢優化並不是簡簡單單的按照某個公式某個規則就可達到的。實驗是檢驗標準的唯一標準,經過這幾天的測試,得出的結論就是:MySQL的查詢優化是有大方向,但是想要得出一個萬能優化公式那是不可能的,畢竟每一條SQL查詢語句的寫法、結果著重點、以及表的字段環境都不一樣。能夠達到看SQL查詢語句就能得出優化方法的大神,必定是仔細研究過SQL查詢優化並且有過好幾年優化經驗的老鳥。哈哈,我還只是個小菜鳥。

  建議各位正在學習SQL查詢優化的童鞋們:不要僅僅只是看,要多敲代碼,多測試,各種字段環境測試、各種數據量級別測試。


MySQL查詢優化