1. 程式人生 > >(譯)MySQL 8.0實驗室---MySQL中的倒序索引(Descending Indexes)

(譯)MySQL 8.0實驗室---MySQL中的倒序索引(Descending Indexes)

譯者注:
MySQL 8.0之前,不管是否指定索引建的排序方式,都會忽略建立索引時候指定的排序方式(語法上不會報錯),最終都會建立為ASC方式的索引,
在執行查詢的時候,只存在forwarded(正向)方式對索引進行掃描。
關於正向索引和反向索引,邏輯上很容易理解,這裡有兩個相關的概念:
正向索引或者反向(倒序)索引,兩者都是在構建B樹索引時候的相關欄位排序方式,是B索引樹的邏輯儲存方式
正向掃描(forward)和反向掃描( Backward index scan;)是執行查詢的過程中對B樹索引的掃描方式,是資料執行計劃時候的一種索引掃描方式
關於正向掃描或者反向掃描不是隨意的,受sql語句中(正/反向)排序方式以及(正/反向)索引的影響
之前在sqlserver中簡單寫過一點類似的東西,

https://www.cnblogs.com/wy123/p/5552719.html

整體上看,拋開正向索引和倒序索引,在掃描掃描的過程中,正向索引掃描的在效能上,稍微優於反向索引掃描。
不過,即便是反向索引掃描,也是優化器根據具體查詢進行優化的結果,並非一個不好的選擇。

以下為譯文:

從8.0優化器實驗室釋出開始,MySQL開始支援倒序索引。
正如我將在本文中詳細介紹的,這個新特性可以用來消除對結果排序的需求,並在許多查詢中帶來效能改進。

簡介

在此版本之前,所有索引都是按升序建立的。當語法本身被解析時,元資料不會被保留。例如在MySQL 5.7中:

mysql 5.7
> CREATE TABLE t1 (a INT, b INT, INDEX a_desc_b_asc (a DESC, b ASC)); Query OK, 0 rows affected (0.47 sec) mysql 5.7> SHOW CREATE TABLE t1\G *************************** 1. row *************************** Table: t1 Create Table: CREATE TABLE `t1` ( `a` int(11) DEFAULT NULL, `b`
int(11) DEFAULT NULL, KEY `a_desc_b_asc` (`a`,`b`) <-- 建立索引時候的元資料沒有被保留 ) ENGINE=InnoDB DEFAULT CHARSET=latin1 1 row in set (0.00 sec)

應該注意的是,MySQL 5.7 optimizer能夠反向掃描一個升序索引(按照降序排列),其成本較高

(譯者注:以上是原文中寫道的,MySQL 5.7中不知道怎麼去判斷在對索引掃描的時候,究竟是正向掃描還是反向掃描)。
如下可以進一步測試,我們可以看到正向索引掃描比反向索引掃描好~15%。
不能支援倒敘索引的主要限制是,優化器必須對混合順序(如DESC、b ASC的順序)使用檔案排序。

MySQL 8.0中的改進

引入反向索引後,InnoDB現在可以按照降序順序儲存資料行,優化器將在查詢中請求降序時利用它。
重複上面的例子,我們可以看到在建立表時索引順序資訊被正確地保留了:

mysql 8.0> CREATE TABLE t1 (a INT, b INT, INDEX a_desc_b_asc (a DESC, b ASC));
Query OK, 0 rows affected (0.47 sec)
 
mysql 8.0> show create table t1;
+-------+--------------------------------------------------------------------------------------------------------------------------------------------------------+
| Table | Create Table |
+-------+--------------------------------------------------------------------------------------------------------------------------------------------------------+
| t1 | CREATE TABLE `t1` (
`a` int(11) DEFAULT NULL,
`b` int(11) DEFAULT NULL,
KEY `a_desc_b_asc` (`a` DESC,`b`)
) ENGINE=InnoDB DEFAULT CHARSET=latin1 |
+-------+--------------------------------------------------------------------------------------------------------------------------------------------------------+
1 row in set (0.00 sec)

為了區分向後和向前索引掃描,還改進了EXPLAIN的輸出。
對於MySQL-5.7,除了查詢2和查詢6之外,我們對所有查詢都使用反向索引掃描或檔案排序,因為這兩個查詢只需要升序。

Query 1: SELECT * FROM t1 ORDER BY a DESC;

mysql 8.0> explain SELECT * FROM t1 ORDER BY a DESC;
+----+-------------+-------+------------+-------+---------------+--------------+---------+------+------+----------+-------------+
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
+----+-------------+-------+------------+-------+---------------+--------------+---------+------+------+----------+-------------+
| 1  | SIMPLE    | t1    | NULL    | index  | NULL | a_desc_b_asc | 10 | NULL | 10 | 100.00 | Using index |
+----+-------------+-------+------------+-------+---------------+--------------+---------+------+------+----------+-------------+
1 row in set, 1 warning (0.00 sec)

Query 2: SELECT * FROM t1 ORDER BY a ASC;

mysql 8.0> explain SELECT * FROM t1 ORDER BY a ASC;
+----+-------------+-------+------------+-------+---------------+--------------+---------+------+------+----------+----------------------------------+
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
+----+-------------+-------+------------+-------+---------------+--------------+---------+------+------+----------+----------------------------------+
| 1 | SIMPLE | t1 | NULL | index | NULL | a_desc_b_asc | 10 | NULL | 10 | 100.00 | Backward index scan; Using index |
+----+-------------+-------+------------+-------+---------------+--------------+---------+------+------+----------+----------------------------------+
1 row in set, 1 warning (0.00 sec)

Query 3: SELECT * FROM t1 ORDER BY a DESC, b ASC;

mysql 8.0> EXPLAIN SELECT * FROM t1 ORDER BY a DESC, b ASC;
+----+-------------+-------+------------+-------+---------------+--------------+---------+------+------+----------+-------------+
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
+----+-------------+-------+------------+-------+---------------+--------------+---------+------+------+----------+-------------+
| 1 | SIMPLE | t1 | NULL | index | NULL | a_desc_b_asc | 10 | NULL | 10 | 100.00 | Using index |
+----+-------------+-------+------------+-------+---------------+--------------+---------+------+------+----------+-------------+
1 row in set, 1 warning (0.00 sec)

Query 4: SELECT * FROM t1 ORDER BY a ASC, b DESC;

mysql 8.0> EXPLAIN SELECT * FROM t1 ORDER BY a ASC, b DESC;
+----+-------------+-------+------------+-------+---------------+--------------+---------+------+------+----------+----------------------------------+
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
+----+-------------+-------+------------+-------+---------------+--------------+---------+------+------+----------+----------------------------------+
| 1 | SIMPLE | t1 | NULL | index | NULL | a_desc_b_asc | 10 | NULL | 10 | 100.00 | Backward index scan; Using index |
+----+-------------+-------+------------+-------+---------------+--------------+---------+------+------+----------+----------------------------------+
1 row in set, 1 warning (0.00 sec)

Query 5: SELECT * FROM t1 ORDER BY a DESC, b DESC;

mysql 8.0> EXPLAIN SELECT * FROM t1 ORDER BY a DESC, b DESC;
+----+-------------+-------+------------+-------+---------------+--------------+---------+------+------+----------+-----------------------------+
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
+----+-------------+-------+------------+-------+---------------+--------------+---------+------+------+----------+-----------------------------+
| 1 | SIMPLE | t1 | NULL | index | NULL | a_desc_b_asc | 10 | NULL | 10 | 100.00 | Using index; Using filesort |
+----+-------------+-------+------------+-------+---------------+--------------+---------+------+------+----------+-----------------------------+
1 row in set, 1 warning (0.01 sec)

Query 5: SELECT * FROM t1 ORDER BY a ASC, b ASC;

mysql 8.0> EXPLAIN SELECT * FROM t1 ORDER BY a ASC, b ASC;
+----+-------------+-------+------------+-------+---------------+--------------+---------+------+------+----------+-----------------------------+
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
+----+-------------+-------+------------+-------+---------------+--------------+---------+------+------+----------+-----------------------------+
| 1 | SIMPLE | t1 | NULL | index | NULL | a_desc_b_asc | 10 | NULL | 10 | 100.00 | Using index; Using filesort |
+----+-------------+-------+------------+-------+---------------+--------------+---------+------+------+----------+-----------------------------+
1 row in set, 1 warning (0.00 sec)

當表中有一個索引a_desc_b_asc (a DESC, b ASC)時,以下是上述6個查詢的效能指標。

資料大小為1000萬行。在MySQL-5.7中,它是a_asc_b_asc(a ASC, b ASC),因為不支援倒敘索引。

效能指標的解釋:

1, 對於查詢1,也即ORDER BY a DESC;:
我們看到查詢1中效能的提升,因為請求的語句排序是“a”列的DESC
譯者注:因為MySQL8.0中可以建立倒敘索引,查詢1按照a欄位desc排序,直接走正向(forwarded)索引掃描即可完成查詢,
避免了在MySQL5.7中查詢出來資料之後再進行排序操作的步驟

2,對於查詢2:
由於查詢2的排序為正序(譯者注:與索引的順序相反,因此需要反向掃描),由於反向索引掃描,
在MySQL-8.0中(相對於查詢1)執行向反向索引掃描需要更多的時間
(注意,從圖中可以看出,MySQL-8.0總體上表現更好。MySQL 5.7中正向索引掃描,與MySQL 8.0中反向索引掃描花費的時間(幾乎)相同)

3,對於查詢3 也即ORDER BY a DESC, b ASC;:
查詢3的排序方式與查詢1類似,然而在MySQL-5.7中,對於任何請求混合順序的查詢,會對查詢結果重新排序,因此效能差別是巨大的。

4,對於查詢4 也即 ORDER BY a ASC, b DESC;
可以看到,在MySQL 8.0中,查詢4執行的是反向索引掃描,因此比查詢3花費了更多的時間,
儘管如此,在查詢5和查詢6中,排序的方式是(a DESC, b DESC)/(a ASC, b ASC),不管是正向掃描還是反向掃描,都無法滿足排序需求,因此會用到filesort
但是,在這種情況下,由於在MySQL-5.7中ASC/DESC索引標誌被忽略(譯者注:MySQL 5.7中沒有正向和反向索引的概念),因此MySQL-5.7可以使用(正向/反向)索引掃描來給出請求的順序。

5,如果使用者想要避免查詢5和查詢6的filesorts,可以修改表以新增一個鍵(a ASC, b ASC)。
此外,如果使用者也想避免反向索引掃描,可以同時新增(a ASC, b DESC)和(a DESC, b DESC)。

下面是添加了第5點下的額外索引後的MySQL-5.7.14和MySQL-8.0-labs的最後對比:

注意,在MySQL-5.7中,我們不能新增額外的索引來提高上述查詢的效能。
而且,有了這個特性,在某些情況下可以避免物化,比如在連線中的第一個表上請求混合順序。
在一些用例中,反向索引提高了效能。區間掃描訪問方法也使用反向索引。
雖然並不是所有的範圍掃描訪問方法都使用反向索引,但我們將在未來嘗試消除這些限制。

改進

隨著倒序索引(反向索引)的引入,我們已經刪除了對隱式排序的支援,結果是作為GROUP BY的一部分提到的列的升序。
除了上述改進外,我們還看到在一些情況下效能得到了改善,這些情況下的順序是隱含的,但可能不是必需的。

總結

我們很高興能夠解決MySQL社群長期存在的功能請求之一。請了解倒敘索引的特性,讓我們知道你的想法!