資料量對where in語句的索引影響

阿新 • • 發佈：2019-04-02

我們經常在論壇和麵試中遇到這個問題，mysql中，where in會不會用到索引？

為了徹底搞明白這個問題，做了一些測試，發現記錄數大小對是否命中索引有影響，我們來看一看。

使用的mysql版本是5.7，資料庫引擎為預設的innoDB，索引型別是預設的B+樹索引，用explain執行計劃確認是否命中索引。

我們建立一個表

create table staffs(
    id int primary key auto_increment,
    name varchar(24) not null default '' comment '姓名',
    age int not null default 0 comment '年齡',
    pos varchar(20) not null default '' comment '職位',
    add_time timestamp not null default current_timestamp comment '入職時間'
)charset utf8 comment '員工記錄表';

1，我們測試第一種情況，資料量少的情況

先插入三條資料

insert into staffs(name,age,pos,add_time) values('z3',22,'manager',now());
insert into staffs(name,age,pos,add_time) values('July',23,'dev',now());
insert into staffs(name,age,pos,add_time) values('2000',23,'dev',now());

1.1 對單列索引的影響，以name為例

alter table staffs add index idx_staffs_name(name);

mysql> explain select * from staffs where name in ('z3', '2000');
+----+-------------+--------+------------+------+-----------------+------+---------+------+------+----------+-------------+
| id | select_type | table  | partitions | type | possible_keys   | key  | key_len | ref  | rows | filtered | Extra       |
+----+-------------+--------+------------+------+-----------------+------+---------+------+------+----------+-------------+
|  1 | SIMPLE      | staffs | NULL       | ALL  | idx_staffs_name | NULL | NULL    | NULL |    3 |    66.67 | Using where |
+----+-------------+--------+------------+------+-----------------+------+---------+------+------+----------+-------------+
1 row in set, 1 warning (0.00 sec)

可以看到，沒有命中索引，行數為3，server層對儲存引擎返回的資料做過濾之後剩餘66.67%，也就是說，儲存引擎返回了3條記錄，mysql的server層過濾掉1條，剩下2條，filtered的值為66.67%. （explain詳見之前的博文: https://my.oschina.net/u/3412738/blog/2244825）

1.2 對聯合索引的影響

準備索引

alter table staffs drop index idx_staffs_name;
alter table staffs add index idx_staffs_nameAgePos(name, age, pos);

1.2.1 對聯合索引最左欄位的影響

mysql> explain select * from staffs where name = 'z3';
+----+-------------+--------+------------+------+-----------------------+-----------------------+---------+-------+------+----------+-------+
| id | select_type | table  | partitions | type | possible_keys         | key                   | key_len | ref   | rows | filtered | Extra |
+----+-------------+--------+------------+------+-----------------------+-----------------------+---------+-------+------+----------+-------+
|  1 | SIMPLE      | staffs | NULL       | ref  | idx_staffs_nameAgePos | idx_staffs_nameAgePos | 74      | const |    1 |   100.00 | NULL  |
+----+-------------+--------+------------+------+-----------------------+-----------------------+---------+-------+------+----------+-------+
1 row in set, 1 warning (0.00 sec)

mysql> explain select * from staffs where name in ('z3', '2000');
+----+-------------+--------+------------+------+-----------------------+------+---------+------+------+----------+-------------+
| id | select_type | table  | partitions | type | possible_keys         | key  | key_len | ref  | rows | filtered | Extra       |
+----+-------------+--------+------------+------+-----------------------+------+---------+------+------+----------+-------------+
|  1 | SIMPLE      | staffs | NULL       | ALL  | idx_staffs_nameAgePos | NULL | NULL    | NULL |    3 |    66.67 | Using where |
+----+-------------+--------+------------+------+-----------------------+------+---------+------+------+----------+-------------+
1 row in set, 1 warning (0.04 sec)

可以看到，用 = 查詢時，由於最左原則，用到了索引，而用in查詢時，沒有用到索引。

1.2.2 對聯合索引中間欄位的影響

mysql> explain select * from staffs where name = 'z3' and age = 22;
+----+-------------+--------+------------+------+-----------------------+-----------------------+---------+-------------+------+----------+-------+
| id | select_type | table  | partitions | type | possible_keys         | key                   | key_len | ref         | rows | filtered | Extra |
+----+-------------+--------+------------+------+-----------------------+-----------------------+---------+-------------+------+----------+-------+
|  1 | SIMPLE      | staffs | NULL       | ref  | idx_staffs_nameAgePos | idx_staffs_nameAgePos | 78      | const,const |    1 |   100.00 | NULL  |
+----+-------------+--------+------------+------+-----------------------+-----------------------+---------+-------------+------+----------+-------+
1 row in set, 1 warning (0.00 sec)

mysql> explain select * from staffs where name = 'z3' and age in (22, 23);
+----+-------------+--------+------------+------+-----------------------+------+---------+------+------+----------+-------------+
| id | select_type | table  | partitions | type | possible_keys         | key  | key_len | ref  | rows | filtered | Extra       |
+----+-------------+--------+------------+------+-----------------------+------+---------+------+------+----------+-------------+
|  1 | SIMPLE      | staffs | NULL       | ALL  | idx_staffs_nameAgePos | NULL | NULL    | NULL |    3 |    66.67 | Using where |
+----+-------------+--------+------------+------+-----------------------+------+---------+------+------+----------+-------------+
1 row in set, 1 warning (0.00 sec)

同樣的，當使用 = 查詢時，依次使用了聯合索引，而第二個欄位用 in 查詢時，連第一個欄位都被拖累，沒有使用索引。

2，資料量大的情況

為了快速插入大量資料並建立索引，我們先把原來的那張表drop掉，再建一張一樣的表，不帶任何索引，這樣就不會耗費更新索引的時間。這邊用儲存過程插入。

DELIMITER $$
    CREATE PROCEDURE test_insert()
    BEGIN
        declare i int;
        set i = 1 ;
        WHILE (i < 10000) DO
            INSERT INTO staffs(`name`,`age`,`pos`) VALUES(CONCAT('a', i), FLOOR(20 + RAND() * (100 - i + 1)),'dev');	 
            set i = i + 1;
        END WHILE;
        commit;
END$$
DELIMITER ;

CALL test_insert();

Query OK, 0 rows affected (8 min 7.84 sec)

9999條資料耗時8分多鐘，還是有點慢的。

2.1 對單列索引的影響，以name為例

按照之前的動作，建立索引（命令和上面一樣，為了節約篇幅，這裡就不放出來了，下同），再查詢。

mysql> explain select * from staffs where name in ('a1', 'a2000');
+----+-------------+--------+------------+-------+-----------------+-----------------+---------+------+------+----------+-----------------------+
| id | select_type | table  | partitions | type  | possible_keys   | key             | key_len | ref  | rows | filtered | Extra                 |
+----+-------------+--------+------------+-------+-----------------+-----------------+---------+------+------+----------+-----------------------+
|  1 | SIMPLE      | staffs | NULL       | range | idx_staffs_name | idx_staffs_name | 74      | NULL |    2 |   100.00 | Using index condition |
+----+-------------+--------+------------+-------+-----------------+-----------------+---------+------+------+----------+-----------------------+
1 row in set, 1 warning (0.00 sec)

命中索引，2條記錄，準確率100%.

1.2 對聯合索引的影響

同樣先刪除單列索引，建立聯合索引。

1.2.1 對聯合索引最左欄位的影響

mysql> explain select * from staffs where name in ('a1', 'a2000');
+----+-------------+--------+------------+-------+-----------------------+-----------------------+---------+------+------+----------+-----------------------+
| id | select_type | table  | partitions | type  | possible_keys         | key                   | key_len | ref  | rows | filtered | Extra                 |
+----+-------------+--------+------------+-------+-----------------------+-----------------------+---------+------+------+----------+-----------------------+
|  1 | SIMPLE      | staffs | NULL       | range | idx_staffs_nameAgePos | idx_staffs_nameAgePos | 74      | NULL |    2 |   100.00 | Using index condition |
+----+-------------+--------+------------+-------+-----------------------+-----------------------+---------+------+------+----------+-----------------------+
1 row in set, 1 warning (0.00 sec)

命中索引。

mysql> explain select * from staffs where name in ('a1', 'a2000') and age = 23;
+----+-------------+--------+------------+-------+-----------------------+-----------------------+---------+------+------+----------+-----------------------+
| id | select_type | table  | partitions | type  | possible_keys         | key                   | key_len | ref  | rows | filtered | Extra                 |
+----+-------------+--------+------------+-------+-----------------------+-----------------------+---------+------+------+----------+-----------------------+
|  1 | SIMPLE      | staffs | NULL       | range | idx_staffs_nameAgePos | idx_staffs_nameAgePos | 78      | NULL |    2 |   100.00 | Using index condition |
+----+-------------+--------+------------+-------+-----------------------+-----------------------+---------+------+------+----------+-----------------------+
1 row in set, 1 warning (0.00 sec)

in欄位後面再加條件也可以命中。

1.2.2 對聯合索引中間欄位的影響

mysql> explain select * from staffs where name = 'a1' and age in (22, 23);
+----+-------------+--------+------------+-------+-----------------------+-----------------------+---------+------+------+----------+-----------------------+
| id | select_type | table  | partitions | type  | possible_keys         | key                   | key_len | ref  | rows | filtered | Extra                 |
+----+-------------+--------+------------+-------+-----------------------+-----------------------+---------+------+------+----------+-----------------------+
|  1 | SIMPLE      | staffs | NULL       | range | idx_staffs_nameAgePos | idx_staffs_nameAgePos | 78      | NULL |    2 |   100.00 | Using index condition |
+----+-------------+--------+------------+-------+-----------------------+-----------------------+---------+------+------+----------+-----------------------+
1 row in set, 1 warning (0.01 sec)

mysql> explain select * from staffs where name in ('a1', 'a2000') and age in (22, 23);
+----+-------------+--------+------------+-------+-----------------------+-----------------------+---------+------+------+----------+-----------------------+
| id | select_type | table  | partitions | type  | possible_keys         | key                   | key_len | ref  | rows | filtered | Extra                 |
+----+-------------+--------+------------+-------+-----------------------+-----------------------+---------+------+------+----------+-----------------------+
|  1 | SIMPLE      | staffs | NULL       | range | idx_staffs_nameAgePos | idx_staffs_nameAgePos | 78      | NULL |    4 |   100.00 | Using index condition |
+----+-------------+--------+------------+-------+-----------------------+-----------------------+---------+------+------+----------+-----------------------+
1 row in set, 1 warning (0.00 sec)

對中間欄位也沒有影響，同樣可以命中索引。

3, 總結

3.1 當資料量少時，會按照聯合索引的順序依次使用索引，反而不會使用單列索引，可能的原因是，mysql認為資料量太小，直接走全表查詢，全表掃描反而更快。

3.2 當資料量大時，單列索引一定會使用。聯合索引也會按順序依次使用。

3.3 當然這裡in條件裡面的數值長度不大，如果是一個很長陣列，導致返回的結果佔全表記錄數量較大時，應該也不會使用索引而走全表查詢。

3.4 這裡還沒有測試，當in條件裡面是一個子查詢時的情況。同時，這裡沒有對5.7以下版本做測試。這裡引用一段這位博主的話

如果是 5.5 之前的版本確實不會走索引的，在 5.5 之後的版本，MySQL 做了優化。MySQL 在 2010 年釋出 5.5 版本中，優化器對 in 操作符可以自動完成優化，針對建立了索引的列可以使用索引，沒有索引的列還是會走全表掃描。

比如，5.5 之前的版本（以下都是 5.5 以前的版本）。select * from a where id in (select id from b); 這條 sql 語句它的執行計劃其實並不是先查詢出 b 表的所有 id，然後再與 a 表的 id 進行比較。mysql 會把 in 子查詢轉換成 exists 相關子查詢，所以它實際等同於這條 sql 語句：select * from a where exists(select * from b where b.id=a.id);

而 exists 相關子查詢的執行原理是：迴圈取出 a 表的每一條記錄與 b 表進行比較，比較的條件是 a.id=b.id。看 a 表的每條記錄的 id 是否在 b 表存在，如果存在就行返回 a 表的這條記

資料量對where in語句的索引影響

開發十年，就只剩下這套架構體系了！ >>>

[吳恩達機器學習筆記]11機器學習系統設計5資料量對機器學習的影響

11. 機器學習系統的設計覺得有用的話,歡迎一起討論相互學習~Follow Me 參考資料斯坦福大學 2014 機器學習教程中文筆記 by 黃海廣 11.5 資料量對機器學習的

027.Mysql的in語句索引

還是慢查詢優化，mysql 5.7上抓到一個5s的查詢，沒有走到合理的索引。對應的mybatis的sql片段如下複雜的動態查詢，沒有分而治之，搞的組合條件。結論性的規則，如下：確定值=，使用索引 track_num = (SELECT ... limit 1) 字面量IN，使用索引

MySQL 中 delete where in 語句的子查詢限制

場景一 delete from table1 where id = (select max(id) from table1 ); [Err] 1093 - You can’t specify target table 'table1 ’ for updat

MySql 大資料量快速插入和語句優化

INSERT語句的速度插入一個記錄需要的時間由下列因素組成，其中的數字表示大約比例：連線：(3) 傳送查詢給伺服器：(2) 分析查詢：(2) 插入記錄：（1x記錄大小）插入索引：（1x索引）關閉：(1) 這不考慮開啟表的初始開銷，每個併發執行的查詢開啟。

MySQL大資料量分頁SQL語句優化

分頁程式原理很簡單，這裡就不多說了，本篇文章主要說的是在資料表記錄量比較大的情況下，如何將分頁SQL做到更優化，讓MySQL執行的更快的方法。一般的情況下，我們的分頁SQL語句是這樣的：

用對地方的索引可以讓你的大資料量的查詢效率飛起來

前言之前在做專案的時候，接觸到的千萬級以上的表資料不是太多，對於聯合索引的認知不是太深刻，用索引與不用索引以及索引的建立順序和規則之前的區別不是太明顯，最近手頭有優化查詢千萬級資料量的慢sql的任務，優化前，查詢時間達到了60秒，導致前端請求掛起，做了相應的優化後，查詢千萬級別資料時，速度基本保持在零點

Mysql加鎖過程詳解（4）-select for update/lock in share mode 對事務並發性影響

per inno targe 允許 evel transacti 修改 not null warn select for update/lock in share mode 對事務並發性影響事務並發性理解事務並發性，粗略的理解就是單位時間內能夠執行的事務數量，常見的單

用SQL語句檢視資料庫資料量的大小

1、進入MQSQL命令列介面 2、輸入密碼 3、輸入命令 1、進入information_schema 資料庫（存放了其他的資料庫的資訊） use information_schema; 2、查詢所有資料的大小： s

大資料量表的查詢優化及索引使用

一、對於運算邏輯，儘可能將要統計的各專案整合在一個查詢語句中計算，而不是用分組條件或分專案呼叫多個查詢語句，而後在程式碼裡計算結果。二、查詢語句的優化，諸如不用"select *"、多表關聯查詢時新增別名於查詢欄位上、避免使用in、not in關鍵字、非去除重複時用union all替換uni

大資料量 Mybatis 分頁外掛Count語句優化

前言當在大數量的情況下，進行分頁查詢，統計總數時，會自動count一次，這個語句是在我們的查詢語句的基礎上巢狀一層，如： SELECT COUNT(*) FROM (主sql) 這樣在資料量大的情況下，會出問題，很容易cpu就跑滿了優化在mapper.xml

ibatis/mybatis出現 sql 語句 where in（引數1，引數2……引數1000）超過1000個引數時候的解決方案

公司專案出現bug，查詢後是由於sql 語句in（）內參數查過1000引起的由於專案比較大，無法輕易修改或重構。公司框架比較老用了ibates 無法從xml配置裡進行修改。所以本人寫了段程式碼

【機器學習】基於python對大資料量CSV進行操作

在我們日常學習之中，往往會遇到各種各樣的資料。但有時候其龐大的資料量，使得我們無法使用一般的辦公軟體進行操作，與此同時直接將所有資料取到記憶體之中，也有存在溢位的風險。所以，在這種情況下，採用逐行存取的方式對資料進行操作是十分必要的。本文簡單的使用python最為基礎的函式實

對大資料量的處理思路

最近要用程式對百萬級別的資料量進行處理,綜合性能和程式碼執行時間,來考慮如何書寫高質量的程式碼. 首先就是讀資料的問題,由於資料量比較大,我們可以考慮根據唯一的主鍵id來取資料,這樣速度比較快,而且數量不能太大,讀取Mysql資料庫,資料超過3萬,速度就下降很明顯了

索引對提高查詢速度的影響

2009-01-06 10:35 456人閱讀評論(0)收藏舉報在進行多個表聯合查詢的時候，使用索引可以顯著的提高速度，剛才用SQLite做了一下測試。建立三個表： create table t1 (id integer primary key, num

mysql千萬級資料量根據索引優化查詢速度

（一）索引的作用索引通俗來講就相當於書的目錄，當我們根據條件查詢的時候，沒有索引，便需要全表掃描，資料量少還可以，一旦資料量超過百萬甚至千萬，一條查詢sql執行往往需要幾十秒甚至更多，5秒以上就已經讓人難以忍受了。提升查詢速度的方向一是提升硬體(記憶體、cpu、硬碟)

影響快取的三個因素（命中率、快取更新策略、快取最大資料量）

我們經常通過命中率來衡量快取機制的好壞和效率，這個命中率指的就是請求快取次數和快取返回正確結果的次數的一個比例，這個比例越高，就表明快取的使用率越高。正常的快取命中率也會因為不同的快取應用而大不相同，咱們以query cache為例來說明一下，經過伺服器一段時間的執行和積累，query c

MySQL大資料量分頁查詢方法及其優化 ---方法1: 直接使用資料庫提供的SQL語句 ---語句樣式: MySQL中,可用如下方法: SELECT * FROM 表名稱 LIMIT M,N ---適

測試實驗 1. 直接用limit start, count分頁語句，也是我程式中用的方法： select * from product limit start, count 當起始頁較小時，查詢沒有效能問題，我們分別看下從10， 100， 1000， 10000開始分頁的執行時間（每頁取20條），如

excel資料轉成insert語句插入資料庫（資料量為幾十萬）；

最近接到一個蛋疼的活，要把excel中的資料，匯入到資料庫中，剛開始首先想到的是用程式去做，但是因為時間很緊，寫程式加除錯，也不來及，於是就像直接把excel的資料轉化成insert語句，然後批量執行，資料如下， 1、把excel的資料轉成inser int

mysql千萬級資料量根據（索引）優化查詢速度

轉自：http://blog.csdn.net/qq_33556185/article/details/52192551 （一）索引的作用索引通俗來講就相當於書的目錄，當我們根據條件查詢的時候，沒有索引，便需要全表掃描，資料量少還可以，一旦資料量超過百萬甚至千萬，一條查詢

資料量對where in語句的索引影響

1， 我們測試第一種情況，資料量少的情況

1.1 對單列索引的影響，以name為例

1.2 對聯合索引的影響

1.2.1 對聯合索引最左欄位的影響

1.2.2 對聯合索引中間欄位的影響

2，資料量大的情況

2.1 對單列索引的影響，以name為例

1.2 對聯合索引的影響

1.2.1 對聯合索引最左欄位的影響

1.2.2 對聯合索引中間欄位的影響

3, 總結

相關推薦

1，我們測試第一種情況，資料量少的情況