首頁 > 軟體

MySQL索引優化之不適合構建索引及索引失效的幾種情況詳解

2022-07-29 14:04:04

結論

具體案例下文有詳盡描述

不適合建立索引的場景:

  • 資料量比較小的表不建議建立索引
  • 有大量重複資料的欄位上不建議建立索引(類似:性別欄位)
  • 需要進行頻繁更新的表不建議建立索引
  • where、group by、order by後面的沒有使用到的欄位不建立索引
  • 不要定義冗餘索引

索引失效的場景:

  • 過濾條件使用不等於(!=、<>)
  • 過濾條件使用is not null
  • 在索引欄位上使用函數或進行計算
  • 在使用聯合索引的時候,需要滿足“最佳左字首法則”,否則失效
  • 當使用了型別轉換也會導致索引失效
  • 在使用範圍查詢的時候,聯合索引的部分欄位失效(where age >18)
  • 在like欄位中,如果是以%開頭,索引失效(where name like ‘%abc’)
  • 在使用or進行查詢的時候,or前後出現非索引欄位,索引失效
  • 表和庫的字元集不一致,回導致索引失效

知識點:

  • 每張表的索引不建議超過6個(佔用空間、降低表更新速度)
  • 最終到底是否使用索引還是優化器進行決定的
  • 優化器會根據資料量、資料庫版本、資料選擇讀進行查詢代價的比較,從而決定是否使用索引
  • 建立索引的時候將需要範圍匹配的欄位建立在索引的尾部,避免失效
  • 在建立表的時候將欄位設定為not null同時設定預設值,當需要查詢沒有值的記錄的時候就可以使用where xxx = 預設值,放置使用is not null導致索引失效
  • 頁面搜尋的時候嚴謹左模糊或者全模糊(like ‘%abc’)
  • 對於過濾性較好的欄位建立在聯合索引的前面,這樣就可以優先過濾比較多的資料

不建議建立索引的場景

場景一:資料少的表

當資料比較少的時候,索引的優勢就不明顯了,因為資料庫的儲存引擎也是非常快的,相較於需要查詢索引在進行回表操作,可能直接查詢的效能會更高一些,所以資料相對較少的表不建議建立索引

場景二:有大量重複資料的欄位

類似於性別欄位,只有“男”和“女”兩個不同的值,所以索引一半的資料是“男”一半的資料是“女”,那麼建立索引並不能進行快速的查詢等,所以不建議在有大量重複資料的列上建立索引

場景三:頻繁更新的表(update/delete/insert)

因為表中更新資料的時候,索引也是需要進行對應的維護的,如果一個表近期需要頻繁的進行增刪改操作,那麼就需要耗費大量的時間去維護索引,不建議建立索引,可以在需要進行頻繁的更新操作的時候將索引刪除,更新完畢之後重建索引

場景四:沒有使用的欄位(where/group by/order by)

不是where/group by/order by後面的欄位沒有必要建立索引,因為不會使用到該索引

場景五:不要定義冗餘索引

create index username_password_address on xiao(username,password,address);
-- 如果建立了第一個索引,那麼就沒有必要建立第二個索引
create index username on xiao (username);
--第二個索引就是冗餘索引,因為第一個已經是先根據username排序的索引
--也就是第二個索引的功能完全可以由第一個索引實現

這裡因為username作為第一個聯合索引的第一個欄位,所以索引就是按照username進行排序,在username相同的情況下按照password、address排序,所以也就是實現了單獨拿username列作為索引的功能,即第二個索引就是多餘的

索引失效的場景

場景一:在建立索引的欄位上進行運算(函數等),導致索引失效

這裡首先是給age建立了索引,在第一次查詢過程中使用了age索引,但是第二次key值為null(索引失效),導致索引失效的原因在於第二次查詢的時候where後面對age進行了計算,計算機並不知道執行的是什麼計算所以會將age+1計算後與1比較,索引失效

類似於在欄位上使用函數concat()等都會導致索引失效

場景二:使用不等於(where age != 18)

當使用等值運算,那麼是可以在索引中進行查詢的,但是如果是不等於,那麼則需要遍歷所有資料,所以所失效

explain select * from xiaoyuanhao where age = 18;
explain select * from xiaoyuanhao where age != 18;
--這裡是在age欄位上建立了普通索引,第二個查詢時候索引失效

場景三:使用is not null索引失效

與不等於一樣,如果使用的是is not null,那麼就需要進行全部資料的遍歷操作,索引失效,但是如果使用的是is null那麼依舊是可以使用索引的

--這裡是在age欄位上建立了普通索引,第二個查詢時候索引失效
explain select * from xiaoyuanhao where age is null;
--可以正常使用索引
explain select * from xiaoyuanhao where age is not null;
--索引失效

場景四:在使用聯合索引的時候沒有遵循最佳左字首法則

CREATE INDEX age_classid_name ON student(age,classId,NAME);
EXPLAIN SELECT * FROM student WHERE classId = 30 AND NAME = 'xiaoyuanhao';
-- 因為沒有使用age欄位,所以沒有準許最佳左字首原則,索引失效

從這裡可以看出是沒有使用索引的(key = null),因為建立的索引是先按照age進行排序,在age相同的情況下按照classId和name排序,如果在查詢的時候需要直接按照classId進行排序查詢,那麼就無法使用該索引,即索引失效。

如果需要使用使用索引,那麼就一定需要到聯合索引的第一個欄位age,案例如下

EXPLAIN SELECT * FROM student WHERE age = 10 AND NAME = 'xiaoyuanhao';
EXPLAIN SELECT * FROM student WHERE age = 10 AND classId = 33 AND NAME = 'xiaoyuanhao';
--兩者都是使用age欄位索引,所以索引有效

場景五:型別轉換導致索引失效

CREATE INDEX NAME ON student(NAME);
-- 這裡的name欄位是varchar型別
EXPLAIN SELECT * FROM student WHERE NAME = 'xiao';
-- 本次查詢是可以使用索引的,因為型別都是一致的,都是字串
EXPLAIN SELECT * FROM student WHERE NAME = 123;
-- 本次查詢則無法使用索引,因為是將數位型別123轉換為字元型別

沒有發生型別轉換,使用索引key = name

發生了型別轉換,無法使用索引kye = null,索引失效

使用索引的時候一定需要保證資料型別是一致的,否則系統就需要進行轉換,那麼就無法使用索引

場景六:使用範圍查詢導致聯合索引其他欄位失效

create index age_classId_name on student (age,classId,name);
EXPLAIN SELECT * FROM student WHERE age = 10 AND classId > 20 AND NAME = 'xiaoyuanhao';
-- 這裡只能使用age,classId,索引的前兩個欄位
EXPLAIN SELECT * FROM student WHERE age = 10 AND classId = 20 AND NAME = 'xiaoyuanhao';
-- 這裡可以使用完整的索引,因為都是等值連線

在classId欄位上使用範圍查詢,導致name欄位失效,有效索引長度為63

使用的都是等值匹配,整個索引皆可用,有效索引長度為73

也就是在對於聯合索引來說,如果在使用的時候是等值匹配,那麼就可以重複的利用索引,如果不是等值匹配,那麼該欄位也是可以使用索引的,但是該欄位右邊的欄位就將失效

建議在建立索引的時候將需要範圍匹配的欄位建立在索引的最後面

場景七:在使用like的時候,如果以%開頭導致索引失效

EXPLAIN SELECT * FROM student WHERE NAME LIKE 'abc%';
-- 可以正常使用索引
EXPLAIN SELECT * FROM student WHERE NAME LIKE '%abc';
-- 這裡在like中,%在前面無法使用索引

key = name,使用了該索引,索引有效

key = null,索引失效

因為建立的索引實際上是按照整個字串的從第一個開始進行比較排序的,所以在使用like的時候,也只能夠重現進行比較,如果使用的是’%abc’,那麼查詢的就是以abc結尾的資料,無法使用索引

場景八:or前後出現非索引欄位,索引失效

-- 該表中只有name欄位上的索引
CREATE INDEX NAME ON student(NAME);
EXPLAIN SELECT * FROM student WHERE NAME = 'xiao';
-- 這裡是可以使用name索引的
EXPLAIN SELECT * FROM student WHERE NAME = 'xiao' OR classId = 1001;
-- 這個則無法使用索引,進行的是全表掃描

key = null,無法使用索引,or條件中出現非索引欄位

因為如果name不等於’xiao’的時候那麼就會繼續判斷classId是否等於1001,那麼實際上還是會進行全表掃描,所以索引失效(也就是進行name判斷的時候可以使用索引,但是在判斷classId的時候又要全表掃描,那麼優化器就直接進行全表掃描),但是如果or前後的欄位都有索引了,那麼就就會使用索引

小結

在建立索引的時候,儘量要避免出現以上的情況導致索引失效,但是就算建立的索引是正確的、有效的,但是在不同的資料量以及資料庫版本的情況下,執行的結果也是不一致的,如果想了解哪些情況下適合建立索引,可以從以下文章中進行交流MySQL索引優化之適合構建索引的幾種情況詳解

到此這篇關於MySQL索引優化之不適合構建索引及索引失效的幾種情況詳解的文章就介紹到這了,更多相關MySQL索引優化內容請搜尋it145.com以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援it145.com!


IT145.com E-mail:sddin#qq.com