MySQL學習之索引及優化

2023-03-31 06:00:58

索引是什麼？

索引是幫助MySQL進行高效查詢的一種資料結構。好比一本書的目錄，能加快查詢的速度

索引的結構？

索引可以有B-Tree索引，Hash索引。索引是在儲存引擎中實現的

InnoDB / MyISAM 僅支援 B-Tree索引

Memory/Heap 支援B-Tree索引和Hash索引

B-Tree

B-Tree是一種非常適合用於磁碟操作的資料結構。它是一棵多路平衡查詢樹。其高度一般在2-4，其非葉子節點，葉子節點，都會儲存資料。其所有的葉子節點，都在同一層。下圖是一顆B-Tree

B+ Tree：B+樹是在B-Tree基礎上的一種優化。它和B樹的主要區別在於：B+樹的資料全部儲存在葉子節點中，且葉子節點被一個連結串列串了起來。下圖是一顆B+樹

InnoDB中一個頁的大小為16KB（一個頁即B+樹上的一個節點），若表的主鍵為INT，大小為4位元組，那一個節點也能夠儲存4K個鍵值，假設指標和鍵值都佔相同大小，那麼高度為3的B+樹，第二層有2048個節點，第三層的葉子節點數為2048*2048 = 4194304，一個節點為16KB，則一共可容納67108864KB，即65536MB，即64G的資料。

由於葉子節點是被一個連結串列串起來的，所以若order by 索引列，則預設已經是排好序的，所以效率會很高。

MyISAM索引
MyISAM的索引和資料是分開存放的。在MyISAM的主鍵索引中，B+樹葉子節點裡，存的是記錄的地址，故MyISAM通過索引查詢，需要經過2次IO

MyISAM的輔助索引和主鍵索引一樣，唯一的區別是，輔助索引中的key可以重複，而主鍵索引的key不能重複

InnoDB索引
InnoDB的資料和索引是存放在一起的，又稱聚集索引。資料通過主鍵索引，存放在主鍵索引B+樹的葉子節點上。
InnoDB主鍵索引，資料已經包含在了葉子節點中，即索引和資料存放在一起，是為聚集索引。

InnoDB的輔助索引，葉子節點中存的是主鍵值，而不是地址。走輔助索引，需要檢索2次。

InnoDB和MyISAM索引的區別：

InnoDB使用聚集索引，其主鍵索引葉子節點中直接儲存了資料，而其輔助索引中葉子節點存的是主鍵的值
MyISAM使用非聚集索引，資料和索引不在同一個檔案中，其主鍵索引中葉子節點上存的是該行記錄所在的地址，其輔助索引中葉子節點上存的也是記錄所在的地址，只是輔助索引的key可以重複，而主鍵索引的key不能重複

問題：

InnoDB為什麼不要使用過長的欄位做主鍵？
過長的主鍵，會使得輔助索引所佔空間變得很大
為什麼推薦InnoDB使用自增主鍵？
若使用自增主鍵，則每次插入新的記錄，就會順序的將新記錄新增到當前索引節點的後續位置，一頁寫滿了，才會進行開闢新的一頁，這樣使得索引結構很緊湊，且每次插入時不需要移動已有資料，非常高效。而如果不使用自增主鍵，則每次插入新記錄時，都要選擇一個插入位置，並且可能需要行動資料，使得效率不高，且索引結構不緊湊
為什麼要用B+樹，不用B樹

索引存在哪兒？

索引本身也比較大，一般會儲存在磁碟中，索引和資料可能是分開存放的（MyISAM的非聚集索引），也可能是一起存放的（InnoDB的聚集索引）

索引的優缺點?

優點
- 降低IO成本，提高資料查詢效率
- 降低排序成本（被索引的列會自動排序，使用order by 效率會提高很多）
缺點
- 索引會額外佔據儲存空間
- 索引會降低更新表資料的效率。進行增刪改操作時，不僅要儲存資料，還要更新對應的索引

索引的分類

單列索引
- 主鍵索引
- 唯一索引
- 普通索引
組合索引

索引使用

建立索引

 CREATE INDEX index_name ON table_name(col_name);
-- 或者
ALTER TABLE table_name ADD INDEX index_name(col_name)

刪除索引

DROP INDEX index_name ON table_name;

需要建立索引的場景
- 頻繁作為查詢條件的列，需建索引
- 多表關聯中，關聯欄位需建索引
- 查詢中排序的欄位，需建索引
不適用索引的場景
- 寫多讀少的表，不適合建索引
- 頻繁更新的欄位，不適合建索引

explain執行計劃

現有一張user表，其索引如下所示

其中name,age,address 三個欄位作為一個組合索引

可以使用explain對某個SQL語句進行效能分析

explain select * from user where name = 'am';

possible_keys
可能用到的索引
key
實際用到的索引
key_len
用於查詢的索引的長度
ref
如果是等值查詢，這裡會會是const
rows
預計需要掃描的行數（不是精確值）
extra

額外資訊，如

using where
表示儲存引擎返回的結果，還需要在SQL Layer層過濾
using index
表示不需要回表查詢，一般在使用了覆蓋索引時會是這個值。覆蓋索引指的是，select中的列，全是索引列。不需要回表查詢指的是，直接走輔助索引，就能拿到索引列的值，不需要再去主鍵索引上取記錄了
using index condition
MySQL 5.6.x之後支援ICP特性（Index Condition Pushdown），可以把檢查條件下推到儲存引擎層，不符合條件的記錄，直接不讀取，而不是像原來一樣，先讀取出來，再在SQL Layer層過濾，這樣減少了儲存引擎層掃描的行數

using filesort
排序時無法用到索引

type

system : 表中只有1行資料，或空表
const : 使用唯一索引或主鍵索引，且用where等值查詢，返回記錄是1行，又叫唯一索引掃描

ref : 針對非唯一索引，使用等值where條件，或者最左字首規則的查詢。

下面是滿足了最左字首規則，即對idx_name_age_add來說，滿足了最左字首，第一個索引為name

range：索引範圍掃描，常見於>，<，between，in，like等查詢

注意like時，萬用字元%不能放在開頭，否則會導致全表掃描

index ：沒有完全匹配上索引，但不用回表查詢的

all: 全表掃描，然後再在SQL Layer層過濾符合要求的記錄

索引使用規範（索引失效分析）

全值匹配
在索引列上使用等值查詢

explain select * from user where name = 'y' and age = 15;

2. 最左字首

組合索引中，查詢條件要從組合索引的最左列開始，如上述example中組合索引idx_name_age_add，是建立在三個列name，age，address的，若跳過name，直接用age查詢，則會變為全表掃描

explain select * from user where age = 15;

3. 不要在索引列上做計算

4. 範圍條件右側的索引列會失效

看到第一個SQL語句，沒有用上addresss索引

5. 儘量使用覆蓋索引

explain select name,age from user where name = 'y' and age = 1;

可以避免回表查詢

6. 索引欄位不要使用不等（!= 或 <>）,不要判斷null（is null/ is not null）
會導致索引失效，轉為全表掃描

7. 索引欄位上使用like時，不要以%開頭

8. 索引欄位如果是字串，記得加單引號

9. 索引欄位不要用or

例子總結：

順口溜：
全值匹配我最愛，最左字首不放開。
帶頭大哥不能死，中間兄弟不能斷。
索引列上不計算，範圍查詢後全斷。
like百分號寫最右，覆蓋索引搞起來。
不等空值以及or，索引通通說拜拜。

到此這篇關於MySQL學習之索引及優化的文章就介紹到這了,更多相關MySQL索引及優化內容請搜尋it145.com以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援it145.com！