MySQL優化及索引解析

2022-03-17 10:01:22

索引簡單介紹

索引的本質：

MySQL索引或者說其他關係型資料庫的索引的本質就只有一句話，以空間換時間。

索引的作用：

索引關係型資料庫為了加速對錶中行資料檢索的（磁碟儲存的）資料結構

索引的分類

資料結構上面的分類：

HASH 索引
- 等值匹配效率高
- 不支援範圍查詢
樹形索引
- 二元樹，遞迴二分查詢法，左小右大
- 平衡二元樹，二元樹到平衡二元樹，主要原因是左旋右旋
- 缺點1，IO次數過多
- 缺點2，IO利用率不高，IO飽和度
多路平衡查詢樹（B-Tree）
- 特點，大大的減少了樹的高度
B+樹
- 特點，採用左閉合的比較方式
- 根節點支節點沒有資料區，只有葉子結點才包含資料區（說白了就是即便在根節點和子節點已經定位到，因為沒有資料區的原因也不會停留，會一直找到葉子結點為止。）

當我們搜尋13這條資料時，在根節點和子節點都能定位，但是一直會找到葉子結點。

二元樹平衡二元樹，B樹對比:

如圖顯示如果是自增主鍵情況下：

二元樹顯然不適合做關係型資料庫索引（和全表掃描沒什麼區別）。

平衡二元樹呢，雖然解決了這種情況，但是同樣會導致這棵樹，又瘦又高，這同樣會造成上文所提到查詢IO次數過多以及IO利用率不高。

B樹呢，顯然已經解決了這兩個問題，所以下文來解釋，為什麼在這種情況下MySQL還用了B+樹，又做了那些增強。

B樹和B+樹比較:

B+樹在B樹上面的優化:

IO效率更高（B樹每個節點都會保留資料區，而B+樹則不會，假設我們查詢一條資料要遍歷三層，那麼顯然B+樹查詢中IO消耗更小）

範圍查詢效率更高（如圖，B+樹已經形成了一個天然連結串列形式，只需要根據最結尾的鏈式結構查詢）

基於索引的資料掃描效率更高。

索引型別的分類

索引型別可分為兩類:

主鍵索引
輔佐索引(二級索引)
- 唯一性索引
- 複合索引
- 普通索引
- 覆蓋索引

主鍵索引相對來說效能是最好的，但是對於SQL優化，其實大多時候我們都在輔佐索引上面做一些改進和補充。

B+樹在儲存引擎層面落地

我們建立兩個表分別為test_innodb（採用InnoDB作為儲存引擎）test_myisam（採用MyISAM作為儲存引擎）下圖是兩張表磁碟落地的相關檔案，這兩個儲存引擎在B+樹磁碟落地式截然不同的。

B+樹在MyISAM落地：

*.frm檔案是表格骨架檔案比如這個表中的id欄位name欄位是什麼型別的儲存在這裡
*.MYD（D=data）則儲存資料
*.MYI （I=index）則儲存索引

比如現在執行如下sql語句，那麼在MyISAM中他就是先在test_myisam.MYI中查詢到103然後拿到0x194281這個地址然後再去test_myisam.MYD中找到這個資料返回。

SELECT id,name from test_myisam where id =103

如果test_myisam表中，id為主鍵索引，name也是一個索引，那麼在test_myisam.MYI中則會有兩個平級的B+樹，這也導致MyISAM引擎中主鍵索引和二級索引是沒有主次之分的，是平級關係。因為這種機制在MyISAM引擎中，有可能使用多個索引，在InnoDB中則不會出現這種情況。

B+樹在InnoDB落地：

InnoDB不像MyISAM來獨立一個MYD 檔案來儲存資料，它的資料直接儲存在葉子結點關鍵字對應的資料區在這儲存這一個id列所有行的詳細記錄。
InnoDB 主鍵索引和輔助索引關係

我們現在執行如下SQL語句,他會先去找輔助索引，然後找到輔助索引下101的主鍵，再去回表（二次掃描）根據主鍵索引查詢103這條資料將其返回。

SELECT id,name from test_myisam where name ='zhangsan'

這裡就有一個問題了，為什麼不像MyISAM在輔助索引下直接記錄磁碟地址，而是要多此一舉再去回表掃描主鍵索引，這個問題在下面相關面試題中回答，記一下這個問題是這裡來的。

MySQL優化及索引解析

索引簡單介紹

索引的分類

索引型別的分類

B+樹在儲存引擎層面落地

相關面試題

熱門文章