首頁 > 軟體

mysql幻讀詳解範例以及解決辦法

2022-06-16 14:02:20
髒讀/不可重複讀的概念都比較容易理解和掌握,這裡不在討論

事務隔離級別(tx_isolation)

mysql 有四級事務隔離級別 每個級別都有字元或數位編號

級別symbol描述
讀未提交READ-UNCOMMITTED0存在髒讀、不可重複讀、幻讀的問題
讀已提交READ-COMMITTED1解決髒讀的問題,存在不可重複讀、幻讀的問題
可重複讀REPEATABLE-READ2mysql 預設級別,解決髒讀、不可重複讀的問題,存在幻讀的問題。使用 MMVC機制 實現可重複讀
序列化SERIALIZABLE3解決髒讀、不可重複讀、幻讀,可保證事務安全,但完全序列執行,效能最低

我們可以通過以下命令 檢視/設定 全域性/對談 的事務隔離級別

mysql> SELECT @@global.tx_isolation, @@tx_isolation;
+-----------------------+------------------+
| @@global.tx_isolation | @@tx_isolation   |
+-----------------------+------------------+
| REPEATABLE-READ       | READ-UNCOMMITTED |
+-----------------------+------------------+
1 row in set (0.00 sec)

# 設定全域性的隔離級別 設定對談 global 替換為 session 即可 把set語法溫習一下
# SET [GLOABL] config_name = 'foobar';
# SET @@[session.|global.]config_name = 'foobar';
# SELECT @@[global.]config_name;

SET @@gloabl.tx_isolation = 0;
SET @@gloabl.tx_isolation = 'READ-UNCOMMITTED';

SET @@gloabl.tx_isolation = 1;
SET @@gloabl.tx_isolation = 'READ-COMMITTED';

SET @@gloabl.tx_isolation = 2;
SET @@gloabl.tx_isolation = 'REPEATABLE-READ';

SET @@gloabl.tx_isolation = 3;
SET @@gloabl.tx_isolation = 'SERIALIZABLE';

幻讀

首先我們要搞明白何謂幻讀,目前網上的眾多解釋幻讀的博文個人感覺仔細設想一下就能找出推翻的例子,就像博文把 非阻塞IO 等同為 非同步IO,然後好多文章都紛紛借用,其實這倆貨是完全不同,非阻塞IO 是 同步IO 中的一種模式,並非 非同步IO。錯誤的觀點都被大眾認同的 "正確化" 了,扯遠了,迴歸主題。

幻讀會在 RU / RC / RR 級別下出現,SERIALIZABLE 則杜絕了 幻讀,但 RU / RC 下還會存在髒讀、不可重複讀,故我們就以 RR 級別來研究 幻讀,排除其他干擾。

注意:RR 級別下存在幻讀的可能,但也是可以使用對記錄手動加 X鎖 的方法消除幻讀。SERIALIZABLE 正是對所有事務都加 X鎖 才杜絕了 幻讀,但很多場景下我們的業務 sql 並不會存在 幻讀 的風險。SERIALIZABLE 的一刀切雖然事務絕對安全,但效能會有很多不必要的損失。故可以在 RR 下根據業務需求決定是否加鎖,存在幻讀風險我們加鎖,不存在就不加鎖,事務安全與效能兼備,這也是 RR 作為 mysql 預設隔是個事務離級別的原因,所以需要正確的理解 幻讀。

幻讀錯誤的理解:說幻讀是 事務A 執行兩次 select 操作得到不同的資料集,即 select 1 得到 10 條記錄,select 2 得到 11 條記錄。這其實並不是幻讀,這是不可重複讀的一種,只會在 R-U R-C 級別下出現,而在 mysql 預設的 RR 隔離級別是不會出現的。

這裡給出我對幻讀的比較白話的理解:

幻讀,並不是說兩次讀取獲取的結果集不同,幻讀側重的方面是某一次的 select 操作得到的結果所表徵的資料狀態無法支撐後續的業務操作。更為具體一些:select 某記錄是否存在,不存在,準備插入此記錄,但執行 insert 時發現此記錄已存在,無法插入,此時就發生了幻讀。

這裡給出 mysql 幻讀的比較形象的場景(借用我在知乎上的回答):

table users: id primary key

事務T1


事務T2

step1 T1: SELECT * FROM `users` WHERE `id` = 1;
step2 T2: INSERT INTO `users` VALUES (1, 'big cat');
step3 T1: INSERT INTO `users` VALUES (1, 'big cat');
step4 T1: SELECT * FROM `users` WHERE `id` = 1;

T1 :主事務,檢測表中是否有 id 為 1 的記錄,沒有則插入,這是我們期望的正常業務邏輯。

T2 :干擾事務,目的在於擾亂 T1 的正常的事務執行。

在 RR 隔離級別下,step1、step2 是會正常執行的,step3 則會報錯主鍵衝突,對於 T1 的業務來說是執行失敗的,這裡 T1 就是發生了幻讀,因為 T1 在 step1 中讀取的資料狀態並不能支撐後續的業務操作,T1:“見鬼了,我剛才讀到的結果應該可以支援我這樣操作才對啊,為什麼現在不可以”。T1 不敢相信的又執行了 step4,發現和 setp1 讀取的結果是一樣的(RR下的 MMVC機制)。此時,幻讀無疑已經發生,T1 無論讀取多少次,都查不到 id = 1 的記錄,但它的確無法插入這條他通過讀取來認定不存在的記錄(此資料已被T2插入),對於 T1 來說,它幻讀了。

其實 RR 也是可以避免幻讀的,通過對 select 操作手動加 行X鎖(SELECT ... FOR UPDATE 這也正是 SERIALIZABLE 隔離級別下會隱式為你做的事情),同時還需要知道,即便當前記錄不存在,比如 id=1 是不存在的,當前事務也會獲得一把記錄鎖(因為InnoDB的行鎖鎖定的是索引,故記錄實體存在與否沒關係,存在就加 行X鎖,不存在就加 next-key lock間隙X鎖),其他事務則無法插入此索引的記錄,故杜絕了幻讀。

在 SERIALIZABLE 隔離級別下,step1 執行時是會隱式的新增 行(X)鎖 / gap(X)鎖的,從而 step2 會被阻塞,step3 會正常執行,待 T1 提交後,T2 才能繼續執行(主鍵衝突執行失敗),對於 T1 來說業務是正確的,成功的阻塞扼殺了擾亂業務的T2,對於T1來說他前期讀取的結果是可以支撐其後續業務的。

所以 mysql 的幻讀並非什麼讀取兩次返回結果集不同,而是事務在插入事先檢測不存在的記錄時,驚奇的發現這些資料已經存在了,之前的檢測讀獲取到的資料如同鬼影一般。

這裡要靈活的理解讀取的意思,第一次select是讀取,第二次的 insert 其實也屬於隱式的讀取,只不過是在 mysql 的機制中讀取的,插入資料也是要先讀取一下有沒有主鍵衝突才能決定是否執行插入。

不可重複讀側重表達 讀-讀,幻讀則是說 讀-寫,用寫來證實讀的是鬼影。

RR級別下防止幻讀

RR級別下只要對 SELECT 操作也手動加行(X)鎖即可類似 SERIALIZABLE 級別(它會對 SELECT 隱式加鎖),即大家熟知的:

# 這裡需要用 X鎖, 用 LOCK IN SHARE MODE 拿到 S鎖 後我們沒辦法做 寫操作
SELECT `id` FROM `users` WHERE `id` = 1 FOR UPDATE;

如果 id = 1 的記錄存在則會被加行(X)鎖,如果不存在,則會加 next-lock key / gap 鎖(範圍行鎖),即記錄存在與否,mysql 都會對記錄應該對應的索引加鎖,其他事務是無法再獲得做操作的。

這裡我們就展示下 id = 1 的記錄不存在的場景,FOR UPDATE 也會對此 “記錄” 加鎖,要明白,InnoDB 的行鎖(gap鎖是範圍行鎖,一樣的)鎖定的是記錄所對應的索引,且聚簇索引同記錄是直接關係在一起的。

id = 1 的記錄不存在,開始執行事務:
step1: T1 查詢 id = 1 的記錄並對其加 X鎖
step2: T2 插入 id = 1 的記錄,被阻塞
step3: T1 插入 id = 1 的記錄,成功執行(T2 依然被阻塞中),T1 提交(T2 喚醒但主鍵衝突執行錯誤)
T1事務符合業務需求成功執行,T2干擾T1失敗。

SERIALIZABLE級別杜絕幻讀

在此級別下,我們便不需要對 SELECT 操作顯式加鎖,InnoDB會自動加鎖,事務安全,但效能很低

step1: T1 查詢 id = 2 的記錄,InnoDB 會隱式的對齊加 X鎖
step2: T2 插入 id = 2 的記錄,被阻塞
step3: T1 插入 id = 2 的記錄,成功執行(T2 依然被阻塞中)
step4: T1 成功提交(T2 此時喚醒但主鍵衝突執行錯誤)
T1事務符合業務需求成功執行,T2干擾T1失敗。

總結

RR 級別作為 mysql 事務預設隔離級別,是事務安全與效能的折中,可能也符合二八定律(20%的事務存在幻讀的可能,80%的事務沒有幻讀的風險),我們在正確認識幻讀後,便可以根據場景靈活的防止幻讀的發生。

SERIALIZABLE 級別則是悲觀的認為幻讀時刻都會發生,故會自動的隱式的對事務所需資源加排它鎖,其他事務存取此資源會被阻塞等待,故事務是安全的,但需要認真考慮效能。

InnoDB 的行鎖鎖定的是索引,而不是記錄本身,這一點也需要有清晰的認識,故某索引相同的記錄都會被加鎖,會造成索引競爭,這就需要我們嚴格設計業務 sql,儘可能的使用主鍵或唯一索引對記錄加鎖。索引對映的記錄如果存在,加行鎖,如果不存在,則會加 next-key lock / gap 鎖 / 間隙鎖,故 InnoDB 可以實現事務對某記錄的預先佔用,如果記錄存在,它就是本事務的,如果記錄不存在,那它也將是本是無的,只要本是無還在,其他事務就別想佔有它。

到此這篇關於mysql幻讀詳解的文章就介紹到這了,更多相關mysql幻讀詳解內容請搜尋it145.com以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援it145.com!


IT145.com E-mail:sddin#qq.com