首頁 > 軟體

淺談Redis跟MySQL的雙寫問題解決方案

2022-02-24 13:00:43

專案中有遇到這個問題,跟MySQL中的資料不一致,研究一番發現這裡面細節並不簡單,特此記錄一下。

寫在前面

嚴格意義上任何非原子操作都不可能保證一致性,除非用阻塞讀寫實現強一致性,所以快取架構我們追求的目標是最終一致性。
快取就是通過犧牲強一致性來提高效能的。

這是由CAP理論決定的。快取系統適用的場景就是非強一致性的場景,它屬於CAP中的AP。

以下3 種快取讀寫策略各有優劣,不存在最佳。

三種讀寫快取策略

Cache-Aside Pattern(旁路快取模式)

Cache-Aside Pattern,即旁路快取模式,它的提出是為了儘可能地解決快取與資料庫的資料不一致問題。

:從快取讀取資料,讀到直接返回。如果讀取不到的話,從資料庫載入,寫入快取後,再返回響應。
:更新的時候,先更新資料庫,然後再刪除快取

Read-Through/Write-Through(讀寫穿透)

Read/Write Through Pattern 中伺服器端把 cache 視為主要資料儲存,從中讀取資料並將資料寫入其中。cache 服務負責將此資料讀取和寫入 DB,從而減輕了應用程式的職責。

因為我們經常使用的分散式快取 Redis 並沒有提供 cache 將資料寫入DB的功能,所以使用並不多。

:先查 cache,cache 中不存在,直接更新 DB。cache 中存在,則先更新 cache,然後 cache 服務自己更新 DB(同步更新 cache和DB)。

:從 cache 中讀取資料,讀取到就直接返回 。讀取不到的話,先從 DB 載入,寫入到 cache 後返回響應。

Write Behind Pattern(非同步快取寫入)

Write Behind Pattern 和 Read/Write Through Pattern 很相似,兩者都是由 cache 服務來負責 cache 和 DB 的讀寫。

但是,兩個又有很大的不同:Read/Write Through 是同步更新 cache 和 DB,而 Write Behind Caching 則是隻更新快取,不直接更新 DB,而是改為非同步批次的方式來更新 DB。

很明顯,這種方式對資料一致性帶來了更大的挑戰,比如cache資料可能還沒非同步更新DB的話,cache服務可能就掛掉了,反而會帶來更大的災難。

這種策略在我們平時開發過程中也非常非常少見,但是不代表它的應用場景少,比如訊息佇列中訊息的非同步寫入磁碟、MySQL 的 InnoDB Buffer Pool 機制都用到了這種策略。

Write Behind Pattern 下 DB 的寫效能非常高,非常適合一些資料經常變化又對資料一致性要求沒那麼高的場景,比如瀏覽量、點贊量。

旁路快取模式解析

Cache Aside Pattern 的一些疑問

旁路快取模式是我們平時中使用最多的。下面根據上面介紹的旁路快取模式,我們可以有以下幾個疑問。

為什麼寫操作是刪除快取,而不是更新快取

:執行緒A先發起一個寫操作,第一步先更新資料庫。執行緒B再發起一個寫操作,第二步更新了資料庫,由於網路等原因,執行緒B先更新了快取,執行緒A更新快取。

這時候,快取儲存的是A的資料(老資料),資料庫儲存的是B的資料(新資料),資料不一致了,髒資料出現啦。如果是刪除快取取代更新快取則不會出現這個髒資料問題。

實際上要寫操作的時候更新快取也是可以的,不過我們需要加一個鎖/分散式鎖來保證更新cache的時候不存線上程安全問題。

在寫資料的過程中,為什麼要先更新DB在刪除快取

:比如說請求1 是寫操作,要是先刪除快取A,請求2是讀操作,先讀快取A,發現快取被刪除了(被請求1刪除了),然後去讀資料庫,但是此時請求1還沒來得及把資料及時更新,那麼請求2讀的就是舊資料,並且請求2還會把讀到的舊資料放到快取中,造成了資料的不一致。

其實要先刪快取,再更新資料庫也是可以,如採用延時雙刪策略
休眠1秒,再次淘汰快取 這麼做,可以將1秒內所造成的快取髒資料,再次刪除。不一定是1秒,看你業務決定的,不過不推薦這種做法,因為在這1秒內可能發生因素很多,它的不確定性太大。

在寫資料的過程中,先更新DB,後刪除cache就沒有問題了麼?

答: 理論上來說還是可能會出現資料不一致性的問題,不過概率非常小。

假設這會有兩個請求,一個請求A做查詢操作,一個請求B做更新操作,那麼會有如下情形產生

(1)快取剛好失效
(2)請求A查詢資料庫,得一箇舊值
(3)請求B將新值寫入資料庫
(4)請求B刪除快取
(5)請求A將查到的舊值寫入快取 ok,如果發生上述情況,確實是會發生髒資料。

然而,發生這種情況的概率並不高

發生上述情況有一個先天性條件,就是步驟(3)的寫資料庫操作比步驟(2)的讀資料庫操作耗時更短,才有可能使得步驟(4)先於步驟(5)。

可是,仔細想想,資料庫的讀操作的速度遠快於寫操作的(不然做讀寫分離幹嘛,做讀寫分離的意義就是因為讀操作比較快,耗資源少),因此步驟(3)耗時比步驟(2)更短,這一情形很難出現。

還有其他造成不一致的原因麼?

答: 如果刪除快取過程中失敗了就會造成不一致問題

如何解決?
使用Canal去訂閱資料庫的binlog,獲得需要操作的資料。另起一個程式,獲得這個訂閱程式傳來的資訊,進行刪除快取操作。

Cache Aside Pattern 的缺陷

缺陷1:首次請求資料一定不在 cache 的問題

解決辦法:可以將熱點資料提前放入cache 中。

缺陷2:寫操作比較頻繁的話導致cache中的資料會被頻繁被刪除,這樣會影響快取命中率 。

資料庫和快取資料強一致場景 :更新DB的時候同樣更新cache,不過我們需要加一個鎖/分散式鎖來保證更新cache的時候不存線上程安全問題。可以短暫地允許資料庫和快取資料不一致的場景 :更新DB的時候同樣更新cache,但是給快取加一個比較短的過期時間,這樣的話就可以保證即使資料不一致的話影響也比較小。

到此這篇關於淺談Redis跟MySQL的雙寫問題解決方案的文章就介紹到這了,更多相關Redis MySQL雙寫內容請搜尋it145.com以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援it145.com!


IT145.com E-mail:sddin#qq.com