首頁 > 軟體

Redis資料庫原理深入刨析

2022-11-23 14:01:34

1.伺服器和使用者端實現的資料庫

 Redis伺服器在啟動時,會根據redis.conf檔案的中databases xx這個設定決定建立多少個資料庫(預設設定是16),啟動後預設使用的0號資料庫,當然可以使用select dbnum這個命令來切換。需要注意的是在redis叢集模式下,只有0號資料庫可以用,是無法切換到其他庫的。

 Redis伺服器會將所有的資料庫都儲存在伺服器狀態的redisServer的db陣列中,陣列的每一項都代表了一個資料庫,用redisDb結構來表示,首先看一下redisServer.db的原始碼:

struct redisServer {
	...
	// 代表資料庫的陣列
    redisDb *db;
    // 這個記錄的組態檔中資料庫的數量
	int dbnum;  
    ...
}

 我們通過使用者端向Redis寫入的任何資料都會記錄到這個db陣列中,根據前面描述,我們知道可以通過select命令切換到另一個目標資料庫,但是使用者端是怎麼記錄的它當前操作的哪個資料庫呢?我們繼續看一下原始碼:

typedef struct client {
    ...
    // 指標指向當前使用者端正在操作的資料庫
    redisDb *db;            /* Pointer to currently SELECTed DB. */
	...
} client;

 看,在client使用者端狀態中,有一個db指標,指向了server.db陣列中的某一項,代表了當前使用者端正在操作的資料庫。所以通過切換client.db的指標,調整使用者端操作的資料庫,這就是select命令的實現原理。

2.資料庫字典的實現

 Redis是支援key-value鍵值對儲存的,這其實是通過dict結構來實現的,在前面講到的內容中,伺服器和使用者端都指向了一個redisDb的結構,在這個db結構中,就包含儲存了鍵值對的字典結構,首先看一下原始碼:

typedef struct redisDb {
	...
	// 這個存放的就是鍵值對
    dict *dict;                 /* The keyspace for this DB */
    // 這個存放的是鍵值對的過期時間,下面一節會說到
    dict *expires;              /* Timeout of keys with a timeout set */
    ...
} redisDb;

 dict這個指標就指向了儲存鍵值對的字典結構,key是字串robj型別,value可以是任何的robj型別。當我們分別新增、刪除、更新或者查詢的時候,其實就是根據輸入的key在這個字典上做curd的操作。我們在Redis寫入兩個鍵值對,圖示如下:

 除了對資料庫鍵值對的curd操作,基於整個資料操作的一些命令也是在這個dict上面實現的,比如清空所有鍵值對的flushdb,或者exists、del、dbsize命令等等。在執行命令前後,redis還會執行一些其他操作,比如檢查是否超出最大記憶體,更新lru時間,記錄慢查詢紀錄檔,或者向monitor使用者端傳送命令等等,這就是redis資料字典的實現原理。

3.鍵值對的生命週期管理

 這裡說的生命週期,其實就是指鍵值對的過期時間。通常我們使用expire key這個命令設定鍵的過期時間,但其實Redis是有四個命令支援設定過期時間的:

  • expire key seconds 將key的生命週期設定為second秒;
  • pexpire key milliseconds 將key的生命週期設定為milliseconds毫秒;
  • expireat key timestamp 將key的過期時間設定在timestamp這個秒的時間戳過期;
  • pexpireat key timestamp 將key的過期時間設定在timestamp這個毫秒的時間戳過期;

 值得說明的是,雖然有這麼多命令支援設定過期時間,但是最終經過轉換都是指向pexpireat這一個命令來實現。現在的問題是,這麼多鍵值對的過期時間,在redis伺服器端是怎麼儲存和維護的呢?

 前面在看redisDb原始碼的時候,有一個expires屬性,我們再把原始碼拿過來看一下:

typedef struct redisDb {
	...
    // 這個存放的是鍵的過期時間
    dict *expires;              /* Timeout of keys with a timeout set */
    ...
} redisDb;

 這就很清晰了,通過expires這個指標,指向了一個dict結構,字典中記錄的就是所有鍵值對的過期時間。其中,key是鍵值對的鍵,value是long型別的毫秒精度的unix時間戳,即過期的時間點。值得注意的是,儲存鍵值對的dict字典和儲存過期時間的expires字典,key指標都指向相同的一個鍵字串物件,所以在記憶體空間上是不會存在浪費的。

 除此之外,跟過期時間操作相關的兩個命令,當然也是基於expires這個字典來實現的:

  • ttl 返回鍵值對的剩餘時間
  • persist刪除鍵值對的過期時間

4.過期鍵的管理策略

 既然有過期時間,那麼鍵值對過期之後,是不是立即被刪除了呢?答案肯定不是,redis通過惰性刪除和定期刪除兩種策略實現對過期鍵的管理:

  • 惰性刪除策略:當程式存取到某個鍵值對的時候,會對過期時間檢查,如果過期就刪除,否則不處理。
  • 定期刪除策略:基於serverCron時間事件函數,從一定數量的資料庫中取出一定數量的隨機鍵進行檢查,並刪除其中過期的鍵值對。

 使用這兩種過期鍵管理策略可以最大程度上在合理使用CPU時間和避免浪費記憶體空間之間取得平衡。

5.持久化對過期鍵的處理

rdb 持久化

  • save或者bgsave會檢查鍵的過期時間,已過期的鍵不會儲存到的持久化的rdb檔案中。
  • 伺服器啟動載入rdb檔案時,如果是主伺服器,過期鍵會被忽略載入;如果是從伺服器,不論是否過期,都會被載入。

aof 持久化

  • 寫入aof檔案時,key是會寫入的,過期之後,通過追加del命令,才會顯示的刪除此過期鍵。
  • bgrewriteaof 重寫時會檢查鍵的過期時間,已過期的鍵不會寫入新的aof檔案中。
  • 伺服器啟動載入aof檔案時,過期鍵也會被忽略,不會被載入。

6.主從複製對過期鍵的處理

 主從複製,為了保證資料的一致性,通常由主伺服器執行更新的操作,然後將命令傳送給從伺服器。在3.2版本之前,由於惰性刪除策略的存在,主伺服器遇到對過期鍵的存取,會刪除此鍵值對,並給使用者端返回null值,但是從伺服器由於不能執行刪除操作,即便是此鍵已過期,也會返回對應的value值,出現資料不一致導致的髒讀問題。

 在3.2版本之後,這個問題得到了修改,從伺服器會判斷當前鍵是否過期,如果已過期並且是從伺服器的話,也會返回null值。

到此這篇關於Redis資料庫原理深入刨析的文章就介紹到這了,更多相關Redis資料庫內容請搜尋it145.com以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援it145.com!


IT145.com E-mail:sddin#qq.com