首頁 > 軟體

Redis之SDS資料結構的使用

2022-08-08 22:02:06

序言

Redis的幾種基本資料結構有字串(String)、雜湊(Hash)、列表(List)、集合(Set)、有序集合(Sorted Set),這些是最常見的,也能在官網上檢視到。

官網連結:Redis 教學_redis教學

字串

前面也提到過字串是設計了簡單動態字串SDS(Simple Dynamic String)結構來表示字串。這種資料結構可以提升字串的操作效率,並可以儲存二進位制資料。

先思考一個問題:

Redis是用C語言實現的,那麼為什麼沒有複用C語言的字串實現方法,而選用了SDS呢?

char*字串陣列

C語言實現字串使用的是char*字串陣列,它是一塊連續的記憶體空間,一次存放了字串的每一個字元,並且最後一個字元是“”,用來標識字串的結尾位置,如下圖,

連續的記憶體空間的所有字串沒有分隔符計算機就沒辦法區分字串與字串之間的位置。在C語言標準庫中字串的操作函數就會通過檢查字串陣列中是否有“”來判斷字串是否結束。例如字串操作函數strlen函數,它就是在遍歷字串陣列中的每一個字元,並進行計數,直到檢查到“”,它的時間複雜度是O(n)。流程如下,

簡單動態字串SDS

SDS的資料結構裡包含:字串實際長度,字串分配空間長度,SDS型別,字元陣列,其中字元陣列buf[]用來儲存實際資料,如下圖,

再來看看類似的字元操作函數sdslen函數的原始碼(在sds.h檔案中),直接根據SDS型別返回對應的字串現有長度,避免了對字串的遍歷,時間複雜度變成了O(1),當然也會付出一點代價增加了空間複雜度。這都是設計人員讓資料操作更加高效。原始碼如下,

static inline size_t sdslen(const sds s) {
    unsigned char flags = s[-1];
    switch(flags&SDS_TYPE_MASK) {
        case SDS_TYPE_5:
            return SDS_TYPE_5_LEN(flags);
        case SDS_TYPE_8:
            return SDS_HDR(8,s)->len;
        case SDS_TYPE_16:
            return SDS_HDR(16,s)->len;
        case SDS_TYPE_32:
            return SDS_HDR(32,s)->len;
        case SDS_TYPE_64:
            return SDS_HDR(64,s)->len;
    }
    return 0;
}

再來看一下字串的拷貝原始碼,操作都使用了字串的現有長度,拷貝後進行更新。

sds sdscpylen(sds s, const char *t, size_t len) {
    // 判斷字串陣列分配的空間長度是不是小於字串陣列當前長度
    if (sdsalloc(s) < len) {
        // 根據要追加的長度len-sdslen(s)和現有長度,判斷是否增加新的空間
        s = sdsMakeRoomFor(s,len-sdslen(s));
        if (s == NULL) return NULL;
    }
    // 將源字串t中len長度的資料拷貝到目標字串結尾
    memcpy(s, t, len);
    // 拷貝完後,在目標字串結尾加上
    s[len] = '';
    // 設定字串陣列最新當前長度
    sdssetlen(s, len);
    return s;
}

SDS把目標字串的空間檢查和擴容封裝在了sdsMakeRoomFor函數中,追加、列印、複製等操作都會呼叫該函數。可以看到該函數根據sds的資訊進行動態擴容,原始碼如下,

sds sdsMakeRoomFor(sds s, size_t addlen) {
    void *sh, *newsh;
    // 獲取sds可用空間
    size_t avail = sdsavail(s);
    size_t len, newlen;
    char type, oldtype = s[-1] & SDS_TYPE_MASK;
    int hdrlen;
 
    // 如果可用空間大於等於要增加的空間,則直接返回
    if (avail >= addlen) return s;
    // sds長度
    len = sdslen(s);
    // sds指標
    sh = (char*)s-sdsHdrSize(oldtype);
    // 新字串長度
    newlen = (len+addlen);
    // 如果新長度小於最大預分配長度,則進行兩倍擴容
    if (newlen < SDS_MAX_PREALLOC)
        newlen *= 2;
    else
        newlen += SDS_MAX_PREALLOC;
    type = sdsReqType(newlen);
    // SDS型別5轉換為型別8
    if (type == SDS_TYPE_5) type = SDS_TYPE_8;
 
    hdrlen = sdsHdrSize(type);
    if (oldtype==type) {
        newsh = s_realloc(sh, hdrlen+newlen+1);
        if (newsh == NULL) return NULL;
        s = (char*)newsh+hdrlen;
    } else {
        /* Since the header size changes, need to move the string forward,
         * and can't use realloc */
        newsh = s_malloc(hdrlen+newlen+1);
        if (newsh == NULL) return NULL;
        memcpy((char*)newsh+hdrlen, s, len+1);
        s_free(sh);
        s = (char*)newsh+hdrlen;
        s[-1] = type;
        sdssetlen(s, len);
    }
    sdssetalloc(s, newlen);
    return s;
}

 可以看到sdsMakeRoomFor函數中sdshdr5型別不再使用直接轉換成了sdshdr8型別,它們是SDS設計的5種型別,分別表示sdshdr5sdshdr8sdshdr16sdshdr32sdshdr64,下面就看一下這幾種型別的結構原始碼,如下圖,

struct __attribute__ ((__packed__)) sdshdr5 {
    unsigned char flags; /* 3 lsb of type, and 5 msb of string length */
    char buf[];
};
struct __attribute__ ((__packed__)) sdshdr8 {
    uint8_t len; /* used */
    uint8_t alloc; /* excluding the header and null terminator */
    unsigned char flags; /* 3 lsb of type, 5 unused bits */
    char buf[];
};
struct __attribute__ ((__packed__)) sdshdr16 {
    uint16_t len; /* used */
    uint16_t alloc; /* excluding the header and null terminator */
    unsigned char flags; /* 3 lsb of type, 5 unused bits */
    char buf[];
};
struct __attribute__ ((__packed__)) sdshdr32 {
    uint32_t len; /* used */
    uint32_t alloc; /* excluding the header and null terminator */
    unsigned char flags; /* 3 lsb of type, 5 unused bits */
    char buf[];
};
struct __attribute__ ((__packed__)) sdshdr64 {
    uint64_t len; /* used */
    uint64_t alloc; /* excluding the header and null terminator */
    unsigned char flags; /* 3 lsb of type, 5 unused bits */
    char buf[];
};

sdshdr5已不再使用,所以在函數中做了處理,把sdshdr5型別轉換為sdshdr8型別。前面也提到過SDS是緊湊型字串資料結構,以sdshdr8為例,它是用的是uint8_t即8位元無符號整型,會佔用1位元組的記憶體空間。SDS之所以設計不同的結構是為了能靈活儲存不同大小的字串,從而有效節省記憶體空間。

另外,__attribute__ ((__packed__))標誌可以告訴編譯器在編譯以上資料結構時,不實用位元組對齊的方式(不滿8位元組的整數倍,則會自動補齊),而是採用緊湊的方式分配記憶體。

到此這篇關於Redis之SDS資料結構的使用的文章就介紹到這了,更多相關Redis SDS資料結構內容請搜尋it145.com以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援it145.com!


IT145.com E-mail:sddin#qq.com