首頁 > 軟體

資料庫加密欄位進行模糊查詢詳解

2022-09-05 14:00:51

需求

對於一些敏感欄位,比如手機號碼、身份證、地址、銀行卡號等,我們在存放進資料庫前,可能需要對其進行加密。

大部分情況下,我們只需要支援等值查詢。但是如果需要支援模糊查詢,那麼整段內容整體加密就不具備這個能力。

下面是幾種解決辦法,場景是我們需要根據手機號碼的字首進行匹配。

伺服器端解密

因為伺服器肯定是具備解密密文的能力的,因此最簡單的方式就是把整個表的密文欄位資料拉下來,在伺服器端進行解密,然後再在伺服器端進行匹配。

findRecords(prefix)  {
    records = getAllRecords()
    finds = []
    for (record : records) {
        phone = decrypt(record.phone)
        if (phone.hasPrefix(prefix)) {
            finds.push(record)
        }
    }
    return finds
}

如果資料量很小,那麼這種做法也許還能夠接受。但是隻要資料量上去,那麼效率就會很低,而且還需要通過網路IO把整個表的資料傳輸到伺服器端。

資料庫端解密

上面的做法需要把整個表的資料傳輸到伺服器端,那麼我們只需要能夠在資料庫進行匹配,就不需要傳輸整個表了。因此我們也可以在資料庫實現解密演演算法,在匹配的時候用解密演演算法解密密文,就能夠進行模糊匹配了。

findRecords(prefix) {
    return query("select * from table where decrypt(phone) like '?%'", prefix)
}

這個做法也是需要遍歷整個資料庫,因此只適合資料量比較小的情況下;而且需要把金鑰傳給資料庫,增加了金鑰洩露的風險。

字串分片

上面的做法我們都沒有用到資料庫的索引能力,正常情況下,字首匹配我們是可以使用到索引的,比如where phone like 'prefix%'。如果加密後的密文,也能夠走索引,那麼我們就不需要遍歷整個資料表了。

比如我們可以根據4位元作為一個檢索條件,將手機號碼拆分位多個分片:比如手機號012345678901,我們可以拆分並對分片進行加密:

分片密文
0123/egpaR5G9sMQUUWWz+3CLg
1234eHCMZqxNSLx/B37koArx/w
23459w1Pv8ik2H41s1KORLfPHA
3456vcFFFvi0mwAgIjdSQjcmSw
4567Tr/WaYfVySyMJhcZ78RFlA
56782wFeC6sgdXX7wmo0YcYY/Q
6789FfO9qD9XPx/lnJJuTfTfaA
7890Wufth7zOBLEy2LmepG5Taw
89011xR5MHRmlqOac5X6Cmn3kA

這些密文拼接起來的串為:

/egpaR5G9sMQUUWWz+3CLgeHCMZqxNSLx/B37koArx/w9w1Pv8ik2H41s1KORLfPHAvcFFFvi0mwAgIjdSQjcmSwTr/WaYfVySyMJhcZ78RFlA2wFeC6sgdXX7wmo0YcYY/QFfO9qD9XPx/lnJJuTfTfaAWufth7zOBLEy2LmepG5Taw1xR5MHRmlqOac5X6Cmn3kA

然後就可以支援字首查詢了(最少4位元),比如字首01234,我們可以按照上面的分片方式先分片,再拼接為查詢串:

分片密文
0123/egpaR5G9sMQUUWWz+3CLg
1234eHCMZqxNSLx/B37koArx/w

查詢串:

/egpaR5G9sMQUUWWz+3CLgeHCMZqxNSLx/B37koArx/w

可以看到查詢串為上面的字首,因此可以進行字首查詢!

代價

這種方式也是會有一定的代價的:

密文長度較長

比如手機號碼是明文長度是11,但是按照4位元分片的密文長度是198

分片長度不能太短

分片太短有安全問題,因此沒辦法支援過短的查詢。

主要是因為切片過短,會很容易被猜出來每一位對應的密文。比如0-9的密文切片長度1切分:

分片密文
0hHjJXA0e+haw/+WZ1mFITA
1y7qHn2nn3Ne/6wNRiwl/Lg
2h0dmfkO5SUolFFLp8J2Y5A
3ma/XrJjPv2MXSXE7Y4xs8w
4Q9V4PXXPjJgdR7UChUMY1g
5Wo57z24UXLoBdQ7QzxlOqA
6fC+zrF4ga5TCb5Zu36KVrQ
7z+XqHaWmlAsCnIP6NnD3lg
8olm8cPYmLHCeD1jegauiWw
9hJS77tLMd2Ol5SU4dIbbpw

只有10種分片型別,如果對應的是手機號碼欄位,很容易根據統計每個數位的概率分佈猜出每個數位對應的密文。

可能有多餘結果

可能有兩個不同分片對應相同密文,這時候就需要在伺服器再過濾一遍。

參考

密文欄位檢索方案

實現

Golang實現基於AES+CBC+PKCS5Padding的可模糊查詢加密

以上就是資料庫加密欄位進行模糊查詢詳解的詳細內容,更多關於資料庫加密欄位模糊查詢的資料請關注it145.com其它相關文章!


IT145.com E-mail:sddin#qq.com