首頁 > 軟體

Python標準庫uuid模組(生成唯一標識)詳解

2022-05-17 13:00:39

UUID (Universally Unique Identifier,通用唯一標識)是一個128位元的用於計算機系統中以識別資訊的數目,雖然生成UUID的概率不為零,但是無限接近零,因此可以忽略不記,如此一來,每個人都可以建立不與其他人衝突的UUID。

UUID格式組成

規範的文字中,UUID的十六個八位位元組標識位32個十六進位制(基數16)數位,顯示在由字元分割的五個組中,8-4-4-4-12總格36個字元(32個字母數位字元和4個連字元),如:

123e4567-e89b-12d3-a456-426655440000
xxxxxxxx-xxxx-Mxxx-Nxxx-xxxxxxxxxxxx

其中M代表版本,由下面的知識可知,這個UUID 可能是通過Python的 uuid.uuid1(node, clock_seq)生成

Python 中的uuid 模組

在Python 2.5以後引入,介面包括:不可變物件UUID(UUID類)和函數uuid1()、uuid3()、uuid4()、uuid5(),後面四個函數用於生成“RFC 4122” 規範中指定的第1、3、4、5版UUID。具體演演算法如下:

UUID()

class uuid.UUID([hex[, bytes[, bytes_le[, fields[, int[, version]]]]]]) 
  該類用於從引數給定的內容中範例化UUID物件(hex, bytes, bytes_le, fields, int 必須且只能指定一個):
  hex:指定32個字元以建立UUID物件,當指定一個32個字元構成的字串來建立一個UUID物件時,花括號、連字元和URN字首等都是可選的;
  bytes:指定一個大端位元組序的總長16位元組的位元組串來建立UUID物件;
  bytes_le:指定一個小端位元組序的總長16位元組的位元組串來建立UUID物件;
  fields:指定6個整數域,共計128位元來建立UUID(其中,32位元作為time_low段,16位元作為time_mid段,16位元作為time_hi_version段,8位元作為clock_seq_hi_variant段,8位元作為clock_seq_low段,48位元作為node段);
  int:直接指定一個長度為128個二進位制位的整數用於建立UUID物件;
  version:(可選)指定UUID的版本,從1到5,一旦指定了該引數,生成的UUID將具有自己的變體(variant)和版本數,具體請參考RFC 4122

下面的各種方法建立相同的UUID物件

u = UUID('{12345678-1234-5678-1234-567812345678}')
u = UUID(hex = '12345678123456781234567812345678')
u = UUID('urn:uuid:12345678-1234-5678-1234-567812345678')
u = UUID(bytes='x12x34x56x78'*4)
u = UUID(bytes_le='x78x56x34x12x34x12x78x56' +
  'x12x34x56x78x12x34x56x78')
u = UUID(fields=(0x12345678, 0x1234, 0x5678, 0x12, 0x34, 0x567812345678))
u = UUID(int=0x12345678123456781234567812345678)

uuid1()

從主機ID、序列號和當前時間生成UUID。如果未給定“node”,則使用getnode() 獲取硬體地址。如果給出“時鐘序列”,則將其用作序列號;否則,將選擇隨機的14位元序列號。
# 原始碼參考

def uuid(node=None, clock_seq=None):
  ...
  return UUID(fields=(time_low, time_mid, time_hi_version, clock_seq_hi_variant, clock_seq_low, node), version=1)

fields 各個引數含義如下圖:

uuid3()

基於名稱空間識別符號(實質上是一個UUID)和一個名稱(實質上是一個字串)的MD5雜湊值生成的UUID

# 原始碼參考

 def uuid3(namespace, name):
     """Generate a UUID from the MD5 hash of a namespace UUID and a name."""
     from hashlib import md5
     hash = md5(namespace.bytes + bytes(name, "utf-8")).digest()
     return UUID(bytes=hash[:16], version=3)

uuid4()

基於亂數生成的UUID

# 原始碼參考

 import os
 def uuid4():
     """Generate a random UUID."""
     return UUID(bytes=os.urandom(16), version=4)

uuid5()

基於名稱空間識別符號(實質上是一個UUID)和一個名稱(實質上是一個字串)的SHA-1雜湊值生成的UUID

# 原始碼參考

 def uuid5(namespace, name):
     """Generate a UUID from the SHA-1 hash of a namespace UUID and a name."""
     from hashlib import sha1
     hash = sha1(namespace.bytes + bytes(name, "utf-8")).digest()
     return UUID(bytes=hash[:16], version=5)

由原始碼可知,uuid1() 使用的是 UUID(fields=(...))

      uuid3()、uuid4()、uuid5() 均使用的是 UUID(bytes=...)

“RFC 4122” 推薦使用版本5(SHA1)而不是版本3(MD5)

uuid1() 中的getnode()

獲取硬體的地址並以48位元二進位制長度的整數形式返回,這裡所說的硬體地址是指網路介面的MAC 地址,如果一個機器有多個網路介面,可能返回其中的任一個。如果獲取失敗,將按照“RFC 4122” 的規定隨機返回48位元數位,並將第8位元設定為1(其組播位(第一個八位位組的最低有效位)設定為1)

關於uuid3()和uuid5()中提到的名稱空間識別符號,uuid模組定義瞭如下的備選項:

uuid.NAMESPACE_DNS

當指定該名稱空間時,引數name 是一個完全限定的(fully-qualified)域名

uuid.NAMESPACE_URL

當指定該名稱空間時,引數name 是一個URL

uuid.NAMESPACE_OID

當指定該名稱空間時,引數name 是一個ISO OID

uuid.NAMESPACE_X500

當指定該名稱空間時,引數name 是一個DER 中的X.500 DN或文字輸出格式

這些識別符號在原始碼中統一指向 UUID('6ba7b810-9dad-11d1-80b4-00c04fd430c8'),因此名稱空間僅僅作為標識用,定義了name 引數的格式

UUID實際應用

uuid1 適應用分散式計算環境,具有高度的唯一性;

uuid3 和uuid5 適合於一定範圍的名字唯一,且需要或可能重複生成UUID 的環境下;

uuid4 最簡單,但完全隨機,不可控,建議可以在DRF 生成和驗證JWT 時做使用者的SECRET_KEY 用,用來保證使用者每次登入,異裝置同時登入,修改密碼等操作,JWT 失效問題

UUID 的劣勢

1.varchar(36)字串佔用空間比較大,但攜帶的資訊很少,且不直觀

2.以此建立索引的時候,非常耗效能且慢

3.UUID 是無序的,但是業務系統很多時候希望生成的 是有序的,或者粗略有序

參考資料:

  • uuid — UUID objects according to RFC 4122 https://docs.python.org/3/library/uuid.html
  • Python--uuid http://www.cnblogs.com/Security-Darren/p/4252868.html
  • Python 使用UUID 庫生成唯一ID https://www.cnblogs.com/kaituorensheng/p/5530902.html
  • Universally unique identifier https://en.wikipedia.org/wiki/Universally_unique_identifier
  • 使用UUID的劣勢 https://blog.csdn.net/woshiyexinjie/article/details/83351677

總結

到此這篇關於Python標準庫uuid模組(生成唯一標識)的文章就介紹到這了,更多相關Python標準庫uuid模組內容請搜尋it145.com以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援it145.com!


IT145.com E-mail:sddin#qq.com