<em>Mac</em>Book项目 2009年学校开始实施<em>Mac</em>Book项目,所有师生配备一本<em>Mac</em>Book,并同步更新了校园无线网络。学校每周进行电脑技术更新,每月发送技术支持资料,极大改变了教学及学习方式。因此2011
2021-06-01 09:32:01
雖然現在關係型資料庫越來越相似,但其背後的實現機制可能大相徑庭。實際使用方面,因為SQL語法規範的存在使得我們熟悉多種關係型資料庫並非難事,但是有多少種資料庫可能就有多少種鎖的實現方法。
Microsoft Sql Server2005之前只提供頁鎖,直到2005版本才開始支援樂觀並行、悲觀並行,樂觀模式下允許實現行級別鎖,在Sql Server的設計中鎖是一種稀缺資源,鎖的數量越多,開銷就越大,為了避免因為鎖的數量快速攀升導致效能斷崖式下跌,其支援一種稱為鎖升級的機制,一旦行鎖升級為頁鎖,並行效能就又回到原點。
事實上,即使在同一個資料庫,不同的執行引擎對鎖這一功能的詮釋依然是百家爭鳴。對於MyISAM而言僅僅支援表鎖,並行讀取尚可,並行修改可就捉襟見肘了。Innodb則和Oracle非常相似,提供非鎖定一致性讀取、行鎖支援,與Sql Server明顯不同的是隨著鎖總數的上升,Innodb僅僅只需要付出一點點代價。
Innodb支援行鎖,且對於鎖的描述並不會存在特別大的開銷。因此不需要鎖升級這一機制作為大量鎖導致效能下降之後的搶救措施。
摘自lock0priv.h檔案,Innodb對於行鎖的定義如下:
/** Record lock for a page */ struct lock_rec_t { /* space id */ ulint space; /* page number */ ulint page_no; /** * number of bits in the lock bitmap; * NOTE: the lock bitmap is placed immediately after the lock struct */ ulint n_bits; };
不難看出雖然並行控制可以細化到行級別,但是鎖以頁的粒度組織管理。Innodb的設計中通過space id、page number兩個必要條件就可以確定唯一一個資料頁,n_bits表示描述該頁行鎖資訊需要多少bit位。
同一資料頁中每條記錄都分配唯一的連續的遞增序號:heap_no,若要知道某一行記錄是否上鎖,則只需要判斷點陣圖heap_no位置的數位是否為一即可。由於lock bitmap根據資料頁的記錄數量進行記憶體空間分配的,因此沒有顯式定義,且該頁記錄可能還會繼續增加,因此預留了LOCK_PAGE_BITMAP_MARGIN大小的空間。
/** * Safety margin when creating a new record lock: this many extra records * can be inserted to the page without need to create a lock with * a bigger bitmap */ #define LOCK_PAGE_BITMAP_MARGIN 64
假設space id = 20,page number = 100的資料頁目前有160條記錄,heap_no為2、3、4的記錄已經被鎖,則對應的lock_rec_t結構與資料頁應該被這樣刻畫:
注:
可以看到該頁對應的bitmap第二三四位置全部置一,描述一個資料頁行鎖所消耗記憶體從感官上相當有限,那具體佔用多少呢?我們可以計算一下:
160 / 8 + 8 + 1 = 29byte。
這裡還額外+1,應該是為了避免因為整除導致的結果數值偏小的問題。假如是161條記錄如果不+1則計算出來的20byte不夠描述所有記錄的鎖資訊(不動用預留位)。
摘自lock0priv.h檔案:
/* lock_rec_create函數程式碼片段 */ n_bits = page_dir_get_n_heap(page) + LOCK_PAGE_BITMAP_MARGIN; n_bytes = 1 + n_bits / 8; /* 注意這裡是分配的連續記憶體 */ lock = static_cast<lock_t*>( mem_heap_alloc(trx->lock.lock_heap, sizeof(lock_t) + n_bytes) ); /** * Gets the number of records in the heap. * @return number of user records */ UNIV_INLINE ulint page_dir_get_n_heap(const page_t* page) { return(page_header_get_field(page, PAGE_N_HEAP) & 0x7fff); }
Innodb還支援表鎖,表鎖可分為兩大類:意向鎖,自增鎖其資料結構定義如下:
摘自lock0priv.h檔案
struct lock_table_t { /* database table in dictionary cache */ dict_table_t* table; /* list of locks on the same table */ UT_LIST_NODE_T(lock_t) locks; };
摘自ut0lst.h檔案
struct ut_list_node { /* pointer to the previous node, NULL if start of list */ TYPE* prev; /* pointer to next node, NULL if end of list */ TYPE* next; }; #define UT_LIST_NODE_T(TYPE) ut_list_node<TYPE>
上述lock_rec_t、lock_table_t結構只是單獨的定義,鎖產生於事務之中,因此每個事務對應的行鎖、表鎖會有一個相應的鎖的結構,其定義如下:
摘自lock0priv.h檔案
/** Lock struct; protected by lock_sys->mutex */ struct lock_t { /* transaction owning the lock */ trx_t* trx; /* list of the locks of the transaction */ UT_LIST_NODE_T(lock_t) trx_locks; /** * lock type, mode, LOCK_GAP or LOCK_REC_NOT_GAP, * LOCK_INSERT_INTENTION, wait flag, ORed */ ulint type_mode; /* hash chain node for a record lock */ hash_node_t hash; /*!< index for a record lock */ dict_index_t* index; /* lock details */ union { /* table lock */ lock_table_t tab_lock; /* record lock */ lock_rec_t rec_lock; } un_member; };
lock_t是根據每個事務每個頁(或表)來定義的,但是一個事務往往涉及到多個頁,因此需要連結串列trx_locks串聯起一個事務相關的所有鎖資訊。除了需要根據事務查詢到所有鎖資訊,實際場景還要求系統必須能夠快速高效的檢測出某個行記錄是否已經上鎖。因此必須有一個全域性變數支援對行記錄進行鎖資訊的查詢。Innodb選擇了雜湊表,其定義如下:
摘自lock0lock.h檔案
/** The lock system struct */ struct lock_sys_t { /* Mutex protecting the locks */ ib_mutex_t mutex; /* 就是這裡: hash table of the record locks */ hash_table_t* rec_hash; /* Mutex protecting the next two fields */ ib_mutex_t wait_mutex; /** * Array of user threads suspended while waiting forlocks within InnoDB, * protected by the lock_sys->wait_mutex */ srv_slot_t* waiting_threads; /* * highest slot ever used in the waiting_threads array, * protected by lock_sys->wait_mutex */ srv_slot_t* last_slot; /** * TRUE if rollback of all recovered transactions is complete. * Protected by lock_sys->mutex */ ibool rollback_complete; /* Max wait time */ ulint n_lock_max_wait_time; /** * Set to the event that is created in the lock wait monitor thread. * A value of 0 means the thread is not active */ os_event_t timeout_event; /* True if the timeout thread is running */ bool timeout_thread_active; };
函數lock_sys_create在database start之際負責初始化lock_sys_t結構。rec_hash的hash slot數量由srv_lock_table_size變數決定。rec_hash雜湊表的key值通過頁的space id,page number計算得出。
摘自lock0lock.ic、ut0rnd.ic 檔案
/** * Calculates the fold value of a page file address: used in inserting or * searching for a lock in the hash table. * * @return folded value */ UNIV_INLINE ulint lock_rec_fold(ulint space, ulint page_no) { return(ut_fold_ulint_pair(space, page_no)); } /** * Folds a pair of ulints. * * @return folded value */ UNIV_INLINE ulint ut_fold_ulint_pair(ulint n1, ulint n2) { return ( ( (((n1 ^ n2 ^ UT_HASH_RANDOM_MASK2) << 8) + n1) ^ UT_HASH_RANDOM_MASK ) + n2 ); }
這將意味著無法提供一個手段使得我們可以直接得知某一行是否上鎖。而是應該先通過其所在的頁得到space id、page number通過lock_rec_fold函數得出key值而後經過hash查詢得到lock_rec_t,而後根據heap_no掃描bit map,最終確定鎖資訊。lock_rec_get_first函數實現了上述邏輯:
這裡返回的其實是lock_t物件,摘自lock0lock.cc檔案
/** * Gets the first explicit lock request on a record. * * @param block : block containing the record * @param heap_no : heap number of the record * * @return first lock, NULL if none exists */ UNIV_INLINE lock_t* lock_rec_get_first(const buf_block_t* block, ulint heap_no) { lock_t* lock; ut_ad(lock_mutex_own()); for (lock = lock_rec_get_first_on_page(block); lock; lock = lock_rec_get_next_on_page(lock) ) { if (lock_rec_get_nth_bit(lock, heap_no)) { break; } } return(lock); }
鎖維護以頁的粒度,不是一個最高效直接的方式,明顯的時間換空間,這種設計使得鎖的開銷很小。某一事務對任一行上鎖的開銷都是一樣的,鎖數量的上升也不會帶來額外的記憶體消耗。
每個事務都對應一個trx_t的記憶體物件,其中儲存著該事務鎖資訊連結串列和正在等待的鎖資訊。因此存在如下兩種途徑對鎖進行查詢:
上述各種資料結構,對其整理關係如下圖所示:
注:
lock_sys_t中的slot顏色與lock_t顏色相同則表明lock_sys_t slot持有lock_t 指標資訊,實在是沒法連線,不然圖很混亂
到此這篇關於Mysql鎖內部實現機制之C原始碼解析的文章就介紹到這了,更多相關Mysql鎖內容請搜尋it145.com以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援it145.com!
相關文章
<em>Mac</em>Book项目 2009年学校开始实施<em>Mac</em>Book项目,所有师生配备一本<em>Mac</em>Book,并同步更新了校园无线网络。学校每周进行电脑技术更新,每月发送技术支持资料,极大改变了教学及学习方式。因此2011
2021-06-01 09:32:01
综合看Anker超能充系列的性价比很高,并且与不仅和iPhone12/苹果<em>Mac</em>Book很配,而且适合多设备充电需求的日常使用或差旅场景,不管是安卓还是Switch同样也能用得上它,希望这次分享能给准备购入充电器的小伙伴们有所
2021-06-01 09:31:42
除了L4WUDU与吴亦凡已经多次共事,成为了明面上的厂牌成员,吴亦凡还曾带领20XXCLUB全队参加2020年的一场音乐节,这也是20XXCLUB首次全员合照,王嗣尧Turbo、陈彦希Regi、<em>Mac</em> Ova Seas、林渝植等人全部出场。然而让
2021-06-01 09:31:34
目前应用IPFS的机构:1 谷歌<em>浏览器</em>支持IPFS分布式协议 2 万维网 (历史档案博物馆)数据库 3 火狐<em>浏览器</em>支持 IPFS分布式协议 4 EOS 等数字货币数据存储 5 美国国会图书馆,历史资料永久保存在 IPFS 6 加
2021-06-01 09:31:24
开拓者的车机是兼容苹果和<em>安卓</em>,虽然我不怎么用,但确实兼顾了我家人的很多需求:副驾的门板还配有解锁开关,有的时候老婆开车,下车的时候偶尔会忘记解锁,我在副驾驶可以自己开门:第二排设计很好,不仅配置了一个很大的
2021-06-01 09:30:48
不仅是<em>安卓</em>手机,苹果手机的降价力度也是前所未有了,iPhone12也“跳水价”了,发布价是6799元,如今已经跌至5308元,降价幅度超过1400元,最新定价确认了。iPhone12是苹果首款5G手机,同时也是全球首款5nm芯片的智能机,它
2021-06-01 09:30:45