首頁 > 軟體

Java 垃圾回收超詳細講解記憶集和卡表

2022-04-07 22:00:02

跨代參照

在說記憶集和卡表之前,先給大家介紹一下跨代參照的問題。

假如要現在進行一次只侷限於新生代區域內的收集(Minor GC),但新生代的範例物件1在老年代中被參照,為了找出該區域(新生代)中所有的存活物件,不得不在固定的GC Roots之外,再額外遍歷整個老年代中所有物件來確保可達性分析結果的正確性,反過來也是一樣。遍歷整個老年代所有物件的方案雖然理論上可行,但無疑會為記憶體回收帶來很大的效能負擔。

事實上並不只是新生代、老年代之間才有跨代參照的問題,所有涉及部分割區域收集(Partial GC)行為的垃圾收集器,典型的如G1、ZGC和Shenandoah收集器,都會面臨相同的問題。

解決跨代參照

首先,跨代參照相對於同代參照來說僅佔極少數。原因是跨代參照的物件應該傾向於同時生存或者同時死亡的(舉個:如果某個新生代物件存在跨代參照,由於老年代物件難以消亡,該參照會使得新生代物件在收集時同樣得以存活,進而在年齡增長之後晉升到老年代中,這時跨代參照也隨即被消除了)。

依據上面說所,就不應再為了少量的跨代參照去掃描整個老年代,也不必浪費空間專門記錄每一個物件是否存在及存在哪些跨代參照,只需在新生代上建立一個全域性的資料結構(該結構被稱為“記憶集”,Remembered Set),這個結構把老年代劃分成若干小塊,標識出老年代的哪一塊記憶體會存在跨代參照。此後當發生Minor GC時,只有包含了跨代參照的小塊記憶體裡的物件才會被加入到GCRoots進行掃描。雖然這種方法需要在物件改變參照關係(如將自己或者某個屬性賦值)時維護記錄資料的正確性,會增加一些執行時的開銷,但比起收集時掃描整個老年代來說仍然是划算的。

下面就來介紹一下這個全域性的資料結構記憶集。

記憶集

記憶集是一種用於記錄從非收集區域指向收集區域的指標集合的抽象資料結構。如果我們不考慮效率和成本的話,最簡單的實現可以用非收集區域中所有含跨代參照的物件陣列來實現這個資料結構,如下面程式碼所示:

//以物件指標來實現記憶集的虛擬碼
Class RememberedSet {
	Object[] set[OBJECT_INTERGENERATIONAL_REFERENCE_SIZE]; 
}

這種記錄全部含跨代參照物件的實現方案,無論是空間佔用還是維護成本都相當高昂。而在垃圾收集的場景中,收集器只需要通過記憶集判斷出某一塊非收集區域是否存在有指向了收集區域的指標就可以了,並不需要了解這些跨代指標的全部細節。那設計者在實現記憶集的時候,便可以選擇更為粗獷的記錄粒度來節省記憶集的儲存和維護成本。下面列舉了一些可供選擇(當然也可以選擇這個範圍以外的)的記錄精度:

  • 字長精度:每個記錄精確到一個機器字長(就是處理器的定址位數,如常見的32位元或64位元,這個 精度決定了機器存取實體記憶體地址的指標長度),該字包含跨代指標。
  • 物件精度:每個記錄精確到一個物件,該物件裡有欄位含有跨代指標。
  • 卡精度:每個記錄精確到一塊記憶體區域,該區域內有物件含有跨代指標。

上面的,第三種“卡精度”所指的是用一種稱為“卡表”(Card Table)的方式去實現記憶集,這也是目前最常用的記憶集的實現形式。

卡表和記憶集又有什麼關係呢?

前面介紹記憶集的時候提到 記憶集其實是一種"抽象”的資料結構,抽象的意思是隻定義了記憶集的行為意圖,並沒有定義其行為的具體實現。卡表就是記憶集的一種具體實現,它定義了記憶集的記錄精度、與堆記憶體的對映關係等。關於記憶集與卡表的關係,可以按照Java中Map與HashMap的關係來類比理解(即介面和實現類來的關係)。

下面來詳細說一下記憶集的具體實現卡表

卡表

卡表是使用一個位元組陣列CARD_TABLE[] 實現,每個元素對應其標識的記憶體區域一塊特定大小的記憶體塊,每個記憶體塊稱為卡頁,hotspot使用的卡頁是2^9大小 即512位元組。如下圖所示

這樣我們就可以把某個區域按照卡頁進行劃分,假如我們現在要對新生代區域進行垃圾回收,那麼就可以把老年代區域看成是一個卡頁一個卡頁劃分好的,如下圖所示。

如圖所示,因為cardpage1中存在指向新生代的跨代參照,所以對應卡表的第一個位置為1,表明該page區域存在跨代應用的物件。

  • 卡表角度:因為page1中存在跨代飲用的物件,所以卡表對應的第一個位置記為1,表明page1這個元素變髒。
  • 記憶體回收角度:因為卡表的第一個位置為1,表明該page區域存在跨代應用的物件,垃圾回收的時候需要掃描該區域。

一個卡頁的記憶體中通常包含不止一個物件,只要卡頁內有一個(或更多)物件的欄位存在著跨代指標,那就將對應卡表的陣列元素的值標識為1,稱為這個元素變髒(Dirty),沒有則標識為0。在垃圾收集發生時,只要篩選出卡表中變髒的元素,就能輕易得出哪些卡頁記憶體塊中包含跨代指標,把它們加入GC Roots中一併掃描。這樣就不需要掃描整個老年代大大減少GC Roots的掃描範圍。 

到此這篇關於Java 萬字超詳細講解記憶集和卡表的文章就介紹到這了,更多相關Java 記憶集和卡表內容請搜尋it145.com以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援it145.com!


IT145.com E-mail:sddin#qq.com