首頁 > 軟體

Java中為什麼ArrayList初始化容量大小為10

2022-06-19 14:00:48

背景

看ArrayList原始碼時,無意中看到ArrayList的初始化容量大小為10,這就奇怪了!我們都知道ArrayList和HashMap底層都是基於陣列的,但為什麼ArrayList不像用HashMap那樣用16作為初始容量大小,而是採用10呢?

於是各方查詢資料,求證了這個問題,這篇文章就給大家講講。

為什麼HashMap的初始化容量為16?

在聊ArrayList的初始化容量時,要先來回顧一下HashMap的初始化容量。這裡以Java 8原始碼為例,HashMap中的相關因素有兩個:初始化容量及裝載因子:

/**
 * The default initial capacity - MUST be a power of two.
 */
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16
/**
 * The load factor used when none specified in constructor.
 */
static final float DEFAULT_LOAD_FACTOR = 0.75f;

在HashMap當中,陣列的預設初始化容量為16,當資料填充到預設容量的0.75時,就會進行2倍擴容。當然,使用者也可以在初始化時傳入指定大小。但需要注意的是,最好是2的n次方的數值,如果未設定為2的n次方,HashMap也會將其轉化,反而多了一步操作。

關於HashMap的實現原理的內容,這裡就不再贅述,網路上已經有太多文章講這個了。有一點我們需要知道的是HashMap計算Key值座標的演演算法,也就是通過對Key值進行Hash,進而對映到陣列中的座標。

此時,保證HashMap的容量是2的n次方,那麼在hash運算時就可以採用位執行直接對記憶體進行操作,無需轉換成十進位制,效率會更高。

通常,可以認為,HashMap之所以採用2的n次方,同時預設值為16,有以下方面的考量:

  • 減少hash碰撞;
  • 提高Map查詢效率;
  • 分配過小防止頻繁擴容;
  • 分配過大浪費資源;

總之,HashMap之所以採用16作為預設值,是為了減少hash碰撞,同時提升效率。

ArrayList的初始化容量是10嗎?

下面,先來確認一下ArrayList的初始化容量是不是10,然後在討論為什麼是這個值。

先來看看Java 8中,ArrayList初始化容量的原始碼:

/**
 * Default initial capacity.
 */
private static final int DEFAULT_CAPACITY = 10;

很明顯,預設的容器初始化值為10。而且從JDK1.2到JDK1.6,這個值也始終都為10。

從JDK1.7開始,在初始化ArrayList的時候,預設值初始化為空陣列:

    /**
     * Shared empty array instance used for default sized empty instances. We
     * distinguish this from EMPTY_ELEMENTDATA to know how much to inflate when
     * first element is added.
     */
    private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};
    
    /**
     * Constructs an empty list with an initial capacity of ten.
     */
    public ArrayList() {
        this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
    }

此處肯定有朋友說,Java 8中ArrayList預設初始化大小為0,不是10。而且還會發現構造方法上的註釋有一些奇怪:構造一個初始容量10的空列表。什麼鬼?明明是空的啊!

保留疑問,先來看一下ArrayList的add方法:

    public boolean add(E e) {
        ensureCapacityInternal(size + 1);  // Increments modCount!!
        elementData[size++] = e;
        return true;
    }

在add方法中呼叫了ensureCapacityInternal方法,進入該方法一開始是一個空容器所以size=0傳入的minCapacity=1

    private void ensureCapacityInternal(int minCapacity) {
        ensureExplicitCapacity(calculateCapacity(elementData, minCapacity));
    }

上述方法中先通過calculateCapacity來計算容量:

    private static int calculateCapacity(Object[] elementData, int minCapacity) {
        if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
            return Math.max(DEFAULT_CAPACITY, minCapacity);
        }
        return minCapacity;
    }

會發現minCapacity被重新賦值為10 (DEFAULT_CAPACITY=10),傳入ensureExplicitCapacity(minCapacity);minCapacity=10

下面是方法體:

    private void ensureExplicitCapacity(int minCapacity) {
        modCount++;​
        // overflow-conscious code
        if (minCapacity - elementData.length > 0)
            grow(minCapacity);
    }
    private void grow(int minCapacity) {
        // overflow-conscious code
        int oldCapacity = elementData.length;
        int newCapacity = oldCapacity + (oldCapacity >> 1);
        if (newCapacity - minCapacity < 0)
            newCapacity = minCapacity;
        if (newCapacity - MAX_ARRAY_SIZE > 0)
            newCapacity = hugeCapacity(minCapacity);
        // minCapacity is usually close to size, so this is a win:
        elementData = Arrays.copyOf(elementData, newCapacity);
    }

上述程式碼中grow方法是用來處理擴容的,將容量擴容為原來的1.5倍。

瞭解上面的處理流程,我們會發現,本質上ArrayList的初始化容量還是10,只不過使用懶載入而已,這是Java 8為了節省記憶體而進行的優化而已。所以,自始至終,ArrayList的初始化容量都是10。

這裡再多提一下懶載入的好處,當有成千上萬的ArrayList存在程式當中,10個物件的預設大小意味著在建立時為底層陣列分配10個指標(40 或80位元組)並用空值填充它們,一個空陣列(用空值填充)佔用大量記憶體。如果能夠延遲初始化陣列,那麼就能夠節省大量的記憶體空間。Java 8的改動就是出於上述目的。

為什麼ArrayList的初始化容量為10?

最後,我們來探討一下為什麼ArrayList的初始化容量為10。其實,可以說沒有為什麼,就是“感覺”10挺好的,不大不小,剛剛好,眼緣!

首先,在討論HashMap的時候,我們說到HashMap之所以選擇2的n次方,更多的是考慮到hash演演算法的效能與碰撞等問題。這個問題對於ArrayList的來說並不存在。ArrayList只是一個簡單的增長陣列,不用考慮演演算法層面的優化。只要超過一定的值,進行增長即可。所以,理論上來講ArrayList的容量是任何正值即可。

ArrayList的檔案中並沒有說明為什麼選擇10,但很大的可能是出於效能損失與空間損失之間的最佳匹配考量。10,不是很大,也不是很小,不會浪費太多的記憶體空間,也不會折損太多效能。

如果非要問當初到底為什麼選擇10,可能只有問問這段程式碼的作者“Josh Bloch”了吧。

如果你仔細觀察,還會發現一些其他有意思的初始化容量數位:

ArrayList-10
Vector-10
HashSet-16
HashMap-16
HashTable-11

ArrayList與Vector初始化容量一樣,為10;HashSet、HashMap初始化容量一樣,為16;而HashTable獨獨使用11,又是一個很有意思的問題。

小結

有很多問題是沒有明確原因、明確的答案的。就好像一個女孩兒對你沒感覺,可能是因為你不夠好,也可能是她已經愛上別人了,但也有很大可能你是不會知道答案。但在尋找原因和答案的過程中,還是能夠學到很多,成長很多的。沒有對比就沒有傷害,比如HashMap與ArrayList的對比,沒有對比就不知道是否適合,還比如HashMap與ArrayList。當然,你還可以試試特立獨行的HashTable,或許適合你呢。

到此這篇關於Java中為什麼ArrayList初始化容量大小為10的文章就介紹到這了,更多相關Java ArrayList 內容請搜尋it145.com以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援it145.com!


IT145.com E-mail:sddin#qq.com