首頁 > 軟體

Python內建型別float原始碼學習

2022-05-17 19:01:14

“深入認識Python內建型別”這部分的內容會從原始碼角度為大家介紹Python中各種常用的內建型別。

1 回顧float的基礎知識

1.1 PyFloatObject

1.2 PyFloat_Type

C原始碼(僅列出部分欄位):

PyTypeObject PyFloat_Type = {
    PyVarObject_HEAD_INIT(&PyType_Type, 0)
    "float",
    sizeof(PyFloatObject),
    0,
    (destructor)float_dealloc,                  /* tp_dealloc */
    0,                                          /* tp_print */
    0,                                          /* tp_getattr */
    0,                                          /* tp_setattr */
    0,                                          /* tp_reserved */
    (reprfunc)float_repr,                       /* tp_repr */
    &float_as_number,                           /* tp_as_number */
    0,                                          /* tp_as_sequence */
    0,                                          /* tp_as_mapping */
    (hashfunc)float_hash,                       /* tp_hash */
    0,                                          /* tp_call */
    (reprfunc)float_repr,                       /* tp_str */
    // ...
    0,                                          /* tp_init */
    0,                                          /* tp_alloc */
    float_new,                                  /* tp_new */
};

PyFloat_Type中儲存了很多關於浮點物件的元資訊,關鍵欄位包括:

tp_name:儲存型別名稱,常數float

tp_dealloc、tp_init、tp_alloc和tp_new:物件建立和銷燬的相關函數

tp_repr:生成語法字串表示形式的函數

tp_str:生成普通字串表示形式的函數

tp_as_number:數值操作集

tp_hash:雜湊值生成函數

1.3 物件的建立

通過型別物件建立範例物件:

通過C API建立範例物件:

PyObject *
PyFloat_FromDouble(double fval);
PyObject *
PyFloat_FromString(PyObject *v);

1.4 物件的銷燬

當物件不再需要時,Python通過Py_DECREF或者Py_XDECREF宏來減少參照計數;

當參照計數降為0時,Python通過_Py_Dealloc宏回收物件。(有關參照計數的內容後續會詳細介紹)

_Py_Dealloc宏實際上呼叫的是*Py_TYPE(op)->tp_dealloc,對於float即呼叫float_dealloc:

#define _Py_Dealloc(op) (                               
    _Py_INC_TPFREES(op) _Py_COUNT_ALLOCS_COMMA          
    (*Py_TYPE(op)->tp_dealloc)((PyObject *)(op)))

1.5 小結

最後將物件從建立到銷燬整個生命週期所涉及的關鍵函數、宏以及呼叫關係整理如下:

2 空閒物件快取池

問題:浮點運算背後涉及大量臨時物件建立和銷燬。

area = pi * r ** 2

這個語句首先計算半徑r的平方,中間結果由一個臨時物件來儲存,假設是t;然後計算pi與t的乘積,得到最終結果並賦值給變數area;

最後,銷燬臨時物件t。建立物件時需要分配記憶體,銷燬物件時又要回收記憶體,大量臨時物件建立和銷燬,意味著大量記憶體分配回收操作,這是不能接受的。

因此,Python在浮點物件銷燬之後,並不急於回收記憶體,而是將物件放入一個空閒連結串列,後續需要建立浮點物件時,先到空閒連結串列中取,省去了部分分配記憶體的開銷。

2.1 浮點物件的空閒連結串列

C原始碼:

#ifndef PyFloat_MAXFREELIST
#define PyFloat_MAXFREELIST    100
#endif
static int numfree = 0;
static PyFloatObject *free_list = NULL;

原始碼解讀:

free_list變數:指向空閒連結串列頭節點的指標

numfree變數:維護空閒連結串列當前長度

PyFloat_MAXFREELIST宏:限制空閒連結串列的最大長度,避免佔用過多記憶體

為了保持簡潔,Python把ob_type欄位當作next指標來用,將空閒物件串成連結串列。float空閒連結串列圖示如下:

個人體會:

Python中這樣的池技術很多地方都在用,並且在實際工程中,這也是一種廣泛使用的方式,大家可以具體體會下。

“把ob_type欄位當作next指標來用“,這種方式可以學習,但是也要結合實際情況:可讀性,是否需要節省這部分記憶體等等。

2.2 空閒連結串列的使用

有了空閒連結串列之後,需要建立浮點物件時,可以從連結串列中取出空閒物件,省去申請記憶體的開銷,以PyFloat_FromDouble()為例:(只列出部分程式碼)

PyObject *
PyFloat_FromDouble(double fval)
{
    PyFloatObject *op = free_list;
    if (op != NULL) {
        free_list = (PyFloatObject *) Py_TYPE(op);
        numfree--;
    } else {
        op = (PyFloatObject*) PyObject_MALLOC(sizeof(PyFloatObject));
        if (!op)
            return PyErr_NoMemory();
    }
    /* Inline PyObject_New */
    (void)PyObject_INIT(op, &PyFloat_Type);
    op->ob_fval = fval;
    return (PyObject *) op;
}

檢查free_list是否為空

如果free_list非空,取出頭節點備用,free_list指向第二個節點(這裡看程式碼呼叫的是Py_TYPE(),

也就是op的ob_type欄位,也就是第二個節點),並將numfree減1

如果free_list為空,則呼叫PyObject_MALLOC分配記憶體

最後會通過PyObject_INIT對op進行相應設定(包括修改ob_type),然後設定ob_fval為fval

圖示如下:(對比2.1中的圖示,可以看到free_list指向了第二個節點,並且第一個節點的ob_type欄位也不再指向第二個節點,而是指向對應的型別物件)

物件銷燬時,Python將其快取在空閒連結串列中,以備後用。float_dealloc函數原始碼如下:

static void
float_dealloc(PyFloatObject *op)
{
    if (PyFloat_CheckExact(op)) {
        if (numfree >= PyFloat_MAXFREELIST)  {
            PyObject_FREE(op);
            return;
        }
        numfree++;
        Py_TYPE(op) = (struct _typeobject *)free_list;
        free_list = op;
    }
    else
        Py_TYPE(op)->tp_free((PyObject *)op);
}

若空閒連結串列長度達到限制值,呼叫PyObject_FREE回收物件記憶體

若空閒連結串列長度未達到限制值,則將物件插到空閒連結串列頭部(這裡可以順帶複習下頭插法,hh)

3 其他

問題:以下例子中,變數e的id值為何與已銷燬的變數pi相同?

>>> pi = 3.14
>>> id(pi)
4565221808
>>> del pi
>>> e = 2.71
>>> id(e)
4565221808

答:在3.14這個浮點數物件被銷燬時,並沒有直接回收其記憶體,而是將物件快取在空閒連結串列中,此時3.14這個浮點數物件為空閒連結串列頭節點;

當建立浮點物件2.71時,此時空閒連結串列非空,則取出空閒連結串列的頭節點,修改ob_fval值為2.71,因此兩個物件的id是一樣的。

以上就是Python內建型別float原始碼學習的詳細內容,更多關於Python內建型別float的資料請關注it145.com其它相關文章!


IT145.com E-mail:sddin#qq.com