首頁 > 軟體

Python可變與不可變資料和深拷貝與淺拷貝

2022-04-06 19:03:13

淺拷貝和深拷貝

拷貝函數是專門為可變資料型別listsetdict使用的一種函數。作用是,當一個值指向另一個值的時候,也不會影響指向的值,如果被指向的資料是可變資料,那麼它一旦被修改,指向的資料也會隨之改變。

什麼是可變資料和不可變資料

我們來舉一個例子,整型是不可變的資料,那麼為什麼是不可變的資料呢?一個資料是不是可變的就要關係到python的快取機制。

當一個資料發生變化,如果它的記憶體地址沒有發生變化,就說明這是一個可變資料。

比如說,我們現在建立一個值是a的變數,它的值是100,然後讓這個數值發生變化,觀察者個變數的記憶體地址是否發生了變化。

a = 100
print(a, id(a)) # 100 1610845392

a += 100
print(a, id(a)) # 200 1610848592

我們發現數值發生了變化,變數的記憶體也跟著發生了變化,我們再建立一個變數b,值也是整型100

b = 100
print(b, id(b))	# 100 1610845392

發現b的記憶體地址和a的記憶體地址是一樣的,也就是說,像整型這樣的資料型別,一個數位就獨佔一個記憶體地址,當某個指向這個值的變數,發生了變化的時候,不是這個變數的值要改變,而是這個變數要尋找改變後的值的記憶體地址,然後重新的指向它。只要你的硬體不重新啟動,那麼這個記憶體地址就永遠也不會發生變化了,這樣的資料就是不可變資料。

那麼,反之就是可變資料,指的就是當變數指向的值發生變化之後,在這個記憶體地址上的值實打實的發生變化的值,就是可變資料型別。

比如列表,列表發生改變之後,是在原有的基礎上發生變化的,所以記憶體地址是不會改變的,這就是可變資料型別,可變資料型別沒有記憶體快取機制,不能節省記憶體,所以一模一樣的資料,他們的記憶體地址可能是不相同的。

a = [1, 2]
print(a, id(a)) # [1, 2] 1528536069896

a.append(3)
print(a, id(a)) # [1, 2, 3] 1528536069896

# b 和 a的值相同,但是記憶體地址不相同
b = [1, 2, 3]
print(b, id(b)) # [1, 2, 3] 1528536069832

那麼拷貝函數是幹什麼的?

在我們的實際工作當中,經常會使用的一種操作就是定義一個變數,它的值直接就賦給了一個原有的變數之上。可是變數定義之後我們絕不是用來作為一個擺設的,而是要做運算、或者是做一個臨時的儲存,那麼原有的變數的值是要改變的,問題就來了,如果是一個不可變的資料還好,如果是可變的資料,直接的賦值他們的記憶體地址是相同的, 如果一個變數的值發生變化,同記憶體地址的的值就都發生改變了,我們的向要臨時儲存的值也就不再是我們想要的那個值了,這是絕大多數的時候我們不想看到的結果。

我們拿整型為例,變數a直接賦值給變數b,這個時候的變數a b 的值是相同的,但是如果變數a的值發生了變化,是絲毫不影響變數b的值的。

a = 100
print(a, id(a))  # 100 1610845392

b = a
print(b, id(b))  # 100 1610845392

a += 100
print(a, id(a))  # 200 1610848592
print(b, id(b))  # 100 1610845392

但是如果是可變資料就不是這樣的情況了

a = [1, 2]
print(a, id(a))  # [1, 2] 2077688035080

b = a
print(b, id(b))  # [1, 2] 2077688035080

a.append(3)
print(a, id(a))  # [1, 2, 3] 2077688035080
print(b, id(b))  # [1, 2, 3] 2077688035080

不可變資料的這個特性既是一個優點也是一個缺點,缺點就是如果我們想要儲存a變數發生變化之前的的一個狀況的時候,是儲存不下來的,這個時候就出現了拷貝函數,它可以將可變資料變成不可變資料那樣的效果。

淺拷貝

使用拷貝函數,將a變數放入作為引數放入函數中,使用b變數接受函數的返回值,就成功的拷貝了變數a,變數b的記憶體地址和變數a的不一樣,這樣當它們其中一方發生變化之後,不會影響到另一方的資料。

# 拷貝函數不能直接使用,需要使用import匯入copy模組,copy模組的copy函數就是淺拷貝

import copy

a = [1, 2, 3]

# 變數b不在直接是變數a的直接賦值了,而是通過copy函數的返回值
b = copy.copy(a)

# 他們的數值一樣,但是記憶體地址不同,所以他們之間的任意一方發生變化都不會影響到第二方。
print(a, id(a))  # [1, 2, 3] 2343743813320
print(b, id(b))  # [1, 2, 3] 2343743813192

a.append(4)
print(a, id(a))  # [1, 2, 3, 4] 2343743813320
print(b, id(b))  # [1, 2, 3] 2343743813192

但是如果變數a是一個二級容器或者是一個更多級容器,淺拷貝無法拷貝第二級容器或者更多級的容器,所以當第二級容器或者是更多級的容器發生變化的時候,還是會發生變化,因為淺拷貝只能拷貝一級容器,所以多級容器的記憶體地址還是相同的。

import copy

a = [[66,88], 2, 3]

b = copy.copy(a)

print(a, id(a))  # [[66, 88], 2, 3] 2431683163720
print(b, id(b))  # [[66, 88], 2, 3] 2431683162184

# 改變二級容器
a[0].append(100)
print(a, id(a))  # [[66, 88, 100], 2, 3] 2431683163720
print(b, id(b))  # [[66, 88, 100], 2, 3] 2431683162184

# 淺拷貝不能拷貝二級及以上的容器
print(id(a[0]))  # 1582481372872
print(id(b[0]))  # 1582481372872

深拷貝

淺拷貝只能拷貝一級容器

所以誕生了深拷貝,深拷貝可以拷貝所有級別的容器。

import copy

a = [[66,88], 2, 3]

# 深拷貝使用deepcopy函數
b = copy.deepcopy(a)


print(a, id(a))  # [[66, 88], 2, 3] 2168411158088
print(b, id(b))  # [[66, 88], 2, 3] 2168411156552

a[0].append(100)
print(a, id(a))  # [[66, 88, 100], 2, 3] 2168411158088
print(b, id(b))  # [[66, 88], 2, 3] 2168411156552

# 深拷貝所有級別的容器
print(id(a[0]))  # 2168411158216
print(id(b[0]))  # 2168411122760

總結

使用深淺拷貝需要匯入copy模組;

淺拷貝使用copy函數,只能拷貝一級容器的所有元素;

深拷貝使用deepcopy函數,可以拷貝所有級別容器的所有元素;

標準庫copy中只有copydeepcopy兩個函數對外開放使用;

因為深拷貝要拷貝的元素跟多,所以速度會遠不如淺拷貝,在程式設計的過程中要注意避免造成多餘的系統負擔;

python中的不可變資料是Number、string、tuple,可變資料是list、set、dict;而拷貝就是專門為可變資料提供的,所以深淺拷貝只適用於list、set、dict,當然,可變資料使用拷貝函數也不會出錯,但是沒有意義。

到此這篇關於Python可變與不可變資料和深拷貝與淺拷貝的文章就介紹到這了,更多相關Python資料與拷貝內容請搜尋it145.com以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援it145.com!


IT145.com E-mail:sddin#qq.com