Python可變與不可變資料和深拷貝與淺拷貝

2022-04-06 19:03:13

淺拷貝和深拷貝

拷貝函數是專門為可變資料型別list、set、dict使用的一種函數。作用是，當一個值指向另一個值的時候，也不會影響指向的值，如果被指向的資料是可變資料，那麼它一旦被修改，指向的資料也會隨之改變。

什麼是可變資料和不可變資料

我們來舉一個例子，整型是不可變的資料，那麼為什麼是不可變的資料呢？一個資料是不是可變的就要關係到python的快取機制。

當一個資料發生變化，如果它的記憶體地址沒有發生變化，就說明這是一個可變資料。

比如說，我們現在建立一個值是a的變數，它的值是100，然後讓這個數值發生變化，觀察者個變數的記憶體地址是否發生了變化。

a = 100
print(a, id(a)) # 100 1610845392

a += 100
print(a, id(a)) # 200 1610848592

我們發現數值發生了變化，變數的記憶體也跟著發生了變化，我們再建立一個變數b，值也是整型100

b = 100
print(b, id(b))	# 100 1610845392

發現b的記憶體地址和a的記憶體地址是一樣的，也就是說，像整型這樣的資料型別，一個數位就獨佔一個記憶體地址，當某個指向這個值的變數，發生了變化的時候，不是這個變數的值要改變，而是這個變數要尋找改變後的值的記憶體地址，然後重新的指向它。只要你的硬體不重新啟動，那麼這個記憶體地址就永遠也不會發生變化了，這樣的資料就是不可變資料。

那麼，反之就是可變資料，指的就是當變數指向的值發生變化之後，在這個記憶體地址上的值實打實的發生變化的值，就是可變資料型別。

比如列表，列表發生改變之後，是在原有的基礎上發生變化的，所以記憶體地址是不會改變的，這就是可變資料型別，可變資料型別沒有記憶體快取機制，不能節省記憶體，所以一模一樣的資料，他們的記憶體地址可能是不相同的。

a = [1, 2]
print(a, id(a)) # [1, 2] 1528536069896

a.append(3)
print(a, id(a)) # [1, 2, 3] 1528536069896

# b 和 a的值相同，但是記憶體地址不相同
b = [1, 2, 3]
print(b, id(b)) # [1, 2, 3] 1528536069832

那麼拷貝函數是幹什麼的？

在我們的實際工作當中，經常會使用的一種操作就是定義一個變數，它的值直接就賦給了一個原有的變數之上。可是變數定義之後我們絕不是用來作為一個擺設的，而是要做運算、或者是做一個臨時的儲存，那麼原有的變數的值是要改變的，問題就來了，如果是一個不可變的資料還好，如果是可變的資料，直接的賦值他們的記憶體地址是相同的，如果一個變數的值發生變化，同記憶體地址的的值就都發生改變了，我們的向要臨時儲存的值也就不再是我們想要的那個值了，這是絕大多數的時候我們不想看到的結果。

我們拿整型為例，變數a直接賦值給變數b，這個時候的變數a b 的值是相同的，但是如果變數a的值發生了變化，是絲毫不影響變數b的值的。

a = 100
print(a, id(a))  # 100 1610845392

b = a
print(b, id(b))  # 100 1610845392

a += 100
print(a, id(a))  # 200 1610848592
print(b, id(b))  # 100 1610845392

但是如果是可變資料就不是這樣的情況了

a = [1, 2]
print(a, id(a))  # [1, 2] 2077688035080

b = a
print(b, id(b))  # [1, 2] 2077688035080

a.append(3)
print(a, id(a))  # [1, 2, 3] 2077688035080
print(b, id(b))  # [1, 2, 3] 2077688035080

不可變資料的這個特性既是一個優點也是一個缺點，缺點就是如果我們想要儲存a變數發生變化之前的的一個狀況的時候，是儲存不下來的，這個時候就出現了拷貝函數，它可以將可變資料變成不可變資料那樣的效果。

淺拷貝

使用拷貝函數，將a變數放入作為引數放入函數中，使用b變數接受函數的返回值，就成功的拷貝了變數a，變數b的記憶體地址和變數a的不一樣，這樣當它們其中一方發生變化之後，不會影響到另一方的資料。

# 拷貝函數不能直接使用，需要使用import匯入copy模組，copy模組的copy函數就是淺拷貝

import copy

a = [1, 2, 3]

# 變數b不在直接是變數a的直接賦值了，而是通過copy函數的返回值
b = copy.copy(a)

# 他們的數值一樣，但是記憶體地址不同，所以他們之間的任意一方發生變化都不會影響到第二方。
print(a, id(a))  # [1, 2, 3] 2343743813320
print(b, id(b))  # [1, 2, 3] 2343743813192

a.append(4)
print(a, id(a))  # [1, 2, 3, 4] 2343743813320
print(b, id(b))  # [1, 2, 3] 2343743813192

但是如果變數a是一個二級容器或者是一個更多級容器，淺拷貝無法拷貝第二級容器或者更多級的容器，所以當第二級容器或者是更多級的容器發生變化的時候，還是會發生變化，因為淺拷貝只能拷貝一級容器，所以多級容器的記憶體地址還是相同的。

import copy

a = [[66,88], 2, 3]

b = copy.copy(a)

print(a, id(a))  # [[66, 88], 2, 3] 2431683163720
print(b, id(b))  # [[66, 88], 2, 3] 2431683162184

# 改變二級容器
a[0].append(100)
print(a, id(a))  # [[66, 88, 100], 2, 3] 2431683163720
print(b, id(b))  # [[66, 88, 100], 2, 3] 2431683162184

# 淺拷貝不能拷貝二級及以上的容器
print(id(a[0]))  # 1582481372872
print(id(b[0]))  # 1582481372872

深拷貝

淺拷貝只能拷貝一級容器

所以誕生了深拷貝，深拷貝可以拷貝所有級別的容器。

import copy

a = [[66,88], 2, 3]

# 深拷貝使用deepcopy函數
b = copy.deepcopy(a)


print(a, id(a))  # [[66, 88], 2, 3] 2168411158088
print(b, id(b))  # [[66, 88], 2, 3] 2168411156552

a[0].append(100)
print(a, id(a))  # [[66, 88, 100], 2, 3] 2168411158088
print(b, id(b))  # [[66, 88], 2, 3] 2168411156552

# 深拷貝所有級別的容器
print(id(a[0]))  # 2168411158216
print(id(b[0]))  # 2168411122760