1. 程式人生 > >Python-copy()與deepcopy()區別

Python-copy()與deepcopy()區別

allow color 有變 其他 docker 淺復制 可能 另一個 body

http://blog.csdn.net/qq_32907349/article/details/52190796

學習過程中發現copy()和deepcopy()這對好基友實在是有點過分,搞的博主就有點傻傻分不清啊,但是呢本著一探到底的精神,還是要查資料搞清楚這對好基友的區別。

其實呢,copy()與deepcopy()之間的區分必須要涉及到python對於數據的存儲方式。

首先直接上結論:

—–我們尋常意義的復制就是深復制,即將被復制對象完全再復制一遍作為獨立的新個體單獨存在。所以改變原有被復制對象不會對已經復制出來的新對象產生影響。
—–而淺復制並不會產生一個獨立的對象單獨存在,他只是將原有的數據塊打上一個新標簽,所以當其中一個標簽被改變的時候,數據塊就會發生變化,另一個標簽也會隨之改變。這就和我們尋常意義上的復制有所不同了。

對於簡單的 object,用 shallow copy 和 deep copy 沒區別

復雜的 object, 如 list 中套著 list 的情況,shallow copy 中的 子list,並未從原 object 真的「獨立」出來。也就是說,如果你改變原 object 的子 list 中的一個元素,你的 copy 就會跟著一起變。這跟我們直覺上對「復制」的理解不同。

看不懂文字沒關系我們來看代碼:

 
 1 >>> import copy
 2 >>> origin = [1, 2, [3, 4]]
 3 #origin 裏邊有三個元素:1, 2,[3, 4]
4 >>> cop1 = copy.copy(origin) 5 >>> cop2 = copy.deepcopy(origin) 6 >>> cop1 == cop2 7 True 8 >>> cop1 is cop2 9 False 10 #cop1 和 cop2 看上去相同,但已不再是同一個object 11 >>> origin[2][0] = "hey!" 12 >>> origin 13 [1, 2, [hey!, 4]] 14 >>> cop1
15 [1, 2, [hey!, 4]] 16 >>> cop2 17 [1, 2, [3, 4]] 18 #把origin內的子list [3, 4] 改掉了一個元素,觀察 cop1 和 cop2

 

可以看到 cop1,也就是 shallow copy 跟著 origin 改變了。而 cop2 ,也就是 deep copy 並沒有變。

似乎 deep copy 更加符合我們對「復制」的直覺定義: 一旦復制出來了,就應該是獨立的了。如果我們想要的是一個字面意義的「copy」,那就直接用 deep_copy 即可。

那麽為什麽會有 shallow copy 這樣的「假」 copy 存在呢? 這就是有意思的地方了。

python的數據存儲方式

Python 存儲變量的方法跟其他 OOP 語言不同。它與其說是把值賦給變量,不如說是給變量建立了一個到具體值的 reference。

當在 Python 中 a = something 應該理解為給 something 貼上了一個標簽 a。當再賦值給 a 的時候,就好象把 a 這個標簽從原來的 something 上拿下來,貼到其他對象上,建立新的 reference。 這就解釋了一些 Python 中可能遇到的詭異情況:

 1 >> a = [1, 2, 3]
 2 >>> b = a
 3 >>> a = [4, 5, 6] //賦新的值給 a
 4 >>> a
 5 [4, 5, 6]
 6 >>> b
 7 [1, 2, 3]
 8 # a 的值改變後,b 並沒有隨著 a 變
 9 
10 >>> a = [1, 2, 3]
11 >>> b = a
12 >>> a[0], a[1], a[2] = 4, 5, 6 //改變原來 list 中的元素
13 >>> a
14 [4, 5, 6]
15 >>> b
16 [4, 5, 6]
17 # a 的值改變後,b 隨著 a 變了

上面兩段代碼中,a 的值都發生了變化。區別在於,第一段代碼中是直接賦給了 a 新的值(從 [1, 2, 3] 變為 [4, 5, 6]);而第二段則是把 list 中每個元素分別改變。

而對 b 的影響則是不同的,一個沒有讓 b 的值發生改變,另一個變了。怎麽用上邊的道理來解釋這個詭異的不同呢?

首次把 [1, 2, 3] 看成一個物品。a = [1, 2, 3] 就相當於給這個物品上貼上 a 這個標簽。而 b = a 就是給這個物品又貼上了一個 b 的標簽。
技術分享圖片
第一種情況:

a = [4, 5, 6] 就相當於把 a 標簽從 [1 ,2, 3] 上撕下來,貼到了 [4, 5, 6] 上。

在這個過程中,[1, 2, 3] 這個物品並沒有消失。 b 自始至終都好好的貼在 [1, 2, 3] 上,既然這個 reference 也沒有改變過。 b 的值自然不變。

技術分享圖片
第二種情況:

a[0], a[1], a[2] = 4, 5, 6 則是直接改變了 [1, 2, 3] 這個物品本身。把它內部的每一部分都重新改裝了一下。內部改裝完畢後,[1, 2, 3] 本身變成了 [4, 5, 6]。

而在此過程當中,a 和 b 都沒有動,他們還貼在那個物品上。因此自然 a b 的值都變成了 [4, 5, 6]。

搞明白這個之後就要問了,對於一個復雜對象的淺copy,在copy的時候到底發生了什麽?
再看一段代碼:

>>> import copy
>>> origin = [1, 2, [3, 4]]
#origin 裏邊有三個元素:1, 2,[3, 4]
>>> cop1 = copy.copy(origin)
>>> cop2 = copy.deepcopy(origin)
>>> cop1 == cop2
True
>>> cop1 is cop2
False 
#cop1 和 cop2 看上去相同,但已不再是同一個object
>>> origin[2][0] = "hey!" 
>>> origin
[1, 2, [hey!, 4]]
>>> cop1
[1, 2, [hey!, 4]]
>>> cop2
[1, 2, [3, 4]]
#把origin內的子list [3, 4] 改掉了一個元素,觀察 cop1 和 cop2

學過docker的人應該對鏡像這個概念不陌生,我們可以把鏡像的概念套用在copy上面。

概念圖如下:
技術分享圖片

copy對於一個復雜對象的子對象並不會完全復制,什麽是復雜對象的子對象呢?就比如序列裏的嵌套序列,字典裏的嵌套序列等都是復雜對象的子對象。對於子對象,python會把它當作一個公共鏡像存儲起來,所有對他的復制都被當成一個引用,所以說當其中一個引用將鏡像改變了之後另一個引用使用鏡像的時候鏡像已經被改變了。

所以說看這裏的origin[2],也就是 [3, 4] 這個 list。根據 shallow copy 的定義,在 cop1[2] 指向的是同一個 list [3, 4]。那麽,如果這裏我們改變了這個 list,就會導致 origin 和 cop1 同時改變。這就是為什麽上邊 origin[2][0] = “hey!” 之後,cop1 也隨之變成了 [1, 2, [‘hey!’, 4]]。

而deepcopy概念圖如下:
技術分享圖片

註:上圖cop1 = copy.copy(origin)應為cop2 = copy.deepcopy(origin)

deepcopy的時候會將復雜對象的每一層復制一個單獨的個體出來。
這時候的 origin[2] 和 cop2[2] 雖然值都等於 [3, 4],但已經不是同一個 list了。即我們尋常意義上的復制。

Python-copy()與deepcopy()區別