草帽路飞UU 发表于 2022-11-7 15:02:52

copy与deepcopy的区别看完这篇就够了

背景

  在运用Python进行开发代码过程中,会遇到变量复制备份的场景,但并没有得到预期的结果,例如下面的例子:



lista = ['a', 'b', ]

listb = lista.copy()

lista.append(4)


print(lista)# ['a', 'b', ]

print(listb)# ['a', 'b', ]



  代码本意是将lista复制给listb做个备份,再修改liasta,但是修改后发现listb也一并被修改了,没有达到备份的效果,这个是什么原因呢?

  存储方式

  首先了解一下Python的变量在内存中的存储方式。在基本数据类型中(包括set、list(tuple, str)、dict)都是采用引用的方式。

  也就是说,每个变量都存储的是这个变量的地址,而不是值本身,就算更复杂的嵌套结构,也是存储是每个元素的地址而已,用一幅图来表示。




如上图所示,用户看到的是 lista的4个元素值,但是内存中保存的却是4个元素地址。

  当元素是列表时,第一层保存的是列表的地址,第二层保存的是列表元素的地址,第三层才是列表的值。当元素是字典的时候,与列表类似。

  列表的增删改

  在明白了变量存储方式后,继续看下内存下的增删改是怎么变化的。

  列表修改已有值

  新增一个内存块,再将引用的地址修改为新内存块的地址。



列表新增一个值

  新增一个内存块,新增一个地址引用。



列表整体重新赋值

  删除变量地址和引用的值,新增地址和引用值的内存块。



copy与deepcopy的区别

  基于以上的理解,再来看两种copy的区别就会更容易理解了,首先记住一个原则:

  copy:不管多么复杂的数据结构,浅拷贝都只会copy一层。

  deepcopy:将整个变量内存全部复制一遍,新变量与原变量没有任何关系。

  举个例子来验证一下上面的结论:有如下的一段代码,最终的4个列表值是多少?

  注意:引用deepcopy需要导入copy库。

import copy


a = ]

b = a

c = copy.copy(a)

d = copy.deepcopy(a)


a.append(5)

a = 20

a.append('c')

del a


print(a)

print(b)

print(c)

print(d)



  列表b

  表示b也引用的a的地址,两者引用的内存地址是一样的。因此b和a的关系是紧密相连的,一模一样。可以通过 id(a) 和id(b)比较,两者是一样的。

  列表c

  由于c是浅拷贝的a列表,因此只copy了第一层,也就是地址层。

  所以,当a.append(5)时,新增了一个内存块,但是c只有前5个内存块,因此c没有变化。

  继续a修改了a,然而这个值是属于第一层,已经copy给了c,因此c也没有变化。

  继续a修改了子列表,这个时候a复制给c的只是列表的地址,且a中的子列表地址和c中的子列表地址是指向同一个地方的,因此修改了a中子列表,c中的子列表也会相应的改变。

  最后删除a,与修改a一致,与c无关。可以用图再说明一下。



列表d

  由于d是深拷贝的a列表,因此d是将a的地址和值一并复制过来,与a没有半点关系,也就是说d和a是两个完全独立的内存块,没有任何交集。因此,后面a的任意修改都与d无关,用图表示如下。




因此,程序运行出来后的结果就是:

  a:,5]

  b:,5]

  c:]

  d:]

  总结

  综上,我们在使用copy的时候,一定要记住:copy只是拷贝了第一层,而deepcopy才是拷贝的全部数据。

  因此就不难发现,文章背景中的代码使用备份功能时,备份列表需要使用deepcopy,而不是简单的copy。

















页: [1]
查看完整版本: copy与deepcopy的区别看完这篇就够了