51Testing软件测试论坛
标题: 详解python中的列表切片以及它与浅拷贝的关系(下) [打印本页]
作者: lsekfe 时间: 2022-7-5 11:24
标题: 详解python中的列表切片以及它与浅拷贝的关系(下)
从上文的列表切片中,我们已经能大致看出浅拷贝的全貌了。不管是使用切片的方式获取列表的部分内容还是全部内容,python都帮我们把列表的索引以及每个列表元素的引用都拷贝了一份,相当于生成了一个新列表。下面我们来详细介绍一下浅拷贝与深拷贝。
浅谈列表的深/浅拷贝
浅拷贝与深拷贝是各大语言中的一个比较热门的话题,具体到每种语言,体现出的含义又略有不同。在python中,由于它一切皆对象的特性,使得我们经常在浅拷贝与深拷贝这个问题上弄得晕头转向。
· 浅拷贝
在python中,无论是数值、字符、字符串,还是列表、元组、集合、字典,都看作是一种对象。列表、元组、集合、字典属于复合对象,它们可以包含数值、字符、字符串,也可以互相嵌套。在不考虑复合对象之间互相嵌套的情形下,浅拷贝解决了复合对象拷贝以后与源对象的数据隔离问题。
我们看如下代码:
- originList = ["钢铁侠", "美国队长", "雷神", "冬兵", "浩克", "星爵", "格鲁特", "蚁人", "猩红女巫", "女武神"]
- heroList02 = ["幻视", "鹰眼", "蜘蛛侠"]
- element = "灭霸"
- herolist01 = originList[:]
- print("heroList01 的内容是:{}".format(herolist01))
- print("heroList01 的地址是:{}".format(hex(id(herolist01))))
- print("heroList01 第一个元素的地址是:{}".format(hex(id(herolist01[0]))))
- print("originList 的内容是:{}".format(originList))
- print("originList 的地址是:{}".format(hex(id(originList))))
- print("originList 第一个元素的地址是:{}".format(hex(id(originList[0]))))
- print("----------------接下来我们修改heroList第一个元素-----------------")
- print("element 的内容是{},地址是{}".format(element, hex(id(element))))
- herolist01[0] = element
- print("heroList01 的内容是:{}".format(herolist01))
- print("heroList01 的地址是:{}".format(hex(id(herolist01))))
- print("heroList01 第一个元素的地址是:{}".format(hex(id(herolist01[0]))))
- print("originList 的内容是:{}".format(originList))
- print("originList 的地址是:{}".format(hex(id(originList))))
- print("originList 第一个元素的地址是:{}".format(hex(id(originList[0]))))
复制代码在pycharm中运行上述代码,得到如下输出:
- heroList01 的内容是:['钢铁侠', '美国队长', '雷神', '冬兵', '浩克', '星爵', '格鲁特', '蚁人', '猩红女巫', '女武神']
- heroList01 的地址是:0x15011868688
- heroList01 第一个元素的地址是:0x150105c5390
- originList 的内容是:['钢铁侠', '美国队长', '雷神', '冬兵', '浩克', '星爵', '格鲁特', '蚁人', '猩红女巫', '女武神']
- originList 的地址是:0x15010485188
- originList 第一个元素的地址是:0x150105c5390
- ----------------接下来我们修改heroList第一个元素-----------------
- element 的内容是灭霸,地址是0x150118e9090
- heroList01 的内容是:['灭霸', '美国队长', '雷神', '冬兵', '浩克', '星爵', '格鲁特', '蚁人', '猩红女巫', '女武神']
- heroList01 的地址是:0x15011868688
- heroList01 第一个元素的地址是:0x150118e9090
- originList 的内容是:['钢铁侠', '美国队长', '雷神', '冬兵', '浩克', '星爵', '格鲁特', '蚁人', '猩红女巫', '女武神']
- originList 的地址是:0x15010485188
- originList 第一个元素的地址是:0x150105c5390
复制代码可以看到,使用浅拷贝以后,heroList01与originList之间实现了数据隔离,对heroList01中的元素进行修改不影响originList。浅拷贝的数据隔离非常类似于linux内核中的写时复制机制,即浅拷贝发生以后,拷贝的列表与原始列表仍然共享一份数据副本,后续对拷贝的列表或者原始列表进行写入操作时,才会重新申请空间写入新数据。
列表切片属于浅拷贝的一种,对于列表来说,浅拷贝还有其它3种实现方式,分别是工厂方法list()、列表中自带的copy()方法,以及copy库中的copy方法,感兴趣的同学可以去尝试一下,这里不再一一赘述。
· 深拷贝
浅拷贝只解决了复合对象中包含简单对象的数据隔离,当待拷贝的对象中嵌套了其他复合对象的时候,浅拷贝就出问题了。我们看如下代码:
- list01 = [1, 2, 3, [4, 5]]
- list02 = list01[::]
- print(hex(id(list01[0])))
- print(hex(id(list02[0])))
- list02[0] = 10
- list02[3][0] = 8
- print(hex(id(list01[0])))
- print(hex(id(list02[0])))
- print(list01)
- print(list02)
复制代码代码输出如下:
- 0x7ffeea02a190
- 0x7ffeea02a190
- 0x7ffeea02a190
- 0x7ffeea02a2b0
- [1, 2, 3, [8, 5]]
- [10, 2, 3, [8, 5]]
复制代码可以看到,对于外层元素,两个列表之间实现了数据隔离,而对于嵌套的复合对象,两个列表之间仍然是共享的。我们将上述代码转化成内存示意图,就能更直观地看出在拷贝以及修改过程中究竟发生了什么
[attach]138786[/attach]
可以看到,浅拷贝在拷贝复杂对象时仍然采取了共享策略,于是,对嵌套列表的修改导致list01、list02的数据都发生了变化。当我们要对列表中嵌套的列表保持数据隔离时,深拷贝就派上用场了。在python中,实现深拷贝的方法是调用copy中的deepcopy方法,请看如下代码:
- import copy
- list01 = [1, 2, 3, [4, 5]]
- print("----------------使用深拷贝的方法复制一个list02----------------")
- list02 = copy.deepcopy(list01)
- print("list01 第一个元素的地址是:{}".format(hex(id(list01[0]))))
- print("list01 中嵌套的列表地址是:{}".format(hex(id(list01[3]))))
- print("list01 中嵌套的列表的第一个元素地址是:{}".format(hex(id(list01[3][0]))))
- print("list02 第一个元素的地址是:{}".format(hex(id(list02[0]))))
- print("list02 中嵌套的列表地址是:{}".format(hex(id(list02[3]))))
- print("list02 中嵌套的列表的第一个元素地址是:{}".format(hex(id(list02[3][0]))))
- print("-----------------下面对list02中的元素进行修改-----------------")
- list02[0] = 10
- list02[3][0] = 8
- print("list01 第一个元素的地址是:{}".format(hex(id(list01[0]))))
- print("list01 中嵌套的列表地址是:{}".format(hex(id(list01[3]))))
- print("list01 中嵌套的列表的第一个元素地址是:{}".format(hex(id(list01[3][0]))))
- print("list02 第一个元素的地址是:{}".format(hex(id(list02[0]))))
- print("list02 中嵌套的列表地址是:{}".format(hex(id(list02[3]))))
- print("list02 中嵌套的列表的第一个元素地址是:{}".format(hex(id(list02[3][0]))))
- print("list01的内容是:{}".format(list01))
- print("list02的内容是:{}".format(list02))
复制代码上述代码的输出如下:
- ----------------使用深拷贝的方法复制一个list02----------------
- list01 第一个元素的地址是:0x7ffee9d9a190
- list01 中嵌套的列表地址是:0x148f6d95188
- list01 中嵌套的列表的第一个元素地址是:0x7ffee9d9a1f0
- list02 第一个元素的地址是:0x7ffee9d9a190
- list02 中嵌套的列表地址是:0x148f6ecbf08
- list02 中嵌套的列表的第一个元素地址是:0x7ffee9d9a1f0
- -----------------下面对list02中的元素进行修改-----------------
- list01 第一个元素的地址是:0x7ffee9d9a190
- list01 中嵌套的列表地址是:0x148f6d95188
- list01 中嵌套的列表的第一个元素地址是:0x7ffee9d9a1f0
- list02 第一个元素的地址是:0x7ffee9d9a2b0
- list02 中嵌套的列表地址是:0x148f6ecbf08
- list02 中嵌套的列表的第一个元素地址是:0x7ffee9d9a270
- list01的内容是:[1, 2, 3, [4, 5]]
- list02的内容是:[10, 2, 3, [8, 5]]
复制代码在上述代码的输出中,我们至少可以看出两点:1、对于列表中包含的数值类型,在深拷贝时依然采取了写时复制的策略,也就是说只有当这些元素被修改时才会重新申请空间写入新数据;2、对于列表中包含的列表,在深拷贝时会逐层拷贝,但嵌套列表中包含的数值类型仍然采取共享策略。我们用内存图来表达上述深拷贝过程,会更直观更清晰。
[attach]138787[/attach]
列表与函数参数传递
在开发过程中经常遇到的一个问题是:列表在函数参数传递时使用的是浅拷贝还是深拷贝?如果你的回答是浅拷贝,那么恭喜你,答错了!列表在函数参数传递过程中使用的既不是浅拷贝也不是深拷贝,而是简单的引用传递。请看下面的程序:
- list01 = ["幻视", "鹰眼", "蜘蛛侠"]
- def listPrint(strList):
- print(hex(id(strList)))
- for item in strList:
- print(item, end='\t')
- print()
- strList[0] = "灭霸"
- print("--------------在listPrint函数里面----------------")
- print(strList)
- print(hex(id(list01)))
- listPrint(list01)
- print("--------------调用完listPrint以后----------------")
- print(list01)
复制代码程序的输出如下:
- 0x234a59b5188
- 0x234a59b5188
- 幻视 鹰眼 蜘蛛侠
- --------------在listPrint函数里面----------------
- ['灭霸', '鹰眼', '蜘蛛侠']
- --------------调用完listPrint以后----------------
- ['灭霸', '鹰眼', '蜘蛛侠']
复制代码在进行listPrint函数调用时,解释器仅仅是简单地将list01的引用放在了函数listPrint的栈帧上,在函数listPrint中对列表的修改都将影响到list01。
我们在调用listPrint函数时对list01做一次简单的浅拷贝,观察程序输出:
- list01 = ["幻视", "鹰眼", "蜘蛛侠"]
- def listPrint(strList):
- print(hex(id(strList)))
- for item in strList:
- print(item, end='\t')
- print()
- strList[0] = "灭霸"
- print("--------------在listPrint函数里面----------------")
- print(strList)
- print(hex(id(list01)))
- listPrint(list01.copy())
- print("--------------调用完listPrint以后----------------")
- print(list01)
复制代码上述代码的输出如下:
- 0x250328b5188
- 0x250328b5388
- 幻视 鹰眼 蜘蛛侠
- --------------在listPrint函数里面----------------
- ['灭霸', '鹰眼', '蜘蛛侠']
- --------------调用完listPrint以后----------------
- ['幻视', '鹰眼', '蜘蛛侠']
复制代码我们发现,此时listPrint对实参的修改已经不能影响到list01了,因为函数listPrint接收到的参数是list01的一份浅拷贝,而不是list01本身,从而实现了一次简单的数据隔离。
深/浅拷贝的拓展
上文介绍了列表的深/浅拷贝,在python中,深/浅拷贝主要发生在可变对象互相嵌套的场景中,包括python内置的可变对象列表、集合、字典,以及元组中嵌套的列表、集合、字典。除此之外,用户自定义的对象,只要对象属性中包含了可变对象,在对对象进行拷贝的时候就需要考虑使用浅拷贝还是深拷贝,从而实现拷贝对象与源对象的数据隔离。
欢迎光临 51Testing软件测试论坛 (http://bbs.51testing.com/) |
Powered by Discuz! X3.2 |