首页 > 代码库 > python 集合相关操作

python 集合相关操作

集合相关操作

集合是一个无序的,不重复的数据组合,它有着两个主要作用:去重以及关系测试。

去重指的是当把一个列表变成了集合,其中重复的内容就自动的被去掉了

关系测试指的是,测试两组数据之间的交集、差集、并集等关系。

去重测试代码如下:

# 创建一个列表 -- 里面存在一些重复值
test_list = [1,2,3,4,2,2,3,4,3,2,3,4]

# 利用集合将列表中重复的内容去掉
test_list = set(test_list)

# 打印测试并且查看test_list 被赋予新值后的数据类型
print(test_list,type(test_list))   #  {1, 2, 3, 4} <class ‘set‘>

 

Tip:需要注意的是,集合和字典一样都是无序的。

获取交集需要使用集合中的方法intersection方法,获取两个集合中的交集代码如下:

# 创建两个集合,并且获取集合的交集
test_list_01 = set([YanYan,LiBai,LuLu,YangMi])
test_list_02 = set([YanYan,LiuDeHua,ZhangXueYou,LiBai])


# 在上面的两个集合中,存在相同的值,那么现在我们取出两个集合中的交集
test_intersection = test_list_01.intersection(test_list_02)
print(test_intersection)  # {‘YanYan‘, ‘LiBai‘}

 

获取并集的方式需要采用集合中union方法,获取两个集合的并集代码如下:

# 创建两个集合,并且获取集合的交集
test_list_01 = set([YanYan,LiBai,LuLu,YangMi])
test_list_02 = set([YanYan,LiuDeHua,ZhangXueYou,LiBai])

# 采用集合中的union方法获取并集
test_list_union = test_list_01.union(test_list_02)
print(test_list_union)  # {‘LiBai‘, ‘LuLu‘, ‘ZhangXueYou‘, ‘LiuDeHua‘, ‘YangMi‘, ‘YanYan‘}

 

获取差集的方式要采用集合中的difference方法,获取两个集合的差集的代码如下所示:

# 创建两个集合,并且获取集合的交集
test_list_01 = set([YanYan,LiBai,LuLu,YangMi])
test_list_02 = set([YanYan,LiuDeHua,ZhangXueYou,LiBai])

# 使用集合中的difference 方法来获取差集
test_difference = test_list_01.difference(test_list_02)
test_difference2 = test_list_02.difference(test_list_01)


print(test_difference) # {‘LuLu‘, ‘YangMi‘}
print(test_difference2) # {‘ZhangXueYou‘, ‘LiuDeHua‘}

 

判断一个集合是否是另外一个集合的子集可以使用issubset()方法,同样,还可以使用issuperset()方法判断一个集合是否是另外一个集合的父级

代码如下:

# 创建两个集合

list_set  = set([1,2,3,4])

list_son = set([2,3])

# 判断list_son是否是list_set的子集
print(list_son.issubset(list_set))  # True
# 判断list_set 是否是list_son的父级
print(list_set.issuperset(list_son)) # True

 

对称差集(又有人称之为叫做反向差集),指的是取出两个集合中互相都没有的值取出放在一个集合中。

代码如下:

# 创建两个集合

list_set_num1 = set([1,3,5,7,9])
list_set_num2 = set([2,3,4,6,9,10])

# 获取两个集合的对称差集
print(list_set_num1.symmetric_difference(list_set_num2))  # {1, 2, 4, 5, 6, 7, 10}

 

如果上述的难以理解的话,可以对 对称差集理解为去掉两个集合中都存在的内容,将剩余的内容取到一个新的集合中。

除了上述的这些方法实现的关系功能之外,还有一个方法 isdisjoint() ,功能是判断两个集合中是否有相同的值,如果两个集合中没有相同的值(即没有交集),那么返回True

代码如下:

# 创建集合
test_set_num1 = set([1,2,3,4])
test_set_num2 = set([5,6,7,8])
test_set_num3 = set([1,3,7,8])

# 使用isdisjoint()方法来判断
print(test_set_num1.isdisjoint(test_set_num2)) # True
print(test_set_num1.isdisjoint(test_set_num3)) # False

 

通过运算符来进行关系测试

在上面的应用中,主要是通过python中的方法进行的关系测试,那么在python中,除了使用方法以外,还可以使用关系运算符来进行关系测试。

实例代码如下:

test_list_01 = set([YanYan,LiBai,LuLu,YangMi])
test_list_02 = set([YanYan,LiuDeHua,ZhangXueYou,LiBai])


# 获取交集 &
print(test_list_01 & test_list_02) # {‘LiBai‘, ‘YanYan‘}

# 获取并集 |
print(test_list_01 | test_list_02) # {‘LuLu‘, ‘LiBai‘, ‘LiuDeHua‘, ‘YanYan‘, ‘ZhangXueYou‘, ‘YangMi‘}

# 获取差集  -
print(test_list_01 - test_list_02) # {‘LuLu‘, ‘YangMi‘}
print(test_list_02 - test_list_01) # {‘LiuDeHua‘, ‘ZhangXueYou‘}

# 获取对称差集
print(test_list_01 ^ test_list_02) # {‘ZhangXueYou‘, ‘YangMi‘, ‘LuLu‘, ‘LiuDeHua‘}

 

集合的增删改查

添加

语法: Set.add()

代码如下:

# 创建一个集合
test_set = set([YanYan])

# 添加
test_set.add(LiBai) # 添加一项
test_set.update([LuLu,JingJing]) # 一次性向集合中添加多项


# 输出集合
print(test_set) # {‘YanYan‘, ‘LuLu‘, ‘LiBai‘, ‘JingJing‘}

 

删除

删除集合中的某一个元素可以使用remove方法

代码如下:

# 创建一个集合
test_set = set([YanYan])

# 使用remove方法删除元素
test_set.remove(YanYan)
print(test_set)  # set()

 

删除项目除了使用remove以外,还可以使用pop()方法,但是pop()方法删除内容不能够指定,只是随机删除。
pop方法会把删除的内容返回,示例代码如下:

# 创建一个集合
test_set = set([20,9,a,1,2,3,4])
print(test_set.pop()) # 1
print(test_set.pop()) # 2
print(test_set.pop()) # 3

 

删除元素还可以使用discard()方法,这个方法没有返回值,如果打印返回值的话会输出None

# 创建一个集合
test_list = set([1,2,3,4,5])

# 使用discard()方法删除 -- 注意,discard()方法删除返回None,也就是没有返回值
print(test_list.discard(3))  # None
# 此时原集合中的3已经被删除了
print(test_list)  # {1, 2, 4, 5}

 

查询

x in s # 判断 x是否是s 的成员
x not in s  判断x 是否是s的成员

len(x) # 查看x的长度
s <= t # 测试是否s中的每一个元素都在t中
s >= t # 测试是否 t 中的每一个元素都在 s 中  

 

python 集合相关操作