Select Language

AI社区

AI技术百科

2.23、Python set集合精讲

和列表类似,Python 集合也是一个数据集合,其也不要求元素的类型一致,但是集合有下面两个特点:

  • 集合内元素唯一。如不可以用 1、2、1、1 组成集合,因为其包含重复的 1。

  • 集合是无序的,添加元素时不能指定位置,删除元素时也不能通过指定位置,只能通过指定值。当然也不能通过位置来定位某个元素。

Python 创建集合

我们可以从列表创建集合,将列表中的元素都加入到集合中,如果有重复的元素就仅保留一个。

>>> a = set([1, 1, 3])
>>> a
set([1, 3])  # 重复的元素被丢弃
>>> type(a)  # 查看类型<type 'set'>

下面的例子说明了集合的无序性:

>>> a = set([100, 99, 1, 1, 3])  # 从列表中构建一个集合
>>> type(a)                      # 得到a的类型<type 'set'>                     # 类型是字典型
>>> a                            # 查看a的内容
set([3, 1, 99, 100])             # 可以发现其顺序和添加的顺序是无关的

也可以从元组、字典和其他集合构建集合。

下面的例子是用元组构建集合:

>>> a = set((0, 1, 2, 3, 3, 2))  # 从元组构建集合
>>> a                            # 重复元素被丢弃
{0, 1, 2, 3}
>>> type(a)                      # 查看类型<class 'set'>


下面的例子是从字典构建集合,使用的是字典的键来构建集合,字典的值没有被使用到:

>>> a = set({1:10, 2:20, 3:30})
>>> a
{1, 2, 3}
>>> type(a)<class 'set'>


下面的例子是从字符串构建集合,其每个字符都成为集合的一个元素:

>>> a = set("abcdefabc")  # 以字符串为输入创建一个集合
>>> a                     # 查看a的内容
{'c', 'e', 'f', 'b', 'd', 'a'}
>>> type(a)               # 查看a的类型<class 'set'>


下面的例子是从另外一个集合构建集合:

>>> a = set([1, 2, 3])  # 3个元素的集合
>>> b = set(a)          # 用集合a作为输入,创建一个新的集合b
>>> b                   # 查看b的值
{1, 2, 3}
>>> type(b)             # 查看b的类型<class 'set'>


当然也可以构造一个空的集合,使用的方法是 set()。空集合没有任何元素。

>>> a = set()  # 创建一个空的集合
>>> type(a)    # 查看类型<class 'set'>
>>> len(a)     # 得到元素个数
0

Python 集合的基本操作

1) 添加元——add(值)

该函数只能添加一个元素。

>>> a = set()   # 构造一个空的集合
>>> a.add(1)    # 添加一个元素1
>>> a           # 查看a的值
set([1])        # 的确包含唯一一个元素1
>>> a.add(100)  # 再次添加元素100
>>> a           # 查看现在a的值
set([1, 100])   # 包含两个元素了


如果添加的元素已经在集合中存在,那么不会发生任何变化。

>>> a           # a是包含1和100的集合
set([1, 100])   # a的内容
>>> a.add(100)  # 添加重复的元素100
>>> a           # a没有发生任何变化
set([1, 100])

2) 扔掉元素——discard(值)

该函数删除集合中指定的值对应的元素。

>>> a = set([1, 2, 3])
>>> a
set([1, 2, 3])
>>> a.discard(1)
>>> a
set([2, 3])

如果指定值在集合中不存在,则不做任何操作。

>>> a
set([2, 3])
>>> a.discard(100)
>>> a
set([2, 3])

3) 删除指定值——remove(值)

该函数和 discard() 的不同之处在于,如果指定的值在集合中不存在,会抛出异常。

>>> a = set([1, 2, 3])
>>> a.remove(1)
>>> a
set([2, 3])
>>> a.remove(10)  # 删除不存在的元素10,抛出KeyError异常
Traceback (most recent call last):
  File "", line 1, in KeyError: 10

4) 清空所有元素——clear()

该函数扔掉所有的元素。执行完该函数后,该集合将变成一个空的集合。

>>> a = set([1, 2, 3])
>>> a
set([1, 2, 3])
>>> a.clear()
>>> a
set([])
>>> a.clear()
>>> a
set([])

5) 删除第一个元素——pop()

如果集合中有元素,则返回值为删除掉的元素的值。

>>> a = set([1, 2, 3])
>>> a.pop()
1
>>> a
set([2, 3])

如果集合为空,则抛出异常。

>>> a = set([])
>>> len(a)
0
>>> a
set([])
>>> a.pop()
Traceback (most recent call last):
  File "", line 1, in KeyError: 'pop from an empty set'

6) 是否存在交集——isdisjoint()

该函数判断是否存在这样的元素,其同时属于集合 a 和集合 b。如果存在这样的元素,返回 False;否则返回 True。

>>> a = set([1, 2, 3, 4])
>>> b = set([1, 2, 10, 20])
>>> a.isdisjoint(b)
False
>>> c = set([100, 200])
>>> a.isdisjoint(c)
True

7) 是指定集合的子集吗——issubset()

a 是 b 的子集就是说集合 a 的所有元素都属于集合 b。

>>> a = set([1, 2])
>>> b = set([1, 2, 10, 20])
>>> a.issubset(b)  # 集合a是集合b的子集吗
True               # 是的
>>> c = set([1, 10, 20, 30, 40])
>>> a.issubset(c)
False

如果 a 等于 b,那么 a 和 b 互为子集。

>>> a = set([1, 2])  # 集合a和集合b值相同,但是是不同的对象
>>> id(a)            # 集合a的id
49020712
>>> b = set([2, 1])
>>> id(b)            # 集合b的id,不同于a的id
49018024
>>> a is b           # 集合a和b不是一个对象
False  
>>> a == b           # 集合a和b的内容相等
True
>>> a.issubset(b)    # a是b的子集
True
>>> b.issubset(a)    # b也是a的子集
True

8) 是指定集合的超集吗——issuperset()

a 是 b 的超集合就是说集合 b 中的所有元素都属于集合 a。

>>> a = set([1, 2])
>>> b = set([1, 2, 10, 20])
>>> b.issuperset(a)
True
>>> b.issuperset(b)
True
>>> a.issuperset(b)
False

如果 a 是 b 的超集,那么 b 就是 a 的子集。

>>> a = set([1, 2, 3, 4])  # a包含所有b的元素
>>> b = set([1, 3])
>>> a.issuperset(b)        # a是b的超集
True   
>>> b.issubset(a)          # b是a的子集
True

如果 a 等于 b,那么它们互为子集,同时也互为超集。

>>> a = set([1, 2])  # 集合a和b值相同,但是不是一个对象
>>> b = set([2, 1])
>>> a == b           # 值相同
True
>>> a is b           # 不是一个对象
False
>>> a.issuperset(b)  # 它们互为超集
True
>>> b.issuperset(a)
True


我要发帖
  • 26

    条内容
Python基本数据类型一共26个章节
本章将介绍 Python 内置的基本数据类型,包括整型、浮点数、字符串、布尔型、列表、元组、集合和字典等 Python 定义的基本数据类型,以及这些数据类型的运算操作。
我们知道,Python 是强类型语言,每个变量在某个时刻的类型是确定的。也就是说,Python 中任意一个存活的对象,其类型是唯一的。不同类型的对象有不同的属性,能完成不同的操作。
另外本章最后还会介绍变量、对象等概念。每个对象都有一个确定的类型,每个变量都指向某个特定的对象。