您好,登錄后才能下訂單哦!
這篇文章主要講解了“Python常用數據結構之怎么創建集合”,文中的講解內容簡單清晰,易于學習與理解,下面請大家跟著小編的思路慢慢深入,一起來研究和學習“Python常用數據結構之怎么創建集合”吧!
說到集合這個詞大家一定不會陌生,在數學課本上就有這個概念。通常我們對集合的定義是“把一定范圍的、確定的、可以區別的事物當作一個整體來看待”,集合中的各個事物通常稱為集合的元素。集合應該滿足以下特性:
無序性:一個集合中,每個元素的地位都是相同的,元素之間是無序的。
互異性:一個集合中,任何兩個元素都認為是不相同的,即每個元素只能出現一次。
確定性:給定一個集合,任給一個元素,該元素或者屬于或者不屬于該集合,二者必居其一,不允許有模棱兩可的情況出現。
Python程序中的集合跟數學上的集合是完全一致的,需要強調的是上面所說的無序性和互異性。無序性說明集合中的元素并不像列中的元素那樣一個挨著一個,可以通過索引的方式實現隨機訪問(隨機訪問指的是給定一個有效的范圍,隨機抽取出一個數字,然后通過這個數字獲取到對應的元素),所以Python中的集合肯定不能夠支持索引運算。另外,集合的互異性決定了集合中不能有重復元素,這一點也是集合區別于列表的關鍵,說得更直白一些就是,Python中的集合類型具有去重特性。當然,Python中的集合一定是支持in和not in成員運算的,這樣就可以確定一個元素是否屬于集合,也就是上面所說的集合的確定性。集合的成員運算在性能上要優于列表的成員運算,這是集合的底層存儲特性決定的,此處我們暫時不做討論,先記下這個結論即可。
在Python中,創建集合可以使用{}字面量語法,{}中需要至少有一個元素,因為沒有元素的{}并不是空集合而是一個空字典,我們下一節課就會大家介紹字典的知識。當然,也可以使用內置函數set來創建一個集合,準確的說set并不是一個函數,而是創建集合對象的構造器,這個知識點我們很快也會講到,現在不理解跳過它就可以了。要創建空集合可以使用set();也可以將其他序列轉換成集合,例如:set('hello')會得到一個包含了4個字符的集合(重復的l會被去掉)。除了這兩種方式,我們還可以使用生成式語法來創建集合,就像我們之前用生成式創建列表那樣。要知道集合中有多少個元素,還是使用內置函數len;使用for循環可以實現對集合元素的遍歷。
# 創建集合的字面量語法(重復元素不會出現在集合中)
set1 = {1,
2,
3,
3,
3,
2}
print(set1) # {1,
2,
3}
print(len(set1)) #
3
# 創建集合的構造器語法(后面會講到什么是構造器)
set2 = set('hello')
print(set2) # {'h',
'l',
'o',
'e'}
# 將列表轉換成集合(可以去掉列表中的重復元素)
set3 = set([1,
2,
3,
3,
2,
1])
print(set3) # {1,
2,
3}
# 創建集合的生成式語法(將列表生成式的[]換成{})
set4 = {num
for num in
range(1,
20)
if num %
3 ==
0 or num %
5 ==
0}
print(set4) # {3,
5,
6,
9,
10,
12,
15,
18}
# 集合元素的循環遍歷
for elem in set4:
print(elem)
需要提醒大家,集合中的元素必須是hashable類型。所謂hashable類型指的是能夠計算出哈希碼的數據類型,你可以暫時將哈希碼理解為和變量對應的唯一的ID值。通常不可變類型都是hashable類型,如整數、浮點、字符串、元組等,而可變類型都不是hashable類型,因為可變類型無法確定唯一的ID值,所以也就不能放到集合中。集合本身也是可變類型,所以集合不能夠作為集合中的元素,這一點請大家一定要注意。
Python為集合類型提供了非常豐富的運算符,主要包括:成員運算、交集運算、并集運算、差集運算、比較運算(相等性、子集、超集)等。
可以通過成員運算in和not in檢查元素是否在集合中,代碼如下所示。
set1 = {11,
12,
13,
14,
15}
print(10 in set1) # False
print(15 in set1) # True
set2 = {'Python',
'Java',
'Go',
'Swift'}
print('Ruby' in set2) # False
print('Java' in set2) # True
Python中的集合跟數學上的集合一樣,可以進行交集、并集、差集等運算,而且可以通過運算符和方法調用兩種方式來進行操作,代碼如下所示。
set1 = {1, 2, 3, 4, 5, 6, 7}
set2 = {2, 4, 6, 8, 10}
# 交集
# 方法一: 使用 & 運算符
print(set1 & set2) # {2, 4, 6}
# 方法二: 使用intersection方法
print(set1.intersection(set2)) # {2, 4, 6}
# 并集
# 方法一: 使用 | 運算符
print(set1 | set2) # {1, 2, 3, 4, 5, 6, 7, 8, 10}
# 方法二: 使用union方法
print(set1.union(set2)) # {1, 2, 3, 4, 5, 6, 7, 8, 10}
# 差集
# 方法一: 使用 - 運算符
print(set1 - set2) # {1, 3, 5, 7}
# 方法二: 使用difference方法
print(set1.difference(set2)) # {1, 3, 5, 7}
# 對稱差
# 方法一: 使用 ^ 運算符
print(set1 ^ set2) # {1, 3, 5, 7, 8, 10}
# 方法二: 使用symmetric_difference方法
print(set1.symmetric_difference(set2)) # {1, 3, 5, 7, 8, 10}
# 方法三: 對稱差相當于兩個集合的并集減去交集
print((set1 | set2) - (set1 & set2)) # {1, 3, 5, 7, 8, 10}
通過上面的代碼可以看出,對兩個集合求交集,&運算符和intersection方法的作用是完全相同的,使用運算符的方式更直觀而且代碼也比較簡短。相信大家對交集、并集、差集、對稱差這幾個概念是比較清楚的,如果沒什么印象了可以看看下面的圖。
集合的交集、并集、差集運算還可以跟賦值運算一起構成復合運算,如下所示。
set1 = {1, 3, 5, 7}
set2 = {2, 4, 6}
# 將set1和set2求并集再賦值給set1
# 也可以通過set1.update(set2)來實現
set1 |= set2
print(set1) # {1, 2, 3, 4, 5, 6, 7}
set3 = {3, 6, 9}
# 將set1和set3求交集再賦值給set1
# 也可以通過set1.intersection_update(set3)來實現
set1 &= set3
print(set1) # {3, 6}
兩個集合可以用==和!=進行相等性判斷,如果兩個集合中的元素完全相同,那么==比較的結果就是True,否則就是False。如果集合A的任意一個元素都是集合B的元素,那么集合A稱為集合B的子集,即對于?a∈A,均有a∈B,則A?B。A是B的子集,反過來也可以稱B是A的超集。如果A是B的子集且A不等于B,那么A就是B的真子集。Python為集合類型提供了判斷子集和超集的運算符,其實就是我們非常熟悉的<和>運算符,代碼如下所示。
set1 = {1, 3, 5}
set2 = {1, 2, 3, 4, 5}
set3 = set2
# <運算符表示真子集,<=運算符表示子集
print(set1 < set2, set1 <= set2) # True True
print(set2 < set3, set2 <= set3) # False True
# 通過issubset方法也能進行子集判斷
print(set1.issubset(set2)) # True
# 反過來可以用issuperset或>運算符進行超集判斷
print(set2.issuperset(set1)) # True
print(set2 > set1) # True
Python中的集合是可變類型,我們可以通過集合類型的方法為集合添加或刪除元素。
# 創建一個空集合
set1 = set()
# 通過add方法添加元素
set1.add(33)
set1.add(55)
set1.update({1,
10,
100,
1000})
print(set1) # {33,
1,
100,
55,
1000,
10}
# 通過discard方法刪除指定元素
set1.discard(100)
set1.discard(99)
print(set1) # {1,
10,
33,
55,
1000}
# 通過remove方法刪除指定元素,建議先做成員運算再刪除
# 否則元素如果不在集合中就會引發KeyError異常
if 10 in set1:
set1.remove(10)
print(set1) # {33,
1,
55,
1000}
# pop方法可以從集合中隨機刪除一個元素并返回該元素
print(set1.pop())
# clear方法可以清空整個集合
set1.clear()
print(set1) # set()
如果要判斷兩個集合有沒有相同的元素可以使用isdisjoint方法,代碼如下所示。
set1 = {'Java',
'Python',
'Go',
'Kotlin'}
set2 = {'Kotlin',
'Swift',
'Java',
'Objective-C',
'Dart'}
set3 = {'HTML',
'CSS',
'JavaScript'}
print(set1.isdisjoint(set2)) # False - set1和set2有相同元素
print(set1.isdisjoint(set3)) # True - set1和set3沒有相同元素
Python中還有一種不可變類型的集合,名字叫frozenset。set跟frozenset的區別就如同list跟tuple的區別,frozenset由于是不可變類型,能夠計算出哈希碼,因此它可以作為set中的元素。除了不能添加和刪除元素,frozenset在其他方面跟set基本是一樣的,下面的代碼簡單展示了frozenset的用法。
set1 = frozenset({1,
3,
5,
7})
set2 = frozenset(range(1,
6))
print(set1 & set2) # frozenset({1,
3,
5})
print(set1 | set2) # frozenset({1,
2,
3,
4,
5,
7})
print(set1 - set2) # frozenset({7})
print(set1 < set2) # False
感謝各位的閱讀,以上就是“Python常用數據結構之怎么創建集合”的內容了,經過本文的學習后,相信大家對Python常用數據結構之怎么創建集合這一問題有了更深刻的體會,具體使用情況還需要大家實踐驗證。這里是億速云,小編將為大家推送更多相關知識點的文章,歡迎關注!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。