1. 程式人生 > >Python中字典的近親——集合

Python中字典的近親——集合

mar env sort bfd 無符號整數 pda fcc dict true

集合的兩個功能
1.集合可以實現去重的功能;
2.集合可以實現關系測試:交集,差集,並集,是否子集,是否沒有交集

以一個應用場景來引出集合:
現在IPV4下用一個32位無符號整數來表示,一般用點分方式來顯示,點將IP地址分成4個部
分,每個部分為8位,表示成一個無符號整數(因此不需要用正號出現),如10.137.17.1,
是我們非常熟悉的IP地址,一個IP地址串中沒有空格出現(因為要表示成一個32數字)。
現在需要你用程序來判斷IP是否合法。
(1)輸入描述:輸入一個ip地址
(2)輸出描述:返回判斷的結果YES or NO
示例1
1.輸入: 10.138.15.1
2.輸出: YES

#!/usr/bin/env python

#coding:utf-8

#172.25.254.1
ip = raw_input(‘ip:‘)
#["172"."25"."254"."1"]
ip = ip.split(‘.‘)
#一次判斷每一部分是否合法;
for i in ip:
if 0<=int(i)<=255:
print ‘YES‘
break
else:
print ‘NO‘

場景1: li = [‘a‘, ‘b‘]
場景2: 社聯要統計所有加入社團的學生?

li1 = [‘a‘, ‘b‘, ‘c‘] li2 = [‘a‘, ‘c‘]
all = []
for i in li1: for j in li2:

列表解決太麻煩;
set(li1 + li2) set(li1.extend(li2))

一.集合set的定義
1.集合是不重復的數據結構;
(1)花括號裏面為空,是字典類型;
In [1]: s = {}

In [2]: type(s)
Out[2]: dict
技術分享圖片
(2)定義集合的第一種方式;
In [3]: s = {1, 2, 3, 1, 2}

In [4]: type(s)
Out[4]: set

In [5]: print s
set([1, 2, 3])
技術分享圖片
2.工廠方法定義集合時,括號裏面是可叠代的對象, eg: 數值類型不可以;
(1)定義集合的第二種方式:定義一個空集合
In [6]: s = set()

In [7]: type(s)
Out[7]: set
技術分享圖片
(2)定義集合

*字符串
In [8]: s = set(‘hello‘)

In [9]: print s
set([‘h‘, ‘e‘, ‘l‘, ‘o‘])
技術分享圖片
*字典
In [11]: s = set({‘a‘:1, ‘b‘:2, ‘c‘:3})

In [12]: print s
set([‘a‘, ‘c‘, ‘b‘])
*元組
In [13]: s = set((1, 2, 3, 4))

In [14]: print s
set([1, 2, 3, 4])
*列表

In [15]: s = set([1, 2, 3])

In [16]: print s
set([1, 2, 3])
技術分享圖片
二.應用:實現列表去重

1,轉換為集合數據類型:set(列表)
2.字典的fromkeys方法實現;
(1)實現列表去重
In [22]: li = [1, 2, 3, 4, 2, 3]

In [23]: s = set(li)

In [24]: li = list(s)

In [25]: print s
set([1, 2, 3, 4])
技術分享圖片
In [26]: print li
[1, 2, 3, 4]
(2)fromkeys方法實現列表去重
In [28]: li = [1, 2, 3, 4, 2, 3]

In [29]: d = {}.fromkeys(li)

In [30]: print d.keys()
[1, 2, 3, 4]
技術分享圖片
三.集合的特征

1.集合是無序的, 不重復的數據類型;
2.因此不支持索引,也不支持切片;也不支持重復;也不支持連接;
3.支持成員操作符;
4.支持for循環;

(1)成員操作符:
In [31]: s = {1, 2, 3, 4, 1, 2}

In [32]: 1 in s
Out[32]: True

In [33]: 1 not in s
Out[33]: False
技術分享圖片
(2)集合支持for循環,是可叠代的:
In [34]: for i in s:
....: print i
....:
1
2
3
4
技術分享圖片

四.集合的增三改查

1.增

In [35]: s = {1, 2, 3, 4, 1, 2}

In [36]: s.add(8)

In [37]: s.add(1)

In [38]: print s
set([8, 1, 2, 3, 4])
技術分享圖片
In [39]: s1 = {‘a‘, ‘b‘, ‘c‘}

In [40]: s.update(s1)

In [41]: print s
set([‘a‘, 1, 2, 3, 4, 8, ‘c‘, ‘b‘])
技術分享圖片
2.改

3.查
關系測試操作

In [45]: s1 = {1, 2, 3, 4}

In [46]: s2 = {1, 2, 3, 5}
#交集
In [47]: s1 & s2
Out[47]: {1, 2, 3}
#並集
In [48]: s1 | s2
Out[48]: {1, 2, 3, 4, 5}
#差集
In [49]: s1 - s2
Out[49]: {4}

In [50]: s2 - s1
Out[50]: {5}

#對等差分
In [51]: s1 ^ s2
Out[51]: {4, 5}
技術分享圖片
#交集
In [52]: s1.intersection(s2)
Out[52]: {1, 2, 3}
#並集
In [53]: s1.union(s2)
Out[53]: {1, 2, 3, 4, 5}
技術分享圖片
#差集
In [54]: s1.difference(s2)
Out[54]: {4}

In [55]: s2.difference(s1)
Out[55]: {5}
技術分享圖片
#對等差分
In [56]: s1.symmetric_difference(s2)
Out[56]: {4, 5}
技術分享圖片
In [67]: s1 = {1, 2, 3, 4}

In [68]: s2 = {1, 2, 3}
#s2是否s1子集
In [69]: s2.issubset(s1)
Out[69]: True
#s1是否是s2的父集
In [71]: s1.issuperset(s2)
Out[71]: True

#是否沒有交集
In [72]: s1.isdisjoint(s2)
Out[72]: False

4.刪

In [73]: s = {1, ‘a‘, ‘hello‘, 45,}
(1)s.pop() #隨機刪除一個,返回一個對象
In [74]: s.pop()
Out[74]: ‘a‘
技術分享圖片
(2)s.remove #刪除指定元素,是set成員則刪除,不是成員報錯
In [75]: s.remove(1)

In [76]: print s
set([45, ‘hello‘])

In [77]: s.remove(‘b’)
File "<ipython-input-77-fe0f6997b18b>", line 1
s.remove(‘b’)
^
SyntaxError: invalid syntax
技術分享圖片
In [78]: print s
set([45, ‘hello‘])
(3)s.discard() #刪除指定元素,是成員刪除,不是成員什麽都不做
In [79]: s.discard(45)

In [80]: s.discard(‘b‘)

In [81]: print s
set([‘hello‘])
技術分享圖片
(4)s.clear() #清空集合元素
In [82]: s.clear()

In [83]: s
Out[83]: set()
技術分享圖片

應用:
(華為機試題)題目描述
明明想在學校中請一些同學一起做一項問卷調查,為了實驗的客觀性, 他先用計算機生成了N個1到1000
之間的隨機整數(N≤1000), N是用戶輸入的,對於 其中重復的數字,只保留一個,把其余相同的數去
掉,不同的數對應 著不同的學生的學號。然後再把這些數從小到大排序,按照排好的順 序去找同學做調
查。請你協助明明完成“去重”與“排序”的工作;
提示:
生成隨機數,
import random
random.randint(1,1000)
列表的去重

#!/usr/bin/env python
#coding:utf-8

import random
s = set()
N = input(‘輸入一個數:‘)
for i in range (N) :
s.add(random.randint(1,1000))
#sorted是內置方法用來排序;
print sorted(s)
#li = list(s)
#li.sort()
#print li

總結
可變數據類型: 列表, 字典, 集合
不可變數據類型: 數值類型, 字符串, 元組
可變數據類型實現某個功能, 直接改變可變的數據類型;
不可變數據類型實現某個功能,需要將結果賦值給另外一個變量;
是否實現for循環
可叠代數據類型: str, list, tuple, dict, set
不可叠代數據類型:數值類型
是否支持索引,切片, 重復和連接特性
有序的數據類型: str, list, tuple
無序的數據類型: dict, set

Python中字典的近親——集合