Python中list,tuple,dict,set的區別和用法
Python語言簡潔明,可以用較少的程式碼實現同樣的功能。其中Python的四個內建資料型別功不可沒,即是list, tuple, dict, set。
List
在Python中List中的元素用中括號[]來表示,可以這樣定義一個List:
L = [12, 'China', 19.998]
可以看到並不要求元素的型別都是一樣的。當然也可以定義一個空的List:
L = []
Python中的List是有序的,所以要訪問List的話可以通過序號來訪問,就像是陣列的下標一樣,一樣是下標從0開始:
>>> print(L[0]) 12
千萬不要越界,否則會報錯
L[3] Traceback (most recent call last): File "<stdin>", line 1, in <module> IndexError: list index out of range
List也可以倒序訪問,通過“倒數第x個”這樣的下標來表示序號,比如-1這個下標就表示倒數第一個元素:
>>> L = [12, 'China', 19.998] >>> print L[-1] 19.998
-4的話顯然就越界了
>>> print L[-4] Traceback (most recent call last): File"<pyshell#2>", line 1, in <module> print L[-4] IndexError: list index out of range >>>
List通過內建的append()方法來新增到尾部,通過insert()方法新增到指定位置(下標從0開始):
>>> L = [12, 'China', 19.998] >>> L.append('Jack') >>> print(L) [12, 'China', 19.998, 'Jack'] >>> L.insert(1, 3.14)>>> print(L) [12, 3.14, 'China', 19.998, 'Jack']
通過pop()刪除最後尾部元素,也可以指定一引數刪除指定位置:
>>> L.pop() 'Jack' >>> print(L) [12, 3.14, 'China', 19.998] >>> L.pop(0) 12 >>> print(L) [3.14, 'China', 19.998]
也可以通過下標進行復制替換(即修改元素)
>>> L[1] = 'America' >>> print L [3.14, 'America', 19.998]
Tuple
Tuple可以看做是一種“不變”的List(即:不可修改元素),訪問也是通過下標,用小括號()表示:
>>> t = (3.14, 'China', 'Jason') >>> print(t) (3.14, 'China', 'Jason')
但是不能重新賦值替換,也沒有pop和insert、append方法。
>>> t[1] = 'America' Traceback (most recent call last): File "<pyshell#21>", line 1, in <module> t[1] = 'America' TypeError: 'tuple' object does not support item assignment
可以建立空元素的tuple:
t = ()
可以建立單元素的tuple (單元素後要加一個逗號防止和宣告一個整形歧義):
t = (3.14,)
那麼tuple這個型別到底有什麼用處呢?要知道如果你希望一個函式返回多個返回值,其實只要返回一個tuple就可以了,因為tuple裡面的含有多個值,而且是不可變的(就像是java裡面的final)。
當然,tuple也是可變的,比如:
>>> t = (3.14, 'China', 'Jason', ['A', 'B']) >>> print t (3.14, 'China', 'Jason', ['A', 'B']) >>> L = t[3] >>> L[0] = 122 >>> L[1] = 233 >>> print t (3.14, 'China', 'Jason', [122, 233])
這是因為Tuple所謂的不可變指的是指向的位置不可變,因為本例子中第四個元素並不是基本型別,而是一個List型別,所以t指向的該List的位置是不變的,但是List本身的內容是可以變化的,因為List本身在記憶體中的分配並不是連續的。
Dict
Dict是Python中非常重要的資料型別,就像它的字面意思一樣,它是個活字典,其實就是Key-Value鍵值對,類似於HashMap,可以用花括號{}通過類似於定義一個C語言的結構體那樣去定義它:
>>> d = { 'Adam': 95, 'Lisa': 85, 'Bart': 59, 'Paul': 75 } >>> print d {'Lisa': 85, 'Paul': 75, 'Adam': 95, 'Bart': 59}
可以看到打印出來的結果都是Key:Value的格式,可以通過len函式計算它的長度(List,tuple也可以):
>>> len(d)
4
可以直接通過鍵值對方式新增dict中的元素:
>>> print d {'Lisa': 85, 'Paul': 75, 'Adam': 95, 'Bart': 59} >>> d['Jone'] = 99 >>> print d {'Lisa': 85, 'Paul': 75, 'Adam': 95, 'Jone': 99, 'Bart': 59}
List和Tuple用下標來訪問內容,而Dict用Key來訪問: (字串、整型、浮點型和元組tuple都可以作為dict的key)
>>> print d['Adam'] 95
如果Key不存在,會報錯:
>>> print d['Jack'] Traceback (most recent call last): File "<pyshell#40>", line 1, in <module> print d['Jack'] KeyError: 'Jack'
所以訪問之前最好先查詢下key是否存在:
>>> if 'Adam' in d : print 'exist key' exist key
或者直接用保險的get方法:
>>> print d.get('Adam') 95 >>> print d.get('Jason') None
至於遍歷一個dict,實際上是在遍歷它的所有的Key的集合,然後用這個Key來獲得對應的Value:
>>> for key in d : print(key, ':', d.get(key)) Lisa : 85 Paul : 75 Adam : 95 Bart : 59
Dict具有一些特點:
- 查詢速度快。無論是10個還是10萬個,速度都是一樣的,但是代價是耗費的記憶體大。List相反,佔用記憶體小,但是查詢速度慢。這就好比是陣列和連結串列的區別,陣列並不知道要開闢多少空間,所以往往開始就會開闢一個大空間,但是直接通過下標查詢速度快;而連結串列佔用的空間小,但是查詢的時候必須順序的遍歷導致速度很慢
- 沒有順序。Dict是無順序的,而List是有序的集合,所以不能用Dict來儲存有序集合
- Key不可變,Value可變。一旦一個鍵值對加入dict後,它對應的key就不能再變了,但是Value是可以變化的。所以List不可以當做Dict的Key,但是可以作為Value:
>>> print d {'Lisa': 85, 'Paul': 75, 'Adam': 95, 'Jone': 99, 'Bart': 59} >>> d['NewList'] = [12, 23, 'Jack'] >>> print d {'Bart': 59, 'NewList': [12, 23, 'Jack'], 'Adam': 95, 'Jone': 99, 'Lisa': 85, 'Paul': 75}
- Key不可重複。(下面例子中添加了一個'Jone':0,但是實際上原來已經有'Jone'這個Key了,所以僅僅是改了原來的value)
>>> print d {'Bart': 59, 'NewList': [12, 23, 'Jack'], 'Adam': 95, 'Jone': 99, 'Lisa': 85, 'Paul': 75} >>> d['Jone'] = 0 >>> print d {'Bart': 59, 'NewList': [12, 23, 'Jack'], 'Adam': 95, 'Jone': 0, 'Lisa': 85, 'Paul': 75}
Dict的合併,如何將兩個Dict合併為一個,可以用dict函式:
>>> d1 = {'mike':12, 'jack':19} >>> d2 = {'jone':22, 'ivy':17} >>> dMerge = dict(d1.items() + d2.items()) >>> print dMerge {'mike': 12, 'jack': 19, 'jone': 22, 'ivy': 17}
或者
>>> dMerge2 = dict(d1, **d2) >>> print dMerge2 {'mike': 12, 'jack': 19, 'jone': 22, 'ivy': 17}
方法2比方法1速度快很多,方法2等同於:
>>> dMerge3 = dict(d1) >>> dMerge3.update(d2) >>> print dMerge {'mike': 12, 'jack': 19, 'jone': 22, 'ivy': 17}
set
set就像是把Dict中的key抽出來了一樣,類似於一個List,但是內容又不能重複,通過呼叫set()方法建立:
>>> s = set(['A', 'B', 'C'])
就像dict是無序的一樣,set也是無序的,也不能包含重複的元素。
對於訪問一個set的意義就僅僅在於檢視某個元素是否在這個集合裡面(大小寫是敏感的。):
>>> print('A' in s) True >>> print('D' in s) False
也可以通過for來遍歷:
s = set([('Adam', 95), ('Lisa', 85), ('Bart', 59)]) #tuple for x in s: print(x[0],':',x[1]) >>> Lisa : 85 Adam : 95 Bart : 59
通過add和remove來新增、刪除元素(保持不重複),新增元素時,用set的add()方法:
>>> s = set([1, 2, 3]) >>> s.add(4) >>> print s set([1, 2, 3, 4])
如果新增的元素已經存在於set中,add()不會報錯,但是不會加進去了:
>>> s = set([1, 2, 3]) >>> s.add(3) >>> print s set([1, 2, 3])
刪除set中的元素時,用set的remove()方法:
>>> s = set([1, 2, 3, 4]) >>> s.remove(4) >>> print s set([1, 2, 3])
如果刪除的元素不存在set中,remove()會報錯:
>>> s = set([1, 2, 3]) >>> s.remove(4) Traceback (most recent call last): File "<stdin>", line 1, in <module> KeyError: 4
如果要判斷一個元素是否在一些不同的條件內符合,用set是最好的選擇,下面例子:
months = set(['Jan','Feb','Mar','Apr','May','Jun','Jul','Aug','Sep','Oct','Nov','Dec']) x1 = 'Feb' x2 = 'Sun' if(x1 in months): print('x1: ok') else: print('x1: error') if(x2 in months): print('x2: ok') else: print('x2: error') >>> x1: ok x2: error