python 字典詳解 一 (基礎用法)
python字典是python中非常重要的一個基礎型別,它是一個高效的基礎型別,不僅在編寫程式的時候經常用到,就連python底層的實現都大量的使用了字典。
主要從幾個方面去學習python的字典
1. 字典的基本使用
2. 字典的擴充套件和針對它的一些類庫(針對特殊用途的字典)
3. 自定義自己的字典
4. 字典的底層實現
字典的基本使用
建立字典
建立字典有很多種方式,但是要注意一點的是,字典的鍵必需是能夠雜湊的,因此字典的鍵的雜湊值應該在物件的生命週期中是不會變的,這其中包括不可變型別如:str, bytes, int,還有frozen set, 和不包含可變型別項的元組,以及實現了eq
下面列舉了一些構造字典的方法
(只考慮方法,並未關注效率問題, 關於效率問題在深入研究之後來分析)
直接構造字典的方式
a = {‘one’ : 1, ‘two’ : 2, ‘three’ : 3}
通過工廠方法建立字典
傳字典引數的方法構造字典:
b = dict(one=1, two=2, three=3)
使用zip方法構造
c = dict(zip([‘one’ , ‘two’ , ‘three’ ], [1, 2, 3]))
元組對列表的方式
d = dict([(‘two’ , 2), (‘one’ , 1), (‘three’ , 3)])
直接以字典作為構造引數的形式
e = dict({‘three’ : 3, ‘one’ : 1, ‘two’ : 2})
列表對元組的方式
f = dict(([‘one’, 1], [‘two’,2],[‘three’,3]))
fromkeys建立預設值字典:
g = dict.fromkeys([‘one’,’tow’,’three’], 1)
字典推導式
h = {value:index+1 for index, value in enumerate(['one','tow','three'])}
可見python中的字典是非常強大的,它的操作非常豐富和方便,下面列舉一些常用的操作
常用操作
字典中有哪些方法,怎麼使用了
首先來看下字典的類圖
dict_test = {1: ‘one’, 2: ‘two’, 3: ‘three’}
- container
可以使用 in 來判斷元素是否存在:
>>> 1 in dict_test
True
- mapping
>>> dict_test.keys()
dict_keys([1, 2, 3])
>>> dict_test.values()
dict_values(['one', 'two', 'three'])
>>> dict_test.items()
dict_items([(1, 'one'), (2, 'two'), (3, 'three')])
注: 在python3中這三個方法返回的都是檢視,
- 另外可以通過key取得值
>>> dict_test[1]
‘one’
- 也可以直接給key配對值
>>> dict_test[4] = 'four'
>>> dict_test
{1: ‘one’, 2: ‘two’, 3: ‘three’, 4: ‘four’}
- 以及使用get方法取得值,如果沒有這個key返回預設值
>>> dict_test.get(1, '1')
‘one’
>>> dict_test.get('1', '1')
‘1’
- sized
獲取字典的長度
>>> len(dict_test)
3
- iterable
可以遍歷和是迭代物件(以鍵進行遍歷)
>>> for value in dict_test:
... print(value)
...
1
2
3
>>> from collections import Iterable
>>> isinstance(dict_test, Iterable)
True
>>> iter(dict_test)
- iterator
變成迭代器
>>> iter_test = iter(dict_test)
>>> next(iter_test)
1
>>> next(iter_test)
2
>>> next(iter_test)
3
>>> next(iter_test)
Traceback (most recent call last):
File “”, line 1, in
StopIteration
- 其他一些方法
>>> dir(dict_test)
['__class__', '__contains__', '__delattr__', '__delitem__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__getitem__', '__gt__', '__hash__
', '__init__', '__iter__', '__le__', '__len__', '__lt__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__setattr__', '__setitem__', '__sizeof__', '__s
tr__', '__subclasshook__', 'clear', 'copy', 'fromkeys', 'get', 'items', 'keys', 'pop', 'popitem', 'setdefault', 'update', 'values']
- 常用的方法
pop 移除並返回移除的鍵對應的值, 需要傳一個key引數
>>> dict_test.pop(1)
‘one’
>>> dict_test
{2: ‘two’, 3: ‘three’}
同上, popitem移除並返回移除的鍵值對
>>> dict_test.popitem()
(2, ‘two’)
>>> dict_test
{3: ‘three’}
setdefault 方法類似於get方法,只不過在沒有找到鍵的情況下會將這個鍵對應的值設定成預設值,並將這個值返回,如果有這個鍵,直接返回鍵對應的值
>>> dict_test.setdefault(4, 'four')
‘four’
>>> dict_test
{1: ‘one’, 2: ‘two’, 3: ‘three’, 4: ‘four’}
直接刪除字典中的鍵值對
>>> del dict_test[1]
>>> dict_test
{2: ‘two’, 3: ‘three’, 4: ‘four’}
copy方法, 直接呼叫copy()為淺拷貝, 即建立了一個新物件,但內容實際上是用的原物件內容的引用, 請看下面的這個例子
>>> dict_test = {'one':1, 'two':[1,1]}
>>> dict_copy = dict_test.copy()
>>> dict_copy['two'].append(1)
>>> dict_test['two']
[1, 1, 1]
使用深拷貝就不會有這個問題
dict_test = {'one':1, 'two':[1,1]}
import copy
dict_deep_copy = copy.deepcopy(dict_test)
dict_deep_copy['two'].append(1)
dict_test['two']
[1, 1]
部分方法前面已經有演示了,這裡不再說明, update用於字典合併,合併有很多種方法,而且經常用到,
合併和更新字典
這裡列舉一些方法:
dict1 = dict([(1,'one'), (2,'two')])
dict2 = {2:'two_two',3:'three'}
直接用update方法(這種情況會改變字典)
>>> dict1.update(dict2)
>>> dict1
{1: ‘one’, 2: ‘two_two’, 3: ‘three’}
可以使用copy方法或者工廠方法,新建立一個字典從而不改變原有字典
>>> dict1_copy = dict1.copy() # dict(dict1)
>>> dict1_copy.update(dict2)
>>> dict1_copy
{1: ‘one’, 2: ‘two_two’, 3: ‘three’}
>>> dict1
{1: ‘one’, 2: ‘two’}
使用解綁再組合的方式,這種方式存在一些問題,如下:
>>> dict(dict1, **dict2)
Traceback (most recent call last):
File “”, line 1, in
TypeError: keyword arguments must be strings
因此這種方式只適合key為可作為變數名字的情況
同樣可以使用字典推導式的方式進行字典合併
>>> {key:value for d in [dict1, dict2] for key, value in d.items()}
{1: ‘one’, 2: ‘two_two’, 3: ‘three’}
全部遍歷相加的方法,類似於前面的推導式
>>> dict(list(dict1.items()) + list(dict2.items()))
{1: ‘one’, 2: ‘two_two’, 3: ‘three’}
使用連線操作符 ‘|’
>>> dict(dict1.items() | dict2.items())
{1: ‘one’, 2: ‘two’, 3: ‘three’}
>>> dict(dict2.items()|dict1.items())
{1: ‘one’, 2: ‘two_two’, 3: ‘three’}
這裡覆蓋的順序變了, 如果有重複的key將以第一個字典中key的值作為最終合併的值
藉助於其他類庫
>>> from itertools import chain
>>> dict(chain(dict1.items(), dict2.items()))
{1: ‘one’, 2: ‘two_two’, 3: ‘three’}
>>> from collections import ChainMap
>>> ChainMap({}, dict2 ,dict1 )
ChainMap({}, {1: ‘one’, 2: ‘two’}, {2: ‘two_two’, 3: ‘three’})
>>> dict(ChainMap({}, dict1, dict2))
{1: ‘one’, 2: ‘two’, 3: ‘three’}
這裡第一個空字典,是為了不改變dict1中的值, 而且注意字典的排放順序, dict1需要放到最後,因為我們需要dict2中的值覆蓋dict1中的值, 這種方式不進行字典遍歷,因為它首先生成了一個view,在查詢的時候才會去匹配,ChainMap並不會直接變成 dict, 需要dict工廠方法進行轉換, 這種情況適合合併多個字典的情況
dict3 = {3:'three_three', 4:'four'}
>>> dict(ChainMap({}, dict3, dict2, dict1))
{1: ‘one’, 2: ‘two_two’, 3: ‘three_three’, 4: ‘four’}
注意字典在引數中的位置, 需要更新的字典放最後
全部解綁的方式(這種方便快捷的方式只在python3.5以上有效)
>>> {**dict1, **dict2}
{1: ‘one’, 2: ‘two_two’, 3: ‘three’}
除了合併比較兩個字典的大小也常用
比較字典
由於在python2.1之後有增加了更加豐富的比較符, 但python2又一直保留著cmp這個內建函式,因此可以直接通過cmp方法進行比較但是在python3中這個內建方法已經移除,需要自己去實現那些比較符對應的方法,比如 < 對應著 _lt_, 其他類似: <= _le_, == _eq_, != _ne_, > _gt_, >= _ge_.
字典的比較順序,在python2中遵守下面的規則
首先比較字典的長度, 然後比較字典的鍵,最後比較字典的值
而在python3中需要自己去實現那些比較符方法
dict1 = {1:'one', 3:'three'}
dict2 = {2:'two', 3:'three_three'}
condition = True if dict1 >= dict2 else False
condition
---------------------------------------------------------------------------
TypeError Traceback (most recent call last)
<ipython-input-26-6e55c3e20291> in <module>()
----> 1 condition = True if dict1 >= dict2 else False
2 condition
TypeError: unorderable types: dict() >= dict()
dict1.__lt__(dict2)
NotImplemented
另外要說的一點就是, 字典中的鍵是無序的集合,因此可以利用集合的一些操作來處理字典, 比如找到第一個字典中沒有的鍵值對,可以利用集合的差補來做
{key: dict1[key] for key in set(dict1) - set(dict2)}
{1: ‘one’}
還有其他一些字典的操作,比如給字典排序, 擴充套件和改造自己的字典型別等,下次有時間總結下。
上面這些例子是在python3.4.3下面測試的