高階Python----常用的資料結構與演算法

阿新 • • 發佈：2018-11-01

前言

高階Python系列文章是筆者想要突破自己目前的技術生涯瓶頸而作，不具有普適性。本文主要是介紹Python在資料結構和演算法中常用的函式。這也是資料分析領域必備知識點。

也不是特地為了某些讀者而作，想著提高自己的同時，能方便他人就更好了。懂分享的人，一定會快樂！

常用的四個模組應該是：collections，heapq，operator，itertools。其中，collections是日常工作中的重點/高頻模組。

另外，正確學習這些技巧的姿勢應該是：開啟電腦，實現數遍，嘗試不同解決辦法和程式設計方式。

注：所有程式碼在Python3.5.1中測試。

collections模組

deque

from collections import deque

"""學習固定長度的deque"""
q = deque(maxlen=5)    # 建立一個固定長度的佇列,當有新記錄加入已滿的佇列時，會自動移除最老的記錄。

q.append(1)    # 新增元素


"""學習不固定長度的deque，從佇列兩端新增或彈出元素的複雜度為o(1)."""
q = deque()    # 建立一個無界限的佇列，可以在佇列兩端執行新增和彈出操作

q.append(1)    # 新增元素

q.appendleft(2 
)    # 向左邊新增一個元素

q.pop()    # 彈出佇列尾部的記錄

q.popleft()    # 彈出佇列頭部的記錄

defaultdict
用於建立有多個value對應一個key的字典。比如建立value可重複(list儲存)的該字典：dic = {“a”: [1, 2 , 2, 3, 3], “b”: [1, 2]}。或建立value不可重複（set儲存）的該字典：dic = {“a”: { 1, 2, 3}, “b”: {1, 2} }

from collections import defaultdict

d_list = defaultdict(list)    # list 

d['a'].append(1)
d['a'].append(2)
d['a'].append(2)
d['a'].append(3)
d['a'].append(3)

d_set = defaultdict(set)    # set
d['a'].add(1)
d['a'].add(2)
d['a'].add(3)

OrderedDict
OrderedDict內部維護了一個雙向連結串列，會根據元素加入的順序來排列鍵的位置。一個新加入的元素被放在連結串列的末尾，然後，對已存在的鍵做重新賦值但不會改變鍵的順序。作用：嚴格控制元素初始新增的順序。

from collections import OrderedDict

d = OrderedDict()    # 例項化
d['a'] = 1
d['b'] = 2

Counter
作用：統計可雜湊的序列中元素出現的次數。（可雜湊：一種特性，具備該特性的物件在其生命週期內必須不可變。在Python中，有整數、浮點數、字串、元組。）

from collections import Counter

test = ['a', 'a', 'b', 'c', 'b', 'd', 'a', 'c', 'e', 'f', 'd']    # 測試集

word_count = Counter(test)    # 呼叫，傳參

print(word_count)    # 輸出：Counter({'a': 3, 'b': 2, 'c': 2, 'd': 2, 'f': 1, 'e': 1})

word_count.most_common(3)    # 獲取出現頻次前3的單詞

word_count['a']    # 獲取某個單詞的頻次

Counter還可以將兩個資料集進行數學運算。如下:

from collections import Counter

test = ['a', 'a', 'b', 'c', 'b', 'd', 'a', 'c', 'e', 'f', 'd']    # 測試集

test1 = ['a', 'b', 'c', 'd', 'e', 'f']    # 另一測試集

a = Counter(test)    # 統計test
b = Counter(test1)    # 統計test1

print(a)    # 輸出：Counter({'a': 3, 'b': 2, 'c': 2, 'd': 2, 'f': 1, 'e': 1})
print(b)    # 輸出：Counter({'b': 1, 'a': 1, 'f': 1, 'c': 1, 'd': 1, 'e': 1})

c = a + b    # 統計兩個資料集
print(c)    # 輸出：Counter({'a': 4, 'b': 3, 'c': 3, 'd': 3, 'f': 2, 'e': 2})

c = a - b    # Counter({'a': 2, 'b': 1, 'c': 1, 'd': 1})
c = b - a    # Counter()

heapq模組

heapq 模組提供了堆演算法。heapq是一種子節點和父節點排序的樹形資料結構。這個模組提供heap[k] <= heap[2*k+1] and heap[k] <= heap[2*k+2]。為了比較不存在的元素被人為是無限大的。堆最重要的特性就是heap[0]總是最小的那個元素。

nlargest/nsmallest

import heapq

"""簡單的資料集"""
numbers = [11,22,33,-9,0,5,-11]    # 測試資料集

heapq.nlargest(3,numbers)    # 獲得前3最大的元素

heapq.nsmallest(3,numbers)    # 獲得前3最小的元素

"""複雜的資料集"""
people_info = [
    {'name': "guzhenping", 'age':19, 'score':90},
    {'name': "xiao gu", 'age':21, 'score':100}
]

max_age = heapq.nlargest(1,people_info, key=lambda people_info: people_info['age'])    # 獲取最大年齡的個人

min_score = heapq.nsmallest(1, people_info, key=lambda info: info['score'])    # 獲取最低分數的個人

heapify
作用：對元素進行堆排序。保證最小的元素在為第一個元素。

import heapq
nums = [11, 22, 33, 44, 0, -1,20,-12]     # 測試資料集

heapq.heapify(nums)    # 轉化成堆排序的列表

print(nums)    # 輸出：[-12, 0, -1, 22, 11, 33, 20, 44]。

heapq.heappop(nums)    # 彈出最小的元素，同時讓第二小的元素變成第一小

heappop/heappush
heappop和heappush是在堆排序中常用的方法。heapq.heappop()作用：將第一個元素（最小的）彈出，然後將第二小的元素放在第一個。heapq.heappush()是插入操作。兩者複雜度o(logN),N代表堆中元素的數量。

以一個優先順序佇列進行舉例：

import heapq

class PriorityQueue:
    def __init__(self):
        self._queue = []
        self._index = 0

    def push(self, item, priority):
        heapq.heappush(self._queue, (priority, self._index, item))
        self._index += 1

    def pop(self):
        data = heapq.heappop(self._queue)
        print(data)
        return data[-1]

if __name__ == '__main__':
    q = PriorityQueue()

    q.push("guzhenping", 1)
    q.push("xiao gu", 3)
    q.push("xiao ping",1)

    # 列印測試
    while len(q._queue) != 0:
        print(q.pop())

結語

隨便整理一下，發現內容已經很多了。如果你沒有見過上述的常用函式，可以好好學習一下。

這裡還有很多沒說的內容：

operator.itemgetter()和operator.attrgetter()的使用，以及同lambda函式的區別。
collections中的namedtuple()、ChainMap()的使用
……

希望以後能再繼續。

2年Python開發經驗，但是，還有很多原理不懂。以前的不求甚解，變成了現在的知識瓶頸。所以，來啊，快活啊，一起進階Python啊！

有興趣和我一起提高Python技術的同學，歡迎加入微信群–高階Python打卡群。掃碼進入：

這裡寫圖片描述

也歡迎關注我的微信公眾平臺號：
這裡寫圖片描述

常用資料結構與演算法時間複雜度求解

1.0 資料結構的相關概念 2.0 一些基本演算法的時間複雜度 O(1)： int x=1; O(n)： for(int i = 0; i < n; i++){ printf("%d",i); } O(lo

強烈推薦一本免費演算法書《用Python解決資料結構與演算法問題》

學 Python 僅僅只學 Python 語法和 API 是遠遠不夠的，掌握演算法和資料結構這種永遠都不會過時的核心技能才是決定一個程式設計師職業發展的關鍵因素。演算法和資料結構對專業程式設計師來說重要性不言而喻，同樣一個問題，不同演算法效率可謂千差萬別。在問題規模很小的時候你可能感知不到，

面試常考的常用資料結構與演算法

資料結構與演算法，這個部分的內容其實是十分的龐大，要想都覆蓋到不太容易。在校學習階段我們可能需要對每種結構，每種演算法都學習，但是找工作筆試或者面試的時候，要在很短的時間內考察一個人這方面的能力，把每種結構和演算法都問一遍不太現實。所以，實際的情況是，企業一般考察一些看起來很基本的概念和演算法，或者是一些

筆試題目總結之二——常用資料結構與演算法

資料結構與演算法，這個部分的內容其實是十分的龐大，要想都覆蓋到不太容易。在校學習階段我們可能需要對每種結構，每種演算法都學習，但是找工作筆試或者面試的時候，要在很短的時間內考察一個人這方面的能力，把每種結構和演算法都問一遍不太現實。所以，實際的情況是，企業一般考察一些看起來

常用資料結構與演算法：二叉堆(binary heap)

一：什麼是二叉堆二：二叉堆的實現三：使用二叉堆的幾個例子一：什麼是二叉堆 1.1：二叉堆簡介二叉堆故名思議是一種特殊的堆，二叉堆具有堆的性質（父節點的鍵值總是大於或等於（小於或等於）任何一個子節點的鍵值），二叉堆又具有二叉樹的性質（二叉堆是完全二叉樹

JS常用資料結構與演算法--佇列

佇列遵循先進先出，後進後出原則的一組有序的項。例如:銀行排隊取錢，食堂排隊吃飯，先到佇列的人總是先取完錢和吃完飯。 function Queue(){ var items = []; //進隊，向隊尾新增新的項 this.enqueue =

Python版本的資料結構書_《用Python解決資料結構與演算法問題》

源於經典資料結構作為計算機從業人員的必備基礎，Java, c 之類的語言有很多這方面的書籍，Python 相對較少，其中比較著名的一本 problem-solving-with-algorithms-and-data-structure-using-pyt

高階Python----常用的資料結構與演算法

前言高階Python系列文章是筆者想要突破自己目前的技術生涯瓶頸而作，不具有普適性。本文主要是介紹Python在資料結構和演算法中常用的函式。這也是資料分析領域必備知識點。也不是特地為了某些讀者而作，想著提高自己的同時，能方便他人就更好了。懂分享的人，一定會快樂！

資料結構與演算法二分法查詢【Python與C】的實現

程式碼如下： Python： def ErFen(List ,Number ,Len): left = 0 high = Len - 1 while left <= high: mid = (left + high)//2

資料結構與演算法JavaScript描述讀書筆記（高階排序演算法）

希爾排序在插入排序的基礎上，只不過比較的步長不一樣，插入排序比較步長一直是1（即一個一個的比較）。希爾排序的步長第一次一般設定為gap=Math.floor(arr.length/2)，之後依次將步長設定為gap/2，直到步長變為1，這個時候徹底轉化成插入排測試時間普通排序演算法1

python 資料結構與演算法 day02 雙向連結串列

1.實現雙向連結串列 #_+_coding:utf-8_*_ #author: xuanxuan #Time : 2018/11/7 8:48 class Node(): def __init__(self,item): self.item=item

python 資料結構與演算法 day02 單向迴圈連結串列

1. 實現單向迴圈連結串列 class Node(): """定義結點""" def __init__(self,item): self.item=item self.next=None class SingleLoopLinkList(object):

Python-資料結構與演算法（十一、字典（對映）——基於兩種不同的底層實現）

保證一週更兩篇吧，以此來督促自己好好的學習！程式碼的很多地方我都給予了詳細的解釋，幫助理解。好了，幹就完了～加油！宣告：本python資料結構與演算法是imooc上liuyubobobo老師java資料結構的python改寫，並添加了一些自己的理解和新的東西，liuyubobobo

python 資料結構與演算法 day04 氣泡排序

1. 氣泡排序思路：可以看做按對高低不一的一組學生按照大小個排隊，校長從每次從頭開始走，觀察當前站的位置與後一個位置元素大小進行比較，如果比當前元素大，就交換兩者的位置，然後往後走一步，接著比較當前元素與後一個位置元素大小，重複剛才的過程，，，校長一次從頭走到尾的遍歷過程最大位置的元素跟著走到了最後，

python 資料結構與演算法 day04 選擇排序

1. 選擇排序原理：從後面無序序列中選出最小的元素放在有序序列的後面，第一次先把第一個位置元素作為比較的物件，從後面n-1個元素中選出最小的那個元素跟第一個位置元素進行交換，然後令第二個位置作為比較的物件，從後面n-2個元素中選最小的元素，跟第二個位置元素進行交換，，，以此類推；下面

python 資料結構與演算法 day04 插入排序

1. 插入排序原理：插入排序也是把序列分為有序序列和無序序列，首先把第一個元素（i=0位置）作為有序序列，比較i=1位置的第二個元素（其實也是待插入的元素）跟有序序列的元素進行比較（從後往前比較）如果比有序序列的元素小就進行交換，如果比有序序列的元素大，就不動，接著找無序序列的下一個待插入的元素，也是

Python 資料結構與演算法——列表（連結串列，linked list）

分享一下我老師大神的人工智慧教程！零基礎，通俗易懂！http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識，造福人民，實現我們中華民族偉大復興！

python 資料結構與演算法 day05 歸併排序

1.歸併排序思路：逐步把一個序列拆分，每次拆一半，直到拆成n個元素的序列，拆完之後開始合併，兩個兩個合併，合併完之後再四個一組合並，依次合併為原來長度的序列；整個過程使用遞迴 2. 程式碼實現 def merge_sort(L): """歸併排序""" i

python 資料結構與演算法 day05 二叉樹的深度優先遍歷（縱向）

1. 二叉樹深度優先遍歷三種方式不同於樹的廣度優先遍歷（一層一層的走，同一層從左到右走完開始走下一層的橫向遍歷方式），深度優先遍歷是一條路走到黑，然後再走下一條；先序遍歷：根節點--左子節點---右子節點（先從根節點開始，走左子樹，對這個左子樹依然按照根節點

python 資料結構與演算法之歸併演算法

def merge_sort(alist): n=len(alist) if n<=1: return alist mid=n//2 left_list =merge_sort(alist[:mid]) right_list =mer

高階Python----常用的資料結構與演算法

前言

collections模組

heapq模組

結語

相關推薦