1. 程式人生 > >你必須知道的8大資料結構,程式設計師面試

你必須知道的8大資料結構,程式設計師面試

有些面試題會明確提及某種資料結構,例如,“給定一個二叉樹。”而另一些則隱含在面試題中,例如,“我們希望記錄每個作者相關的書籍數量。”

什麼是資料結構?

簡單地說,資料結構是以某種特定的佈局方式儲存資料的容器。這種“佈局方式”決定了資料結構對於某些操作是高效的,而對於其他操作則是低效的。首先我們需要理解各種資料結構,才能在處理實際問題時選取最合適的資料結構。

為什麼我們需要資料結構?

資料是電腦科學當中最關鍵的實體,而資料結構則可以將資料以某種組織形式儲存,因此,資料結構的價值不言而喻。

無論你以何種方式解決何種問題,你都需要處理資料——無論是涉及員工薪水、股票價格、購物清單,還是隻是簡單的電話簿問題。

資料需要根據不同的場景,按照特定的格式進行儲存。有很多資料結構能夠滿足以不同格式儲存資料的需求。

常見的資料結構

首先列出一些最常見的資料結構,我們將逐一說明:

陣列

佇列

連結串列

字典樹(這是一種高效的樹形結構,但值得單獨說明)

散列表(雜湊表)

陣列

陣列是最簡單、也是使用最廣泛的資料結構。棧、佇列等其他資料結構均由陣列演變而來。下圖是一個包含元素(1,2,3和4)的簡單陣列,陣列長度為4。

640?wx_fmt=jpeg

每個資料元素都關聯一個正數值,我們稱之為索引,它表明陣列中每個元素所在的位置。大部分語言將初始索引定義為零。

以下是陣列的兩種型別:

一維陣列(如上所示)

多維陣列(陣列的陣列)

陣列的基本操作

Insert——在指定索引位置插入一個元素

Get——返回指定索引位置的元素

Delete——刪除指定索引位置的元素

Size——得到陣列所有元素的數量

面試中關於陣列的常見問題:

尋找陣列中第二小的元素

找到陣列中第一個不重複出現的整數

合併兩個有序陣列

重新排列陣列中的正值和負值

著名的撤銷操作幾乎遍佈任意一個應用。但你有沒有思考過它是如何工作的呢?這個問題的解決思路是按照將最後的狀態排列在先的順序,在記憶體中儲存歷史工作狀態(當然,它會受限於一定的數量)。這沒辦法用陣列實現。但有了棧,這就變得非常方便了。

可以把棧想象成一列垂直堆放的書。為了拿到中間的書,你需要移除放置在這上面的所有書。這就是LIFO(後進先出)的工作原理。

下圖是包含三個資料元素(1,2和3)的棧,其中頂部的3將被最先移除:

640?wx_fmt=jpeg

棧的基本操作

Push——在頂部插入一個元素

Pop——返回並移除棧頂元素

isEmpty——如果棧為空,則返回true

Top——返回頂部元素,但並不移除它

面試中關於棧的常見問題:

使用棧計算字尾表示式

對棧的元素進行排序

判斷表示式是否括號平衡

佇列

與棧相似,佇列是另一種順序儲存元素的線性資料結構。棧與佇列的最大差別在於棧是LIFO(後進先出),而佇列是FIFO,即先進先出。

一個完美的佇列現例項子:售票亭排隊隊伍。如果有新人加入,他需要到隊尾去排隊,而非隊首——排在前面的人會先拿到票,然後離開隊伍。

下圖是包含四個元素(1,2,3和4)的佇列,其中在頂部的1將被最先移除:

640?wx_fmt=jpeg

移除先入隊的元素、插入新元素

佇列的基本操作

Enqueue() —— 在佇列尾部插入元素

Dequeue() ——移除佇列頭部的元素

isEmpty()——如果佇列為空,則返回true

Top() ——返回佇列的第一個元素

面試中關於佇列的常見問題:

使用隊列表示棧

對佇列的前k個元素倒序

使用佇列生成從1到n的二進位制數

連結串列

連結串列是另一個重要的線性資料結構,乍一看可能有點像陣列,但在記憶體分配、內部結構以及資料插入和刪除的基本操作方面均有所不同。

連結串列就像一個節點鏈,其中每個節點包含著資料和指向後續節點的指標。 連結串列還包含一個頭指標,它指向連結串列的第一個元素,但當列表為空時,它指向null或無具體內容。

連結串列一般用於實現檔案系統、雜湊表和鄰接表。

這是連結串列內部結構的展示:

640?wx_fmt=png

連結串列包括以下型別:

單鏈表(單向)

雙向連結串列(雙向)

連結串列的基本操作:

InsertAtEnd - 在連結串列的末尾插入指定元素

InsertAtHead - 在連結列表的開頭/頭部插入指定元素

Delete  - 從連結列表中刪除指定元素

DeleteAtHead - 刪除連結列表的第一個元素

Search  - 從連結串列中返回指定元素

isEmpty - 如果連結串列為空,則返回true

面試中關於連結串列的常見問題:

反轉連結串列

檢測連結串列中的迴圈

返回連結串列倒數第N個節點

刪除連結串列中的重複項

圖是一組以網路形式相互連線的節點。節點也稱為頂點。 一對節點(x,y)稱為邊(edge),表示頂點x連線到頂點y。邊可以包含權重/成本,顯示從頂點x到y所需的成本。

640?wx_fmt=jpeg

圖的型別

無向圖

有向圖

在程式語言中,圖可以用兩種形式表示:

鄰接矩陣

鄰接表

常見圖遍歷演算法

廣度優先搜尋

深度優先搜尋

面試中關於圖的常見問題:

實現廣度和深度優先搜尋

檢查圖是否為樹

計算圖的邊數

找到兩個頂點之間的最短路徑

樹形結構是一種層級式的資料結構,由頂點(節點)和連線它們的邊組成。 樹類似於圖,但區分樹和圖的重要特徵是樹中不存在環路。

樹形結構被廣泛應用於人工智慧和複雜演算法,它可以提供解決問題的有效儲存機制。

這是一個簡單樹的示意圖,以及樹資料結構中使用的基本術語:

640?wx_fmt=jpeg

Root - 根節點

Parent - 父節點

Child - 子節點

Leaf - 葉子節點

Sibling - 兄弟節點

以下是樹形結構的主要型別:

N元樹

平衡樹

二叉樹

二叉搜尋樹

AVL樹

紅黑樹

2-3樹

其中,二叉樹和二叉搜尋樹是最常用的樹。

面試中關於樹結構的常見問題:

求二叉樹的高度

在二叉搜尋樹中查詢第k個最大值

查詢與根節點距離k的節點

在二叉樹中查詢給定節點的祖先節點

字典樹(Trie)

字典樹,也稱為“字首樹”,是一種特殊的樹狀資料結構,對於解決字串相關問題非常有效。它能夠提供快速檢索,主要用於搜尋字典中的單詞,在搜尋引擎中自動提供建議,甚至被用於IP的路由。

以下是在字典樹中儲存三個單詞“top”,“so”和“their”的例子:

640?wx_fmt=jpeg

這些單詞以頂部到底部的方式儲存,其中綠色節點“p”,“s”和“r”分別表示“top”,“thus”和“theirs”的底部。

面試中關於字典樹的常見問題:

計算字典樹中的總單詞數

列印儲存在字典樹中的所有單詞

使用字典樹對陣列的元素進行排序

使用字典樹從字典中形成單詞

構建T9字典(字典樹+ DFS )

散列表(雜湊表)

雜湊法(Hashing)是一個用於唯一標識物件並將每個物件儲存在一些預先計算的唯一索引(稱為“鍵(key)”)中的過程。因此,物件以鍵值對的形式儲存,這些鍵值對的集合被稱為“字典”。可以使用鍵搜尋每個物件。基於雜湊法有很多不同的資料結構,但最常用的資料結構是雜湊表。

雜湊表通常使用陣列實現。

雜湊資料結構的效能取決於以下三個因素:

雜湊函式

雜湊表的大小

碰撞處理方法

下圖為如何在陣列中對映雜湊鍵值對的說明。該陣列的索引是通過雜湊函式計算的。

640?wx_fmt=jpeg

面試中關於雜湊結構的常見問題:

在陣列中查詢對稱鍵值對

追蹤遍歷的完整路徑

查詢陣列是否是另一個數組的子集

檢查給定的陣列是否不相交

以上是在程式設計面試之前你應該知曉的八大資料結構。