1. 程式人生 > >JavaScript 資料結構與演算法之美 - 非線性表中的樹、堆是幹嘛用的 ?其資料結構是怎樣的 ?

JavaScript 資料結構與演算法之美 - 非線性表中的樹、堆是幹嘛用的 ?其資料結構是怎樣的 ?

1. 前言

想學好前端,先練好內功,內功不行,就算招式練的再花哨,終究成不了高手。

非線性表(樹、堆),可以說是前端程式設計師的內功,要知其然,知其所以然。

筆者寫的 JavaScript 資料結構與演算法之美 系列用的語言是 JavaScript ,旨在入門資料結構與演算法和方便以後複習。

非線性表中的樹、堆是幹嘛用的 ?其資料結構是怎樣的 ?

希望大家帶著這兩個問題閱讀下文。

2. 樹

的資料結構就像我們生活中的真實的樹,只不過是倒過來的形狀。

術語定義

  • 節點:樹中的每個元素稱為節點,如 A、B、C、D、E、F、G、H、I、J。
  • 父節點:指向子節點的節點,如 A。
  • 子節點:被父節點指向的節點,如 A 的孩子 B、C、D。
  • 父子關係:相鄰兩節點的連線,稱為父子關係,如 A 與 B,C 與 H,D 與 J。
  • 根節點:沒有父節點的節點,如 A。
  • 葉子節點:沒有子節點的節點,如 E、F、G、H、I、J。
  • 兄弟節點:具有相同父節點的多個節點稱為兄弟節點,如 B、C、D。
  • 節點的高度:節點到葉子節點的最長路徑所包含的邊數。
  • 節點的深度:根節點到節點的路徑所包含的邊數。
  • 節點層數:節點的深度 +1(根節點的層數是 1 )。
  • 樹的高度:等於根節點的高度。
  • 森林: n 棵互不相交的樹的集合。

高度是從下往上度量,比如一個人的身高 180cm ,起點就是從 0 開始的。
深度是從上往下度量,比如泳池的深度 180cm ,起點也是從 0 開始的。
高度和深度是帶有

字的,都是從 0 開始計數的。
而層數的計算,是和我們平時的樓層的計算是一樣的,最底下那層是第 1 層,是從 1 開始計數的,所以根節點位於第 1 層,其他子節點依次加 1。

二叉樹分類

二叉樹

  • 每個節點最多隻有 2 個子節點的樹,這兩個節點分別是左子節點和右子節點。如上圖中的 1、 2、3。
    不過,二叉樹並不要求每個節點都有兩個子節點,有的節點只有左子節點,有的節點只有右子節點。以此類推,自己想四叉樹、八叉樹的結構圖。

滿二叉樹

  • 一種特殊的二叉樹,除了葉子節點外,每個節點都有左右兩個子節點,這種二叉樹叫做滿二叉樹。如上圖中的 2。

完全二叉樹

  • 一種特殊的二叉樹,葉子節點都在最底下兩層,最後一層葉子節都靠
    排列,並且除了最後一層,其他層的節點個數都要達到最大,這種二叉樹叫做完全二叉樹。如上圖的 3。
    完全二叉樹與不是完全二叉樹的區分比較難,所以對比下圖看看。

之前的文章 棧記憶體與堆記憶體 、淺拷貝與深拷貝 中有說到:JavaScript 中的引用型別(如物件、陣列、函式等)是儲存在堆記憶體中的物件,值大小不固定,棧記憶體中存放的該物件的訪問地址指向堆記憶體中的物件,JavaScript 不允許直接訪問堆記憶體中的位置,因此操作物件時,實際操作物件的引用。

那麼到底是什麼呢 ?其資料結構又是怎樣的呢 ?

堆其實是一種特殊的樹。只要滿足這兩點,它就是一個堆。

  • 堆是一個完全二叉樹。
    完全二叉樹:除了最後一層,其他層的節點個數都是滿的,最後一層的節點都靠左排列。
  • 堆中每一個節點的值都必須大於等於(或小於等於)其子樹中每個節點的值。
    也可以說:堆中每個節點的值都大於等於(或者小於等於)其左右子節點的值。這兩種表述是等價的。

對於每個節點的值都大於等於子樹中每個節點值的堆,我們叫作大頂堆。對於每個節點的值都小於等於子樹中每個節點值的堆,我們叫作小頂堆

其中圖 1 和 圖 2 是大頂堆,圖 3 是小頂堆,圖 4 不是堆。除此之外,從圖中還可以看出來,對於同一組資料,我們可以構建多種不同形態的堆。

二叉查詢樹(Binary Search Tree)

  • 一種特殊的二叉樹,相對較小的值儲存在左節點中,較大的值儲存在右節點中,叫二叉查詢樹,也叫二叉搜尋樹。
    二叉查詢樹是一種有序的樹,所以支援快速查詢、快速插入、刪除一個數據。
    下圖中, 3 個都是二叉查詢樹,

平衡二叉查詢樹

  • 平衡二叉查詢樹:二叉樹中任意一個節點的左右子樹的高度相差不能大於 1。
    從這個定義來看,完全二叉樹、滿二叉樹其實都是平衡二叉樹,但是非完全二叉樹也有可能是平衡二叉樹。
    平衡二叉查詢樹中平衡的意思,其實就是讓整棵樹左右看起來比較對稱、比較平衡,不要出現左子樹很高、右子樹很矮的情況。這樣就能讓整棵樹的高度相對來說低一些,相應的插入、刪除、查詢等操作的效率高一些。
    平衡二叉查詢樹其實有很多,比如,Splay Tree(伸展樹)、Treap(樹堆)等,但是我們提到平衡二叉查詢樹,聽到的基本都是紅黑樹。

紅黑樹(Red-Black Tree)

紅黑樹中的節點,一類被標記為黑色,一類被標記為紅色。除此之外,一棵紅黑樹還需要滿足這樣幾個要求:

  • 根節點是黑色的。
  • 每個葉子節點都是黑色的空節點(NIL),也就是說,葉子節點不儲存資料。
  • 任何相鄰的節點都不能同時為紅色,也就是說,紅色節點是被黑色節點隔開的。
  • 每個節點,從該節點到達其可達葉子節點的所有路徑,都包含相同數目的黑色節點。

下面兩個都是紅黑樹。

儲存

完全二叉樹的儲存

  • 鏈式儲存
    每個節點由 3 個欄位,其中一個儲存資料,另外兩個是指向左右子節點的指標。
    我們只要拎住根節點,就可以通過左右子節點的指標,把整棵樹都串起來。
    這種儲存方式比較常用,大部分二叉樹程式碼都是通過這種方式實現的。

  • 順序儲存
    用陣列來儲存,對於完全二叉樹,如果節點 X 儲存在陣列中的下標為 i ,那麼它的左子節點的儲存下標為 2 * i ,右子節點的下標為 2 * i + 1,反過來,下標 i / 2 位置儲存的就是該節點的父節點。
    注意,根節點儲存在下標為 1 的位置。完全二叉樹用陣列來儲存是最省記憶體的方式。

二叉樹的遍歷

經典的方法有三種:前序遍歷、中序遍歷、後序遍歷。其中,前、中、後序,表示的是節點與它的左右子樹節點遍歷訪問的先後順序。

前序遍歷(根 => 左 => 右)

  • 對於樹中的任意節點來說,先訪問這個節點,然後再訪問它的左子樹,最後訪問它的右子樹。

中序遍歷(左 => 根 => 右)

  • 對於樹中的任意節點來說,先訪問它的左子樹,然後再訪問它的本身,最後訪問它的右子樹。

後序遍歷(左 => 右 => 根)

  • 對於樹中的任意節點來說,先訪問它的左子樹,然後再訪問它的右子樹,最後訪問它本身。

實際上,二叉樹的前、中、後序遍歷就是一個遞迴的過程。

時間複雜度:3 種遍歷方式中,每個節點最多會被訪問 2 次,跟節點的個數 n 成正比,所以時間複雜度是 O(n)。

實現二叉查詢樹

二叉查詢樹的特點是:相對較小的值儲存在左節點中,較大的值儲存在右節點中。

程式碼實現二叉查詢樹,方法有以下這些。

方法

  • insert(key):向樹中插入一個新的鍵。
  • search(key):在樹中查詢一個鍵,如果節點存在,則返回 true;如果不存在,則返回 false。
  • min:返回樹中最小的值/鍵。
  • max:返回樹中最大的值/鍵。
  • remove(key):從樹中移除某個鍵。

遍歷

  • preOrderTraverse:通過先序遍歷方式遍歷所有節點。
  • inOrderTraverse:通過中序遍歷方式遍歷所有節點。
  • postOrderTraverse:通過後序遍歷方式遍歷所有節點。

具體程式碼

  • 首先實現二叉查詢樹類的類
// 二叉查詢樹類
function BinarySearchTree() {
    // 用於例項化節點的類
    var Node = function(key){
        this.key = key; // 節點的健值
        this.left = null; // 指向左節點的指標
        this.right = null; // 指向右節點的指標
    };
    var root = null; // 將根節點置為null
}
  • insert 方法,向樹中插入一個新的鍵。
    遍歷樹,將插入節點的鍵值與遍歷到的節點鍵值比較,如果前者大於後者,繼續遞迴遍歷右子節點,反之,繼續遍歷左子節點,直到找到一個空的節點,在該位置插入。
this.insert = function(key){
    var newNode = new Node(key); // 例項化一個節點
    if (root === null){
        root = newNode; // 如果樹為空,直接將該節點作為根節點
    } else {
        insertNode(root,newNode); // 插入節點(傳入根節點作為引數)
    }
};
// 插入節點的函式
var insertNode = function(node, newNode){
    // 如果插入節點的鍵值小於當前節點的鍵值
    // (第一次執行insertNode函式時,當前節點就是根節點)
    if (newNode.key < node.key){
        if (node.left === null){
            // 如果當前節點的左子節點為空,就直接在該左子節點處插入
            node.left = newNode;
        } else {
            // 如果左子節點不為空,需要繼續執行insertNode函式,
            // 將要插入的節點與左子節點的後代繼續比較,直到找到能夠插入的位置
            insertNode(node.left, newNode);
        }
    } else {
        // 如果插入節點的鍵值大於當前節點的鍵值
        // 處理過程類似,只是insertNode函式繼續比較的是右子節點
        if (node.right === null){
            node.right = newNode;
        } else {
            insertNode(node.right, newNode);
        }
    }
}

在下圖的樹中插入健值為 6 的節點,過程如下:

  • 搜尋最小值
    在二叉搜尋樹裡,不管是整個樹還是其子樹,最小值一定在樹最左側的最底層。
    因此給定一顆樹或其子樹,只需要一直向左節點遍歷到底就行了。
this.min = function(node) {
    // min方法允許傳入子樹
    node = node || root;
    // 一直遍歷左側子節點,直到底部
    while (node && node.left !== null) {
        node = node.left;
    }
    return node;
};
  • 搜尋最大值
    搜尋最大值與搜尋最小值類似,只是沿著樹的右側遍歷。
this.max = function(node) {
    // min方法允許傳入子樹
    node = node || root;
    // 一直遍歷左側子節點,直到底部
    while (node && node.right !== null) {
        node = node.right;
    }
    return node;
};
  • 搜尋特定值
    搜尋特定值的處理與插入值的處理類似。遍歷樹,將要搜尋的值與遍歷到的節點比較,如果前者大於後者,則遞迴遍歷右側子節點,反之,則遞迴遍歷左側子節點。
this.search = function(key, node){
    // 同樣的,search方法允許在子樹中查詢值
    node = node || root;
    return searchNode(key, node);
};
var searchNode = function(key, node){
    // 如果node是null,說明樹中沒有要查詢的值,返回false
    if (node === null){
        return false;
    }
    if (key < node.key){
        // 如果要查詢的值小於該節點,繼續遞迴遍歷其左側節點
        return searchNode(node.left, key);
    } else if (key > node.key){
        // 如果要查詢的值大於該節點,繼續遞迴遍歷其右側節點
        return searchNode(node.right, key);
    } else {
        // 如果要查詢的值等於該節點,說明查詢成功,返回改節點
        return node;
    }
};
  • 移除節點
    移除節點,首先要在樹中查詢到要移除的節點,再判斷該節點是否有子節點、有一個子節點或者有兩個子節點,最後分別處理。
this.remove = function(key, node) {
    // 同樣的,允許僅在子樹中刪除節點
    node = node || root;
    return removeNode(key, node);
};
var self = this;
var removeNode = function(key, node) {
    // 如果 node 不存在,直接返回
    if (node === false) {
        return null;
    }

    // 找到要刪除的節點
    node = self.search(key, node);

    // 第一種情況,該節點沒有子節點
    if (node.left === null && node.right === null) {
        node = null;
        return node;
    }
    // 第二種情況,該節點只有一個子節點的節點
    if (node.left === null) {
        // 只有右節點
        node = node.right;
        return node;
    } else if (node.right === null) {
        // 只有左節點
        node = node.left;
        return node;
    }
    // 第三種情況,有有兩個子節點的節點
    // 將右側子樹中的最小值,替換到要刪除的位置
    // 找到最小值
    var aux = self.min(node.right);
    // 替換
    node.key = aux.key;
    // 刪除最小值
    node.right = removeNode(aux.key, node.right);
    return node;
};

第三種情況的處理過程,如下圖所示。
當要刪除的節點有兩個子節點時,為了不破壞樹的結構,刪除後要替補上來的節點的鍵值大小必須在已刪除節點的左、右子節點的鍵值之間,且替補上來的節點不應該有子節點,否則會產生一個節點有多個位元組點的情況,因此,找右側子樹的最小值替換上來。
同理,找左側子樹的最大值替換上來也可以。

  • 先序遍歷
this.preOrderTraverse = function(callback){
    // 同樣的,callback用於對遍歷到的節點做操作
    preOrderTraverseNode(root, callback);
};
var preOrderTraverseNode = function (node, callback) {
    // 遍歷到node為null為止
    if (node !== null) {
        callback(node.key); // 先處理當前節點
        preOrderTraverseNode(node.left, callback); // 再繼續遍歷左子節點
        preOrderTraverseNode(node.right, callback); // 最後遍歷右子節點
    }
};

用先序遍歷遍歷下圖所示的樹,並列印節點鍵值。
輸出結果:11 7 5 3 6 9 8 10 15 13 12 14 20 18 25。
遍歷過程如圖:

  • 中序遍歷
this.inOrderTraverse = function(callback){
    // callback用於對遍歷到的節點做操作
    inOrderTraverseNode(root, callback);
};
var inOrderTraverseNode = function (node, callback) {
    // 遍歷到node為null為止
    if (node !== null) {
        // 優先遍歷左邊節點,保證從小到大遍歷
        inOrderTraverseNode(node.left, callback);
        // 處理當前的節點
        callback(node.key);
        // 遍歷右側節點
        inOrderTraverseNode(node.right, callback);
    }
};

對下圖的樹做中序遍歷,並輸出各個節點的鍵值。
依次輸出:3 5 6 7 8 9 10 11 12 13 14 15 18 20 25。
遍歷過程如圖:

  • 後序遍歷
this.postOrderTraverse = function(callback){
    postOrderTraverseNode(root, callback);
};
var postOrderTraverseNode = function (node, callback) {
    if (node !== null) {
        postOrderTraverseNode(node.left, callback); //{1}
        postOrderTraverseNode(node.right, callback); //{2}
        callback(node.key); //{3}
    }
};

可以看到,中序、先序、後序遍歷的實現方式幾乎一模一樣,只是 {1}、{2}、{3} 行程式碼的執行順序不同。
對下圖的樹進行後序遍歷,並列印鍵值:3 6 5 8 10 9 7 12 14 13 18 25 20 15 11。
遍歷過程如圖:

  • 新增列印的方法 print。
this.print = function() {
  console.log('root :', root);
  return root;
};

完整程式碼請看檔案 binary-search-tree.html

測試過程:

// 測試
var binarySearchTree = new BinarySearchTree();
var arr = [11, 7, 5, 3, 6, 9, 8, 10, 15, 13, 12, 14, 20, 18, 25];
for (var i = 0; i < arr.length; i++) {
    var value = arr[i];
    binarySearchTree.insert(value);
}

console.log('先序遍歷:');
var arr = [];
binarySearchTree.preOrderTraverse(function(value) {
    // console.log(value);
    arr.push(value);
});
console.log('arr :', arr); // [11, 7, 5, 3, 6, 9, 8, 10, 15, 13, 12, 14, 20, 18, 25]

var min = binarySearchTree.min();
console.log('min:', min); // 3
var max = binarySearchTree.max();
console.log('max:', max); // 25
var search = binarySearchTree.search(10);
console.log('search:', search); // 10
var remove = binarySearchTree.remove(13);
console.log('remove:', remove); // 13

console.log('先序遍歷:');
var arr1 = [];
binarySearchTree.preOrderTraverse(function(value) {
    // console.log(value);
    arr1.push(value);
});
console.log('arr1 :', arr1); //  [11, 7, 5, 3, 6, 9, 8, 10, 15, 14, 12, 20, 18, 25]

console.log('中序遍歷:');
var arr2 = [];
binarySearchTree.inOrderTraverse(function(value) {
    // console.log(value);
    arr2.push(value);
}); 
console.log('arr2 :', arr2); // [3, 5, 6, 7, 8, 9, 10, 11, 12, 14, 15, 18, 20, 25]

console.log('後序遍歷:');
var arr3 = [];
binarySearchTree.postOrderTraverse(function(value) {
    // console.log(value);
    arr3.push(value);
});
console.log('arr3 :', arr3); //  [3, 6, 5, 8, 10, 9, 7, 12, 14, 18, 25, 20, 15, 11]

binarySearchTree.print(); // 看控制檯

結果如下:

看到這裡,你能解答文章的題目 非線性表中的樹、堆是幹嘛用的 ?其資料結構是怎樣的 ?

如果不能,建議再回頭仔細看看哦。

3. 最後

如果覺得本文還不錯,記得給個 star , 你的 star 是我持續更新的動力。

筆者 GitHub。

參考文章:

資料結構與演算法之美

學習JavaScript資料結構與演算法 —