【資料結構】B樹、B+樹與B*樹詳解

阿新 • • 發佈：2018-12-23

B樹

1.B樹的定義

B樹（B-tree）是對2-3樹資料結構的擴充套件，又稱為多路平衡查詢樹，它的一個節點可以擁有多於2個子節點的二叉查詢樹。與自平衡二叉查詢樹不同，
B樹是一種自平衡樹資料結構，可以保持資料排序，它能夠儲存資料、對其進行排序並允許以O(log n)的時間複雜度執行進行查詢、順序讀取、插入和刪除的資料結構
B樹針對讀寫大資料塊的系統進行了優化。B樹的演算法減少定位記錄時所經歷的中間過程，從而加快存取速度。普遍運用在資料庫和檔案系統。

注：有人說B-樹，其實就是B樹，因為B樹的原英文名稱為B-tree

2.B樹的性質

一棵m階的B 樹 (m叉樹)的性質

樹中每個結點最多含有m個孩子（m>=2）；
若根結點不是葉子結點，則至少有2個孩子
除根結點和葉子結點外，其它每個結點至少有[ceil(m / 2)]個孩子
所有葉子結點都出現在同一層，葉子結點不包含任何關鍵字資訊
每個非終端結點中包含有n個關鍵字資訊，並且以升序排列

B樹實示例圖
這裡寫圖片描述

注：小紅方塊表示這個17檔案內容在硬碟中的儲存位置；p1表示指向17左子樹的指標

3.B樹的插入與刪除

（1）插入的步驟

插入一個元素時，首先在B樹中是否存在，如果不存在，即在葉子結點處結束，然後在葉子結點中插入該新的元素
如果葉子結點空間足夠，這裡需要向右移動該葉子結點中大於新插入關鍵字的元素，如果空間滿了以致沒有足夠的空間去新增新的元素，則將該結點進行“分裂”，將一半數量的關鍵字元素分裂到新的其相鄰右結點中，中間關鍵字元素上移到父結點中（當然，如果父結點空間滿了，也同樣需要“分裂”操作），
當結點中關鍵元素向右移動了，相關的指標也需要向右移。如果在根結點插入新元素，空間滿了，則進行分裂操作，這樣原來的根結點中的中間關鍵字元素向上移動到新的根結點中，因此導致樹的高度增加一層

例項：構造一個包含C N G A H E K Q M F W L T Z D P R X Y S元素的5階B樹
（關鍵字小於2個就合併，超過4個就分裂）

1>結點空間足夠，4個字母插入相同的結點中

這裡寫圖片描述

2>插入H時，結點發現空間不夠，以致將其分裂成2個結點，移動中間元素G上移到新的根結點中，把A和C留在當前結點中，而H和N放置新的其右鄰居結點中

這裡寫圖片描述

3>插入E,K,Q時，不需要任何分裂操作

這裡寫圖片描述

4>插入M需要一次分裂，因為M恰好是中間關鍵字元素，所以向上移到父節點中

這裡寫圖片描述

5>插入F,W,L,T不需要任何分裂操作

這裡寫圖片描述

6>插入Z時，最右的葉子結點空間滿了，需要進行分裂操作，中間元素T上移到父節點中，注意通過上移中間元素，樹最終還是保持平衡，分裂結果的結點存在2個關鍵字元素。

這裡寫圖片描述

7>插入D時，導致最左邊的葉子結點被分裂，D恰好也是中間元素，上移到父節點中，然後字母P,R,X,Y陸續插入不需要任何分裂操作

這裡寫圖片描述

8>最後，當插入S時，含有N,P,Q,R的結點需要分裂，把中間元素Q上移到父節點中，但是情況來了，父節點中空間已經滿了，所以也要進行分裂，將父節點中的中間元素M上移到新形成的根結點中

這裡寫圖片描述

（2）刪除的步驟

首先查詢B樹中需刪除的元素,如果該元素在B樹中存在，則將該元素在其結點中進行刪除，
刪除該元素後，首先判斷該元素是否有左右孩子結點，如果有，則上移孩子結點中的某相近元素(“左孩子最右邊的節點”或“右孩子最左邊的節點”)到父節點中，然後是移動之後的情況；如果沒有，直接刪除後，移動之後的情況。
刪除元素，移動相應元素之後，如果某結點中元素數目（即關鍵字數）小於ceil(m/2)-1，則需要看其某相鄰兄弟結點是否豐滿（結點中元素個數大於ceil(m/2)-1）
如果豐滿，則向父節點借一個元素來滿足條件；如果其相鄰兄弟都剛脫貧，即借了之後其結點數目小於ceil(m/2)-1，則該結點與其相鄰的某一兄弟結點進行“合併”成一個結點，以此來滿足條件。

例項：刪除B樹中的h、r、p、d元素

這裡寫圖片描述

B+樹

1.B+樹的定義

B+-tree是應檔案系統所需而產生的一種B-tree的變形樹。

2.B+樹與B樹區別

B+樹中有n棵子樹的結點中含有n個關鍵字，而B 樹是n棵子樹有n-1個關鍵字
B+樹所有的葉子結點中包含了全部關鍵字的資訊，及指向含有這些關鍵字記錄的指標，所有的葉子結點和相連的節點使用連結串列按從小到大的順序相連，便於區間查詢和遍歷。而B 樹的葉子節點並沒有包括全部需要查詢的資訊。
B+樹所有的非終端結點可以看成是索引部分，結點中僅含有其子樹根結點中最大（或最小）關鍵字。 (而B 樹的非終節點也包含需要查詢的有效資訊)
B+樹的葉子結點都是相鏈的，因此對整棵樹的便利只需要一次線性遍歷葉子結點即可。而B樹則需要進行每一層的遞迴遍歷。相鄰的元素可能在記憶體中不相鄰，所以快取命中性沒有B+樹好。
B+樹在內部節點上不包含資料資訊，因此在記憶體頁中能夠存放更多的key。資料存放的更加緊密，具有更好的空間區域性性。因此訪問葉子幾點上關聯的資料也具有更好的快取命中率。B樹的優點：由於B樹的每一個節點都包含key和value，因此經常訪問的元素可能離根節點更近，因此訪問也更迅速。

B+樹示例圖
這裡寫圖片描述

**B*樹**

**1.B*樹的定義**

B*-tree是B+-tree的變體，在B+ 樹非根和非葉子結點再增加指向兄弟的指標

**2.B*樹的性質**

B*樹定義了非葉子結點關鍵字個數至少為(2/3)*M，即塊的最低使用率為2/3（代替B+樹的1/2）
B+樹的分裂：當一個結點滿時，分配一個新的結點，並將原結點中1/2的資料複製到新結點，最後在父結點中增加新結點的指標；B+樹的分裂隻影響原結點和父結點，而不會影響兄弟結點，所以它不需要指向兄弟的指標。
B*樹的分裂：當一個結點滿時，如果它的下一個兄弟結點未滿，那麼將一部分資料移到兄弟結點中，再在原結點插入關鍵字，最後修改父結點中兄弟結點的關鍵字（因為兄弟結點的關鍵字範圍改變了）；如果兄弟也滿了，則在原結點與兄弟結點之間增加新結點，並各複製1/3的資料到新結點，最後在父結點增加新結點的指標。
B*樹分配新結點的概率比B+樹要低，空間使用率更高；

B*樹示例圖
這裡寫圖片描述

B樹和B+樹的應用場景

1.檔案儲存系統

在B+樹中，內節點只儲存導航用到的key，並不儲存具體值，這樣內節點個數較少，能夠全部讀取到主存中，外接點儲存key及值，並且順序排列，具有良好的空間區域性性。所以B及B+樹比較適合與檔案系統的資料結構。

2.資料庫系統

Mysql的MyISAM和InnoDB兩個儲存引擎的索引實現方式：

MyISAM
- MyISAM引擎使用B+ Tree作為索引結構，葉節點存放的是資料記錄的地址。
- MyISAM引擎的輔助索引（二級索引）和主索引在結構上沒有區別，只是輔助索引的key可以重複，葉節點上存放的也是資料記錄的地址。
- MyISAM索引檔案和資料檔案是分離的，索引檔案僅儲存資料記錄的地址。
InnoDB
- InnoDB中表資料本身就是按B+ Tree組織的一個索引結構，葉節點存放的就不是資料記錄的地址，而是完整的資料記錄。所以InnoDB這種儲存方式，又稱為聚集索引，使得按主鍵的搜尋十分高效，但二級索引搜尋需要檢索兩遍索引：首先二級索引獲得主鍵，然後用主鍵到主索引中檢索到資料記錄。
- 因為主鍵是InnoDB表記錄的”邏輯地址“，所以InnoDB要求表必須有主鍵，MyISAM可以沒有。

本人才疏學淺，若有錯，請指出
謝謝！

參考資料：

【資料結構】順序表、單鏈表、迴圈連結串列的插入與刪除

寫在前面的順序表插入刪除定位單鏈表插入刪除總結寫在前面的在複習資料結構的過程中對於連結串列的操作總是容易忘記，時不時的就不知道具體的該怎麼

【資料結構】B樹、B+樹與B*樹詳解

B樹 1.B樹的定義 B樹（B-tree）是對2-3樹資料結構的擴充套件，又稱為多路平衡查詢樹，它的一個節點可以擁有多於2個子節點的二叉查詢樹。與自平衡二叉查詢樹不同， B樹是一種自平衡樹資料結構，可以保持資料排序，它能夠儲存資料、對其進行排序並允許以

【資料結構】B樹、B+樹詳解

B樹前言　　　　首先，為什麼要總結B樹、B+樹的知識呢？最近在學習資料庫索引調優相關知識，資料庫系統普遍採用B-/+Tree作為索引結構（例如mysql的InnoDB引擎使用的B+樹），理解不透徹B樹，則無法理解資料庫的索引機制；接下來將用最簡潔直白的內容來了解B樹、B+樹的資料結構　　另外，B-

【資料結構】B樹和B+樹講解

一、B樹 1、B樹的定義 B樹是一種平衡的多分樹，通常我們說m階的B樹，它必須滿足如下條件：（1）每個結點至多有m個子結點；（2）除根結點和葉結點外，其它每個結點至少有個子結點；（3）若根結點不是葉子結點，則至少有兩個子結點；

【資料結構】【Java】B樹和B+樹區別

B樹和B+樹 1. B樹的定義: 1970年，R.Bayer和E.mccreight提出了一種適用於外查詢的樹，它是一種平衡的多叉樹，稱為B樹，其定義如下：一棵m階的B樹滿足下列條件： ⑴ 樹中每個結點至多有m個孩子； ⑵ 除根結點和葉子結點

【資料結構】B樹/B+樹

本篇博文旨在介紹一種適合外查詢的樹---B樹，以及B樹的延伸B+樹；比較了B樹和B+樹的各自優缺點；說明了B樹B+樹的應用場景；以及實現了B樹的程式碼 B樹 B樹的概念和性質 B樹是一種適合外查詢的樹，它是一種多叉平衡樹除此之外，它還滿足如下的性質：（1）根節點有至少

【資料結構】平衡搜尋樹之---B樹的演算法實現

#include<iostream> using namespace std; #ifndef __BTREE_H__ #define __BTREE_H__ template<class K,int M=3>//設為三階B樹（每個陣列三個關鍵字

【資料結構】淺析B樹

一、B樹的概念 B樹，概括來說是一個節點可以擁有多於2個子節點的平衡多叉樹。特點： 1> 根節點至少有兩個子節點 2>每個非跟節點節點有(M/2)-1至M-1個key 3>每個非根節點有[M/2 ,M]個孩子 4>key[i]和key[i+1]之間

【資料結構】樹（四）：B樹（C++實現）

> 《演算法導論》學習基本介紹 B樹是為磁碟或者其他直接存取的輔助儲存（secondary storage）裝置而設計的平衡搜尋樹。B樹類似於紅黑樹，但是在降低磁碟I/O運算元方面表現更好。許多資料庫系統使用B樹或其變種來儲存資訊。一個

【資料結構】資料結構探索（四）—— 紅黑樹（R-B Tree）

紅黑樹，一種二叉查詢樹，但在每個結點上增加一個儲存位表示結點的顏色，可以是Red或Black。紅黑樹有五個性質：性質1. 節點是紅色或黑色。性質2. 根節點是黑色。性質3 每個葉節點（NIL節點，空節點）是黑色的。性質4 每

3、【資料結構】樹形結構之二叉查詢樹

一、樹的介紹 1. 樹的定義樹是一種資料結構，它是由n（n>=1）個有限節點組成一個具有層次關係的集合。　　把它叫做“樹”是因為它看起來像一棵倒掛的樹，也就是說它是根朝上，而葉朝下的。它具有以下的特點：　　(1) 每個節點有零個或多個子節點；

【資料結構】二叉搜尋樹(增、刪、查)的遞迴與非遞迴實現

前言：二叉搜尋樹是二叉樹中的一種特殊結構，具有如下的性質： ➢每個節點都有一個作為搜尋依據的關鍵碼（key），所有節點的關鍵碼互不相同。 ➢左子樹上所有節點的關鍵碼（key）都小於根節點的關鍵碼（key）。 ➢右子樹上所有節點的關鍵碼（key）都大於根節點的關鍵碼

平衡二叉樹的C語言實現（建立、插入、查詢、刪除、旋轉）【資料結構】

平衡二叉樹(AVL)或者是一顆空樹，或者是具有下列性質的非空二叉搜尋樹： (1). 任一結點的左、右子樹均為AVL樹； (2). 任一結點的左、右子樹高度差的絕對值不超過1。對於二叉樹中任一結點T，其“平衡因子”(Balance Factor, BF)定義為BF(T)

【資料結構】陣列、連結串列、棧、佇列、二叉樹

陣列陣列儲存的資料在地址空間上是連續的。方便資料的查詢，查詢資料的時間複雜度為O(1）。連結串列連結串列儲存的資料在地址空間上可連續，可不連續。連結串列中的每一個節點都

【資料結構】高效雙向連結串列list、樹tree（二叉樹）

vi正常模式下： "shift + g" 跳到最後一行 "gg" 跳到第一行 <效率更高的雙向連結串列結構程式碼>/*程式碼*/ 01link.c #include <stdlib.h> #include "01link.h" //連結串列初始化 v

【資料結構】二叉樹（順序儲存、鏈式儲存）的JAVA程式碼實現

二叉樹是一種非線性的資料結構。它是由n個有限元素的集合，該集合或者為空、或者由一個稱為根(root)的元素及兩顆不相交的、被分別稱為左子樹、右子樹的二叉樹組成。當集合為空時，稱該二叉樹為空二叉樹。在二叉樹中，一個元素也可以稱做一個結點。二叉樹是有序的，即若將其左右兩個子樹顛倒

【資料結構】—— 1、不要小瞧陣列

2-1、使用Java中的陣列 2-2 二次封裝屬於我們自己的陣列 2-3 向陣列中新增元素 2-4 陣列中查詢元素和修改元素 2-5 包含，搜尋和刪除 2-6 使用泛型 2-7 動態陣列 2-8 簡單的複雜度分析 2-9 均攤複雜度和防止複雜度的震盪

【資料結構】二叉樹的相關操作（待更）

#include "stdio.h" #include "stdlib.h" typedef struct node { char data; struct node *rchild,*lchild; }bintnode; typedef bintnode *bintree;//指向該結構體

【資料結構】【線段樹】2018國慶三校聯考D5T3

題意：分析：有一個顯然的暴力方法：對每個詢問，從左往右做一次，記錄字首和，當某個位置字首和為負後，則刪去當前點。再從右往左做一次。考慮使這個過程變得高效：可以將詢問按左端點從右往左排序，然後用棧依次處理每個在從左往右考慮時是否需要刪除。再利用線段樹，求

【資料結構】二叉樹的建立和遍歷（非遞迴）

該程式使用的是遞迴地建立方法，以及非遞迴的遍歷演算法執行環境：Dev-C++ #include <stdio.h> #include <stdlib.h> typedef struct node{ char data; struct node *lchild

【資料結構】B樹、B+樹與B*樹詳解

B樹

1.B樹的定義

2.B樹的性質

3.B樹的插入與刪除

B+樹

1.B+樹的定義

2.B+樹與B樹區別

B*樹

1.B*樹的定義

2.B*樹的性質

B樹和B+樹的應用場景

1.檔案儲存系統

2.資料庫系統

相關推薦

**B*樹**

**1.B*樹的定義**

**2.B*樹的性質**