【演算法和資料結構】平衡查詢樹之B樹

阿新 • • 發佈：2018-12-25

以B-樹的效能總是等價於二分查詢（與M值無關），也就沒有B樹平衡的問題；由於M/2的限制，在插入結點時，如果結點已滿，需要將結點分裂為兩個各佔M/2的結點；刪除結點時，需將兩個不足M/2的兄弟結點合併。

下面簡單說明分裂：

下面對B-樹進行實現

#pragma once

//3階B樹
template<class K, int M = 3>
struct BTreeNode
{
	K _keys[M];//儲存有M-1個key，多一個是為了方便分裂
	BTreeNode<K, M>* _subs[M + 1];//儲存有M個subs，多一個是為了方便分裂
	BTreeNode<K, M>* _parent;
	size_t _size;//陣列中存在的有效關鍵字的個數
	BTreeNode()
		:_parent(NULL)
		, _size(0)
	{
		int i = 0;
		for (; i <= M; ++i)
		{
			_keys[i] = 0;
			_subs[i] = NULL;
		}
		_keys[i] = 0;
	}
};
template<class K,class V>//結構體實現K,V形式
struct Pair
{
	K _first;
	V _second;
	Pair(const  K& key = k(), const V& value = V())
		:_first(key)
		, _second(value)
	{}
};
template<class K, int M = 3>
class BTree
{
	typedef BTreeNode<K, M> Node;
public:
	BTree()
		:_root(NULL)
	{}
	bool Insert(const K& key)//插入節點
	{
		if (_root == NULL)
		{
			_root = new Node;
			_root->_size++;
			_root->_keys[0] = key;
			return true;
		}

		Pair<Node*, int> ret= Find(key);
		if (ret._second != -1)//判斷key是否已經存在
			return false;
		//在節點cur中插入key和sub
		Node* cur = ret._first;
		K insertkey = key;
		Node* sub = NULL;
		while (1)
		{
			_InsertKey(cur, insertkey, sub);
			if (cur->_size < M)
				return true;
			//插入資料後，節點關鍵字個數大於M-1，需分裂節點，拷貝右半部分
			int mid = (cur->_size - 1) / 2;//找到中間值，進行上移
			int index = 0;
			Node* tmp = new Node;//tmp分裂出來的右半部分，左半部分在cur中

			//拷貝key和subs
			for (size_t i = mid + 1; i < cur->_size; ++i)
			{
				//拷貝key
				tmp->_keys[index++] = tmp->_keys[i];
				tmp->_size++;
				//拷貝subs
				tmp->_subs[index++] = cur->_subs[i];
				if (cur->_subs[i])
					cur->_subs[i]->_parent = tmp;
			}

			cur->_size = (cur->_size - 1) / 2;//更新cur（分裂後的左半部分）大小
			if (cur->_parent == NULL)//插入分裂後上移的元素
			{
				_root = new Node;
				_root->_keys[0] = cur->_keys[mid];
				_root->_size = 1;
				_root->_subs[0] = cur;
				_root->_subs[1] = tmp;

				cur->_parent = _root;
				tmp->_parent = _root;
				break;
			}
			else
			{
				insertkey = cur->_keys[mid];
				sub = tmp;
				cur = cur->_parent;//上移
			}
		}
		return true;
	}
	Pair<Node*, int> Find(const K& key) //查詢key,返回節點及對應節點中陣列下標
	{
		Node* parent = NULL;
		Node* cur = _root;
		while (cur)
		{
			size_t index = 0;
			while (index < cur->_size)//遍歷整個節點關鍵字
			{
				if (key == cur->_keys[index])
					return Pair<Node*, int>(cur, index);
				else if (key > cur->_keys[index])
					index++;
				else//小於_key[index] --> 結束迴圈，在_key[index]所在節點查詢
					break;
			}
			parent = cur;
			cur = cur->_subs[index];
		}
		return Pair<Node*, int>(parent, -1);//沒有找到，注意返回cur的父結點和-1
	}
	void InOrder()//中序遍歷輸出
	{
		_InOrder(_root);
	}
private:
	void _InsertKey(Node* cur,const K& key, Node* sub)//插入key值
	{
		int index = cur->_size - 1;//從後向前比較移位
		while (index >= 0 && key < cur->_keys[index])//後面的資料（包括_sub[]）向後移
		{
			cur->_keys[index + 1] = cur->_keys[index];
			cur->_subs[index + 2] = cur->_subs[index + 1];//畫圖分析，_subs[]移動兩位
			--index;
		}
		cur->_keys[index + 1] = key;
		cur->_subs[index + 2] = sub;
		if (sub)
			sub->_parent = cur;
		++cur->_size;
	}
	void _InOrder(Node* root)
	{
		if (root == NULL)
		{
			return;
		}
		for (int i = 0; i < _root->_size; ++i)
		{
			_InOrder(root->_subs[i]);
			cout << root->_keys[i] << " ";
		}
	}
protected:
	Node* _root;
};

void BTreeTest()
{
	int a[] = { 53, 75, 139, 49, 145, 36, 101 };
	BTree<int, 3> bt;
	for (int i = 0; i < sizeof(a) / sizeof(a[0]); ++i)
	{
		bt.Insert(a[i]);
	}
	bt.InOrder();
}

B+樹

B+樹是B-樹的變體，也是一種多路搜尋樹：

1.其定義基本與B-樹同，除了以下幾點不同。

2.非葉子結點的子樹指標與關鍵字個數相同；

3.非葉子結點的子樹指標P[i]，指向關鍵字值屬於[K[i], K[i+1])的子樹（B-樹是開區間）；

5.為所有葉子結點增加一個鏈指標；

6.所有關鍵字都在葉子結點出現；

B+的搜尋與B-樹也基本相同，區別是B+樹只有達到葉子結點才命中（B-樹可以在非葉子結點命中），其效能也等價於在關鍵字全集做一次二分查詢。

B*樹

B*樹是B+樹的變體，在B+樹的非根和非葉子結點再增加指向兄弟的指標。

【演算法和資料結構】平衡查詢樹之B樹

以B-樹的效能總是等價於二分查詢（與M值無關），也就沒有B樹平衡的問題；由於M/2的限制，在插入結點時，如果結點已滿，需要將結點分裂為兩個各佔M/2的結點；刪除結點時，需將兩個不足M/2的兄弟結點合併。下面簡單說明分裂：下面對B-樹進行實現 #pragma once //3階B樹 tem

淺談演算法和資料結構: 八平衡查詢樹之2-3樹

前面介紹了二叉查詢樹(Binary Search Tree)，他對於大多數情況下的查詢和插入在效率上來說是沒有問題的，但是他在最差的情況下效率比較低。本文及後面文章介紹的平衡查詢樹的資料結構能夠保證在最差的情況下也能達到lgN的效率，要實現這一目標我們需要保證樹在插入完成之後

淺談演算法和資料結構: 九平衡查詢樹之紅黑樹

前面一篇文章介紹了2-3查詢樹，可以看到，2-3查詢樹能保證在插入元素之後能保持樹的平衡狀態，最壞情況下即所有的子節點都是2-node，樹的高度為lgN，從而保證了最壞情況下的時間複雜度。但是2-3樹實現起來比較複雜，本文介紹一種簡單實現2-3樹的資料結構，即紅黑樹（

淺談演算法和資料結構: 十平衡查詢樹之B樹

前面講解了平衡查詢樹中的2-3樹以及其實現紅黑樹。2-3樹種，一個節點最多有2個key，而紅黑樹則使用染色的方式來標識這兩個key。維基百科對B樹的定義為“在電腦科學中，B樹（B-tree）是一種樹狀資料結構，它能夠儲存資料、對其進行排序並允許以O(log n)的時間複雜度執行進行查詢、順序讀取、插入和刪

【演算法與資料結構】二叉樹查詢

目錄概要樹的介紹二叉樹的介紹二叉查詢樹的C實現 1. 節點定義 2 遍歷 3. 查詢 4. 最大值和最小值 5. 前驅和後繼 6. 插入 7. 刪除 8. 列印 9. 銷燬二叉樹完整的實現程式碼二叉查詢樹的C測試程式下面對

【演算法與資料結構】連結串列

1.如何分別用連結串列和陣列實現LRU緩衝淘汰策略？ 1）什麼是快取？快取是一種提高資料讀取效能的技術，在硬體設計、軟體開發中都有著非廣泛的應用，比如常見的CPU快取、資料庫快取、瀏覽器快取等等。 2）為什麼使用快取？即快取的特點快取的大小是有限的，當快取被用滿時，哪些資料應該被清理出去，哪

【演算法與資料結構】陣列

陣列看起來簡單基礎，但是很多人沒有理解這個資料結構的精髓。帶著為什麼陣列要從0開始編號，而不是從1開始的問題，進入主題。 1. 陣列如何實現隨機訪問 1）陣列是一種線性資料結構，用連續的儲存空間儲存相同型別資料 I）線性表：陣列、連結串列、佇列、棧非線性表：樹圖 II）連續的記憶體空間

【演算法與資料結構】演算法複雜度分析

一、什麼是複雜度分析？ 1.資料結構和演算法解決是“如何讓計算機更快時間、更省空間的解決問題”。 2.因此需從執行時間和佔用空間兩個維度來評估資料結構和演算法的效能。 3.分別用時間複雜度和空間複雜度兩個概念來描述效能問題，二者統稱為複雜度。 4.複雜度描述的是演算法執行時間（或佔用空間）與資料

【演算法與資料結構】AVL樹

目錄概要 AVL樹的介紹 AVL樹的C實現 1. 節點 2. 旋轉 AVL樹的C實現(完整原始碼) AVL樹的C測試程式概要本章介紹AVL樹。和前面介紹"二叉查詢樹"的流程一樣，本章先對AVL樹的理論知識進行簡單介紹，然後給出C語言的實現。本篇實現的二叉

【演算法與資料結構】---------選擇排序

選擇排序是對氣泡排序的優化，其比對的次數並沒有減少，仍保持為O(n^2).減少了其氣泡排序的交換次數，從O(n^2)減少到O(n). 選擇排序在每一輪比較完之後，才進行位置交換。演算法分析：選擇排序最好和最壞的情況一樣運行了O(n^2).時間，但是選擇排

《常見演算法與資料結構》平衡查詢樹（1）—— 2-3查詢樹（附動畫）

本系列文章主要介紹常用的演算法和資料結構的知識，記錄的是《Algorithms I/II》課程的內容，採用的是“演算法（第4版）”這本紅寶書作為學習教材的，語言是java。這本書的名氣我不用多說吧？豆瓣評分9.4，我自己也認為是極好的學習演算法的書籍。

【演算法與資料結構】在n個數中取第k大的數（基礎篇）

題目介紹在n個數中取第k大的數（基礎篇），之所以叫基礎篇是因為還有很多更高階的演算法，這些以後再討論。本文用兩種最基本的方法來解決這個問題。使用java語言描述。例子是十個數中取第三大的。演算法

【面試心得】演算法和資料結構：查詢和排序

演算法和資料結構在面試中備受面試官的青睞，其中排序和查詢是面試中考察演算法的重點。在準備面試的時候，我們應該重點掌握二分查詢、快速排序和歸併排序，做到能隨時正確、完整地寫出程式碼。查詢和排序都是在程式設計中常用到的演算法。關於查詢演算法應該掌握：順序查詢、二分查詢、雜

【資料結構】平衡搜尋樹之---B樹的演算法實現

#include<iostream> using namespace std; #ifndef __BTREE_H__ #define __BTREE_H__ template<class K,int M=3>//設為三階B樹（每個陣列三個關鍵字

【專欄】- 演算法和資料結構C++實現

演算法和資料結構C++實現用C++實現各種資料結構和演算法，包括書本《演算法導論》《資料結構-嚴蔚敏》《演算法設計與分析》等的例子，和麵試常用演算法，經典演算法等。本專欄注重C++語言特徵，包括STL的用法。

查詢演算法淺談演算法和資料結構: 七二叉查詢樹淺談演算法和資料結構: 十一雜湊表

閱讀目錄 1. 順序查詢 2. 二分查詢 3. 插值查詢 4. 斐波那契查詢 5. 樹表查詢 6. 分塊查詢 7. 雜湊查詢　　查詢是在大量的資訊中尋找一個特定的資訊元素，在計算機應用中，查詢是常用的基本運算，例如編譯程式中符號表的查詢。本文

【演算法與資料結構專場】BitMap演算法介紹

我們先來看個簡單的問題。假如給你20億個非負數的int型整數，然後再給你一個非負數的int型整數 t ，讓你判斷t是否存在於這20億數中，你會怎麼做呢？有人可能會用一個int陣列，然後把20億個數給存進去，然後再迴圈遍歷一下就可以了。想一下，這樣的話，時間複雜度是O(n)，所需要的記憶體空間4byte *

【演算法與資料結構專場】BitMap演算法基本操作程式碼實現

上篇我們講了BitMap是如何對資料進行儲存的，沒看過的可以看一下【演算法與資料結構專場】BitMap演算法介紹這篇我們來講一下BitMap這個資料結構的程式碼實現。回顧下資料的儲存原理一個二進位制位對應一個非負數n，如果n存在，則對應的二進位制位的值為1，否則為0。這個時候，我們的第一個問題：我們在

【演算法與資料結構專場】二叉堆是什麼鬼？

什麼是二叉堆？二叉堆是一種特殊的堆。具有如下的特性：具有完全二叉樹的特性。堆中的任何一個父節點的值都大於等於它左右孩子節點的值，或者都小於等於它左右孩子節點的值。根據第二條特性，我們又可以把二叉堆分成兩類：1、最大堆：父節點的值大於等於左右孩子節點的值。 2、最小堆：父節點的值小於等於左右孩

【演算法與資料結構專場】堆排序是什麼鬼？

排序演算法相必大家都見過很多種，例如快速排序、歸併排序、氣泡排序等等。今天，我們就來簡單講講堆排序。在上一篇中，我們講解了二叉堆，今天的堆排序演算法主要就是依賴於二叉堆來完成的，不清楚二叉堆是什麼鬼的，可以看下：用輔助陣列來實現堆排序演算法假如給你一個二叉堆，根據二叉堆的特性，你會怎麼使用二叉堆

【演算法和資料結構】平衡查詢樹之B樹

相關推薦