平衡二叉樹(AVL)的插入和刪除詳解(上)
在電腦科學中,AVL樹是最先發明的自平衡二叉查詢樹。在AVL樹中任何節點的兩個子樹的高度最大差別為1,所以它也被稱為高度平衡樹。查詢、插入和刪除在平均和最壞情況下都是O(log n)。增加和刪除可能需要通過一次或多次樹旋轉來重新平衡這個樹。AVL樹得名於它的發明者G.M. Adelson-Velsky和E.M. Landis,他們在1962年的論文《An algorithm for the organization of information》中發表了它。
原理請看上面維基百科詞條,可以參考嚴蔚敏資料結構或其它書籍,這裡就不對原理做過多解釋了,下面將直接給出其實現,程式碼有詳細註釋。
1、基本約定
使用平衡二叉樹就是為了高效的查詢,一般是根據關鍵字查詢記錄,而記錄一般是複雜的型別物件。這裡我們以一個Student類作為記錄型別,學號作為關鍵字。
我們假定所使用的元素型別,都能進行各種比較和賦值。用LH,EH,RH分別表示左子樹高,等高,右子樹高,即平衡因子-1、0、1。
#define LH +1 //左高 #define EH 0 //等高 #define RH -1 //右高 #define EQ(a,b) ((a) == (b)) #define LT(a,b) ((a) < (b)) #define LQ(a,b) ((a) <= (b)) //結點元素型別 typedef struct Student { int key; string major; Student(){} Student(int k,string s) : key(k), major(s){} }ElementType; ostream& operator<<(ostream& out, const Student& s) { out<<"("<<s.key<<","<<s.major<<")"; return out; } istream& operator>>(istream& in,Student& s) { in>>s.key>>s.major; } typedef int KeyType;//關鍵字型別 typedef struct AVLNode { ElementType data; int bf; struct AVLNode* lchild; struct AVLNode* rchild; AVLNode(){} AVLNode(ElementType& e, int ibf=EH, AVLNode* lc=NULL, AVLNode* rc=NULL) : data(e), bf(ibf), lchild(lc),rchild(rc){} }AVLNode, *AVL;
2、初始化、銷燬
/*
*Description: 初始化(其實可以不用)
*/
void initAVL(AVL& t)
{
t = NULL;
}
/*
*Description: 銷燬平衡二叉樹
*/
void destroyAVL(AVL& t)
{
if(t)
{
destroyAVL(t->lchild);
destroyAVL(t->rchild);
delete t;
t = NULL;
}
}
3、遍歷和查詢//前序遍歷 void preOrderTraverse(AVL t) { if(t) { cout<<t->data<<" "; preOrderTraverse(t->lchild); preOrderTraverse(t->rchild); } } //中序遍歷 void inOrderTraverse(AVL t) { if(t) { inOrderTraverse(t->lchild); cout<<t->data<<" "; inOrderTraverse(t->rchild); } } //以前序和中序輸出平衡二叉樹 void printAVL(AVL t) { cout<<"inOrder: "<<endl; inOrderTraverse(t); cout<<endl; cout<<"preOrder: "<<endl; preOrderTraverse(t); cout<<endl; } /* Description: 在根指標t所指平衡二叉樹中遞迴地查詢某關鍵字等於key的資料元素, 若查詢成功,則返回指向該資料元素結點的指標,否則返回空指標。 根據需要,也可以返回一個bool值 */ AVLNode* searchAVL(AVL& t, KeyType key) { if((t == NULL)||EQ(key,t->data.key)) return t; else if LT(key,t->data.key) /* 在左子樹中繼續查詢 */ return searchAVL(t->lchild,key); else return searchAVL(t->rchild,key); /* 在右子樹中繼續查詢 */ }
4、旋轉處理
左旋和右旋,大家記住“左逆右順”就可以了。
(1)左旋-逆時針旋轉(如RR型就得對根結點做該旋轉)
/*
Description:
對以*p為根的二叉排序樹作左旋處理,處理之後p指向新的樹根結點,即旋轉
處理之前的右子樹的根結點。也就是書上說說的RR型.
*/
void L_Rotate(AVLNode* &p)
{
AVLNode * rc = NULL;
rc = p->rchild; //rc指向p的右子樹根結點
p->rchild = rc->lchild;//rc的左子樹掛接為p的右子樹
rc->lchild = p;
p = rc; //p指向新的根結點
}
(2)右旋-順時針旋轉(如LL型就得對根結點做該旋轉)
/*
Description:
對以*p為根的二叉排序樹作右旋處理,處理之後p指向新的樹根結點,即旋轉
處理之前的左子樹的根結點。也就是書上說說的LL型.
*/
void R_Rotate(AVLNode* &p)
{
AVLNode * lc = NULL;
lc = p->lchild; //lc指向p的左子樹根結點
p->lchild = lc->rchild; //lc的右子樹掛接為p的左子樹
lc->rchild = p;
p = lc; //p指向新的根結點
}
5、左平衡處理
所謂左平衡處理,就是某一根結點的左子樹比右子樹過高,從而失去了平衡。
(1)插入時如果需要左平衡處理,根結點左子樹根平衡因子只可能為LH和RH。
(2)刪除和插入不同,根結點左子樹根的平衡因子三種情況都可能出現,因為是刪除根結點右子樹中的結點從而引起左子樹過高,在刪除前,根結點左子樹根的平衡因子是可以為EH的,此種情況同樣是對根結點做簡單右旋處理。
/*對以指標t所指結點為根的二叉樹作左平衡旋轉處理
包含LL旋轉和LR旋轉兩種情況
平衡因子的改變其實很簡單,自己畫圖就出來了
*/
void leftBalance(AVLNode* &t)
{
AVLNode* lc = NULL;
AVLNode* rd = NULL;
lc = t->lchild;
switch(lc->bf)
{
case LH: //LL旋轉
t->bf = EH;
lc->bf = EH;
R_Rotate(t);
break;
case EH: //deleteAVL需要,insertAVL用不著
t->bf = LH;
lc->bf = RH;
R_Rotate(t);
break;
case RH: //LR旋轉
rd = lc->rchild;
switch(rd->bf)
{
case LH:
t->bf = RH;
lc->bf = EH;
break;
case EH:
t->bf = EH;
lc->bf = EH;
break;
case RH:
t->bf = EH;
lc->bf = LH;
break;
}
rd->bf = EH;
L_Rotate(t->lchild);//不能寫L_Rotate(lc);採用的是引用引數
R_Rotate(t);
break;
}
}
6、右平衡處理
類似左平衡處理,所謂右平衡處理,就是某一根結點的右子樹比左子樹過高,從而失去了平衡。
(1)插入時如果需要右平衡處理,根結點右子樹根平衡因子只可能為LH和RH。
(2)刪除和插入不同,根結點右子樹根的平衡因子三種情況都可能出現,因為是刪除根結點左子樹中的結點從而引起右子樹過高,在刪除前,根結點右子樹根的平衡因子是可以為EH的,此種情況同樣是對根結點做簡單左旋處理。
/*對以指標t所指結點為根的二叉樹作右平衡旋轉處理
包含RR旋轉和RL旋轉兩種情況
*/
void rightBalance(AVLNode* &t)
{
AVLNode* rc = NULL;
AVLNode *ld = NULL;
rc = t->rchild;
switch(rc->bf)
{
case LH: //RL旋轉
ld = rc->lchild;
switch(ld->bf)
{
case LH:
t->bf = EH;
rc->bf = RH;
break;
case EH:
t->bf = EH;
rc->bf = EH;
break;
case RH:
t->bf = LH;
rc->bf = EH;
break;
}
ld->bf = EH;
R_Rotate(t->rchild);//不能寫R_Rotate(rc);採用的是引用引數
L_Rotate(t);
break;
case EH: //deleteAVL需要,insertAVL用不著
t->bf = RH;
rc->bf = LH;
L_Rotate(t);
break;
case RH: //RR旋轉
t->bf = EH;
rc->bf = EH;
L_Rotate(t);
break;
}
}
7、插入處理
在插入一個元素時,總是插入在一個葉子結點上。我們採用遞迴插入,也就是不斷搜尋平衡二叉樹,找到一個合適的插入點(當然相同關鍵字不插入)。插入後,引起的第一個不平衡的子樹的根結點,一定是在查詢路徑上離該插入點最近的,注意看程式碼中遞迴後的回溯。
/*
若在平衡的二叉排序樹t中不存在和e有相同關鍵字的結點,則插入一個
資料元素為e的新結點,並返回true,否則返回false。若因插入而使二叉排序樹
失去平衡,則作平衡旋轉處理,布林變數taller反映t長高與否
*/
bool insertAVL(AVL& t, ElementType& e, bool& taller)
{
if(t == NULL)
{
t = new AVLNode(e); //插入元素
taller = true;
}
else
{
if(EQ(e.key, t->data.key)) //樹中已含該關鍵字,不插入
{
taller = false;
return false;
}
else if(LT(e.key, t->data.key))//在左子樹中查詢插入點
{
if(!insertAVL(t->lchild, e, taller))//左子樹插入失敗
{
return false;
}
if(taller) //左子樹插入成功,且左子樹增高
{
switch(t->bf)
{
case LH: //原來t的左子樹高於右子樹
leftBalance(t); //做左平衡處理
taller = false;
break;
case EH: //原來t的左子樹和右子樹等高
t->bf = LH; //現在左子樹比右子樹高
taller = true; //整棵樹增高了
break;
case RH: //原來t的右子樹高於左子樹
t->bf = EH; //現在左右子樹等高
taller = false;
break;
}
}
}
else //在右子樹中查詢插入點
{
if(!insertAVL(t->rchild, e, taller))//右子樹插入失敗
{
return false;
}
if(taller) //右子樹插入成功,且右子樹增高
{
switch(t->bf)
{
case LH: //原來t的左子樹高於右子樹
t->bf = EH;
taller = false;
break;
case EH: //原來t的左子樹和右子樹等高
t->bf = RH;
taller = true;
break;
case RH: //原來t的右子樹高於左子樹
rightBalance(t);//做右平衡處理
taller = false;
break;
}
}
}
}
return true; //插入成功
}
8、刪除處理
刪除和插入不同的是,刪除的結點不一定是葉子結點,可能是樹中的任何一個結點。前面在講解二叉查詢樹時,我們知道刪除的結點可能有三種情況:(1)為葉子結點,(2)左子樹或右子樹有一個為空,(3)左右子樹都不空。對第三種情況的處理我們介紹了三種處理方式,這裡我們採用刪除前驅的方式。注意到我們仍然採用的是遞迴刪除,然後判斷刪除後樹是否“變矮”了,然後進行相應的處理。對(1)(2)中情況,很好處理,樹的確是“變矮”了。對於第(3)種情況,我們不能直接找到前驅結點,然後把資料拷貝到原本要刪除的根結點,最後直接刪除前驅結點。因為這麼做,我們無法判斷原先根結點子樹高度的變化情況。所以我們在找到前驅結點後,不是直接刪除,而是採用在根結點左子樹中遞迴刪除前驅的方式。
/*
若在平衡的二叉排序樹t中存在和e有相同關鍵字的結點,則刪除之
並返回true,否則返回false。若因刪除而使二叉排序樹
失去平衡,則作平衡旋轉處理,布林變數shorter反映t變矮與否
*/
bool deleteAVL(AVL& t, KeyType key, bool& shorter)
{
if(t == NULL) //不存在該元素
{
return false; //刪除失敗
}
else if(EQ(key, t->data.key)) //找到元素結點
{
AVLNode* q = NULL;
if(t->lchild == NULL) //左子樹為空
{
q = t;
t = t->rchild;
delete q;
shorter = true;
}
else if(t->rchild == NULL) //右子樹為空
{
q = t;
t = t->lchild;
delete q;
shorter = true;
}
else //左右子樹都存在,
{
q = t->lchild;
while(q->rchild)
{
q = q->rchild;
}
t->data = q->data;
deleteAVL(t->lchild, q->data.key, shorter); //在左子樹中遞迴刪除前驅結點
}
}
else if(LT(key, t->data.key)) //左子樹中繼續查詢
{
if(!deleteAVL(t->lchild, key, shorter))
{
return false;
}
if(shorter)
{
switch(t->bf)
{
case LH:
t->bf = EH;
shorter = true;
break;
case EH:
t->bf = RH;
shorter = false;
break;
case RH:
rightBalance(t); //右平衡處理
if(t->rchild->bf == EH)//注意這裡,畫圖思考一下
shorter = false;
else
shorter = true;
break;
}
}
}
else //右子樹中繼續查詢
{
if(!deleteAVL(t->rchild, key, shorter))
{
return false;
}
if(shorter)
{
switch(t->bf)
{
case LH:
leftBalance(t); //左平衡處理
if(t->lchild->bf == EH)//注意這裡,畫圖思考一下
shorter = false;
else
shorter = true;
break;
case EH:
t->bf = LH;
shorter = false;
break;
case RH:
t->bf = EH;
shorter = true;
break;
}
}
}
return true;
}
注:
(1)在平衡二叉樹(AVL)插入和刪除詳解(下)中給出測試程式碼和測試用例,並給出了一個涵蓋所有情況的圖例。
(2)也許大家難以理解的是插入和刪除過程中,平衡因子的變化。其實,插入和刪除都是遞迴進行的,平衡因子的變化是在遞歸回溯過程中,自底向上改變的,至於怎麼改變,把幾種情況弄清楚之後,畫圖就出來了。
參考資料:
[1]嚴蔚敏 資料結構(C語言版)