1. 程式人生 > >【資料結構】線段樹(Segment Tree)

【資料結構】線段樹(Segment Tree)

 

假設我們現在拿到了一個非常大的陣列,對於這個數組裡面的數字要反覆不斷地做兩個操作。

1、(query)隨機在這個陣列中選一個區間,求出這個區間所有數的和。

2、(update)不斷地隨機修改這個陣列中的某一個值。

時間複雜度:

列舉:

列舉L~R的每個數並累加。

  • query:O(n)

找到要修改的數直接修改。

  • update:O(1)

如果query與update要做很多很多次,query的O(n)會被卡住,所以時間複雜度會非常慢。那麼有沒有辦法把query的時間複雜度降成O(1)呢?其中一種方法如下:

  • 先建立一個與a陣列一樣大的陣列。

  • s[1]=a[1];s[2]=a[1]+a[2];s[3]=a[1]+a[2]+a[3];...;s[n]=a[1]+a[2]+a[3]+...+a[n](在s陣列中存入a的字首和)

  • 此時a[L]+a[L+1]+...+a[R]=s[R]-s[L-1],query的時間複雜度降為O(1)。
  • 但若要修改a[k]的值,隨之也需修改s[k],s[k+1],...,s[n]的值,時間複雜度升為O(n)。

字首和:

query:O(1)

update:O(n)

  • 我們發現,當我們想盡方法把其中一個操作的時間複雜度改成O(1)後,另一個操作的時間複雜度就會變為O(n)。當query與update的操作特別多時,不論用哪種方法,總體的時間複雜度都不會特別快。
  • 所以,我們將要討論一種叫線段樹的資料結構,它可以把這兩個操作的時間複雜度平均一下,使得query和update的時間複雜度都落在O(n log n)上,從而增加整個演算法的效率。

線段樹

假設我們拿到了如下長度為6的陣列:

在構建線段樹之前,我們先闡述線段樹的性質:

1、線段樹的每個節點都代表一個區間。

2、線段樹具有唯一的根節點,代表的區間是整個統計範圍,如[1,N]。

3、線段樹的每個葉節點都代表一個長度為1的元區間[x,x]。

4、對於每個內部節點[l,r],它的左子結點是[l,mid],右子節點是[mid+1,r],其中mid=(l+r)/2(向下取整)。

依照這個陣列,我們構建如下線段樹(結點的性質為sum):

若我們要求[2-5]區間中數的和:

若我們要把a[4]改為6:

  • 先一層一層找到目標節點修改,在依次向上修改當前節點的父節點。

 

 

接下來的問題是:如何儲存這棵線段樹?

  • 用陣列儲存。

若我們要取node結點的左子結點(left)與右子節點(right),方法如下:

  • left=2*node+1
  • right=2*ndoe+2

舉結點5為例(左子結點為節點11,右子節點為節點12):

  • left5=2*5+1=11
  • right5=2*5+2=12

接下來給出建樹的程式碼:

 

#include<bits/stdc++.h>
using namespace std; 

const int N = 1000;

int a[] = {1, 3, 5, 7, 9, 11};
int size = 6;
int tree[N] = {0};

//建立範圍為a[start]~a[end] 
void build(int a[], int tree[], int node/*當前節點*/, int start, int end){
    //遞迴邊界(即遇到葉子節點時) 
    if (start == end){
        //直接儲存a陣列中的值 
        tree[node] = a[start];
    } 

    else {
        //將建立的區間分成兩半 
        int mid = (start + end) / 2;
     
        int left  = 2 * node + 1;//左子節點的下標 
        int right = 2 * node + 2;//右子節點的下標 
        
        //求出左子節點的值(即從節點left開始,建立範圍為a[start]~a[mid])
        build(a, tree, left,  start, mid);
        //求出右子節點的值(即從節點right開始,建立範圍為a[start]~a[mid])
        build(a, tree, right, mid+1, end);
    
        //當前節點的職位左子節點的值加上右子節點的值 
        tree[node] = tree[left] + tree[right];
    }
}

int main(){
    //從根節點(即節點0)開始建樹,建樹範圍為a[0]~a[size-1]
    build(a, tree, 0, 0, size-1);
    
    for(int i = 0; i <= 14; i ++)
        printf("tree[%d] = %d\n", i, tree[i]);
        
    return 0;
}

執行結果:

update操作:

  • 確定需要改的分支,向下尋找需要修改的節點,再向上修改節點值。
  •  與建樹的函式相比,update函式增加了兩個引數x,val,即把a[x]改為val。

例:把a[x]改為6(程式碼實現)

void update(int a[], int tree[], int node, int start, int end, int x, int val){
    //找到a[x],修改值 
    if (start == end){
        a[x] = val;
        tree[node] = val;
    }
    
    else {
        int mid = (start + end) / 2;
    
        int left  = 2 * node + 1;
        int right = 2 * node + 2;
    
        if (x >= start && x <= mid) {//如果x在左分支 
            update(a, tree, start, mid, x, val);
        }
        else {//如果x在右分支 
            update(a, tree, right, mid+1, end, x, val);
        }
        
        //向上更新值 
        tree[node] = tree[left] + tree[right]; 
    } 
}

在主函式中呼叫:
//把a[x]改成6
update(a, tree, 0, 0, size-1, 4, 6);

 

執行結果:

query操作:

  • 向下依次尋找包含在目標區間中的區間,並累加。
  • 與建樹的函式相比,query函式增加了兩個引數L,Rl,即把求a的區間[L,R]的和。

例:求a[2]+a[3]+...+a[5]的值(程式碼實現)

int query(int a[], int tree[], int node, int start, int end, int L,int R){
    //若目標區間與當時區間沒有重疊,結束遞迴返回0 
    if (start > R || end < L){
        return 0;
    }
    
    //若目標區間包含當時區間,直接返回節點值 
    else if (L <=start && end <= R){
        return tree[node];
    }
    
    else {
        int mid = (start + end) / 2;
    
        int left  = 2 * node + 1;
        int right = 2 * node + 2;
    
        //計算左邊區間的值 
        int sum_left  = query(a, tree, left,  start, mid, L, R);
        //計算右邊區間的值 
        int sum_right = query(a, tree, right, mid+1, end, L, R);
        
        //相加即為答案 
        return sum_left + sum_right;
    } 
}

在主函式中呼叫:
//求區間[2,5]的和
int ans = query(a, tree, 0, 0, size-1, 2, 5);
printf("ans = %d", ans); 

執行結果:

最後,獻上完整的程式碼:

#include<bits/stdc++.h>
using namespace std; 

const int N = 1000;

int a[] = {1, 3, 5, 7, 9, 11};
int size = 6;
int tree[N] = {0};

//建立範圍為a[start]~a[end] 
void build(int a[], int tree[], int node/*當前節點*/, int start, int end){
    //遞迴邊界(即遇到葉子節點時) 
    if (start == end) {
        //直接儲存a陣列中的值 
        tree[node] = a[start];
    } 

    else {
        //將建立的區間分成兩半 
        int mid = (start + end) / 2;
     
        int left  = 2 * node + 1;//左子節點的下標 
        int right = 2 * node + 2;//右子節點的下標 
        
        //求出左子節點的值(即從節點left開始,建立範圍為a[start]~a[mid])
        build(a, tree, left,  start, mid);
        //求出右子節點的值(即從節點right開始,建立範圍為a[start]~a[mid])
        build(a, tree, right, mid+1, end);
    
        //當前節點的職位左子節點的值加上右子節點的值 
        tree[node] = tree[left] + tree[right];
    }
}

void update(int a[], int tree[], int node, int start, int end, int x, int val){
    //找到a[x],修改值 
    if (start == end){
        a[x] = val;
        tree[node] = val;
    }
    
    else {
        int mid = (start + end) / 2;
    
        int left  = 2 * node + 1;
        int right = 2 * node + 2;
    
        if (x >= start && x <= mid) {//如果x在左分支 
            update(a, tree, left, start, mid, x, val);
        }
        else {//如果x在右分支 
            update(a, tree, right, mid+1, end, x, val);
        }
        
        //向上更新值 
        tree[node] = tree[left] + tree[right]; 
    } 
}

//求a[L]~a[R]的區間和 
int query(int a[], int tree[], int node, int start, int end, int L,int R){
    //若目標區間與當時區間沒有重疊,結束遞迴返回0 
    if (start > R || end < L){
        return 0;
    }
    
    //若目標區間包含當時區間,直接返回節點值 
    else if (L <=start && end <= R){
        return tree[node];
    }
    
    else {
        int mid = (start + end) / 2;
    
        int left  = 2 * node + 1;
        int right = 2 * node + 2;
    
        //計算左邊區間的值 
        int sum_left  = query(a, tree, left,  start, mid, L, R);
        //計算右邊區間的值 
        int sum_right = query(a, tree, right, mid+1, end, L, R);
        
        //相加即為答案 
        return sum_left + sum_right;
    } 
}

int main(){
    //從根節點(即節點0)開始建樹,建樹範圍為a[0]~a[size-1]
    build(a, tree, 0, 0, size-1);
    
    for(int i = 0; i <= 14; i ++)
        printf("tree[%d] = %d\n", i, tree[i]);
    printf("\n");    
        
    //把a[x]改成6
    update(a, tree, 0, 0, size-1, 4, 6); 
    
    for(int i = 0; i <= 14; i ++)
        printf("tree[%d] = %d\n", i, tree[i]);
    printf("\n");
    
    //求區間[2,5]的和
    int ans = query(a, tree, 0, 0, size-1, 2, 5);
    printf("ans = %d", ans); 
            
    return 0;
}

執行結果:

學習視訊連結

&n