1. 程式人生 > >【轉載】樹狀數組詳解

【轉載】樹狀數組詳解

name 移除 src 父親 公式 設置 sum函數 一個數 圖片

第01講 什麽是樹狀數組?

樹狀數組用來求區間元素和,求一次區間元素和的時間效率為O(logn)。

有些同學會覺得很奇怪。用一個數組S[i]保存序列A[]的前i個元素和,那麽求區間i,j的元素和不就為S[j]-S[i-1],那麽時間效率為O(1),豈不是更快?

但是,如果題目的A[]會改變呢?例如:

我們來定義下列問題:我們有n個盒子。可能的操作為

1.向盒子k添加石塊

2.查詢從盒子i到盒子j總的石塊數

自然的解法帶有對操作1為O(1)而對操作2為O(n)的時間復雜度。但是用樹狀數組,對操作1和2的時間復雜度都為O(logn)。

第02講 圖解樹狀數組C[]

現在來說明下樹狀數組是什麽東西?假設序列為A[1]~A[8]

技術分享圖片

網絡上面都有這個圖,但是我將這個圖做了2點改進。

(1)圖中有一棵滿二叉樹,滿二叉樹的每一個結點對應A[]中的一個元素。

(2)C[i]為A[i]對應的那一列的最高的節點。

現在告訴你:序列C[]就是樹狀數組。

那麽C[]如何求得?

C[1]=A[1];

C[2]=A[1]+A[2];

C[3]=A[3];

C[4]=A[1]+A[2]+A[3]+A[4];

C[5]=A[5];

C[6]=A[5]+A[6];

C[7]=A[7];

C[8]= A[1]+A[2]+A[3]+A[4]+A[5]+A[6]+A[7]+A[8];

以上只是枚舉了所有的情況,那麽推廣到一般情況,得到一個C[i]的抽象定義:

因為A[]中的每個元素對應滿二叉樹的每個葉子,所以我們幹脆把A[]中的每個元素當成葉子,那麽:C[i]=C[i]的所有葉子的和。

現在不得不引出關於二進制的一個規律:

先仔細看下圖:

技術分享圖片

將十進制化成二進制,然後觀察這些二進制數最右邊1的位置:

1 --> 00000001

2 --> 00000010

3 --> 00000011

4 --> 00000100

5 --> 00000101

6 --> 00000110

7 --> 00000111

8 --> 00001000

1的位置其實從我畫的滿二叉樹中就可以看出來。但是這與C[]有什麽關系呢?

接下來的這部分內容很重要:

在滿二叉樹中,

以1結尾的那些結點(C[1],C[3],C[5],C[7]),其葉子數有1個,所以這些結點C[i]代表區間範圍為1的元素和;

以10結尾的那些結點(C[2],C[6]),其葉子數為2個,所以這些結點C[i]代表區間範圍為2的元素和;

以100結尾的那些結點(C[4]),其葉子數為4個,所以這些結點C[i]代表區間範圍為4的元素和;

以1000結尾的那些結點(C[8]),其葉子數為8個,所以這些結點C[i]代表區間範圍為8的元素和。

擴展到一般情況:

i的二進制中的從右往左數有連續的x個“0”,那麽擁有2^x個葉子,為序列A[]中的第i-2^x+1到第i個元素的和。

終於,我們得到了一個C[i]的具體定義:

C[i]=A[i-2^x+1]+…+A[i],其中x為i的二進制中的從右往左數有連續“0”的個數。

第03講 利用樹狀數組求前i個元素的和S[i]

理解了C[i]後,前i個元素的和S[i]就很容易實現。

從C[i]的定義出發:

C[i]=A[i-2^x+1]+…+A[i],其中x為i的二進制中的從右往左數有連續“0”的個數。

我們可以知道:C[i]是肯定包括A[i]的,那麽:

S[i]=C[i]+C[i-2^x]+…

也許上面這個公式太抽象了,因為有省略號,我們拿一個具體的實例來看:

S[7]=C[7]+C[6]+C[4]

因為C[7]=A[7],C[6]=A[6]+A[5],C[4]=A[4]+A[3]+A[2]+A[1],所以S[7]=C[7]+C[6]+C[4]

(1)i=7,求得x=0,那麽我們求得了A[7];

(2)i=i-2^x=6,求得x=1,那麽求得了A[6]+A[5];

(3)i=i-2^x=4,求得x=2,那麽求得了A[4]+A[3]+A[2]+A[1]。

講到這裏其實有點難度,因為S[i]的求法,如果要講清楚,那麽得寫太多的東西了。所以不理解的同學,再反復多看幾遍。

從(1)(2)(3)這3步可以知道,求S[i]就是一個累加的過程,如果將2^x求出來了,那麽這個過程用C++實現就沒什麽難度。

現在直接告訴你結論:2^x=i&(-i)

證明:設A’為A的二進制反碼,i的二進制表示成A1B,其中A不管,B為全0序列。那麽-i=A’0B’+1。由於B為全0序列,那麽B’就是全1序列,所以-i=A’1B,所以:

i&(-i)= A1B& A’1B=1B,即2^x的值。

所以根據(1)(2)(3)的過程我們可以寫出如下的函數:

int Sum(int i) //返回前i個元素和

{

int s=0;

while(i>0)

{

s+=C[i];

i-=i&(-i);

}

return s;

}

第04講 更新C[]

正如第01講提到的小石塊問題,如果數組A[i]被更新了怎麽辦?那麽如何改動C[]?

如果改動C[]也需要O(n)的時間復雜度,那麽樹狀數組就沒有任何優勢。所以樹狀數組在改動C[]上面的時間效率為O(logn),為什麽呢?

因為改動A[i]只需要改動部分的C[]。這一點從第02講的圖中就可以看出來:

技術分享圖片

如上圖:

假如A[3]=3,接著A[3]+=1,那麽哪些C[]需要改變呢?

答案從圖中就可以得出:C[3],C[4],C[8]。因為這些值和A[3]是有聯系的,他們用樹的關系描述就是:C[3],C[4],C[8]是A[3]的祖先。

那麽怎麽知道那些C[]需要變化呢?

我們來看“A”這個結點。這個“A”結點非常的重要,因為他體現了一個關系:A的葉子數為C[3]的2倍。因為“A”的左子樹和右子樹的葉子數是相同的。 因為2^x代表的就是葉子數,所以C[3]的父親是A,A的父親是C[i+2^0],即C[3]改變,那麽C[3+2^0]也改變。

我們再來看看“B”這個結點。B結點的葉子數為2倍的C[6]的葉子數。所以B和C[6+2^1]在同一列,所以C[6]改變,C[6+2^1]也改變。

推廣到一般情況就是:

如果A[i]發生改變,那麽C[i]發生改變,C[i]的父親C[i+2^x]也發生改變。

這一行的叠代過程,我們可以寫出當A[i]發生改變時,C[]的更新函數為:

void Update(int i,int value) //A[i]的改變值為value

{

while(i<=n)

{

C[i]+=value;

i+=i&(-i);

}

}

第05講 一維樹狀數組的應用舉例

廢了4講的話,我們終於把一維樹狀數組的2個不到5行的代碼給搞定了。現在要正式投入到應用當中。

題目鏈接:http://poj.org/problem?id=2352

題意:按照y升序給你n個星星的坐標,如果有m個星星的x,y坐標均小於等於星星A的坐標,那麽星星A的等級為m。

分析:是一道樹狀數組題。舉例來說,以下是題目的輸入:

5

1 1

5 1

7 1

3 3

5 5

由於y坐標是升序的且坐標不重復,所以在星星A後面輸入的星星的x,y坐標不可能都小於等於星星A。假如當前輸入的星星為(3,3),易得我們只需要去找 樹狀數組中小於等於3的值就可以了,即GetSum(3)。註意:A[i]表示x坐標為i的個數,C[]為A[]的樹狀數組,那麽GetSum(i)就是 序列中前i個元素的和,即x小於等於i的星星數。

本題還是一點要註意:星星坐標的輸入可以是(0,0),所以我們把x坐標統一加1,然後用樹狀數組實現。

第06講 二維樹狀數組

BIT可用為二維數據結果。假設你有一個帶有點的平面(有非負的坐標)。你有三個問題:

1.在(x , y)設置點

2.從(x , y)移除點

3.在矩形(0 , 0), (x , y)計算點數 - 其中(0 , 0)為左下角,(x , y)為右上角,而邊是平行於x軸和y軸。

對於1操作,在(x,y)處設置點,即Update(x,y,1),那麽這個Update要怎麽寫?很簡單,因為x,y坐標是離散的,所以我們分別對x,y進行更新即可,函數如下:

void Update(int x,int y,int val)

{

while(x<=n)

{

int y1=y;

while(y1<=n)

{

C[x][y1]+=val;

y1+=y1&(-y1);

}

x+=x&(-x);

}

}

那麽根據Update可以推得:GetSum函數為:

int GetSum(int x,int y)

{

int sum=0;

while(x>0)

{

int y1=y;

while(y1>0)

{

sum+=C[x][y1];

y1-=y1&(-y1);

}

x-=x&(-x);

}

return sum;

}

第07講 二維樹狀數組的應用舉例

題目鏈接:http://poj.org/problem?id=2155

我們先討論POJ2155的一維情況,如下:

有一個n卡片的陣列。每個卡片倒放在桌面上。你有兩個問題:

1. T i j (反轉從索引i到索引j的卡片,包括第i張和第j張卡——面朝下的卡將朝上;面朝上的卡將朝下)

2. Q i (如果第i張卡面朝下回答0否則回答1)

解決:

解決問題(1和2)的方法有時間復雜度O(log n)。在數組f(長度n + 1)我們存儲每個問題T(i, j)——我們設置f[i]++和f[j + 1]--。對在i和j之間(包括i和j)每個卡k求和f[1] + f[2] + ... + f[k]將遞增1,其他全部和前面的一樣(看圖2.0清楚一些),我們的結果將描述為和(和累積頻率一樣)模2。

技術分享圖片

圖 2.0

使用BIT來存儲(增加/減少)頻率並讀取累積頻率。

理解了一維的情況,POJ2155就是其二維的版本,易得只需要更(x1,y1),(x1,y2+1),(x2+1,y1),(x2+1,y2+1)四個點的C[]的值就可以了,最後的結果依然是GetSum(x,y)%2

【轉載】樹狀數組詳解