1. 程式人生 > >並查集——簡單易懂(內附並查集刪除操作)

並查集——簡單易懂(內附並查集刪除操作)

並查集

並查集的定義

並查集是一種樹型的資料結構,用於處理一些不相交集合(Disjoint Sets)的合併及查詢問題。常常在使用中以森林來表示。
集就是讓每個元素構成一個單元素的集合,也就是按一定順序將屬於同一組的元素所在的集合合併。

並查集的用途

  1. 維護一個無向圖的連通性,判斷n個點m條邊時最少加多少邊可以連通所有點
  2. 判斷在一個無向圖中,兩點間加邊是否會產生環(最小生成樹克魯斯卡爾中有用到)
  3. 維護集合等操作
  4. 等等等等。。。。

並查集的操作

所謂並查集,並查集。顧名思義操作就兩種:

  • :合併兩個集合
  • :查詢兩個元素是否在一個集合(或者說查詢元素的根節點)

關於並查集的原理,先看一個小故事,具體出處已經找不到了,網上找到的最早的是12年的一個部落格,那個博主也表示不知道出處,不過這個故事確實很生動了解釋了並查集的原理,表示文筆上比不過原作者還是依然決然轉過來了。

話說江湖上散落著各式各樣的大俠,有上千個之多。他們沒有什麼正當職業,整天揹著劍在外面走來走去,碰到和自己不是一路人的,就免不了要打一架。但大俠們有一個優點就是講義氣,絕對不打自己的朋友。而且他們信奉“朋友的朋友就是我的朋友”,只要是能通過朋友關係串聯起來的,不管拐了多少個彎,都認為是自己人。這樣一來,江湖上就形成了一個一個的群落,通過兩兩之間的朋友關係串聯起來。而不在同一個群落的人,無論如何都無法通過朋友關係連起來,於是就可以放心往死了打。但是兩個原本互不相識的人,如何判斷是否屬於一個朋友圈呢?

我們可以在每個朋友圈內推舉出一個比較有名望的人,作為該圈子的代表人物,這樣,每個圈子就可以這樣命名“齊達內朋友之隊”“羅納爾多朋友之隊”……兩人只要互相對一下自己的隊長是不是同一個人,就可以確定敵友關係了。

但是還有問題啊,大俠們只知道自己直接的朋友是誰,很多人壓根就不認識隊長,要判斷自己的隊長是誰,只能漫無目的的通過朋友的朋友關係問下去:“你是不是隊長?你是不是隊長?”這樣一來,隊長面子上掛不住了,而且效率太低,還有可能陷入無限迴圈中。於是隊長下令,重新組隊。隊內所有人實行分等級制度,形成樹狀結構,我隊長就是根節點,下面分別是二級隊員、三級隊員。每個人只要記住自己的上級是誰就行了。遇到判斷敵友的時候,只要一層層向上問,直到最高層,就可以在短時間內確定隊長是誰了。由於我們關心的只是兩個人之間是否連通,至於他們是如何連通的,以及每個圈子內部的結構是怎樣的,甚至隊長是誰,並不重要。所以我們可以放任隊長隨意重新組隊,只要不搞錯敵友關係就好了。於是,門派產生了。

人物關係圖

下面我們來看並查集的實現。

  • int pre[1000]; 這個陣列,記錄了每個大俠的上級是誰。大俠們從1或者0開始編號(依據題意而定),
  • pre[15]=3就表示15號大俠的上級是3號大俠。
  • 如果一個人的上級就是他自己,那說明他就是掌門人了,查詢到此為止。
  • 也有孤家寡人自成一派的,比如歐陽鋒,那麼他的上級就是他自己。

每個人都只認自己的上級。比如胡青牛同學只知道自己的上級是楊左使。張無忌是誰?不認識!要想知道自己的掌門是誰,只能一級級查上去。 find這個函式就是找掌門用的,意義再清楚不過了(路徑壓縮演算法先不論,後面再說)。

1
2
3
4
5
6
7
intfind(int x)//查詢我(x)的掌門{
    int r = x;                      //委託 r 去找掌門
    while (pre[r] != r)           //如果r的上級不是r自己(也就是說找到的大俠他不是掌門 = =)
        r = pre[r];                 // r 就接著找他的上級,直到找到掌門為止。
    return  r;                //掌門駕到~~~
}

再來看看join函式,就是在兩個點之間連一條線,這樣一來,原先它們所在的兩個板塊的所有點就都可以互通了。這在圖上很好辦,畫條線就行了。但我們現在是用並查集來描述武林中的狀況的,一共只有一個pre[]陣列,該如何實現呢? 還是舉江湖的例子,假設現在武林中的形勢如圖所示。虛竹小和尚與周芷若MM是我非常喜歡的兩個人物,他們的終極boss分別是玄慈方丈和滅絕師太,那明顯就是兩個陣營了。我不希望他們互相打架,就對他倆說:“你們兩位拉拉勾,做好朋友吧。”他們看在我的面子上,同意了。這一同意可非同小可,整個少林和峨眉派的人就不能打架了。這麼重大的變化,可如何實現呀,要改動多少地方?其實非常簡單,我對玄慈方丈說:“大師,麻煩你把你的上級改為滅絕師太吧。這樣一來,兩派原先的所有人員的終極boss都是師太,那還打個球啊!反正我們關心的只是連通性,門派內部的結構不要緊的。”玄慈一聽肯定火大了:“我靠,憑什麼是我變成她手下呀,怎麼不反過來?我抗議!”抗議無效,上天安排的,最大。反正誰加入誰效果是一樣的,我就隨手指定了一個。這段函式的意思很明白了吧?

並操作原理圖

1
2
3
4
5
6
voidjoin(int x,int y)//我想讓虛竹和周芷若做朋友{
    int fx=find(x),fy=find(y);         //虛竹的老大是玄慈,芷若MM的老大是滅絕
    if(fx!=fy)                         //玄慈和滅絕顯然不是同一個人
    pre[fx ]=fy;                       //方丈只好委委屈屈地當了師太的手下啦
}

關於合併操作的一個優化:
如果是按照這樣強行指定一個樹合併的另一個樹中而不加以判斷,那麼很容易造出一個極不平衡的樹,就像下圖一樣
影象 2.png
接前面的例子來說,玄慈很火大的說憑什麼讓我當他的手下,明明我的人手比她多,不行我不服,為了平息方丈的怨氣懶懶的老天終於又加了一項規定,門派人手少的給人手多的當手下,人手相同時候老天指定。終於這樣大家都滿意了,這樣就保證了樹可以維持在一個比較平衡的程度。
注意:合併時一定要分清誰合併到誰身上了,否則反而和我們引入秩的目的相反。之前我就犯了這個錯誤,感謝下面兩位網友指出。
程式碼如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
// rank[]初始化是都為1,代表手下的人數
voidjoin(int x,int y)//我想讓虛竹和周芷若做朋友{
    int fx=find(x),fy=find(y);         //虛竹的老大是玄慈,芷若MM的老大是滅絕
    if(fx != fy)                         //玄慈和滅絕顯然不是同一個人
    {
        if(rank[fx] >= rank[fy])        //倆人開始比誰的手下多
        {
            pre[fy]=fx;                       //方丈技不如人當了師太的手下
            rank[fx] += rank[fy];             //方丈的手下都歸師太else
        {
            pre[fx]=fy;                       //師太人數比不過當了方丈的手下啦
            rank[fy] += rank[fx];              //師太的手下都歸方丈
        }
    }
}

關於按照秩來合併也有按照樹的層數來合併,這樣可以把查詢的次數保持在log的水平,但是如果同時用了路徑壓縮的話,樹的層數就很難維護,所以我這裡採用子孫節點的數量來維護。

再來看看路徑壓縮演算法。建立門派的過程是用join函式兩個人兩個人地連線起來的,誰當誰的手下完全隨機。最後的樹狀結構會變成什麼胎脣樣,我也完全無法預計,一字長蛇陣也有可能。這樣查詢的效率就會比較低下。最理想的情況就是所有人的直接上級都是掌門,一共就兩級結構,只要找一次就找到掌門了。哪怕不能完全做到,也最好儘量接近。這樣就產生了路徑壓縮演算法。 設想這樣一個場景:兩個互不相識的大俠碰面了,想知道能不能揍。 於是趕緊打電話問自己的上級:“你是不是掌門?” 上級說:“我不是呀,我的上級是誰誰誰,你問問他看看。” 一路問下去,原來兩人的最終boss都是東廠曹公公。 “哎呀呀,原來是記己人,西禮西禮,在下三營六組白麵葫蘆娃!” “幸會幸會,在下九營十八組仙子狗尾巴花!” 兩人高高興興地手拉手喝酒去了。 “等等等等,兩位同學請留步,還有事情沒完成呢!”我叫住他倆。 “哦,對了,還要做路徑壓縮。”兩人醒悟。 白麵葫蘆娃打電話給他的上級六組長:“組長啊,我查過了,其習偶們的掌門是曹公公。不如偶們一起及接拜在曹公公手下吧,省得級別太低,以後查詢掌門麻環。” “唔,有道理。” 白麵葫蘆娃接著打電話給剛才拜訪過的三營長……仙子狗尾巴花也做了同樣的事情。 這樣,查詢中所有涉及到的人物都聚集在曹公公的直接領導下。每次查詢都做了優化處理,所以整個門派樹的層數都會維持在比較低的水平上。查詢和路徑壓縮都有遞迴和非遞迴兩種方法,遞迴好寫,非遞迴好懂。什麼時候用那個視情況而定。

路徑壓縮原理

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
// 非遞迴寫法
intfind(int x){
    int r=x;
    while(r!=pre[r])
        r=pre[r];

    int i=x,j;
    while(pre[i]!=r)  //如果說不是掌門
    {
        j=pre[i];    //存下這位大蝦的上級
        pre[i]=r;    //告訴這位大蝦掌門是誰
        i=j;         //去找大蝦的上級告訴他掌門是誰
    }
    return r;
}
//遞迴寫法
intfind(int x){
    if(pre[x] != x)
    {
        pre[x] = find(pre[x]);  //找的祖先遞迴賦值,將本次查詢經過的每個節點都直接連到祖先節點上
    }
    return pre[x];
}

並查集的刪除

一般來說,並查集的並、查兩個功能在80%的場景中都是就夠用的,但是你保不準萬一那天那個大蝦發現了盟主是自己多年前的殺父仇人想要出聯盟,發現自己都沒辦法叛逃了多難受。
對於刪除操作,在完美的並查集中(所有節點都直接連線在根節點上)理論上只要把要刪除的節點的上級重新指向自己就可以了。但是實際情況中,我們的並查集形成的樹的形態都是不可預估形態的,如果直接將一個節點指向自己可能會將他的“下級”和他一塊刪除,這就和我們的想法違背了。所以在一個需要刪除的並查集中初始化時就要處理一下:

  • 首先每個節點不再指向自己而是另一個比不會出現的節點,類似於將每個節點放到一個盒子中
  • 這樣,刪除時只需要把這個節點從當前盒子拿出來,放到另一個盒子中
  • 由於節點之間都是通過盒子來確定關係的,所以盒子中元素是否存在並不影響節點之間的關係

於是我們就找到了,並查集中刪除某個節點的方法,我把它形象的成為“找假爹”,因為每一個祖先節點都相當於假的嘛。
把每個節點都套入一個盒子中,他們之間的關係並不會改變
節點套入盒子

如果要刪除2號節點,那麼我們把2拿出來放到另一個盒子中就可以了,可以看到原來的那個樹結構並沒有發生變化。但是2已經不在這裡面了
刪除節點圖

但是要怎麼找這些假節點呢,很簡單,假設最多會有1000個節點就從1001開始作為假節點,初始化就變成了這樣

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
int index;   //存放盒子節點使用到哪一個了
voidinit(int n){
    index = n;
    for(int i=0;i<n;i++)     //普通節點指向他的盒子節點
        pre[i] = index++;
    for(int i=n;i<2*n;i++)   //盒子節點指向自己就像一般的並查集一樣
        pre[i] = i;
}

voiddel(int n){
    pre[n] = index;   //將要刪除的節點重新指向一個新的盒子
    pre[index] = index++ ;   //盒子節點指向自己
}

注意: 這樣操作節點的數量一定要保證足夠大,否則當刪除操作越來越多的時候,節點不夠用就會執行錯誤了。當然還有一種方法就是動態維護節點的數量來將那些被刪除過的“空盒子”重新利用起來。