1. 程式人生 > >並查集(Union Find)簡介

並查集(Union Find)簡介

並查集

在一些有N個元素的集合應用問題中,通常是在開始時讓每個元素構成一個單元素的集合,然後按照一定順序將屬於同一組元素所在的集合合併,期間要反覆查詢一個元素在哪一個集合中。其特點是看似“不復雜”,但當資料量較大時,如果用一般的資料結構來描述,往往在空間上過大,計算機無法承受;即使在空間上勉強通過,執行的時間複雜度也極高。因此可以用並查集來優化。

並查集是一種樹型的資料結構,用於處理不相交集合(disjoint sets)的合併以及查詢問題。在使用中可以想成森林來操作。

基本操作

並查集主要有兩個操作:查詢和合並。在並查集中,設定一個father[i]陣列,表示元素i的父親。

1.查詢一個元素的祖先,也就是查詢這個元素所在的樹的根

樸素的做法是遞迴的,一直查詢到其父親等於自己的元素,這個結點即為該樹的根。這種方法一旦資料量較大(存在長鏈),每次查詢幾乎是O(n)的複雜度,效率不高。對此要進行一種操作,即路徑壓縮。找到最久遠的祖先時順便把它的子孫直接連線到它的直接孩子處,這樣就避免了樹的結構退化,從而提高效率。

路徑壓縮出發點:儘量直接指向根節點,而不是向上慢慢走

int getfather(int x)
{
    if(father[x]!=x) return father[x]=getfather(father[x]);
    return
father[x]; }

2.將兩個不相交的集合合併,此類操作相當於兩棵樹的合併

直接找到兩個結點的樹根,看是否相同,不同合併即可。

void Union(int x,int y)
{
    int fx=getfather(x);
    int fy=getfather(y);
    if(fx!=fy){
        father[fx]=fy;
    }
}

還有一種優化是按秩合併,不過貌似優化程度不大(下面那道模板題)(研究過的還請評論指教)

void Merge(int x,int y)
{
    //有按秩啟發式合併
    int a=Find(x);
    int
b=Find(y); if(Rank[a]<Rank[b]){ father[a]=b; } else{ father[b]=a; if(Rank[b]==Rank[a]) Rank[a]++; } }

模板題(洛谷3367)

#include<bits/stdc++.h>
using namespace std;
const int maxn=100010;

int father[maxn];
int Rank[maxn];

void init(int n)
{
    for(int i=1;i<=n;++i) father[i]=i;
}


//int Find(int x)
//{
//    //沒有路徑壓縮
//    while(father[x]!=x) x=father[x];
//    return x;
//}


int Find(int x)
{
    //有路徑壓縮
    return father[x] = father[x]==x ? x : Find(father[x]);
}


//void Merge(int x,int y)
//{
//    //沒有按秩啟發式合併
//    int fx=Find(x);
//    int fy=Find(y);
//    if(fx!=fy){
//        father[fx]=fy;
//    }
//}


void Merge(int x,int y)
{
    //有按秩啟發式合併
    int a=Find(x);
    int b=Find(y);
    if(Rank[a]<Rank[b]){
        father[a]=b;
    }
    else{
        father[b]=a;
        if(Rank[b]==Rank[a]) Rank[a]++;
    }
}

int main()
{
    ios::sync_with_stdio(false);
    //freopen("ce.in","r",stdin);
    int n,m,tp,x,y;
    cin>>n>>m;
    init(n);
    for(int i=0;i<m;++i){
        cin>>tp>>x>>y;
        if(tp==1){
            Merge(x,y);
        }
        else{
            if(Find(x)==Find(y)) cout<<'Y'<<endl;
            //fastIO::print('Y');
            else cout<<'N'<<endl;
            //fastIO::print('N');
        }
    }
    return 0;
}

優化Kruskal演算法

Kruskal演算法關鍵的一步操作就是判斷連線的兩個節點於圖Graph中在不在同一個連通分量中
這裡並查集就可以大展身手了

//部分程式碼示例
int parent[maxm];

int Find(int f)//查詢連線頂點的尾部下標
{
    return parent[f]!=f?parent[f]=Find(parent[f]):f;
}

void MiniSpanTree_Kruskal()
{
    int sum=0;
    int nn,mm;
    for(int i=0;i<G.numVertexes;++i)
        parent[i]=i;//初始化陣列值為i
    for(int i=0;i<G.numEdges;++i){//迴圈每一條邊
        nn=Find(G.xiang[i].beg);
        mm=Find(G.xiang[i].endd);
        if(nn!=mm){//假如n與m不等,說明此邊沒有與現有生成樹形成環路
            parent[nn]=mm;//將此邊的結尾頂點放入下標為起點的parent中
            //表示此頂點已經在生成樹集合中
            //printf("(%d,%d) %d",G.xiang[i].beg,G.xiang[i].endd,G.xiang[i].weight);
            sum+=G.xiang[i].weight;
        }
    }
    cout<<sum<<endl;
}