1. 程式人生 > >【並查集】一種與時間賽跑的巧妙演算法

【並查集】一種與時間賽跑的巧妙演算法

**【並查集】一種與時間賽跑的巧妙演算法** # 引入:(NOIP模擬題)極端寒冬 **(不要求剛剛接觸並查集的讀者完全明白本題)** 先了解一下並查集是個什麼東西: **合併兩點所在集合** 和 **查詢兩點是否在同一集合** 的演算法 那有什麼用處呢? 我們先來看一道NOIP模擬題![在這裡插入圖片描述](https://img-blog.csdnimg.cn/20200920085358214.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxMjcxODc1Njk0MQ==,size_16,color_FFFFFF,t_70#pic_center) **我們先來看一下題意是什麼:** 首先,有一個n*m的地圖,k個障礙,每個障礙會按順序在不同的時間冒出 問地圖上最多能容納多少個障礙,使得從(1,1)到(n,m)仍保持聯通 **那我們可以怎麼做呢?** 最先也是最容易想到的就是**搜尋** 每次新增一個障礙,就搜尋判斷地圖的連通性 但是,時間複雜度約為O(k(n*m)) ~~[口胡]~~ 3 * 10^4^ * 3 * 10^4^ * 10^5^ = 9 * 10^13^ 超時,但小資料應該勉強能拿2、30分 然後我們會想到做**分塊**(分塊思想:[從疫情中的體溫測量到分塊思想的運用 ](https://www.cnblogs.com/pqh-/p/13167792.html)) 如果給k個障礙,那麼我們把他分成√k堆,每堆√k個障礙 每次新增√k個障礙,然後搜尋判斷連通性 如果不連通,再對√k個障礙,挨個搜尋判斷連通性 那麼,時間複雜度約為O(√k(n*m)*2) ~~[口胡]~~ 時間還是不夠,必定會超時,勉強拿40分 之後我們會想到更快的暴力:**二分答案** 如果給k個障礙,那麼我們把他分成2堆,每堆k/2個障礙 新增k/2個障礙,之後搜尋判斷連通性 左側不連通就二分再次左側,右側不連通就二分再次右側 最後就能找到最多能容納的障礙 所以時間複雜度約為O(㏒(k)*(n *m)) ~~[口胡]~~ 所用時間也還是較大,估計拿50分左右 **那麼正解是什麼呢?** 我們會發現所用時間較大與去搜索連通性有密切關係 地圖越大,就算優化列舉障礙放置,搜尋連通性也耗時過多 那麼,我們可以**不去搜索地圖的連通性**嗎? 答案是可以的 我們可以知道,地圖如果不連通 那麼障礙一定是從地圖左/下邊界一直連通到右、上側邊界的 ![在這裡插入圖片描述](https://img-blog.csdnimg.cn/20200920093228991.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxMjcxODc1Njk0MQ==,size_16,color_FFFFFF,t_70#pic_center)這很容易證明,過程略 所以題目就轉化為了**障礙是否具有連通性** (從地圖左/下邊界一直連通到右/上側邊界是否具有連通性) 可以列舉+染色,也不復雜的暴力 但時間還沒有最優 所以我們想到**並查集** 去合併障礙,看障礙的連通性 賣個關子,我們先講一下並查集的主要內容 # 並查集 剛剛說過,並查集是**合併兩點所在集合** 和 **查詢兩點是否在同一集合** 的演算法 ## 瞭解 **並查集本質是樹狀結構** 把每個集合看成一棵樹 初始時,每個點就是一棵樹 每次合併是將兩棵樹的根節點連線 **合併集合**像歸順之類的一樣:**樹A和樹B,A和B有關係,A就加入B,A的根節點就是B的根節點** **查詢節點是否在同一集合**就去查詢:**節點X和Y,X所在樹的根節點 是否等於 Y的所在樹根節點** 網上已經說得很詳細了,就不贅述了 > 江湖上散落著各式各樣的大俠,有上千個之多。他們沒有什麼正當職業,整天揹著劍在外面走來走去,碰到和自己不是一路人的,就免不了要打一架。但大俠們有一個優點就是講義氣,絕對不打自己的朋友。而且他們信奉“朋友的朋友就是我的朋友”,只要是能通過朋友關係串聯起來的,不管拐了多少個彎,都認為是自己人。這樣一來,江湖上就形成了一個一個的幫派,通過兩兩之間的朋友關係串聯起來。而不在同一個幫派的人,無論如何都無法通過朋友關係連起來,於是就可以放心往死了打。但是兩個原本互不相識的人,如何判斷是否屬於一個朋友圈呢? 我們可以在每個朋友圈內推舉出一個比較有名望的人,作為該圈子的代表人物。這樣,每個圈子就可以這樣命名“中國同胞隊”美國同胞隊”……兩人只要互相對一下自己的隊長是不是同一個人,就可以確定敵友關係了。 但是還有問題啊,大俠們只知道自己直接的朋友是誰,很多人壓根就不認識隊長抓狂要判斷自己的隊長是誰,只能漫無目的的通過朋友的朋友關係問下去:“你是不是隊長?你是不是隊長?”這樣,想打一架得先問個幾十年,餓都餓死了,受不了。這樣一來,隊長面子上也掛不住了,不僅效率太低,還有可能陷入無限迴圈中。於是隊長下令,重新組隊。隊內所有人實行分等級制度,形成樹狀結構,我隊長就是根節點,下面分別是二級隊員、三級隊員。每個人只要記住自己的上級是誰就行了。遇到判斷敵友的時候,只要一層層向上問,直到最高層,就可以在短時間內確定隊長是誰了。由於我們關心的只是兩個人之間是否是一個幫派的,至於他們是如何通過朋友關係相關聯的,以及每個圈子內部的結構是怎樣的,甚至隊長是誰,都不重要了。所以我們可以放任隊長隨意重新組隊,只要不搞錯敵友關係就好了。於是,門派產生了。 下面我們來看並查集的實現。 int fa[1000]; 這個陣列,記錄了每個大俠的上級是誰。大俠們從1或者0開始編號(依據題意而定),fa[15]=3就表示15號大俠的上級是3號大俠。如果一個人的上級就是他自己,那說明他就是掌門人了,查詢到此為止。也有孤家寡人自成一派的,比如歐陽鋒,那麼他的上級就是他自己。每個人都只認自己的上級。比如胡青牛同學只知道自己的上級是楊左使。張無忌是誰?不認識!要想知道自己的掌門是誰,只能一級級查上去。 再來看看加入門派,就是在兩個點之間連一條線,這樣一來,原先它們所在的兩個板塊的所有點就都可以互通了。這在圖上很好辦,畫條線就行了。但我們現在是用並查集來描述武林中的狀況的,一共只有一個fa[]陣列,該如何實現呢? 還是舉江湖的例子,假設現在武林中的形勢如圖所示。虛竹帥鍋與周芷若MM是我非常喜歡的兩個人物,他們的終極boss分別是玄慈方丈和滅絕師太,那明顯就是兩個陣營了。我不希望他們互相打架,就對他倆說:“你們兩位拉拉勾,做好朋友吧。”他們看在我的面子上,同意了。這一同意可非同小可,整個少林和峨眉派的人就不能打架了。這麼重大的變化,可如何實現呀,要改動多少地方?其實非常簡單,我對玄慈方丈說:“大師,麻煩你把你的上級改為滅絕師太吧。這樣一來,兩派原先的所有人員的終極boss都是師太,那還打個球啊!大笑反正我們關心的只是連通性,門派內部的結構不要緊的。”玄慈一聽肯定火大了:“我靠,憑什麼是我變成她手下呀,怎麼不反過來?我抗議!”於是,兩人相約一戰,殺的是天昏地暗,風雲為之變色啊,但是啊,這場戰爭終究會有勝負,勝者為王。弱者就被吞併了。反正誰加入誰效果是一樣的,門派就由兩個變成一個了。這段函式的意思明白了吧? 再來看看路徑壓縮演算法。建立門派的過程是用加入函式兩個人兩個人地連線起來的,誰當誰的手下完全隨機。最後的樹狀結構會變成什麼樣,我也無法預知,一字長蛇陣也有可能。這樣查詢的效率就會比較低下。最理想的情況就是所有人的直接上級都是掌門,一共就兩級結構,只要找一次就找到掌門了。哪怕不能完全做到,也最好儘量接近。這樣就產生了路徑壓縮演算法。 設想這樣一個場景:兩個互不相識的大俠碰面了,想知道能不能幹一場。 於是趕緊打電話問自己的上級:“你是不是掌門?” 上級說:“我不是呀,我的上級是誰誰誰,你問問他看看。” 一路問下去,原來兩人的最終boss都是東廠曹公公。 “哎呀呀,原來是自己人,有禮有禮,在下三營六組白麵葫蘆娃!” “幸會幸會,在下九營十八組仙子狗尾巴花!” 兩人高高興興地手拉手喝酒去了。 “等等等等,兩位大俠請留步,還有事情沒完成呢!”我叫住他倆。 “哦,對了,還要做路徑壓縮。”兩人醒悟。 白麵葫蘆娃打電話給他的上級六組長:“組長啊,我查過了,其實偶們的掌門是曹公公。不如偶們一起結拜在曹公公手下吧,省得級別太低,以後查詢掌門麻煩。” “唔,有道理。” 白麵葫蘆娃接著打電話給剛才拜訪過的三營長……仙子狗尾巴花也做了同樣的事情。 這樣,查詢中所有涉及到的人物都聚集在曹公公的直接領導下。每次查詢都做了優化處理,所以整個門派樹的層數都會維持在比較低的水平上。路徑壓縮的程式碼,看得懂很好,看不懂可以自己模擬一下,很簡單的一個遞迴而已。總之它所實現的功能就是這麼個意思。 寫的還挺好,我們再詳細說說 # 實現 ## 初始化 首先初始化每個節點,使得他們自成一樹 ```cpp void in(){ for(int i=1;i<=n;i++){ fa[i]=i;//樹的根節點 h[i]=1;//樹的深度 } } ``` 所以得到: ![在這裡插入圖片描述](https://img-blog.csdnimg.cn/20200920101758584.jpg?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxMjcxODc1Njk0MQ==,size_16,color_FFFFFF,t_70#pic_center) ## 合併 然後我們對他們進行合併操作:![在這裡插入圖片描述](https://img-blog.csdnimg.cn/20200920102405240.jpg?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxMjcxODc1Njk0MQ==,size_16,color_FFFFFF,t_70#pic_center) **直接將有關係的點進行連線** ```cpp int get(int x,int y){ f[f[x]]=y;//將X點的根節點掛到Y上 } ``` 但我們會發現,最壞的情況是出現了一條鏈,fa指向自己上一個節點 查詢根節點就會很慢,時間複雜度為O(h) (下圖注:例圖,與剛剛資料無關) ![在這裡插入圖片描述](https://img-blog.csdnimg.cn/20200920103035470.jpg?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxMjcxODc1Njk0MQ==,size_16,color_FFFFFF,t_70#pic_center) 那麼,我們可以每次合併兩棵樹時,樹A掛在樹B的根節點上 ![在這裡插入圖片描述](https://img-blog.csdnimg.cn/20200920103709378.jpg?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxMjcxODc1Njk0MQ==,size_16,color_FFFFFF,t_70#pic_center) 以剛剛的資料為例![在這裡插入圖片描述](https://img-blog.csdnimg.cn/20200920103734283.jpg?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxMjcxODc1Njk0MQ==,size_16,color_FFFFFF,t_70#pic_center)**4和2的關係:** 理論上應該連線2和4 但為了防止鏈,導致find的查詢根節點變慢 就**樹A根節點連線到樹B根節點** 我們再來說一下**樹A根節點連B根節點的方法** ![在這裡插入圖片描述](https://img-blog.csdnimg.cn/20200920105604813.jpg?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxMjcxODc1Njk0MQ==,size_16,color_FFFFFF,t_70#pic_center)**如圖,是A掛B好還是B掛A好?** (h大為深,h小為淺) 當然是**淺的樹掛在深的樹**上好唄 **淺的樹掛在深的樹的根節點**上,淺的樹一側深度+1(因為頂上多了個深的樹的根節點) h[淺的樹]+1<=h[深的樹] 而**深的樹掛在淺的樹的根節點**上,深的樹一側深度+1(因為頂上多了個淺的樹的根節點) h[深的樹]+1>=h[深的樹] ∴h[淺的樹]+1
h[y]){ fa[y]=x; }else if(h[x] using namespace std; int fa[1010]; int h[1010]; void in(){//初始化 for(int i=1;i<=n;i++){ fa[i]=i; h[i]=1; } } int find(int i){//查(查詢根節點 if(i==fa[i]){ return i; } else{ int x=find(fa[i]); fa[i]=x; return x; } } void get(int x,int y){//並(合併 x=find(x); y=find(y); if(x==y)return ; else{ if(h[x]>h[y]){ fa[y]=x; }else if(h[x]