1. 程式人生 > >Bellman-Ford 演算法及其優化以及SPFA

Bellman-Ford 演算法及其優化以及SPFA

Bellman-Ford演算法與另一個非常著名的Dijkstra演算法一樣,用於求解單源點最短路徑問題。Bellman-ford演算法除了可求解邊權均非負的問題外,還可以解決存在負權邊的問題(意義是什麼,好好思考),而Dijkstra演算法只能處理邊權非負的問題,因此 Bellman-Ford演算法的適用面要廣泛一些。但是,原始的Bellman-Ford演算法時間複雜度為 OVE,Dijkstra演算法的時間複雜度高,所以常常被眾多的大學演算法教科書所忽略,就連經典的《演算法導論》也只介紹了基本的Bellman-Ford演算法,在國內常見的基本資訊學奧賽教材中也均未提及,因此該演算法的知名度與被掌握度都不如Dijkstra

演算法。事實上,有多種形式的Bellman-Ford演算法的優化實現。這些優化實現在時間效率上得到相當提升,例如近一兩年被熱捧的SPFAShortest-Path Faster Algoithm 更快的最短路徑演算法)演算法的時間效率甚至由於Dijkstra演算法,因此成為資訊學奧賽選手經常討論的話題。然而,限於資料匱乏,有關Bellman-Ford演算法的諸多問題常常困擾奧賽選手。如:該演算法值得掌握麼?怎樣用程式語言具體實現?有哪些優化?與SPFA演算法有關係麼?本文試圖對Bellman-Ford演算法做一個比較全面的介紹。給出幾種實現程式,從理論和實測兩方面分析他們的時間複雜度,供大家在備戰省選和後續的noi
時參考。

Bellman-Ford演算法思想

Bellman-Ford演算法能在更普遍的情況下(存在負權邊)解決單源點最短路徑問題。對於給定的帶權(有向或無向)圖 G=V,E),其源點為s,加權函式 w是邊集 E 的對映。對圖G執行Bellman-Ford演算法的結果是一個布林值,表明圖中是否存在著一個從源點s可達的負權迴路。若不存在這樣的迴路,演算法將給出從源點s到圖G的任意頂點v的最短路徑d[v]

Bellman-Ford演算法流程分為三個階段:

(1)    初始化:將除源點外的所有頂點的最短距離估計值 d[v] ←+∞, d[s] ←0;

(2)    迭代求解:反覆對邊集E中的每條邊進行鬆弛操作,使得頂點集V中的每個頂點v的最短距離估計值逐步逼近其最短距離;(執行|v|-1次)

(3)    檢驗負權迴路:判斷邊集E中的每一條邊的兩個端點是否收斂。如果存在未收斂的頂點,則演算法返回false,表明問題無解;否則演算法返回true,並且從源點可達的頂點v的最短距離儲存在 d[v]中。

演算法描述如下:

Bellman-Ford(G,w,s) boolean   //G ,邊集函式 w s為源點

1        for each vertex v ∈ V(G) do        //初始化 1階段

2            d[v] ←+∞

3        d[s] ←0;                             //1階段結束

4        for i=1 to |v|-1 do               //2階段開始,雙重迴圈。

5           for each edge(u,v) ∈E(G) do //邊集陣列要用到,窮舉每條邊。

6              If d[v]> d[u]+ w(u,v) then      //鬆弛判斷

7                 d[v]=d[u]+w(u,v)               //鬆弛操作   2階段結束

8        for each edge(u,v) ∈E(G) do

9            If d[v]> d[u]+ w(u,v) then

10            Exit false

11    Exit true

下面給出描述性證明:

首先指出,圖的任意一條最短路徑既不能包含負權迴路,也不會包含正權迴路,因此它最多包含|v|-1條邊。

其次,從源點s可達的所有頂點如果存在最短路徑,則這些最短路徑構成一個以s為根的最短路徑樹。Bellman-Ford演算法的迭代鬆弛操作,實際上就是按頂點距離s的層次,逐層生成這棵最短路徑樹的過程。

在對每條邊進行1 遍鬆弛的時候,生成了從s出發,層次至多為1的那些樹枝。也就是說,找到了與s至多有1條邊相聯的那些頂點的最短路徑;對每條邊進行第2遍鬆弛的時候,生成了第2層次的樹枝,就是說找到了經過2條邊相連的那些頂點的最短路徑……。因為最短路徑最多隻包含|v|-1 條邊,所以,只需要迴圈|v|-1 次。

每實施一次鬆弛操作,最短路徑樹上就會有一層頂點達到其最短距離,此後這層頂點的最短距離值就會一直保持不變,不再受後續鬆弛操作的影響。(但是,每次還要判斷鬆弛,這裡浪費了大量的時間,怎麼優化?單純的優化是否可行?)

如果沒有負權迴路,由於最短路徑樹的高度最多隻能是|v|-1,所以最多經過|v|-1遍鬆弛操作後,所有從s可達的頂點必將求出最短距離。如果 d[v]仍保持 +∞,則表明從s到v不可達。

如果有負權迴路,那麼第 |v|-1 遍鬆弛操作仍然會成功,這時,負權迴路上的頂點不會收斂。

例如對於上圖,邊上方框中的數字代表權值,頂點A,B,C之間存在負權迴路。S是源點,頂點中數字表示執行Bellman-Ford演算法後各點的最短距離估計值。

此時d[a] 的值為1,大於d[c]+w(c,a)的值-2,由此d[a]可以鬆弛為-2,然後d[b]又可以鬆弛為-5,d[c]又可以鬆弛為-7.下一個週期,d[a]又可以更新為更小的值,這個過程永遠不會終止。因此,在迭代求解最短路徑階段結束後,可以通過檢驗邊集E的每條邊(u,v)是否滿足關係式 d[v]> d[u]+ w(u,v) 來判斷是否存在負權迴路。

二、基本 Bellman-Ford 演算法的 pascal實現。

bellmanford.pas 檔案

三、基本演算法之上的優化。

分析 Bellman-Ford演算法,不難看出,外層迴圈(迭代次數)|v|-1實際上取得是上限。由上面對演算法正確性的證明可知,需要的迭代遍數等於最短路徑樹的高度。如果不存在負權迴路,平均情況下的最短路徑樹的高度應該遠遠小於 |v|-1,在此情況下,多餘最短路徑樹高的迭代遍數就是時間上的浪費,由此,可以依次來實施優化。

從細節上分析,如果在某一遍迭代中,演算法描述中第7行的鬆弛操作未執行,說明該遍迭代所有的邊都沒有被鬆弛。可以證明(怎麼證明?):至此後,邊集中所有的邊都不需要再被鬆弛,從而可以提前結束迭代過程。這樣,優化的措施就非常簡單了。

設定一個布林型標誌變數 relaxed,初值為false。在內層迴圈中,僅當有邊被成功鬆弛時,將 relaxed 設定為true。如果沒有邊被鬆弛,則提前結束外層迴圈。這一改進可以極大的減少外層迴圈的迭代次數。優化後的 bellman-ford函式如下。

function bellmanford(s:longint):boolean;

     begin

        for i:=1 to nv do

          d[i]:=max;

        d[s]:=0;

        for i:=1 to nv-1 do

         begin

         relaxed:=false;

          for j:=1 TO ne do

          if(d[edges[j].s]<>max) and (d[edges[j].e]>d[edges[j].s]+edges[j].w)

               then begin

d[edges[j].e]:=d[edges[j].s]+edges[j].w ;

relaxed:=true;

                         end;

             if not relaxed then break;

end;

        for i:=1 to ne do

          if d[edges[j].e]>d[edges[j].s]+edges[j].w then exit(false);

        exit(true);

     end;

這樣看似平凡的優化,會有怎樣的效果呢?有研究表明,對於隨機生成資料的平均情況,時間複雜度的估算公式為

1.13|E|                    if |E|<|V|

0.95*|E|*lg|V|              if |E|>|V|

優化後的演算法在處理有負權迴路的測試資料時,由於每次都會有邊被鬆弛,所以relaxed每次都會被置為true,因而不可能提前終止外層迴圈。這對應了最壞情況,其時間複雜度仍舊為O(VE)

優化後的演算法的時間複雜度已經和用二叉堆優化的Dijkstra演算法相近了,而編碼的複雜程度遠比後者低。加之Bellman-Ford演算法能處理各種邊值權情況下的最短路徑問題,因而還是非常優秀的。Usaco3.2.6 的程式見bellmanford_1.pas

四、SPFA 演算法

   SPFA是目前相當優秀的求最短路徑的演算法,值得我們掌握。

   SPFABellman-Ford演算法優化的關鍵之處在於意識到:只有那些在前一遍鬆弛中改變了距離估計值的點,才可能引起他們的鄰接點的距離估計值的改變。因此,用一個先進先出的佇列來存放被成功鬆弛的頂點。初始時,源點s入隊。當佇列不為空時,取出對首頂點,對它的鄰接點進行鬆弛。如果某個鄰接點鬆弛成功,且該鄰接點不在佇列中,則將其入隊。經過有限次的鬆弛操作後,佇列將為空,演算法結束。SPFA演算法的實現,需要用到一個先進先出的佇列 queue 和一個指示頂點是否在佇列中的標記陣列 mark。為了方便查詢某個頂點的鄰接點,圖採用臨界表儲存。

程式儲存在 spfa.pas中。以usaco 3.2.6 試題2為例。用鄰接表寫的程式。

需要注意的是:僅當圖不存在負權迴路時,SPFA能正常工作。如果圖存在負權迴路,由於負權迴路上的頂點無法收斂,總有頂點在入隊和出隊往返,佇列無法為空,這種情況下SPFA無法正常結束。

判斷負權迴路的方案很多,世間流傳最廣的是記錄每個結點進隊次數,超過|V|次表示有負權

還有一種方法為記錄這個結點在路徑中處於的位置,ord[i],每次更新的時候ord[i]=ord[x]+1,若超過|V|則表示有負圈.....

其他方法還有很多,我反倒覺得流傳最廣的方法是最慢的.......

關於SPFA的時間複雜度,不好準確估計,一般認為是 OkE),k是常數

五、時間效率實測

上述介紹的Bellman-Ford演算法及兩種的優化,只是在理論上分析了時間複雜度,用實際的資料測試,會有什麼結果呢?為此,我們選擇 usaco 3.2.6

Spfa的時間效率還是很高的。並且spfa的程式設計複雜度要比Dijksta+heap優化要好的多。

六、結論

經過優化Bellman-Ford演算法是非常優化的求單源最短路徑的演算法,SPFA時間效率要優於第一種優化形式,但第一種優化形式的編碼複雜度低於SPFA。兩種優化形式的程式設計複雜度都低於Dijkstra演算法。如果在判斷是否存在負權迴路,推薦使用第一種優化形式,否則推薦使用SPFA