對極大極小搜尋和阿爾法貝塔剪枝搜尋演算法的簡單描述與理解--萌新向通俗易懂

阿新 • • 發佈：2019-01-11

這是本人第一次正經寫部落格，排版技術不行，看起來可能有點難受，但我相信如果大家認真按順序讀下去一定能理解這個演算法，如果還有不是很清楚或者覺得我哪裡有講錯的地方歡迎評論留言！這段時間都在！會看和回覆的！

阿爾法貝塔剪枝是基於極大極小值搜尋的一種演算法。

舉個比較簡單的例子。這裡有兩個包，在你知道兩個包裡有什麼的情況下，你需要選一個包然後讓你的競爭對手小明從這個包裡的兩張錢中選一張給你，但是你想讓自己的錢越多越好而小明不想讓你錢多，所以他會選一張相對最小的錢給你。也即對你而言，你需要從中獲得最大利益，而小明只是想承受最小的對手變強程度。在這種情況下你應該選擇包2，小明會給你2元。如果你選擇了包1 ，你只能得到0.5元。

這其實就是極大極小搜尋，抽象到樹的形式來看，這次我們來選數字，注意一點的是這個樹的搜尋順序用人腦其實是反過來的，這個具體我會在後面的程式碼實現裡講，為了方便我們理解就暫時先從下往上看把。就比如是上一題的包裡拿錢問題，0.5，100是第一個包內的錢，2，10是第二個包裡的，當我們拿了一個包就往上推讓B選其中一張較小錢，即0.5或2，最後我們從這兩張錢裡選一張拿到我們手上，因為這是我們自己在推演這個過程，所以要考慮完備也即所有可能的情況，也就是為什麼這裡B可以選兩張錢（這個說出來了就很好理解甚至有點蠢，但是我剛學的時候思路卡了很久所以提一下），這樣在實際情況中其實我們只能選一個包讓b選一張錢給我們，所以一個完備的推演過程可以保證我們獲得的利益也就是最上面的節點的數字最大。其實分析以下我們可以推廣到n層，無非是分成了兩個層：一個是MAX層，這一層由我們來選擇從下一層拿上來的數字，為了自己的利益最大化，我們會從下一層的子節點選擇極大的一個來存在這個節點，故稱為MAX；一個是MIN層，由對手選，同理，他會想方設法降低我們獲得的利益，所以他會從下一層選極小的節點來存，這樣我們的MAX層在選的時候就只能拿到相對較小的極大。

以上就是極大極小值搜尋的內容了，但是單純用極大極小搜尋的意義不是很大，因為在博弈中，一步棋可能會有成千上萬種招法，如果全部進行搜尋時間耗費太長，效率不高，在規定時間內下棋肯定是行不通的。這個時候就需要進行一些優化，也就是阿爾法貝塔剪枝了。

小插曲：感興趣的朋友還可以看看負極大值搜尋這個演算法，跟極大極小內涵一樣，只是人們嫌轉換極大極小不方便，乾脆把極小層加個負號，這樣可以全搜極大，因為極大的負就是這層的最小！這裡不多說了。

剪枝，顧名思義就是剪去枝節，也就是我們的樹的節點鏈。【請務必先理解透徹極大極小的搜尋邏輯和順序！】下圖引用自英文的阿爾法貝塔剪枝維基百科https://en.wikipedia.org/wiki/Alpha%E2%80%93beta_pruning

它和我們上面的選錢遊戲的搜尋樹長得很像，因為這個演算法就是基於極大極小值搜尋的，為什麼叫阿爾法貝塔，因為有alpha，beta兩個值。alpha表示我們需要的最好結果，beta表示對手能承受的最壞結果。基於最壞的打算的思想，把alpha初值設為負無窮即-INF，beta為正無窮INF。上圖是已經搜尋完畢並且剪枝節了的，所以我們從下往上從左往右分析一下，為什麼這樣選，為什麼這樣剪枝。【其實最下面的MAX層我感覺沒必要標出來，它們是已經先存在待選的】在最左邊，選第一個MIN層即B選，對B而言研究beta，即B能承受的最小，拿下面兩個子節點和beta比較，此時beta初值為-INF，一定小於子節點的數，選出了5是較小的，往上走發現第三層【從上往下數，後面也一樣】的第一個節點有另一個子節點，於是去搜索另一個子節點，第五層第一個是7，返回到第四層第二個節點，然後繼續往後，第五層第二個節點是4，比7小於是第四層第二個節點更新為4，此時出現了第一個剪枝【關鍵點來了！】。因為對於第三層第一個節點，我們已經搜過一次，得到此時的alpha是5，第三層是max層，他會從第四層對應子節點選一個極大的值，而第四層是min層會從第五層選擇極小值，也就是說，我們繼續在第五層的對應第四層第二個節點的子節點搜尋也只可能返回給第四層第二個節點比4更小的數字，但是第三層選的是極大，5已經比4大了，換句話說，無論第四層第二個節點再怎麼更新值也只能小於等於4，也即小於5，所以第三層第一個節點一定不會去選第四層第二個節點了，也就沒有必要再搜尋後面了，這就使用了第一次剪枝節。【記住一個關鍵點，考慮父節點的min、max性質，比較兄弟節點來剪枝節】第二次剪枝即第四層第五個節點剪枝同理不再講。對於第三次剪枝節也即第二層第三個節點，我們先搜尋他的第一個子節點，一路搜上來返回了5，這裡直接剪掉了一整條第三層第六節點。這裡從我上面提到的關鍵點考慮，因為第一層是max層，他會從第二層選一個極大，此時我們已經搜尋出來第二層第二個節點是6，而第三個節點是5，第二層是min層，第三個節點繼續搜尋也只可能比5小，也即小於6，所以直接剪去第二層第三節點的所有其他子節點，去搜索第四個節點【如果有的話】。

【為方便閱讀看圖下面再貼一次】

相信到這裡大家應該已經對概念理解的差不多了。上面我曾提到過，為了方便理解，我們從底部往上想，但是在程式碼裡這樣就不太好寫了。對程式碼，我們可以利用遞迴返回來實現從下往上回溯，返回一個一個的節點搜尋值。遞迴如果你比較熟悉的話應該會容易懂，即寫的時候是從上往下寫，但邏輯上其實是從下往上返回值。

先推薦一個我感覺alpha-beta寫的比較清楚的：https://blog.csdn.net/u013351484/article/details/50810224

這個是一個三角點格棋的題，理解這個儲存局面和連邊可能會有點挫折，實在看不明白可以直接看他的alpha-beta函式，不去理會這個題本身，博主註釋寫的還是很清楚的！歡迎評論留言

對極大極小搜尋和阿爾法貝塔剪枝搜尋演算法的簡單描述與理解--萌新向通俗易懂

對極大極小搜尋和阿爾法貝塔剪枝搜尋演算法的簡單描述與理解--萌新向通俗易懂

極大極小值搜尋 + 剪枝

【LeetCode 913】cat-and-mouse | BFS+記憶化 | 極大極小搜尋+AB剪枝 | CGUZ | H

算法筆記--極大極小搜索及alpha-beta剪枝

博弈基礎——極大極小搜尋

CCF 201803-4 棋局評估極大極小搜尋

MATLAB—一字棋（極大極小搜尋）

牛頓法求極大極小值

201803-4棋局評估_極大極小值演算法_對抗搜尋（轉載）

中國象棋人機對弈搜尋演算法學習-極大極小值，負極大值，alpha-beta演算法

五子棋（人機）-極大極小值搜尋演算法

poj 1085 Triangle War 1568 Find the Winning Move 極大極小搜尋 alpha-beta剪枝

POJ 1085 Triangle War（極大極小搜尋+alpha-beta剪枝）

POJ 1085 Triangle War（博弈，極大極小搜尋+alpha_beta剪枝）

QT五子棋專案詳解之四：AI人機對戰max-min極大極小值博弈演算法

[演算法] 極大極小搜尋

極大極小搜索思想+（α/β）減枝【轉自-----https://blog.csdn.net/hzk_cpp/article/details/79275772】

極大極小演算法轉

自定義比例的GS噪聲和椒鹽噪聲的加入和阿爾法修正的均值濾波的實現

極大極小演算法原理

對極大極小搜尋和阿爾法貝塔剪枝搜尋演算法的簡單描述與理解--萌新向通俗易懂

相關推薦