201803-4棋局評估_極大極小值演算法_對抗搜尋（轉載）

阿新 • • 發佈：2019-01-11

問題描述

試題編號：	201803-4
試題名稱：	棋局評估
時間限制：	1.0s
記憶體限制：	256.0MB
問題描述：	問題描述　　Alice和Bob正在玩井字棋遊戲。　　井字棋遊戲的規則很簡單：兩人輪流往3*3的棋盤中放棋子，Alice放的是“X”，Bob放的是“O”，Alice執先。當同一種棋子佔據一行、一列或一條對角線的三個格子時，遊戲結束，該種棋子的持有者獲勝。當棋盤被填滿的時候，遊戲結束，雙方平手。　　Alice設計了一種對棋局評分的方法：　　- 對於Alice已經獲勝的局面，評估得分為(棋盤上的空格子數+1)；　　- 對於Bob已經獲勝的局面，評估得分為 -(棋盤上的空格子數+1)；　　- 對於平局的局面，評估得分為0；　　例如上圖中的局面，Alice已經獲勝，同時棋盤上有2個空格，所以局面得分為2+1=3。　　由於Alice並不喜歡計算，所以他請教擅長程式設計的你，如果兩人都以最優策略行棋，那麼當前局面的最終得分會是多少？輸入格式　　輸入的第一行包含一個正整數T，表示資料的組數。　　每組資料輸入有3行，每行有3個整數，用空格分隔，分別表示棋盤每個格子的狀態。0表示格子為空，1表示格子中為“X”，2表示格子中為“O”。保證不會出現其他狀態。　　保證輸入的局面合法。(即保證輸入的局面可以通過行棋到達，且保證沒有雙方同時獲勝的情況) 　　保證輸入的局面輪到Alice行棋。輸出格式　　對於每組資料，輸出一行一個整數，表示當前局面的得分。樣例輸入3 1 2 1 2 1 2 0 0 0 2 1 1 0 2 1 0 0 2 0 0 0 0 0 0 0 0 0樣例輸出3 -4 0樣例說明　　第一組資料：　　Alice將棋子放在左下角(或右下角)後，可以到達問題描述中的局面，得分為3。　　3為Alice行棋後能到達的局面中得分的最大值。　　第二組資料：　　Bob已經獲勝(如圖)，此局面得分為-(3+1)=-4。　　第三組資料：　　井字棋中若雙方都採用最優策略，遊戲平局，最終得分為0。資料規模和約定　　對於所有評測用例，1 ≤ T ≤ 5。

題目分析轉載自該部落格, 非常感謝博主分享解題方法。

以下

先說說極大極小演算法，是指給可能出現的所有狀態賦予一個評估值，兩個玩家通過計算不同下棋策略對應不同的評估值，來決定如何下棋。對於井字棋遊戲來說，它的博弈樹（各種走法組合形成的樹）如下：

Alice(MAX)下X，Bob(MIN)下O，直到到達了樹的終止狀態即一位棋手佔領一行，一列、一對角線或所有方格都被填滿。Utility指效用函式，定義遊戲者在狀態S下的數值。在這道題中，就是指：

- 對於Alice已經獲勝的局面，評估得分為(棋盤上的空格子數+1)；
　　- 對於Bob已經獲勝的局面，評估得分為 -(棋盤上的空格子數+1)；
　　- 對於平局的局面，評估得分為0；

所以，在上圖策略樹中，無論當前局勢如何，Alice（MAX）總會選擇最大的評估分對應的走法，Bob（MIN）總會選擇最小的評估分對應的走法。這樣才能使自己儘快的贏得比賽（這一點是關鍵，要想清楚）。題目中只給出了策略樹中葉子節點的評估分的計算方法（贏，輸或平局情況的評估分計算方法），那如何計算策略樹中每個非葉子節點對應的評估分值呢？

答案是採用深度優先搜尋對整個策略樹進行後序遍歷，這樣，先計算策略樹中葉子節點的評估值，在一層層的往上計算非葉子節點的評估值，最終，會得到整個策略樹的評估值，這樣就可以確定玩家在當前情況下應該如何走棋了。

根據以上思路：

#include <iostream>
using namespace std;

const int INF = 0x3f3f3f3f;
int map[10], T;

int check()
{
    int it = 0;
    for (int i = 1; i <= 3; ++i) { // 找出是否可以結束。
        if (map[i] == map[i + 3] && map[i + 3] == map[i + 6] && map[i]) {
            it = map[i];
            break;
        }
        int k = 3*(i - 1) + 1;
        if (map[k] == map[k + 1] && map[k] == map[k + 2] && map[k]) {
            it = map[k];
            break;
        }
    }
    if (!it) {
        if (map[1] == map[5] && map[1] == map[9] && map[1]) it = map[1];
        else if (map[3] == map[5] && map[5] == map[7] && map[5]) it = map[5];
    }
    int cnt = 0;
    for (int i = 1; i <= 9; ++i)
        if (map[i] == 0) cnt++;
    if (it == 0 && cnt == 0) return 0;
    if (it == 1) return cnt + 1;
    else if (it == 2) return - (cnt + 1);
    else return -1;
}

int dfs(int it)
{
    int chec = check();
    if (chec != -1) return chec;
    int ans = it == 1 ? -INF : INF;
    for (int i = 1; i <= 9; ++i) {
        if (map[i]) continue;
        if (it == 1) {
            map[i] = 1;
            ans = max(ans, dfs(2));
        } else {
            map[i] = 2;
            ans = min(ans, dfs(1));
        }
        map[i] = 0;
    }
    return ans;
}

int main()
{
    cin >> T;
    while (T--) {
        for (int i = 1; i <= 9; ++i) {
            cin >> map[i];
        }
        cout << dfs(1) << endl;;
    }
}

201803-4棋局評估_極大極小值演算法_對抗搜尋（轉載）

以下

201803-4棋局評估_極大極小值演算法_對抗搜尋（轉載）

CCF 201803-4 棋局評估極大極小搜尋

CCF 201803-4 棋局評估（對抗搜索）

201803-4 棋局評估

201803-4 棋局評估

CCF 201803-4 棋局評估

ccf csf 201803-4 棋局評估

201803-4 棋局評估 ccf

201803-4 棋局評估（動態規劃+優先佇列）

CCF-CSP-201803-4 棋局評估

CCF 201803-4 棋局評估（博弈論）

極大極小值搜尋 + 剪枝

牛頓法求極大極小值

中國象棋人機對弈搜尋演算法學習-極大極小值，負極大值，alpha-beta演算法

五子棋（人機）-極大極小值搜尋演算法

QT五子棋專案詳解之四：AI人機對戰max-min極大極小值博弈演算法

梯度爆炸與梯度消失的原因以及解決方法，區域性極小值問題以及學習率問題（對SGD的改進）

極大極小搜索思想+（α/β）減枝【轉自-----https://blog.csdn.net/hzk_cpp/article/details/79275772】

極大極小演算法轉

【LeetCode 913】cat-and-mouse | BFS+記憶化 | 極大極小搜尋+AB剪枝 | CGUZ | H

201803-4棋局評估_極大極小值演算法_對抗搜尋（轉載）

以下

相關推薦