【codeforces 148DBag of mice】【概率dp】【記憶化】
阿新 • • 發佈:2018-12-13
【連結】
【題意】
原來袋子裡有w只白鼠和b只黑鼠 ,龍和王妃輪流從袋子裡抓老鼠。
誰先抓到白色老鼠誰就贏。
王妃每次抓一隻老鼠,龍每次抓完一隻老鼠之後會有一隻老鼠跑出來。
每次抓老鼠和跑出來的老鼠都是隨機的。
如果兩個人都沒有抓到白色老鼠則龍贏。王妃先抓。 問王妃贏的概率
【思路】
dp[i][j]表示現在的狀態為i只白鼠,j只黑鼠,王妃贏得可能性
贏的 狀態來自於:
1.直接選到白色:i/(i+j)
2.王妃選到黑黑鼠,那麼龍必須也要黑鼠。
若逃跑一隻黑鼠,(i,j)的獲勝狀態取決於dp[i,j-3]*j/(i+j)*(j-1)/(i+j-1)*(j-2)/(i+j-2)
若逃跑一隻白鼠,(i,j)的獲勝概率取決於dp[i-1,j-2]*i/(i+j)*(j-1)/(i+j-1)*i/(i+j-2)
【dp程式碼】
#include<cstdio> #include<cstring> #include<map> #include<iostream> #include<iostream> #include<vector> #include<string> #include<algorithm> using namespace std; using ll=long long; const int maxn = 1e3+6; const int inf = 0x3f3f3f3f; const int mod = 1e9 + 7; double dp[maxn][maxn]; int main() { int w, b; scanf("%d%d", &w, &b); for(int i=1;i<=w;i++)dp[i][0] = 1; for (int i = 1; i <= b;i++)dp[0][i] = 0; for (int i = 1; i <= w; i++) { for (int j = 1; j <= b; j++) { dp[i][j] += i * 1.0 / (i + j); if(j>=3)dp[i][j] += 1.0*j / (i + j)*(j - 1) / (i + j - 1)*(j - 2) / (i + j - 2)*dp[i][j - 3]; if(j>=2)dp[i][j] += 1.0*j / (i + j)*(j - 1) / (i + j - 1)*i / (i + j - 2)*dp[i - 1][j - 2]; } } printf("%.10f\n", dp[w][b]); }
const int maxn = 1000 + 10; int T, n, m, vis[maxn][maxn][2], w, b; double d[maxn][maxn][2]; double dp(int a, int b, int id) { double ans = 0; if (a == 0) return 0; if (a != 0 && b == 0) { if (id) return 0; else return 1; } if (vis[a][b][id] != -1) return d[a][b][id]; vis[a][b][id] = 1; if (id) { if (b > 1) ans += dp(a, b - 2, id ^ 1) *b /(a + b) * (b - 1) / (a + b - 1); if (b > 0 && a > 0) ans += dp(a - 1, b - 1, id ^ 1) *b / (a + b) *a / (a + b - 1); } else { if (a > 0) ans += (double)(a) / (a + b); if (b > 0) ans += dp(a, b - 1, id ^ 1) * b / (a + b); } return d[a][b][id]=ans; } int main() { memset(vis, -1, sizeof(vis)); scanf("%d%d", &w, &b); double ans = dp(w, b, 0); printf("%.10f\n", ans); return 0; }