1. 程式人生 > >【codeforces 148DBag of mice】【概率dp】【記憶化】

【codeforces 148DBag of mice】【概率dp】【記憶化】

【連結】

【題意】

原來袋子裡有w只白鼠和b只黑鼠 ,龍和王妃輪流從袋子裡抓老鼠。

誰先抓到白色老鼠誰就贏。

王妃每次抓一隻老鼠,龍每次抓完一隻老鼠之後會有一隻老鼠跑出來。

每次抓老鼠和跑出來的老鼠都是隨機的。

如果兩個人都沒有抓到白色老鼠則龍贏。王妃先抓。 問王妃贏的概率

【思路】

dp[i][j]表示現在的狀態為i只白鼠,j只黑鼠,王妃贏得可能性

贏的 狀態來自於:

1.直接選到白色:i/(i+j)

2.王妃選到黑黑鼠,那麼龍必須也要黑鼠。

   若逃跑一隻黑鼠,(i,j)的獲勝狀態取決於dp[i,j-3]*j/(i+j)*(j-1)/(i+j-1)*(j-2)/(i+j-2)

   若逃跑一隻白鼠,(i,j)的獲勝概率取決於dp[i-1,j-2]*i/(i+j)*(j-1)/(i+j-1)*i/(i+j-2)

【dp程式碼】

#include<cstdio>
#include<cstring>
#include<map>
#include<iostream>
#include<iostream>
#include<vector>
#include<string>
#include<algorithm>
using namespace std;
using ll=long long;
const int maxn = 1e3+6;
const int inf = 0x3f3f3f3f;
const int mod = 1e9 + 7;
double dp[maxn][maxn];

int main() {
	int w, b;
	scanf("%d%d", &w, &b);
	for(int i=1;i<=w;i++)dp[i][0] = 1;
	for (int i = 1; i <= b;i++)dp[0][i] = 0;
	for (int i = 1; i <= w; i++) {
		for (int j = 1; j <= b; j++) {
			dp[i][j] += i * 1.0 / (i + j);
			if(j>=3)dp[i][j] += 1.0*j / (i + j)*(j - 1) / (i + j - 1)*(j - 2) / (i + j - 2)*dp[i][j - 3];
			if(j>=2)dp[i][j] += 1.0*j / (i + j)*(j - 1) / (i + j - 1)*i / (i + j - 2)*dp[i - 1][j - 2];
		}
	}
	printf("%.10f\n", dp[w][b]);
}
const int maxn = 1000 + 10;
int T, n, m, vis[maxn][maxn][2], w, b;
double d[maxn][maxn][2];
double dp(int a, int b, int id) {
	double ans = 0;
	if (a == 0) return 0;
	if (a != 0 && b == 0) {
		if (id) return 0;
		else return 1;
	}
	if (vis[a][b][id] != -1) return d[a][b][id];
	vis[a][b][id] = 1;
	if (id) {
		if (b > 1) ans += dp(a, b - 2, id ^ 1) *b /(a + b) * (b - 1) / (a + b - 1);
		if (b > 0 && a > 0) ans += dp(a - 1, b - 1, id ^ 1) *b / (a + b) *a / (a + b - 1);
	}
	else {
		if (a > 0) ans += (double)(a) / (a + b);
		if (b > 0) ans += dp(a, b - 1, id ^ 1) * b / (a + b);
	}
	return d[a][b][id]=ans;
}
int main() {
	memset(vis, -1, sizeof(vis));
	scanf("%d%d", &w, &b);
	double ans = dp(w, b, 0);
	printf("%.10f\n", ans);
	return 0;
}