1. 程式人生 > >BZOJ1076 [SCOI2008]獎勵關 【狀壓dp + 數學期望】

BZOJ1076 [SCOI2008]獎勵關 【狀壓dp + 數學期望】

1076: [SCOI2008]獎勵關

Time Limit: 10 Sec  Memory Limit: 128 MB
Submit: 3074  Solved: 1599
[Submit][Status][Discuss]

Description

  你正在玩你最喜歡的電子遊戲,並且剛剛進入一個獎勵關。在這個獎勵關裡,系統將依次隨機丟擲k次寶物,
每次你都可以選擇吃或者不吃(必須在丟擲下一個寶物之前做出選擇,且現在決定不吃的寶物以後也不能再吃)。
 寶物一共有n種,系統每次丟擲這n種寶物的概率都相同且相互獨立。也就是說,即使前k-1次系統都丟擲寶物1(
這種情況是有可能出現的,儘管概率非常小),第k次丟擲各個寶物的概率依然均為1/n。 獲取第i種寶物將得到Pi
分,但並不是每種寶物都是可以隨意獲取的。第i種寶物有一個前提寶物集合Si。只有當Si中所有寶物都至少吃過
一次,才能吃第i種寶物(如果系統丟擲了一個目前不能吃的寶物,相當於白白的損失了一次機會)。注意,Pi可
以是負數,但如果它是很多高分寶物的前提,損失短期利益而吃掉這個負分寶物將獲得更大的長期利益。 假設你
採取最優策略,平均情況你一共能在獎勵關得到多少分值?

Input

  第一行為兩個正整數k和n,即寶物的數量和種類。以下n行分別描述一種寶物,其中第一個整數代表分值,隨
後的整數依次代表該寶物的各個前提寶物(各寶物編號為1到n),以0結尾。

Output

  輸出一個實數,保留六位小數,即在最優策略下平均情況的得分。

Sample Input

1 2
1 0
2 0

Sample Output

1.500000

HINT

【資料規模】

1<=k<=100,1<=n<=15,分值為[-10^6,10^6]內的整數。


很容易想到狀壓Dp,但是轉移的過程著實令人頭疼

我們設f[i][s]是第i輪過後已吃狀態為s的期望最優值

怎麼轉移?

我們考慮正著推:

①用f[i][s]更新f[i + 1][...],考慮到是概率期望,所以每次更新所產生的貢獻難以確定

②用f[i - 1][...]更新f[i][s],由於寶物是可以重複收取的,所以無法確定刪去一個點後的狀態

那麼我們可以考慮這樣:f[i][s]表示第i輪開始前狀態為s,從此刻開始到所有寶物收取完的利益期望之和

我們就可以每次列舉n個可能丟擲的物品進行狀態轉移了

【狀壓的轉移方式很重要】

#include<iostream>
#include<cstdio>
#include<cstring>
#include<algorithm>
#define LL long long int
#define REP(i,n) for (int i = 1; i <= (n); i++)
#define Redge(u) for (int k = head[u]; k != -1; k = edge[k].next)
using namespace std;
const int maxn = 20,maxk = 105,maxm = 1 << 15,INF = 1000000000;
inline int RD(){
	int out = 0,flag = 1; char c = getchar();
	while (c < 48 || c > 57) {if (c == '-') flag = -1; c = getchar();}
	while (c >= 48 && c <= 57) {out = (out << 1) + (out << 3) + c - '0'; c = getchar();}
	return out * flag;
}
double f[maxk][maxm];
int v[maxn],w[maxn],n,K;
int main(){
	K = RD(); n = RD(); int x,maxv = (1 << n) - 1;
	REP(i,n){
		w[i] = RD();
		while ((x = RD())) v[i] |= (1 << x - 1);
	}
	for (int i = K; i > 0; i--){
		for (int s = 0; s <= maxv; s++){
			for (int t = 1; t <= n; t++){
				if ((s & v[t]) == v[t]){
					int e = 1 << t - 1;
					f[i][s] += max(f[i + 1][s],f[i + 1][s | e] + w[t]);
				}else f[i][s] += f[i + 1][s];
			}
			f[i][s] /= n;
		}
	}
	printf("%.6lf\n",f[1][0]);
	return 0;
}