1. 程式人生 > >【bzoj 1076】[SCOI2008]獎勵關(狀壓dp+概率)

【bzoj 1076】[SCOI2008]獎勵關(狀壓dp+概率)

1076: [SCOI2008]獎勵關

Time Limit: 10 Sec  Memory Limit: 128 MB
Submit: 1817  Solved: 994
[Submit][Status][Discuss]

Description

  你正在玩你最喜歡的電子遊戲,並且剛剛進入一個獎勵關。在這個獎勵關裡,系統將依次隨機丟擲k次寶物,
每次你都可以選擇吃或者不吃(必須在丟擲下一個寶物之前做出選擇,且現在決定不吃的寶物以後也不能再吃)。
 寶物一共有n種,系統每次丟擲這n種寶物的概率都相同且相互獨立。也就是說,即使前k-1次系統都丟擲寶物1(
這種情況是有可能出現的,儘管概率非常小),第k次丟擲各個寶物的概率依然均為1/n。 獲取第i種寶物將得到Pi
分,但並不是每種寶物都是可以隨意獲取的。第i種寶物有一個前提寶物集合Si。只有當Si中所有寶物都至少吃過
一次,才能吃第i種寶物(如果系統丟擲了一個目前不能吃的寶物,相當於白白的損失了一次機會)。注意,Pi可
以是負數,但如果它是很多高分寶物的前提,損失短期利益而吃掉這個負分寶物將獲得更大的長期利益。 假設你
採取最優策略,平均情況你一共能在獎勵關得到多少分值?

Input

  第一行為兩個正整數k和n,即寶物的數量和種類。以下n行分別描述一種寶物,其中第一個整數代表分值,隨
後的整數依次代表該寶物的各個前提寶物(各寶物編號為1到n),以0結尾。

Output

  輸出一個實數,保留六位小數,即在最優策略下平均情況的得分。

Sample Input

1 2
1 0
2 0

Sample Output

1.500000

HINT

【資料規模】

1<=k<=100,1<=n<=15,分值為[-10^6,10^6]內的整數。

Source

【題解】【狀壓dp+概率】

【這一步的期望=(上一步的期望+這一步的價值)/n】

【f[i][j] 表示到第i種物品的j狀態的期望。】

【由於前面的物品對後面的物品有影響,那麼這樣考慮起來無疑會使算期望變得很繁瑣。所以考慮倒推,即考慮一種物品選了後,有哪些物品必選,這一點可以通過每一個物品的“至少”狀態找出。那麼這一步的期望至少就是就是上一步的期望+當前必選點的價值除以n,非必選點可選可不選。 這樣保證到每個點都是有效狀態,期望就好求得多】

#include<cstdio>
#include<cstring>
#include<algorithm>
using namespace std;
int mi[20],d[20],val[20],n,k;
double f[110][65540];
int main()
{
	for(int i=1;i<=16;++i) mi[i]=1<<(i-1);
	scanf("%d%d",&k,&n);
	for(int i=1;i<=n;++i)
	 {
	 	int x;
	 	scanf("%d%d",&val[i],&x);
	 	while(x)
	 	 {
	 	 	d[i]+=mi[x];
	 	 	scanf("%d",&x);
	    }
	 }
	for(int i=k;i>0;--i)
	 for(int j=0;j<=mi[n+1]-1;++j)
	  {
	  	for(int h=1;h<=n;++h)
	  	 if((d[h]&j)==d[h])  f[i][j]+=max(f[i+1][j],f[i+1][j|mi[h]]+val[h]);
	  	  else f[i][j]+=f[i+1][j];
	  	f[i][j]/=n;
	  }
	printf("%.6lf\n",f[1][0]);
	return 0;
}