1. 程式人生 > >[SCOI2008] 獎勵關

[SCOI2008] 獎勵關

print 所有 依次 系統 DC std reg 一行 void

題目背景

08四川NOI省選

題目描述

你正在玩你最喜歡的電子遊戲,並且剛剛進入一個獎勵關。在這個獎勵關裏,系統將依次隨機拋出k次寶物,每次你都可以選擇吃或者不吃(必須在拋出下一個寶物之前做出選擇,且現在決定不吃的寶物以後也不能再吃)。

寶物一共有n種,系統每次拋出這n種寶物的概率都相同且相互獨立。也就是說,即使前k-1 次系統都拋出寶物1(這種情況是有可能出現的,盡管概率非常小),第k次拋出各個寶物的概率依然均為1/n。

獲取第 i 種寶物將得到Pi分,但並不是每種寶物都是可以隨意獲取的。第i種寶物有一個前提寶物集合Si。只有當Si中所有寶物都至少吃過一次,才能吃第i 種寶物(如果系統拋出了一個目前不能吃的寶物,相當於白白的損失了一次機會)。註意,Pi 可以是負數,但如果它是很多高分寶物的前提,損失短期利益而吃掉這個負分寶物將獲得更大的長期利益。

假設你采取最優策略,平均情況你一共能在獎勵關得到多少分值?

輸入輸出格式

輸入格式:

第一行為兩個正整數k 和n,即寶物的數量和種類。以下n行分別描述一種

寶物,其中第一個整數代表分值,隨後的整數依次代表該寶物的各個前提寶物(各

寶物編號為1到n),以0結尾。

輸出格式:

輸出一個實數,保留六位小數,即在最優策略下平均情況的得分。

輸入輸出樣例

輸入樣例#1:
1 2
1 0
2 0
輸出樣例#1:
1.500000
輸入樣例#2:
6 6
12 2 3 4 5 0
15 5 0
-2 2 4 5 0
-11 2 5 0
5 0
1 2 4 5 0
輸出樣例#2:
10.023470

說明

1 <= k <= 100, 1 <= n <= 15,分值為[-106,106]內的整數。

子集上dp,對後繼期望取max即可。

#include<bits/stdc++.h>
#define ll long long
#define D double
using namespace std;
int ci[25],n,k,pre[25],val[25],now;
D f[105][40005],tmp;

inline void solve(){
	tmp=1/(D)n;
	for(int i=k-1;i>=0;i--)
	    for(int j=0;j<ci[n];j++)
	        for(int l=0;l<n;l++){
			    if((pre[l]&j)==pre[l]) f[i][j]+=tmp*max(f[i+1][j|ci[l]]+val[l],f[i+1][j]);
			    else f[i][j]+=tmp*f[i+1][j];
			}
}

int main(){
	ci[0]=1;
	for(int i=1;i<=20;i++) ci[i]=ci[i-1]<<1;
	scanf("%d%d",&k,&n);
	for(int i=0;i<n;i++){
		scanf("%d",val+i);
		while(scanf("%d",&now)==1&&now) pre[i]|=ci[now-1];
	}
	
	solve();
	
	printf("%.6lf\n",f[0][0]);
	return 0;
}

  

[SCOI2008] 獎勵關