1. 程式人生 > >[bzoj 1076][SCOI2008]獎勵關

[bzoj 1076][SCOI2008]獎勵關

pan 遊戲 表示 bold paper esc max efi 決定

傳送門

Description

你正在玩你最喜歡的電子遊戲,並且剛剛進入一個獎勵關。在這個獎勵關裏,系統將依次隨機拋出k次寶物, 每次你都可以選擇吃或者不吃(必須在拋出下一個寶物之前做出選擇,且現在決定不吃的寶物以後也不能再吃)。 ?寶物一共有n種,系統每次拋出這n種寶物的概率都相同且相互獨立。也就是說,即使前k-1次系統都拋出寶物1( 這種情況是有可能出現的,盡管概率非常小),第k次拋出各個寶物的概率依然均為1/n。 獲取第i種寶物將得到Pi 分,但並不是每種寶物都是可以隨意獲取的。第i種寶物有一個前提寶物集合Si。只有當Si中所有寶物都至少吃過 一次,才能吃第i種寶物(如果系統拋出了一個目前不能吃的寶物,相當於白白的損失了一次機會)。註意,Pi可 以是負數,但如果它是很多高分寶物的前提,損失短期利益而吃掉這個負分寶物將獲得更大的長期利益。 假設你 采取最優策略,平均情況你一共能在獎勵關得到多少分值?

Solution

\(n \leq 15\),可以對取到的種類集合狀壓

考慮逆推,\(f[i][S]\)表示到第\(i\)個位置,狀態為\(S\),走到第\(k\)步的期望
\[ f[i][S] +=max(f[i+1][S],f[i+1][S \cup j]+p[j]) \ \ \ j所需要的集合\subseteq S, \]

\[ f[i][S]+ f[i+1][S] \ \ \ j所需要的集合 \nsubseteq S \]


Code?

#include<bits/stdc++.h>
#define ll long long
#define max(a,b) ((a)>(b)?(a):(b))
#define min(a,b) ((a)<(b)?(a):(b))
inline int read()
{
    int x=0,f=1;char ch=getchar();
    while(ch<'0'||ch>'9'){if(ch=='-')f=-1;ch=getchar();}
    while(ch>='0'&&ch<='9'){x=(x<<3)+(x<<1)+ch-'0';ch=getchar();}
    return x*f;
}
#define MN 105
int k,n,p[16],x,s[16];
double f[2][1<<15];
int main()
{
    k=read();n=read();
    register int i,S,j;
    for(i=0;i<n;++i)
    {
        p[i]=read();
        x=read();
        while(x)
        {
            s[i]|=1<<x-1;
            x=read();
        }
    }
    for(i=k;i>=1;--i)for(S=(1<<n)-1;~S;--S)
    {
        f[i&1][S]=0.;
        for(j=0;j<n;j++)
            f[i&1][S]+=(s[j]|S)==S?max(f[(i&1)^1][S],f[(i&1)^1][S|(1<<j)]+p[j]*1.):f[(i&1)^1][S];
        f[i&1][S]/=n*1.;
    }
    printf("%.6lf\n",f[1][0]);
}



Blog來自PaperCloud,未經允許,請勿轉載,TKS!

[bzoj 1076][SCOI2008]獎勵關