[bzoj 1076][SCOI2008]獎勵關

阿新 • • 發佈：2019-01-03

pan 遊戲表示 bold paper esc max efi 決定

傳送門

Description

你正在玩你最喜歡的電子遊戲，並且剛剛進入一個獎勵關。在這個獎勵關裏，系統將依次隨機拋出k次寶物，每次你都可以選擇吃或者不吃（必須在拋出下一個寶物之前做出選擇，且現在決定不吃的寶物以後也不能再吃）。 ?寶物一共有n種，系統每次拋出這n種寶物的概率都相同且相互獨立。也就是說，即使前k-1次系統都拋出寶物1（這種情況是有可能出現的，盡管概率非常小），第k次拋出各個寶物的概率依然均為1/n。獲取第i種寶物將得到Pi 分，但並不是每種寶物都是可以隨意獲取的。第i種寶物有一個前提寶物集合Si。只有當Si中所有寶物都至少吃過一次，才能吃第i種寶物（如果系統拋出了一個目前不能吃的寶物，相當於白白的損失了一次機會）。註意，Pi可以是負數，但如果它是很多高分寶物的前提，損失短期利益而吃掉這個負分寶物將獲得更大的長期利益。假設你采取最優策略，平均情況你一共能在獎勵關得到多少分值？

Solution

\(n \leq 15\)，可以對取到的種類集合狀壓

考慮逆推，\(f[i][S]\)表示到第\(i\)個位置，狀態為\(S\),走到第\(k\)步的期望
\[ f[i][S] +=max(f[i+1][S],f[i+1][S \cup j]+p[j]) \ \ \ j所需要的集合\subseteq S, \]

\[ f[i][S]+ f[i+1][S] \ \ \ j所需要的集合 \nsubseteq S \]

Code?

#include<bits/stdc++.h>
#define ll long long
#define max(a,b) ((a)>(b)?(a):(b))
#define min(a,b) ((a)<(b)?(a):(b))
inline int read()
{
    int x=0,f=1;char ch=getchar();
    while(ch<'0'||ch>'9'){if(ch=='-')f=-1;ch=getchar();}
    while(ch>='0'&&ch<='9'){x=(x<<3)+(x<<1)+ch-'0';ch=getchar();}
    return x*f;
}
#define MN 105
int k,n,p[16],x,s[16];
double f[2][1<<15];
int main()
{
    k=read();n=read();
    register int i,S,j;
    for(i=0;i<n;++i)
    {
        p[i]=read();
        x=read();
        while(x)
        {
            s[i]|=1<<x-1;
            x=read();
        }
    }
    for(i=k;i>=1;--i)for(S=(1<<n)-1;~S;--S)
    {
        f[i&1][S]=0.;
        for(j=0;j<n;j++)
            f[i&1][S]+=(s[j]|S)==S?max(f[(i&1)^1][S],f[(i&1)^1][S|(1<<j)]+p[j]*1.):f[(i&1)^1][S];
        f[i&1][S]/=n*1.;
    }
    printf("%.6lf\n",f[1][0]);
}

Blog來自PaperCloud，未經允許，請勿轉載，TKS！

[bzoj 1076][SCOI2008]獎勵關

[BZOJ 1076][SCOI2008]獎勵關（期望+狀壓Dp）

方便 double spa solution bsp 所有一個 int stream Description 你正在玩你最喜歡的電子遊戲，並且剛剛進入一個獎勵關。在這個獎勵關裏，系統將依次隨機拋出k次寶物，每次你都可以選擇吃或者不吃（必須在拋出下一個寶物之前做出選

bzoj 1076: [SCOI2008]獎勵關

目前 sin 最大 ios 有一個決定 cpp 正在 gpo Description 你正在玩你最喜歡的電子遊戲，並且剛剛進入一個獎勵關。在這個獎勵關裏，系統將依次隨機拋出k次寶物，每次你都可以選擇吃或者不吃（必須在拋出下一個寶物之前做出選擇，且現在決定不吃的寶物以後也不

BZOJ 1076 [SCOI2008]獎勵關【狀態壓縮】【期望DP】

基於hzwer的部落格。 lim[i]lim[i]lim[i]表示可以獲得iii得前提。考慮倒推，當前狀態的期望=（上一個狀態的期望+這次得到的價值）/概率 #include <bits/stdc++.h> #define db double #d

[bzoj 1076][SCOI2008]獎勵關

pan 遊戲表示 bold paper esc max efi 決定傳送門 Description 你正在玩你最喜歡的電子遊戲，並且剛剛進入一個獎勵關。在這個獎勵關裏，系統將依次隨機拋出k次寶物，每次你都可以選擇吃或者不吃（必須在拋出下一個寶物之前做出選擇，

BZOJ 1076([SCOI2008]獎勵關-期望dp-從後向前)

1076: [SCOI2008]獎勵關 Time Limit: 10 Sec Memory Limit: 162 MBSubmit: 328 Solved: 199 [Submit][Status][Discuss] Description 你正在玩你最喜歡的電子遊

bzoj 1076: [SCOI2008]獎勵關（期望dp）

1076: [SCOI2008]獎勵關 Time Limit: 10 Sec Memory Limit: 128 MBSubmit: 1814 Solved: 992 [Submit][Sta

bzoj 1076: [SCOI2008]獎勵關(期望DP，狀壓。)

Description 　　你正在玩你最喜歡的電子遊戲，並且剛剛進入一個獎勵關。在這個獎勵關裡，系統將依次隨機丟擲k次寶物，每次你都可以選擇吃或者不吃（必須在丟擲下一個寶物之前做出選擇，且現在決定不吃的寶物以後也不能再吃）。寶物一共有n種，系統每次丟擲這n種寶物的概率

BZOJ 1076 SCOI2008獎勵關狀壓與期望DP

Problem Problem Description 你正在玩你最喜歡的電子遊戲，並且剛剛進入一個獎勵關。在這個獎勵關裡，系統將依次隨機丟擲k次寶物，每次你都可以選擇吃或者不吃（必須在丟擲下一個寶物之前做出選擇，且現在決定不吃的寶物以後也不能再吃）。

bzoj 1076: [SCOI2008]獎勵關期望dp+狀態壓縮

Description 　　你正在玩你最喜歡的電子遊戲，並且剛剛進入一個獎勵關。在這個獎勵關裡，系統將依次隨機丟擲k次寶物，每次你都可以選擇吃或者不吃（必須在丟擲下一個寶物之前做出選擇，且現在決定不吃的寶物以後也不能再吃）。寶物一共有n種，系統每次丟

BZOJ 1076 [SCOI2008]獎勵關

看了資料範圍一目瞭然是狀態壓縮，然而對於每種情況有選和不選兩種情況，記錄已選的狀態，每次列舉關卡時判斷是否已選。注意這種最優選擇一般都採取倒序才能排除掉一些不可預知的不合法情況，我正序寫了仨小時不

BZOJ 1076: [SCOI2008]獎勵關（期望+狀壓DP）

傳送門題解不能從前往後推，求期望的正確姿勢應該是從後往前。每個物品有先決限制，我們將已獲得的物品狀壓起來。記f[i][s]為第i關開始前擁有集合s的得分期望。列舉關卡數、集合和第i關的物品。若滿足先決條件，則f[i][s] += ma

【BZOJ】1076 [SCOI2008]獎勵關

算法結合期望dp 枚舉來源獎勵使用狀態題目【算法】期望DP+狀壓DP 【題解】f[i][j]表示第i輪，狀態為j的期望得分。期望DP一般倒著做，因為正著做的話會可能從很多狀態都可以滿足當前選擇，需要雙重枚舉。而如果倒著做的話，是已知當前狀態枚舉後面的選擇

1076: [SCOI2008]獎勵關

獎勵 %d col 就是 ret main sco ios pre 這題有點坑。很容易看出是狀壓吧。但請謹記求概率用正推，期望用逆推。然而這題為啥我一開始覺得逆推不行呢。就是因為前置集合。那麽為啥不影響呢。其實我們逆推的時候也可以判斷這個時候可不可以

1076. [SCOI2008]獎勵關【狀壓DP+期望】

下一個 blog pos out 至少處理 hellip 每次選擇 Description 　　你正在玩你最喜歡的電子遊戲，並且剛剛進入一個獎勵關。在這個獎勵關裏，系統將依次隨機拋出k次寶物，每次你都可以選擇吃或者不吃（必須在拋出下一個寶物之前做出選擇，且現在

【BZOJ 1076】 [SCOI2008]獎勵關期望dp

首先看到n的範圍非常的小，所以考慮狀壓f[i][j]表示現在扔到i次，然後第二維表示有那些吃過，所以轉移就是f[i][j]+=f[i-1][k]+val[]且 pre[i]&k==pre[i]

【bzoj 1076】[SCOI2008]獎勵關（狀壓dp+概率）

1076: [SCOI2008]獎勵關 Time Limit: 10 Sec Memory Limit: 128 MBSubmit: 1817 Solved: 994 [Submit][Stat

[SCOI2008]獎勵關

true etc eof dig [0 cnblogs amp sdi code 題目大意：　　你有k次獲取寶物的機會，每次會等概率的從1~n中選出一種寶物給你。　　每種寶物都有一個依賴s，表示你只有先吃了s中的所有寶物才能吃當前寶物，如果S沒吃完，視作放棄吃當前

bzoj1076: [SCOI2008]獎勵關(期望dp+狀壓dp)

多少 || 註意 log mem 1.5 tchar fine bbs 1076: [SCOI2008]獎勵關 Time Limit: 10 Sec Memory Limit: 128 MBSubmit: 2989 Solved: 1557[Submit][Sta

BZOJ1076: [SCOI2008]獎勵關

之前 tdi () amp max clas ios pri 感覺題解： f[i][S]表示到了第i次，i次之前拿過的寶物集合是S，最大值價值；答案f[1][0] 正著設狀態倒著填表感覺自己對期望的理解不夠深。 #include<iostream> #i

luogu2473 [SCOI2008]獎勵關

== clas turn include names n) https log namespace 題解參照這裏每個研究完記得乘一個1/n，這是乘了概率。 #include <iostream> #include <cstdio> using na

[bzoj 1076][SCOI2008]獎勵關

傳送門

Description

Solution

Code?

相關推薦