BZOJ1076：[SCOI2008]獎勵關——題解

阿新 • • 發佈：2018-02-23

並不是現在 problem 都是 lan 做出 etc tro ctype

http://www.lydsy.com/JudgeOnline/problem.php?id=1076

https://www.luogu.org/problemnew/show/P2473

你正在玩你最喜歡的電子遊戲，並且剛剛進入一個獎勵關。在這個獎勵關裏，系統將依次隨機拋出k次寶物，每次你都可以選擇吃或者不吃（必須在拋出下一個寶物之前做出選擇，且現在決定不吃的寶物以後也不能再吃）。

寶物一共有n種，系統每次拋出這n種寶物的概率都相同且相互獨立。也就是說，即使前k-1 次系統都拋出寶物1（這種情況是有可能出現的，盡管概率非常小），第k次拋出各個寶物的概率依然均為1/n。

獲取第 i 種寶物將得到Pi分，但並不是每種寶物都是可以隨意獲取的。第i種寶物有一個前提寶物集合Si。只有當Si中所有寶物都至少吃過一次，才能吃第i 種寶物（如果系統拋出了一個目前不能吃的寶物，相當於白白的損失了一次機會）。註意，Pi 可以是負數，但如果它是很多高分寶物的前提，損失短期利益而吃掉這個負分寶物將獲得更大的長期利益。

假設你采取最優策略，平均情況你一共能在獎勵關得到多少分值？

因為自己的期望太垃圾於是主動找期望題刷。

結果同時碰上了自己不太會的狀壓。

寫就寫，誰怕誰。

————————————

先想暴力，顯然枚舉最後狀態不斷往前dfs得到最優解即可。

轉標程，打眼一看n很小，直接想到狀壓f[i][j]表示第i次拋物品後狀態為j。

但是為了滿足最優解我們只能從後往前推，即改為f[i][j]表示第i次拋物品，此時狀態為j時往後做能得到的最大期望分數。

於是從後往前推即可。

顯然滿足條件的時候我們可以選擇（不取該物品的期望）或（取該物品的期望+該物品價值）。

當不滿足條件的時候我們只可選前者。

因為是期望所以答案是累加進f數組的，最後除n即可。

#include<cmath>
#include<cstdio>
#include<cctype>
#include<cstring>
#include<iostream>
#include<algorithm>
using namespace std;
typedef double dl;
const 
 int N=32768;
inline int read(){
    int X=0,w=0;char ch=0;
    while(!isdigit(ch)){w|=ch==‘-‘;ch=getchar();}
    while(isdigit(ch))X=(X<<3)+(X<<1)+(ch^48),ch=getchar();
    return w?-X:X;
}
dl f[101][N],v[16];
int k,n,t[16];
int main(){
    k=read(),n=read();
    for(int i=1;i<=n;i++){
        v[i]=read();
        int ch=read();
        while(ch){
            t[i]=t[i]|(1<<ch>>1);
            ch=read();
        }
    }
    for(int i=k;i>=1;i--){
        for(int l=0;l<=(1<<n);l++){
            for(int j=1;j<=n;j++){
                int h=1<<j>>1;
                if((l&t[j])==t[j]){
                    f[i][l]+=max(f[i+1][l],f[i+1][l|h]+v[j]);
                }else f[i][l]+=f[i+1][l];
            }
            f[i][l]/=n;
        }
    }
    printf("%.6lf\n",f[1][0]);
    return 0;
}

+++++++++++++++++++++++++++++++++++++++++++

+本文作者：luyouqi233。　　　　　　　　　　　　　　+

+歡迎訪問我的博客：http://www.cnblogs.com/luyouqi233/+

+++++++++++++++++++++++++++++++++++++++++++

BZOJ1076：[SCOI2008]獎勵關——題解

並不是現在 problem 都是 lan 做出 etc tro ctype http://www.lydsy.com/JudgeOnline/problem.php?id=1076 https://www.luogu.org/problemnew/show/P2473

【題解】 bzoj1076: [SCOI2008]獎勵關（裝壓+期望dp）

狀態 span 方程 con can i+1 std tin log 題面戳我 Solution 並不會做，看了下題解大概了解了。期望這個東西好難搞啊qwq 我們定義\(dp[i][j]\)表示第\(i\)步，拿到寶物前的狀態為\(j\)。正著來會有很多不合法的情況，剔

bzoj1076: [SCOI2008]獎勵關(期望dp+狀壓dp)

多少 || 註意 log mem 1.5 tchar fine bbs 1076: [SCOI2008]獎勵關 Time Limit: 10 Sec Memory Limit: 128 MBSubmit: 2989 Solved: 1557[Submit][Sta

BZOJ1076: [SCOI2008]獎勵關

之前 tdi () amp max clas ios pri 感覺題解： f[i][S]表示到了第i次，i次之前拿過的寶物集合是S，最大值價值；答案f[1][0] 正著設狀態倒著填表感覺自己對期望的理解不夠深。 #include<iostream> #i

bzoj1076 [SCOI2008]獎勵關

input 平均情況 urn 一次 class 必須 style pro scan 1076: [SCOI2008]獎勵關 Time Limit: 10 Sec Memory Limit: 128 MBSubmit: 3312 Solved: 1743[Submit]

[BZOJ1076][SCOI2008]獎勵關(概率DP)

har getch IV AC name else str mes family Code #include <cstdio> #include <algorithm> #include <cstring> #define N

bzoj1076: [SCOI2008]獎勵關狀壓dp

() rec ble 電子遊戲 bzoj1076 現在得到 ios 負數 Description 　　你正在玩你最喜歡的電子遊戲，並且剛剛進入一個獎勵關。在這個獎勵關裏，系統將依次隨機拋出k次寶物，每次你都可以選擇吃或者不吃（必須在拋出下一個寶物之前做出選擇，且現在決定

洛谷P2473||bzoj1076 [SCOI2008]獎勵關

https://www.luogu.org/problemnew/show/P2473 https://www.lydsy.com/JudgeOnline/problem.php?id=1076 不會。。以為是求最大得分的期望（當然要求自己在做第一個決策之前就知道系統每一次要拋的結果），然而看了題解貌

2018.09.23 bzoj1076: [SCOI2008]獎勵關（期望+狀壓dp）

傳送門一道神奇的期望狀壓dp。用f[i][j]f[i][j]f[i][j]表示目前在第i輪已選取物品狀態為j，從現在到第k輪能得到的最大貢獻。如果我們從前向後推有可能會遇到不合法的情況。所以我們

BZOJ1076 || 洛谷P2473 [SCOI2008]獎勵關【狀壓&&期望DP】

Time Limit: 10 Sec Memory Limit: 128 MB Description 你正在玩你最喜歡的電子遊戲，並且剛剛進入一個獎勵關。在這個獎勵關裡，系統將依次隨機丟擲k次寶物，

[BZOJ1076][SCOI2008]獎勵關[狀壓DP+概率期望]

i+1 for += int clas digi 要求 lin sco \[f[i][j]\] 表示第1到i-1輪寶物是否取過的狀態是j,第i輪到最後一輪的最大得分。這樣設計狀態並且倒著推，可以保證不合法的狀態是0，不會造成影響 \[nd[i]\]表示第i個物品要求的狀態

BZOJ1076 [SCOI2008]獎勵關【狀壓dp + 數學期望】

1076: [SCOI2008]獎勵關 Time Limit: 10 Sec Memory Limit: 128 MBSubmit: 3074 Solved: 1599 [Submit][St

BZOJ1076[SCOI2008] 獎勵關

獎勵關 Description 你正在玩你最喜歡的電子遊戲，並且剛剛進入一個獎勵關。在這個獎勵關裡，系統將依次隨機丟擲k次寶物，每次你都可以選擇吃或者不吃（必須在丟擲下一個寶物之前做出選擇，且現在決定不吃的寶物以後也不能再吃）。寶物一共有n種，系統每次丟擲這

bzoj1076 [SCOI2008]獎勵關狀壓+期望dp

題意就不說了。分析：表示我狀壓本來就不好，加上個我不擅長的期望就徹底懵逼了。。一開始想到把物品選或不選的方案設為狀態，設f[i][j]表示i輪後物品的狀態為j。然後。。然後我就懵逼了。按照正常套路來說，先列舉輪（從後往前好處理），然後列舉當前狀態，然

[BZOJ 1076][SCOI2008]獎勵關（期望+狀壓Dp）

方便 double spa solution bsp 所有一個 int stream Description 你正在玩你最喜歡的電子遊戲，並且剛剛進入一個獎勵關。在這個獎勵關裏，系統將依次隨機拋出k次寶物，每次你都可以選擇吃或者不吃（必須在拋出下一個寶物之前做出選

【BZOJ】1076 [SCOI2008]獎勵關

算法結合期望dp 枚舉來源獎勵使用狀態題目【算法】期望DP+狀壓DP 【題解】f[i][j]表示第i輪，狀態為j的期望得分。期望DP一般倒著做，因為正著做的話會可能從很多狀態都可以滿足當前選擇，需要雙重枚舉。而如果倒著做的話，是已知當前狀態枚舉後面的選擇

[SCOI2008]獎勵關

true etc eof dig [0 cnblogs amp sdi code 題目大意：　　你有k次獲取寶物的機會，每次會等概率的從1~n中選出一種寶物給你。　　每種寶物都有一個依賴s，表示你只有先吃了s中的所有寶物才能吃當前寶物，如果S沒吃完，視作放棄吃當前

1076: [SCOI2008]獎勵關

獎勵 %d col 就是 ret main sco ios pre 這題有點坑。很容易看出是狀壓吧。但請謹記求概率用正推，期望用逆推。然而這題為啥我一開始覺得逆推不行呢。就是因為前置集合。那麽為啥不影響呢。其實我們逆推的時候也可以判斷這個時候可不可以

bzoj 1076: [SCOI2008]獎勵關

目前 sin 最大 ios 有一個決定 cpp 正在 gpo Description 你正在玩你最喜歡的電子遊戲，並且剛剛進入一個獎勵關。在這個獎勵關裏，系統將依次隨機拋出k次寶物，每次你都可以選擇吃或者不吃（必須在拋出下一個寶物之前做出選擇，且現在決定不吃的寶物以後也不

luogu2473 [SCOI2008]獎勵關

== clas turn include names n) https log namespace 題解參照這裏每個研究完記得乘一個1/n，這是乘了概率。 #include <iostream> #include <cstdio> using na

BZOJ1076：[SCOI2008]獎勵關——題解

相關推薦