[SCOI2008] 獎勵關

阿新 • • 發佈：2018-04-23

print 所有依次系統 DC std reg 一行 void

題目背景

08四川NOI省選

題目描述

你正在玩你最喜歡的電子遊戲，並且剛剛進入一個獎勵關。在這個獎勵關裏，系統將依次隨機拋出k次寶物，每次你都可以選擇吃或者不吃（必須在拋出下一個寶物之前做出選擇，且現在決定不吃的寶物以後也不能再吃）。

寶物一共有n種，系統每次拋出這n種寶物的概率都相同且相互獨立。也就是說，即使前k-1 次系統都拋出寶物1（這種情況是有可能出現的，盡管概率非常小），第k次拋出各個寶物的概率依然均為1/n。

獲取第 i 種寶物將得到Pi分，但並不是每種寶物都是可以隨意獲取的。第i種寶物有一個前提寶物集合Si。只有當Si中所有寶物都至少吃過一次，才能吃第i 種寶物（如果系統拋出了一個目前不能吃的寶物，相當於白白的損失了一次機會）。註意，Pi 可以是負數，但如果它是很多高分寶物的前提，損失短期利益而吃掉這個負分寶物將獲得更大的長期利益。

假設你采取最優策略，平均情況你一共能在獎勵關得到多少分值？

輸入輸出格式

輸入格式：

第一行為兩個正整數k 和n，即寶物的數量和種類。以下n行分別描述一種

寶物，其中第一個整數代表分值，隨後的整數依次代表該寶物的各個前提寶物（各

寶物編號為1到n），以0結尾。

輸出格式：

輸出一個實數，保留六位小數，即在最優策略下平均情況的得分。

輸入輸出樣例

輸入樣例#1：

1 2
1 0
2 0

輸出樣例#1：

1.500000

輸入樣例#2：

6 6
12 2 3 4 5 0
15 5 0
-2 2 4 5 0
-11 2 5 0
5 0
1 2 4 5 0

輸出樣例#2：

10.023470

說明

1 <= k <= 100, 1 <= n <= 15，分值為[-106,106]內的整數。

子集上dp,對後繼期望取max即可。

#include<bits/stdc++.h>
#define ll long long
#define D double
using namespace std;
int ci[25],n,k,pre[25],val[25],now;
D f[105][40005],tmp;

inline void solve(){
	tmp=1/(D)n;
	for(int i=k-1;i>=0;i--)
	    for(int j=0;j<ci[n];j++)
	        for(int l=0;l<n;l++){
			    if((pre[l]&j)==pre[l]) f[i][j]+=tmp*max(f[i+1][j|ci[l]]+val[l],f[i+1][j]);
			    else f[i][j]+=tmp*f[i+1][j];
			}
}

int main(){
	ci[0]=1;
	for(int i=1;i<=20;i++) ci[i]=ci[i-1]<<1;
	scanf("%d%d",&k,&n);
	for(int i=0;i<n;i++){
		scanf("%d",val+i);
		while(scanf("%d",&now)==1&&now) pre[i]|=ci[now-1];
	}
	
	solve();
	
	printf("%.6lf\n",f[0][0]);
	return 0;
}

[SCOI2008] 獎勵關

[BZOJ 1076][SCOI2008]獎勵關（期望+狀壓Dp）

方便 double spa solution bsp 所有一個 int stream Description 你正在玩你最喜歡的電子遊戲，並且剛剛進入一個獎勵關。在這個獎勵關裏，系統將依次隨機拋出k次寶物，每次你都可以選擇吃或者不吃（必須在拋出下一個寶物之前做出選

【BZOJ】1076 [SCOI2008]獎勵關

算法結合期望dp 枚舉來源獎勵使用狀態題目【算法】期望DP+狀壓DP 【題解】f[i][j]表示第i輪，狀態為j的期望得分。期望DP一般倒著做，因為正著做的話會可能從很多狀態都可以滿足當前選擇，需要雙重枚舉。而如果倒著做的話，是已知當前狀態枚舉後面的選擇

[SCOI2008]獎勵關

true etc eof dig [0 cnblogs amp sdi code 題目大意：　　你有k次獲取寶物的機會，每次會等概率的從1~n中選出一種寶物給你。　　每種寶物都有一個依賴s，表示你只有先吃了s中的所有寶物才能吃當前寶物，如果S沒吃完，視作放棄吃當前

bzoj1076: [SCOI2008]獎勵關(期望dp+狀壓dp)

多少 || 註意 log mem 1.5 tchar fine bbs 1076: [SCOI2008]獎勵關 Time Limit: 10 Sec Memory Limit: 128 MBSubmit: 2989 Solved: 1557[Submit][Sta

1076: [SCOI2008]獎勵關

獎勵 %d col 就是 ret main sco ios pre 這題有點坑。很容易看出是狀壓吧。但請謹記求概率用正推，期望用逆推。然而這題為啥我一開始覺得逆推不行呢。就是因為前置集合。那麽為啥不影響呢。其實我們逆推的時候也可以判斷這個時候可不可以

bzoj 1076: [SCOI2008]獎勵關

目前 sin 最大 ios 有一個決定 cpp 正在 gpo Description 你正在玩你最喜歡的電子遊戲，並且剛剛進入一個獎勵關。在這個獎勵關裏，系統將依次隨機拋出k次寶物，每次你都可以選擇吃或者不吃（必須在拋出下一個寶物之前做出選擇，且現在決定不吃的寶物以後也不

BZOJ1076: [SCOI2008]獎勵關

之前 tdi () amp max clas ios pri 感覺題解： f[i][S]表示到了第i次，i次之前拿過的寶物集合是S，最大值價值；答案f[1][0] 正著設狀態倒著填表感覺自己對期望的理解不夠深。 #include<iostream> #i

luogu2473 [SCOI2008]獎勵關

== clas turn include names n) https log namespace 題解參照這裏每個研究完記得乘一個1/n，這是乘了概率。 #include <iostream> #include <cstdio> using na

BZOJ1076：[SCOI2008]獎勵關——題解

並不是現在 problem 都是 lan 做出 etc tro ctype http://www.lydsy.com/JudgeOnline/problem.php?id=1076 https://www.luogu.org/problemnew/show/P2473

1076. [SCOI2008]獎勵關【狀壓DP+期望】

下一個 blog pos out 至少處理 hellip 每次選擇 Description 　　你正在玩你最喜歡的電子遊戲，並且剛剛進入一個獎勵關。在這個獎勵關裏，系統將依次隨機拋出k次寶物，每次你都可以選擇吃或者不吃（必須在拋出下一個寶物之前做出選擇，且現在

bzoj1076 [SCOI2008]獎勵關

input 平均情況 urn 一次 class 必須 style pro scan 1076: [SCOI2008]獎勵關 Time Limit: 10 Sec Memory Limit: 128 MBSubmit: 3312 Solved: 1743[Submit]

[SCOI2008] 獎勵關

print 所有依次系統 DC std reg 一行 void 題目背景 08四川NOI省選題目描述你正在玩你最喜歡的電子遊戲，並且剛剛進入一個獎勵關。在這個獎勵關裏，系統將依次隨機拋出k次寶物，每次你都可以選擇吃或者不吃（必須在拋出下一個寶物之前做出選擇，且現在決

P2473 [SCOI2008]獎勵關

-html 機會 new 平均情況 std scan sin htm 種類 P2473 [SCOI2008]獎勵關鏈接：https://www.luogu.org/problemnew/show/P2473 題目背景 08四川NOI省選題目描述你正在玩你最喜歡的電子遊

[BZOJ1076][SCOI2008]獎勵關(概率DP)

har getch IV AC name else str mes family Code #include <cstdio> #include <algorithm> #include <cstring> #define N

洛谷 P2473 [SCOI2008]獎勵關解題報告

有時 init line ++ 簡單情況 %d 種類整數 P2473 [SCOI2008]獎勵關題目描述你正在玩你最喜歡的電子遊戲，並且剛剛進入一個獎勵關。在這個獎勵關裏，系統將依次隨機拋出$k$次寶物，每次你都可以選擇吃或者不吃（必須在拋出下一個寶物之前做出選

【題解】 bzoj1076: [SCOI2008]獎勵關（裝壓+期望dp）

狀態 span 方程 con can i+1 std tin log 題面戳我 Solution 並不會做，看了下題解大概了解了。期望這個東西好難搞啊qwq 我們定義$dp[i][j]$表示第$i$步，拿到寶物前的狀態為$j$。正著來會有很多不合法的情況，剔

洛谷P2473 [SCOI2008]獎勵關（期望+狀壓）

har targe 期望 num include 不一定 stdin print 一個傳送門我數學期望還是太差了…… 先考慮狀壓模型，設$dp[i][S]$表示第$i$輪，當前寶物狀態為$S$，能獲得的最大期望分數然而這個模型有

bzoj1076: [SCOI2008]獎勵關狀壓dp

() rec ble 電子遊戲 bzoj1076 現在得到 ios 負數 Description 　　你正在玩你最喜歡的電子遊戲，並且剛剛進入一個獎勵關。在這個獎勵關裏，系統將依次隨機拋出k次寶物，每次你都可以選擇吃或者不吃（必須在拋出下一個寶物之前做出選擇，且現在決定

洛谷P2473||bzoj1076 [SCOI2008]獎勵關

https://www.luogu.org/problemnew/show/P2473 https://www.lydsy.com/JudgeOnline/problem.php?id=1076 不會。。以為是求最大得分的期望（當然要求自己在做第一個決策之前就知道系統每一次要拋的結果），然而看了題解貌

2018.09.23 bzoj1076: [SCOI2008]獎勵關（期望+狀壓dp）

傳送門一道神奇的期望狀壓dp。用f[i][j]f[i][j]f[i][j]表示目前在第i輪已選取物品狀態為j，從現在到第k輪能得到的最大貢獻。如果我們從前向後推有可能會遇到不合法的情況。所以我們

[SCOI2008] 獎勵關

題目背景

題目描述

輸入輸出格式

輸入輸出樣例

說明

相關推薦