1. 程式人生 > >【BZOJ】1076 [SCOI2008]獎勵關

【BZOJ】1076 [SCOI2008]獎勵關

算法 結合 期望dp 枚舉 來源 獎勵 使用 狀態 題目

【算法】期望DP+狀壓DP

【題解】f[i][j]表示第i輪,狀態為j的期望得分。

期望DP一般倒著做,因為正著做的話會可能從很多狀態都可以滿足當前選擇,需要雙重枚舉。

而如果倒著做的話,是已知當前狀態枚舉後面的選擇,只需單重枚舉。

倒著枚舉,則f[i][j]表示當前第i輪狀態為j,枚舉第i+1輪的寶物得到狀態j‘。

題目中出現了最優決策難以和期望DP結合,那麽使用狀壓就可以避開決策問題。

得分的來源是枚舉的寶物,所以正枚和倒枚沒有本質區別,這也是套路

【BZOJ】1076 [SCOI2008]獎勵關