【整理】數學期望和概率DP

阿新 • • 發佈：2018-01-01

公司上班 ima 排除 tle wid day 例子 gpo

數學期望 P=Σ每一種狀態*對應的概率。
因為不可能枚舉完所有的狀態，有時也不可能枚舉完，比如拋硬幣，有可能一直是正面，etc。在沒有接觸數學期望時看到數學期望的題可能會覺得很闊怕（因為我高中就是這麽認為的，對不起何老板了QwQ），避之不及。但是現在發現大多數題就是手動找公式或者DP推出即可，只要處理好邊界，然後寫好方程，代碼超級簡短。與常規的求解不同，數學期望經常逆向推出。

比如常規的dp[x]可能表示到了x這一狀態有多少，最後答案是dp[n]。而數學期望的dp[x]一般表示到了x這一狀態還差多少，最後答案是dp[0]。

具體的看下面的題型吧,看完應該就有感覺了。

最後面幾道是DP，感覺和數學期望關系不大，不看也罷。

一：Uva12230Crossing Rivers (數學期望)

題目大意：
有個人每天要去公司上班，每次會經過N條河，家和公司的距離為D，默認在陸地的速度為1，
給出N條河的信息，包括起始坐標p，寬度L，以及船的速度v。船會往返在河的兩岸，人到達河岸時，
船的位置是隨機的（往返中）。問說人達到公司所需要的期望時間。

思路：

1，過每條河最壞的情況是t=3*L/v； 即去的時候船剛剛走。
2，過沒條河最優的情況是t=L/v；    即去的時候船剛剛來。
3，由於船是均勻發布的，符合線性性質，所以平均下來，過每條河的時間t 
=2*L/v。

（是不是感覺看完後豁然開朗。。。。。。發自內心地說道：原來是尼瑪這樣一個題）

二：SPOJ Favorite Dice（數學期望）

題意：

甩一個n面的骰子，問每一面都被甩到的次數期望是多少。

思路：

比較簡單常見，公式：初始化dp[]=0;  dp[i]=i/n*dp[i]+(n-i)/n*dp[i+1]+1;  化簡逆推即可。  求的是dp[0];

三：SGU495Kids and Prizes（數學期望||概率DP||公式）

題意：

有n個獎品，m個人排隊來選禮物，對於每個人，他打開的盒子，可能有禮物，也有可能已經被之前的人取走了，然後把盒子放回原處。為最後m個人取走禮物的期望。

思路：

排隊取，第1個人取到1個，dp[1]=1;後面的人dp[i]=p取到禮物盒子+dp前面的取到禮物盒子=(n-dp[i-1])/n + dp[i-1]；

當然，也可以化簡為公式   printf("%.10lf\n",n*1.0*(1-pow((n-1)*1.0/n,m)));

四：ZOJ3640Help Me Escape（師傅逃亡系列•一）（我自己的逃亡三題）

題意：

師傅被妖怪抓走了。有n個妖怪，每個妖怪有一個固定的戰鬥力c[]，師傅也有一個初始戰鬥力f0。
每天，師傅會隨機選擇一個妖怪決鬥，如果打得贏ft>c[]，就可以逃出去,逃出去要t[]天，畢竟超人不會飛；
否則，師傅會不甘心，當天他會拿出秘籍練功，將自己變強,f(t+1)=f(t)+c[]，第二天尋找下一次機會。
問師傅能夠逃脫可怕的妖怪，繼續追求去印度吃手抓餅的夢想的天數的數學期望day。

思路：

設dp[F]是戰鬥力為F時，逃離的天數期望。（答案是dp[f]）。則有公式。

dp[F]= Σ 1/n * t[i]              ,F>c[[i]

           +∑ 1/n * dp[F+c[i]]   ,F<=c[i]

（第一題是水的，這一題像樣一點，列方程。）

五：HDU4035 Maze（師傅逃亡系列•二）（循環型經典的數學期望）

題意：

師傅又被抓了，師傅現在在一個樹裏。第一天他在1號節點；對於每一個節點，
有三種可能，一是被妖怪殺死ki，二是被徒兒救走ei，三是第二天等概率地走到相鄰的一個節點。
問師傅被救走的天數的期望，不能被救走輸出“impossible”。

思路：

上一個題，由於是單調的，沒有後續性，所以可以記憶化搜索或者DP解決。
這個題存在後續性，舉個例子。如果求從s號節點逃出去的期望dp[s]，那麽dp[s]和s的子節點和s的父節點有關，而欲求s的子節點時，子節點又和父節點s有關。。。

這個時候就需要我們找一個辦法來排除後續性。大概就是找一個很牛逼的公式。這個公式本來是和後續性有關，但是公式之間抵消的後續性。

設 E[i]表示在結點i處，要走出迷宮所要走的邊數的期望。E[1]即為所求。

    葉子結點：
    E[i] = ki*E[1] + ei*0 + (1-ki-ei)*(E[father[i]] + 1);
         = ki*E[1] + (1-ki-ei)*E[father[i]] + (1-ki-ei);

    非葉子結點：（m為與結點相連的邊數）
    E[i] = ki*E[1] + ei*0 + (1-ki-ei)/m*( E[father[i]]+1 + ∑( E[child[i]]+1 ) );
         = ki*E[1] + (1-ki-ei)/m*E[father[i]] + (1-ki-ei)/m*∑(E[child[i]]) + (1-ki-ei);

設對每個結點：E[i] = Ai*E[1] + Bi*E[father[i]] + Ci;

對於非葉子結點i，設j為i的孩子結點，則
    ∑(E[child[i]]) = ∑E[j]
                   = ∑(Aj*E[1] + Bj*E[father[j]] + Cj)
                   = ∑(Aj*E[1] + Bj*E[i] + Cj)
    帶入上面的式子得
    (1 - (1-ki-ei)/m*∑Bj)*E[i] = (ki+(1-ki-ei)/m*∑Aj)*E[1] + (1-ki-ei)/m*E[father[i]] + (1-ki-ei) + (1-ki-ei)/m*∑Cj;
    由此可得
    Ai =        (ki+(1-ki-ei)/m*∑Aj)   / (1 - (1-ki-ei)/m*∑Bj);
    Bi =        (1-ki-ei)/m            / (1 - (1-ki-ei)/m*∑Bj);
    Ci = ( (1-ki-ei)+(1-ki-ei)/m*∑Cj ) / (1 - (1-ki-ei)/m*∑Bj);

    對於葉子結點
    Ai = ki;
    Bi = 1 - ki - ei;
    Ci = 1 - ki - ei;

    從葉子結點開始，直到算出 A1,B1,C1;

    E[1] = A1*E[1] + B1*0 + C1;
    所以
    E[1] = C1 / (1 - A1);
    若 A1趨近於1則無解...

六：HDU3853LOOPS （師傅逃亡系列•三）（基礎概率DP）

題意：

你知道，師傅經常被抓，這次又被抓到一個矩陣裏面，最開始他在Map[1][1]，出口在Map[n][m]；
每一次他會消耗兩顆神丹，然後每一個格子，有一定概率留在原地，有一定概率向下走一格，有一定概率向右走一格。。。求師傅逃出去的神丹消耗期望。

思路：

這次的逃亡很好想，沒有前兩次那樣需要逆推或者求公式。聰明的你不如手動算一下。實在不行還可以參考下面的題目。

七：ZOJ3551Bloodsucker （數學期望）

題意：

開始有一個吸血鬼，n-1個平民百姓。每天一個百姓被感染的概率可求，問每個人都變成吸血鬼的天數期望

思路：

一般期望題逆推，設dp[i]是目前已經有i個吸血鬼，所有人變成吸血鬼的期望。則dp[n]=0;答案是dp[1]。（註意這裏dp代表的什麽）

每一個dp[i]的感染概率可求是p[]=2.0*(n-i)*i/(n-1)/n*p; 

則可得遞推公式： dp[i] = (dp[i+1]*p[]+1)/p[];

八：ZOJ3329One Person Game(循環型數學期望)

 題意：

有三個骰子，面值分別是k1，k2，k3。每次扔出的值之和加到ans上，問多少次才能ans>n；當然，當遇到k1=a,k2=b,k3=c時，ans=0;重新開始累加。

思路：

和之前第五題Maze一個題型。寫出的公式是有後續性的。我們需要弄一個遞推公式，消去後續性。（當然循環的話高斯消元也可以做。）

設dp[i]表示達到i分時到達目標狀態的期望，pk為投擲k分的概率，p0為回到0的概率
則dp[i]=∑(pk*dp[i+k])+dp[0]*p0+1;
都和dp[0]有關系，而且dp[0]就是我們所求，為常數
設dp[i]=A[i]*dp[0]+B[i];
代入上述方程右邊得到：
dp[i]=∑(pk*A[i+k]*dp[0]+pk*B[i+k])+dp[0]*p0+1
     =(∑(pk*A[i+k])+p0)dp[0]+∑(pk*B[i+k])+1;
     明顯A[i]=(∑(pk*A[i+k])+p0)
     B[i]=∑(pk*B[i+k])+1
     先遞推求得A[0]和B[0].
     那麽  dp[0]=B[0]/(1-A[0]);

大概就是這個樣子。技術分享圖片

九：CF 148D D. Bag of mice （概率DP||數學期望）

 題意：

一對情侶開房玩抓老鼠遊戲，老鼠有黑白兩色，女的為先手，先抓到白老鼠勝。
特別的，男的每抓一只老鼠後，還會隨機放走一只老鼠。問女的贏的概率是多少。如果輸了，後果會很嚴重，當天晚上只能睡沙發。

思路：

dp[i][j]為當前狀態，有i只白老鼠，j只黑老鼠，女的贏的概率。那麽dp[][] = 這一次贏 + 以後贏=   i/(i+j) +  。。。具體見代碼。

十：POJ3682King Arthur‘s Birthday Celebration（數學期望||概率DP）

題意：

有一個富豪，他決定每天撒錢，並且拋硬幣，第一天1塊錢，第二天3塊錢，第三天5塊，直到他拋到硬幣向上的數量為K。

求天數期望和錢期望。

思路：

天數期望dp很好求，公式一推，代碼一敲。錢期望money沒想出來，我開始想難道是用第x天結束的期望乘第x天的錢，累加，直到x天的期望乘錢小於0.0001。

但是參考了下別人的公式，反正自己是沒想出來。

天數：dp[i]=dp[i]*(1-p)+dp[i-1]*p+1，化簡：dp[i]=dp[i-1]+1/p;

money：money[i] = p(money[i-1]+ 2 *(dp[i-1]+1)-1) + (1-p)(money[i] + 2 * (dp[i]+1)-1)。

化簡：money[i]=money[i-1]+2*dp[i-1]-2*dp[i]+(1+2*dp[i])/p;

問題：

可以用巴斯卡分布？二項分布？？？給數學跪了

 http://blog.csdn.net/nmfloat/article/details/50650489

十一： POJ2151Check the difficulty of problems (組合數學||概率DP)

題意：

一套題，有T個題，M個人應考，已知每個人做來某題的概率。問X的概率。X滿足，每個考生至少做來一道題。至少有一人做的題不少於N道。

思路：

不算是很典型的概率DP，更像是一道簡單數學題。

可以把所有考生都至少做來一道題的概率減去 每個人都做來1到n-1道題的概率。

p=[(1-x11)*(1-x12)(..) ] * [(1-x21)*(1-x22)(..)]*[...]     -    [...]*[...] ，這樣的話，用組合數就ok了。

但是這裏是用的DP是思路，先把考生與考題的關系求出來，p[i][j][k] 表示第i個考試前j個題會做k道的概率。再根據題意進行DP。

十二：HihoCoder1164 隨機斐波那契（概率DP）

描述

大家對斐波那契數列想必都很熟悉:

a0 = 1, a1 = 1, ai = ai-1 + ai-2,(i > 1)。

現在考慮如下生成的斐波那契數列:

a0 = 1, ai = aj + ak, i > 0, j, k從[0, i-1]的整數中隨機選出（j和k獨立）。

現在給定n，要求求出E(an)，即各種可能的a數列中an的期望值。(1<=n<=500)

思路：
不說了，數據小，我暴力枚舉的。

十三：HihoCoder 1075 開鎖魔法III（概率DP+組合）

描述

一日，崔克茜來到小馬鎮表演魔法。

其中有一個節目是開鎖咒：舞臺上有 n 個盒子，每個盒子中有一把鑰匙，對於每個盒子而言有且僅有一把鑰匙能打開它。
初始時，崔克茜將會隨機地選擇 k 個盒子用魔法將它們打開。崔克茜想知道最後所有盒子都被打開的概率。

1，每個盒子都有一個入度和一個出度，以之前二分圖拆點的經驗來看，必然會形成很多個環。

2，每個環至少選擇一個盒子。

3，每個環至少選擇一個盒子的組合數，聯想到母函數，組合數。

4.自由YY。可以DP，但是誤差可能大一些。可以全部求出來再除，這樣誤差小一些。

 （ps：學會了母函數再搞組合是要多一分靈感！彎的four）

【整理】數學期望和概率DP

公司上班 ima 排除 tle wid day 例子 gpo 數學期望 P=Σ每一種狀態*對應的概率。因為不可能枚舉完所有的狀態，有時也不可能枚舉完，比如拋硬幣，有可能一直是正面，etc。在沒有接觸數學期望時看到數學期望的題可能會覺得很闊怕（因為我高中

動態規劃之經典數學期望和概率DP

起因：在一場訓練賽上。有這麼一題沒做出來。題目連結：http://acm.hdu.edu.cn/showproblem.php?pid=6829 題目大意：有三個人，他們分別有$X，Y，Z$塊錢（$1> a >> b >> c; for (int i = 99; i >= a; i--)

【BZOJ4008】【HNOI2015】亞瑟王概率DP

name spa 題解 rect printf noi size mem turn 鏈接： #include <stdio.h> int main() { puts("轉載請註明出處[輾轉山河弋流歌 by 空灰冰魂]謝謝");

【整理】原生js和jQ獲取窗口寬高及滾動條的方法和函數

javascript 滾動條 jq 窗口距離原生js和jQ獲取窗口寬高及滾動條的方法和函數一。原生js獲取 1.實際寬高（不包括工具欄，滾動條的視口高度，ie6.7.8不支持） window.innerHeight window.innerWidth 2.顯示屏寬高 screen.h

POJ2096Collecting Bugs（數學期望，概率DP）

like ini namespace reads cts require main pread 概率dp 問題： Ivan is fond of collecting. Unlike other people who collect post stamps, coins

【HDU4405】Aeroplane chess（概率dp）

題目連結 Aeroplane chess Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others) Total Subm

【BZOJ1415】【NOI2005】聰聰和可可（動態規劃，數學期望）

數學期望 class ios char for problem lin vector noi 【BZOJ1415】【NOI2005】聰聰和可可（動態規劃，數學期望）題面 BZOJ 題解先預處理出當可可在某個點，聰聰在某個點時聰聰會往哪裏走然後記憶化搜索一下就好了 #

【轉】關於LIS和一類可以用樹狀數組優化的DP 預備知識

免費關註最長上升子序列 2.3 bzoj1264 一個數 long 個數字等於原文鏈接 http://www.cnblogs.com/liu-runda/p/6193690.html 預備知識　　　　DP（Dynamic Programming)

【BZOJ3470】Freda’s Walk 概率與期望

space 現在 pre -c 我們 mil pop 小數 ble 【BZOJ3470】Freda’s Walk Description 雨後的Poetic Island空氣格外清新，於是Freda和Rainbow出來散步。 Poetic Island的

【整理】python學習筆記（5）-- pygame庫的函式和方法整理

PYGAME的方法和官方文件查詢官方文件 http://www.pygame.org/docs/ 模組簡介 pygame.BufferProxy An array protocol view

【hdu4652】Dice 期望dp 推公式

Dice 題目描述題目傳送門一個骰子有 mmm 面，現在要求擲出如下情形的期望次數：連續 nnn 次結果都相同連續 nnn 次結果都不同資料範圍： n≤m≤106n \le m \le 1

Java之 redirect 和 forward【整理】

轉自：https://blog.csdn.net/qiuzhi__ke/article/details/50951117 return new ModelAndView(new RedirectView(this.getViewPage())); return new ModelAn

【整理】RGB和YUV色彩模式

在視訊和影象編碼中，常用的色彩模式主要有RGB和YUV兩大類。 1.RGB RGB色彩模式是對紅（Red）綠（Green）藍（Blue）三原色進行疊加得到需要的顏色。 RGB色彩模式為每一個紅、綠、藍分量分配了0~255範圍內的亮度值。如下圖分別表示了紅、綠、藍從0到25

【整理】視訊中IBP幀的介紹和判定方法

　　B幀（B frame）基本概念　　B幀法是雙向預測的幀間壓縮演算法。當把一幀壓縮成B幀時，它根據相鄰的前一幀、本幀以及後一幀資料的不同點來壓縮本幀，也即僅記錄本幀與前後幀的差值。只有採用B幀壓縮才能達到200：1的高壓縮。 B幀的模式　　B 幀在 MPEG-4 中有四種參考模式，如果是同時參考前

Oracle表空間、段、區和塊簡述【整理】

塊是資料儲存的物理單位，也是資料檔案中最基礎的單位，資料直接儲存在塊上。是oracle空間分配的最小單位。oracle中的塊大小常見的有三種，2KB、4KB、8KB。塊的大小在資料庫建立時就已經固定下來，資料庫中每個塊的大小都是相同的，而且所有的塊都有相同的格式，由“塊頭＋表目錄＋行目錄＋空閒空間＋資料

【整理】1、C網和G網雙模手機是否可同時支援C網和G網上網？2、上網的同時是否可以打電話？3、呼叫等待和呼叫保持的概念與“雙通”手機

【問題一】C網和G網雙模手機是否可同時支援C網和G網上網？這個以華為的兩款手機為例，華為出了兩款雙模手機：S8600和G330C(C8825D)，這兩款手機均是C網和G網雙模，支援電信的3G網，只支援移動(聯通)的2G網，且手機預設是隻支援C網上網的。那麼S8600和G

時間複雜度和空間複雜度&排序方法的python實現【整理】

① 時間複雜度：（1）時間頻度：時間頻度一個演算法執行所耗費的時間，從理論上是不能算出來的，必須上機執行測試才能知道。但我們不可能也沒有必要對每個演算法都上機測試，只需知道哪個演算法花費的時間多，

使用拷貝建構函式的理由和作用【整理】

因為在系統的學習c++之前，自己寫了一些小玩意，雖然沒有寫拷貝建構函式，但是也沒有報錯。等到真正學習到的時候，就非常疑惑，為什麼要使用拷貝建構函式呢？不寫不是也可以嗎？(⊙﹏⊙)b 然後，不久之後我就跪了【後來才知道是因為類裡含有指標變數】因為如果不寫拷貝

【Spring】使用Spring和AMQP發送接收消息（上）

com load 設定支持消息發送結果 alt 來看接下來講AMQP之前，先講下傳統的JMS的消息模型，JMS中主要有三個參與者：消息的生產者、消費者、傳遞消息的通道（隊列或者主題），兩種消息模型如下：通道是隊列：通道是隊列：通道是主題：在JMS中，雖然

【bzoj4518】[Sdoi2016]征途斜率優化dp

end 時間復雜度 leg size cpp print ++ 需要 () 原文地址：http://www.cnblogs.com/GXZlegend/p/6812435.html 題目描述 Pine開始了從S地到T地的征途。從S地到T地的路可以劃分成n段，相鄰兩段路的

【整理】數學期望和概率DP

一：Uva12230Crossing Rivers (數學期望)

二：SPOJ Favorite Dice（數學期望）

三：SGU495Kids and Prizes（數學期望||概率DP||公式）

四：ZOJ3640Help Me Escape（師傅逃亡系列•一） （我自己的逃亡三題）

五：HDU4035 Maze（師傅逃亡系列•二）（循環型 經典的數學期望）

六：HDU3853LOOPS （師傅逃亡系列•三）（基礎概率DP）

七：ZOJ3551Bloodsucker （數學期望）

八：ZOJ3329One Person Game(循環型 數學期望)

九：CF 148D D. Bag of mice （概率DP||數學期望）

十：POJ3682King Arthur‘s Birthday Celebration（數學期望||概率DP）

十一： POJ2151Check the difficulty of problems (組合數學||概率DP)

十二：HihoCoder1164 隨機斐波那契（概率DP）

十三：HihoCoder 1075 開鎖魔法III（概率DP+組合）

相關推薦

四：ZOJ3640Help Me Escape（師傅逃亡系列•一）（我自己的逃亡三題）

五：HDU4035 Maze（師傅逃亡系列•二）（循環型經典的數學期望）

八：ZOJ3329One Person Game(循環型數學期望)