統計學學習筆記：（三）隨機變數、概率密度、二項分佈、期望值

阿新 • • 發佈：2019-02-19

隨機變數 Random Variable

隨機變數和一般資料上的變數不一樣，通常用大寫字母表示，如X、Y、Z，不是個引數而是function，即函式。例如，下面表示明天是否下雨的隨機變數X，如下。又例如X=每小時經過路口的車輛，隨機變數是個描述，而不是方程中的變數。

隨機變數有兩種，一種是離散的（discrete），一種是連續的（continue）。離散的如上面例子是可以列舉，而連續的隨機變數的取值是infinite的。

概率密度函式

概率probability，以roll dice為例，P(X=6)=1/6，P(X>=5)=1/3，即6點的骰子概率為1/6，大於等於5點的骰子概率為1/3。這是離散的概率例子。

對於連續的，例如明天雨量。使用的是probability density function，下圖是個分佈例子。

P(X=2)是多少，0.5嗎？不對。精確雨量要2.00000……，概率為0。對於連續隨機變數，概率的統計是一個範圍，例如P(|X-2|<0.3)，相當於計算area。以f(x)表示隨機variable，則為

二項分佈

二項分佈binomial distribution，有個更熟悉的名字normal distribution正態分佈。隨機變數處於兩種狀態，例如硬幣的正面或反面，投籃投中或者miss。如果是公平隨機，例如拋硬幣，每個狀態出現的機率是0.5。對於投籃，可能是P（shoot）=0.7，P（miss）=0.3。

如何計算P（X=n），n為出現某種狀態的次數。假設一共投籃N次籃（N=6），有多少種可能組合，例如出現2次命中的組合。簡單說我們有A、B兩個字母，填入6個空格，可以有多少種組合。為6×5，如果有A、B、C三個字母，則有6×5×4，即N！/（N-n）！

由於在計算概率中，A和B的先後順序沒有影響，即無先後順序，則還要除以n！（A、B或A、B、C本身的排列組合），在組合中表述為：

我們得到了組合次數，每個組合出現的概率是多少？投6中2為P(shoot)p(shoot)p(miss)p(miss)p(miss)p(miss)，將每個位置出現的概率乘前來就可以，即p^n×（1-p)^(N-n)，總的概率為：

其實倒不需要去死記硬背，只要知曉計算原理，很容易推導。

這些概率非常適合在Excel中進行計算和畫圖。在Excel有個小技巧我一直不會，如果固定選某個單元，選擇後用F4，在copy這個公式的時候，就不會飄移位置。

期望值E(X)

期望值Exptected value of a random varaible，實際就是population mean，有些時候總本是infinite，例如無數次仍投硬幣的結果，可通過頻率×數值求和獲得。

二項分佈的E(X)

如果是二項分佈，n表示次數，則E(X)=np，這個推導過程很有趣

二項分佈的variance（方差）

和期望值一樣，這屬於頭腦體操，其基本方式亦也差不多。將證明方差為np(1-p)。這部分不是Khan公開課，講正態分佈時涉及二項式方差的計算公式，興致來了，玩一下。

統計學學習筆記：（三）隨機變數、概率密度、二項分佈、期望值

統計學學習筆記：（三）隨機變數、概率密度、二項分佈、期望值

spark機器學習筆記：（三）用Spark Python構建推薦系統

統計學學習筆記：（五）正態分佈

流媒體技術學習筆記之（三）Nginx-Rtmp-Module統計某頻道在線觀看流的客戶數

python學習筆記：（九）迴圈（for和while）

【NLP學習筆記】（三）gensim使用之相似性查詢（Similarity Queries）

MongoDB學習筆記：（1）MongoDB在Win10下的安裝及配置

機器學習系列：（三）特徵提取與處理

DSP——DSP/BIOS學習筆記之（三）——TSK和MBX

QT5.11.1結合VS2017學習筆記：（一）環境的配置及HelloWorld的實現

spark機器學習筆記：（六）用Spark Python構建迴歸模型

Hadoop學習筆記：（一）WordCount執行

3.Zedboard學習筆記之（三）安裝vivado並獲取license

spark機器學習筆記：（四）用Spark Python構建分類模型（上）

python學習筆記——函式（三）

Opencv學習筆記：（2）在VS2012中配置Opencv2.4.9專案

基本設計模式學習筆記：（一）常見的七種面向物件設計原則

Activiti工作流學習筆記入門（五）——流程變數

NetWork Science網路科學學習筆記（三）隨機網路

iOS學習筆記56（Runtime）-Objective-C Runtime 執行時之三：方法與訊息

統計學學習筆記：（三）隨機變數、概率密度、二項分佈、期望值

相關推薦