數學與程式設計——概率論與數理統計

D(x)=E{[x−E(x)]2}：相對於平均數差距的平方的期望；
數理統計一詞的理解：mathematical stats，也即用數學的觀點審視統計，為什麼沒有數理概率，因為概率本身即為數學，而對於統計，random variable 的性質並不全然瞭解，所以數理統計在一些書裡又被稱作：stats in inference（統計推論，已知 ⇒ 未知）
- 概率與統計的中心問題，都是random variable，

PMF與PDF

PMF：probability mass function，概率質量函式，是離散型隨機變數在各特定取值上的概率。與概率密度函式（PDF：probability density function）的不同之處在於：概率質量函式是對離散型隨機變數定義的，本身代表該值的概率

；概率密度函式是針對連續型隨機變數定義的，本身不是概率（連續型隨機變數單點測度為0），只有在對連續隨機變數的pdf在某一給定的區間內進行積分才是概率。

notation

假設X是一個定義在可數樣本空間S上的離散型隨機變數S⊆R，則其概率質量函式PMF為：

fX(x)={Pr(X=x),0,x∈Sx∈R∖S

注意這在所有實數上，包括那些X不可能等於的實數值上，都定義了pmf，只不過在這些X不可能取的實數值上，fX(x)取值為0(x∈R∖S,Pr(X=x)=0)。

離散型隨機變數概率質量函式（pmf）的不連續性決定了其累積分佈函式（cdf）也不連續。

共軛先驗（conjugate prior）

所謂共軛（conjugate），描述刻畫的是兩者之間的關係，單獨的事物不構成共軛，舉個通俗的例子，兄弟這一概念，只能是兩者才能構成兄弟。所以，我們講這兩個人是兄弟關係，A是B的兄弟，這兩個分佈成共軛分佈關係，A是B的共軛分佈。

p(θ|X)=p(θ)p(X|θ)p(x)

p(X|θ)：似然（likelihood）
p(θ)：先驗（prior）
p(X)：歸一化常數（normalizing constant）

我們定義：如果先驗分佈（p(θ)）和似然函式（p(X|θ)）可以使得先驗分佈（p(θ)）和後驗分佈（p(θ|X)）有相同的形式（如，Beta(a+k, b+n-k)=Beta(a, b)*binom(n, k)），那麼就稱先驗分佈與似然函式是共軛的

（成Beta分佈與二項分佈是共軛的）。

幾個常見的先驗分佈與其共軛分佈

先驗分佈	共軛分佈
伯努利分佈	beta distribution
Multinomial	Dirichlet Distribution
Gaussian, Given variance, mean unknown	Gaussian Distribution
Gaussian, Given mean, variance unknown	Gamma Distribution
Gaussian, both mean and variance unknown	Gaussian-Gamma Distribution

最大似然估計（MLE）

首先來看，大名鼎鼎的貝葉斯公式：

p(θ|X)=p(θ)p(X|θ)p(X)

可將θ看成欲估計的分佈的引數，X表示樣本，p(X|θ)則表示似然。

現給定樣本集D={x1,x2,…,xN}，似然函式為：

p(D|θ)=∏n=1Np(xn|θ)
為便於計算，再將其轉換為對數似然函式形式：

lnp(D|θ)=∑n=1Nlnp(xn|θ)

我們不妨以伯努利分佈為例，利用最大似然估計的方式計算其分佈的引數（p），伯努利分佈其概率密度函式（pdf）為：

fX(x)=px(1−p)1−x=⎧⎩⎨⎪⎪p,q≡1−p,0,x=1,x=0,otherwise

整個樣本集的對數似然函式為：

lnp(D|θ)=∑n=1Nlnp(xn|θ)=∑n=1Nln(θ

數學與程式設計——概率論與數理統計

PMF與PDF

notation

共軛先驗（conjugate prior）

最大似然估計（MLE）

數學與程式設計——概率論與數理統計

人工智慧必備數學基礎：概率論與數理統計（1）

人工智慧必備數學基礎：概率論與數理統計（2）

R語言中的概率論和數理統計

搞學術離不開的那些數學—概率論與數理統計

搞學術離不開的那些數學（概率論與數理統計）—第一章概率論基本概念

深度學習數學基礎介紹（二）概率與數理統計

【概率論與數理統計】小結2 - 隨機變量概述

概率論與數理統計

概率論與數理統計復習3

概率論與數理統計復習4

【概率論與數理統計】小結6 - 大數定理與中心極限定理

概率論與數理統計筆記第一章概率論的基本概念

概率論與數理統計筆記第二章隨機變量及其概率分布

【概率論與數理統計】小結7 - 統計基礎概念

【概率論與數理統計】小結9 - 參數估計概述

概率論與數理統計——正態分布

概率論與數理統計基礎<1>:隨機事件與隨機變量

【概率論與數理統計】小結10-1 - 假設檢驗概述

概率論與數理統計（第二版）嚴繼高版(2)

數學與程式設計——概率論與數理統計

PMF與PDF

notation

共軛先驗（conjugate prior）

最大似然估計（MLE）

相關推薦