1. 程式人生 > >正態分佈的前世今生

正態分佈的前世今生

*神說,要有正態分佈,就有了正態分佈。
神看正態分佈是好的,就讓隨機誤差就服從了正態分佈。
創世紀-數理統計*

正態分佈

學過基礎統計學的同學大都對正態分佈非常熟悉。這個鍾型的分佈曲線不但形狀優雅,其密度函式寫成數學表示式

f(x)=12πσe(xμ)22σ2
也非常具有數學的美感。其標準化後的概率密度函式
f(x)=12πe(xμ)22
更加的簡潔漂亮,兩個最重要的數學常量 π,e 都出現在了公式之中。在我個人的審美之中,它也屬於 top-N 的最美麗的數學公式之一,如果有人問我數理統計領域哪個公式最能讓人感覺到上帝的存在,那我一定投正態分佈的票。因為這個分佈戴著神祕的面紗,在自然界中無處不在,讓你在紛繁蕪雜的資料背後看到隱隱的秩序。
這裡寫圖片描述

正態分佈又通常被稱為高斯分佈,在科學領域,冠名權那是一個很高
的榮譽。去過德國的兄弟們還會發現,德國的鋼鏰和10馬克的紙幣上都留有高斯的頭像和正態密度曲線。正態分佈被冠名高斯分佈,我們也容易認為是高斯發現了正態分佈,其實不然,不過高斯對於正態分佈的歷史地位的確立是起到了決定性的作用。
這裡寫圖片描述
這裡寫圖片描述
這裡寫圖片描述
正態曲線雖然看上去很美,卻不是一拍腦袋就能想到的。我在本科學習數理統計的時候,課本一上來介紹正態分佈就給出密度分佈函式,卻從來不說明這個分佈函式是通過什麼原理推匯出來的。所以我一直搞不明白數學家當年是怎麼找到這個概率分佈曲線的,又是怎麼發現誤差服從這個奇妙的分佈的。直到我讀研究生的時候我的導師給我介紹了陳希儒院士的《數理統計簡史》這本書,看了之後才瞭解了正態分佈曲線從發現到被人們重視進而廣泛應用,也是經過了幾百年的歷史。
正態分佈的這段歷史是很精彩的,我們通過講幾個故事來揭開她的神祕面紗。

邂逅,正態曲線的首次發現

第一個故事和概率論的發展密切相關,主角是棣莫弗(De Moivre)和拉普拉斯(Laplace)。拉普拉斯是個大科學家,被稱為法國的牛頓;棣莫弗名氣可能不算很大,不過大家應該都熟悉這個名字,因為我們在高中數學學複數的時候我們都學過棣莫弗定理

(cosθ+isinθ)n=cos(nθ)+isin(nθ).
古典概率論發源於賭博,惠更斯、帕斯卡、費馬、貝努利都是古典概率的奠基人,他們那會研究的概率問題大都來自賭桌上,最早的概率論問題是賭徒梅累在1654 年向帕斯卡提出的如何分賭金的問題。統計學中的總體均值之所以被稱為期望(Expectation),就是源自惠更斯、帕斯卡這些人研究平均情況下一個賭徒在賭桌上可以期望自己贏得多少錢。
有一天一個哥們,也許是個賭徒,向棣莫弗提了一個和賭博相關的一個問題:A,B兩人在賭場裡賭博,A,B各自的獲勝概率是p
q=1p,賭n局,若A贏的局數X>np,則A付給賭場Xnp元,否則B付給賭場npX元。問賭場掙錢的期望值是多少?
棣莫弗(De Moivre)
問題並不複雜,本質上是一個二項分佈,最後求出的理論結果是
2npqb(n,p,np)
其中
b(n,p,i)=(ni)piqni
是常見的二項概率。但是對具體的n,要把這個理論結果實際計算出數值結果可不是件容易的事,因為其中的二項公式中有組合數.這就驅動棣莫弗尋找近似計算的方法。
與此相關聯的另一個問題,是遵從二項分佈的隨機變數XB(n,p),問XX落在二項分佈中心點一定範圍的概率Pd=P(|Xnp|d)是多少?
對於p=12的情形,棣莫弗做了一些計算並得到了一些近似結果,但是還不夠漂亮,幸運的是棣莫弗和斯特林(Stirling)處在同一個時代,而且二人之間有聯絡,斯特林公式是在數學分析中必學的一個重要公式:(事實上斯特林公式的形式其實是棣莫弗最先發現的,但是斯特林改進了這個公式,改進的結果為棣莫弗所用)
n!2πn(ne)n
1733年,棣莫弗很快利用斯特林公式進行計算並取得了重要的進展。考慮n是偶數的情形,令二項概率
b(i)=b(n,12,i)=(ni)(12)n
通過斯特林公式做一些簡單的計算容易得到,
b(n2)2πnb(n2+d)b(n2)exp(2d2n)
於是有
b(n2+d)22πnexp(2d2n)
使用上式的結果,並在二項概率累加求和的過程中近似的使用定積分代替求和,很容易就能得到
P(|Xn12|cn|)=cnicnb(n2+

相關推薦

分佈前世今生(貳)

6. 開疆拓土,正態分佈的進一步發展 19世紀初,隨著拉普拉斯中心極限定理的建立與高斯正態誤差理論的問世,正態分佈開始嶄露頭角,逐步在近代概率論和數理統計學中大放異彩。在概率論中,由於拉普拉斯的推動,中心極限定理髮展成為現代概率論的一塊基石。而在數理統計學中,在高斯的大力提倡之下,正態分佈開始逐

分佈前世今生

*神說,要有正態分佈,就有了正態分佈。 神看正態分佈是好的,就讓隨機誤差就服從了正態分佈。 創世紀-數理統計* 正態分佈 學過基礎統計學的同學大都對正態分佈非常熟悉。這個鍾型的分佈曲線不但形狀優雅,其密度函式寫成數學表示式 f(x)=12π−−√σ

分佈前世今生(壹)

也非常具有數學的美感。其標準化後的概率密度函式 更加的簡潔漂亮,兩個最重要的數學常量 π、e 都出現在這公式之中。在我個人的審美之中,它也屬於 top-N 的最美麗的數學公式之一,如果有人問我數理統計領域哪個公式最能讓人感覺到上帝的存在,那我一定投正態分佈的票。因為這個分佈戴著神祕的面紗

從np.random.normal()到分佈的擬合

分享一下我老師大神的人工智慧教程!零基礎,通俗易懂!http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識,造福人民,實現我們中華民族偉大復興!        

截斷分佈 Truncated normal distribution

分享一下我老師大神的人工智慧教程!零基礎,通俗易懂!http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識,造福人民,實現我們中華民族偉大復興!        

分佈,銳利分佈,萊斯分佈 matlab擬合原始碼

如果你得到一堆數,你想知道它們的大致分佈,該怎麼辦呢?kedensity命令可以幫助你解決這個問題。命令如下: [f,xi]=ksdensity(x) plot(xi,f) 其中,f是估計的密度值,而xi是一個輔助引數,用來決定畫出圖形的取值區間,簡言之,xi大致涵蓋了x的取值區間。

分佈的理解

一、概念 概念:正態分佈,又稱高斯分佈。其特徵為中間高兩邊低左右對稱。 特性: 1)集中性:曲線的最高峰位於正中央,且位置為均數所在的位置。 2)對稱性:正態分佈曲線以均數所在的位置為中心左右對稱且曲線兩段無線趨近於橫軸。 3)均勻變動性:正態分佈曲線以均數所在的位置為中心均勻向左右兩側

課堂練習--計算陣列的最大值,最小值,平均值,標準差,中位數;numpy.random模組提供了產生各種分佈隨機數的陣列;分佈;Matplotlib

#計算陣列的最大值,最小值,平均值,標準差,中位數 import numpy as np a=np.array([1, 4, 2, 5, 3, 7, 9, 0]) print(a) a1=np.max(a) #最大值 print(a1) a2=np.min(a) #最小值 print(a2) a3

分佈(normal distribution)與偏分佈(skewed distribution)

分享一下我老師大神的人工智慧教程!零基礎,通俗易懂!http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識,造福人民,實現我們中華民族偉大復興!        

np.random.rand均勻分佈隨機數和np.random.randn分佈隨機數函式使用方法

np.random.rand用法 覺得有用的話,歡迎一起討論相互學習~Follow Me 生成特定形狀下[0,1)下的均勻分佈隨機數 np.random.rand(a1,a2,a3…)生成形狀為(a1,a2,a3…),[0,1)之間的 均勻分佈 隨機數 np

關於使用scipy.stats.lognorm來模擬對數分佈的誤區

lognorm方法的引數容易把人搞蒙。例如lognorm.rvs(s, loc=0, scale=1, size=1)中的引數s,loc,scale, 要記住:loc和scale並不是我們通常理解的對數變化後資料的均值mu和標準差sigma,如下面所述: The probability density

黎曼和 Riemann Sum ,黎曼積分Riemann Integral,分佈normal distribution

       這裡有一塊形狀不規則的土地,要測量它的面積,怎麼辦呢?一個叫黎曼的德國數學家(Bernhard Riemann, 1826-1866),他想了個辦法:將這不規則圖形切成一條條的小長條兒,然後將這個長條近似的看成一個矩形,再分別測量出這些小矩形的長

MATLAB繪製分佈概率密度函式(normpdf)圖形

這裡是一個簡單的實現程式碼 x=linspace(-5,5,50); %生成負五到五之間的五十個數,行向量 y=normpdf(x,0,1); plot(x,y,‘k’); 圖片複製不過來。。就擺個連結好了 https://jingyan.baidu.com/article/6fb756ec

在python中畫分佈/正弦曲線影象/心形線

1 在python中畫正態分佈圖像 import numpy as np import matplotlib.mlab as mlab import matplotlib.pyplot as plt def demo2(): mu, sigma , num_bins = 0,

均勻分佈差生分佈

文章目錄 中心極限定理 中心極限定理 中心極限定理是說,n只要越來越大,這n個數的樣本均值會趨近於正態分佈,並且這個正態分佈以u為均值,sigma^2/n為方差。 換句話說,假設我們與樣本

分佈隨機數的產生

最近平凡聽到關於正態分佈取樣相關的內容,突然想到一個問題: 到底如何利用正態分佈取樣? 正好近期模式識別課程上也有一個相關的內容,整理了一下查到的資料。 一。柱狀圖估計分佈 假設樣本 x N(u,θ) x~N(u, \theta), 其pdf圖如下:

R 資料分佈檢驗

                        使用R檢測資料是

python3-分佈

loc 平均值scale (scale) 標準差pdf(x, loc=0, scale=1) 正態分佈(Normal distribution),也稱“常態分佈”,又名高斯分佈(Gaussian distribution),最早由A.棣莫弗在求二項分佈的漸近公式中得到。C.F.高斯在研究測量誤差時從另一個角

R語言實戰--隨機產生服從不同分佈函式的資料(分佈,泊松分佈等),並將資料寫入資料框儲存到硬碟

隨機產生服從不同分佈的資料 均勻分佈——runif() > x1=round(runif(100,min=80,max=100)) > x1 [1] 93 100 98 98 92 98 98 89 90 98 100 89

R中三種檢驗分佈的方式

一、畫出密度函式與正態分佈密度圖比較: library(MASS) mu<- c(0,0,0) Sigma<- matrix(c(1,0.5,0.25,0.5,1,0.5, 0.25,0.5,1),3,3) M<- mvrnorm(1000,