1. 程式人生 > >【概率論】1-0:介紹

【概率論】1-0:介紹

title: 【概率論】1-0:Introduction categories:

  • Mathematic
  • Probability keywords:
  • Probability
  • 概率
  • the Frequency Interpretation
  • 頻率概率
  • the Classical Interpretation
  • 古典概率
  • the Subjective Interpretation
  • 主觀概率
  • the Axiomatic Interpretation
  • 公理化概率
  • Experiments
  • 試驗
  • Events
  • 事件 toc: true date: 2018-01-23 11:20:14

Abstract: 本文主要介紹概率的基本概念和觀點,主要為了說明概率是什麼,同時給出比較重要的試驗和事件的解釋說明。

Keywords: Probability,the Frequency Interpretation,the Classical Interpretation,the Subjective Interpretation,the Axiomatic Interpretation,Experiments,Events

開篇廢話

雖然我很冷靜,但外面確實一片歌舞昇平,各種AI應用如雨後春筍,各路AI大神偽大神如跳樑小醜各種雷人的說法也是層出不窮,有些行業確實要看誰的跑的快,但是有些確實需要看誰跑的更遠,當方向明確的時候需要跑得快,方向不明的時候需要的是探路。 我本人的職業規劃可能這輩子都要幹這個,當然哪天窮的吃不上飯了,也可能迫於生計去幹點掙錢的活,但是我確定我的人生必然要與數學,演算法,程式設計這些事情相伴,所以讓他們先去奔跑吧,我們繼續研究地圖和造車,等我們有了車可以很輕鬆的追上那些奔跑的,當然我們也不能掉以輕心,因為好多有GPS開跑車的也在加速前進,當然還有開飛機的,比我們厲害的人比比皆是,不要妄自菲薄,也別夜郎自大,打好基礎一步一個腳印的前進可能有時候會更快。

概率是什麼?

世界上有確定一定要發生的事麼?有,按照目前人類能理解的自然,有些公理是確定要發生的,所以公理是不證自明的,比如生老病死,這些事對於生物來說是一定會發生的,但是更多事是不太確定的,今天下不下雨?明天有沒有霧霾?後天拆不拆遷? 這裡插播一條有點跑題的話,忘了哪本書曾經說過,人類的文明發展的任務主線是理解自然,比如我們最開始的宗教,哲學,以及最近的科學,所有的這些都是在解釋自然現象,近代科學發展迅速的原因是因為科學,尤其是數學物理的發展,一些列結果表明科學可以更準確的描述和預測自然結果,沒錯概率論的任務很貼近上述的描述。 觀察我們周圍不確定事遠遠多於確定的事,當我們嚴格的定義了一件事的條件後(不存在模稜兩可的詞語),考慮這個條件產生結果的時候,這些結果一般是多箇中的一個,雖然完全無法確定哪結果個會發生,扔硬幣,扔骰子,但這些結果範圍完全確定,概率論能幫我們確定麼?不能,但是概率論能幫我們描述這個結果集,也就是某個結果出現的可能性是多少(用數字來描述發生的可能性,0~1,越接近0表示發生的可能性越小,越接近1表示發生的可能性越大)。

試驗與事件

在我們深入研究概率是什麼之前,我們先學習概率論從頭到尾都要用的兩個概念,試驗和事件,從我們傳統教育的角度來講,這兩個概念比本文其他討論的知識都重要,因為這個是考點,當然我認為其他的知識同樣重要,這兩個概念要從始至終的跟隨我們,但是其他知識告訴我們的是關於這個學科的整體思路,同樣重要。

Experiments(試驗)

Definition:An experiment is any process,real or hypothetical,in which the possible outcomes can be identified ahead of time

試驗可以使假設的也可以是實際的,但是他們的結果範圍必須要已知。

最簡單的real例子就是丟硬幣,結果可能是正面,反面,或者立著;hypothetical的例子就是有一個不能立起來的硬幣,丟硬幣的結果就是“正、反面”,不存在“立著”的結果。 概率中實際的試驗更有意義,因為我們的目的就是研究自然中實際存在的問題,當然有時候需要用hypothetical來建模實際的試驗。

Events(事件,隨機事件,偶然事件)

An event is a well-defined set of possible outcomes of the experiment

事件是個集合!事件是個集合!事件是個集合! 事件相對於試驗來說後面用到的更多,當我們描述一個過程的時候試驗是描述條件,對應的我們知道結果集,事件的就是被完備定義的結果集合的子集。 解釋一下:我們定義或者已知了試驗,並對試驗結果瞭如指掌,我們知道並且確定實驗結果組成的集合X,那麼事件就是X的子集x,數學描述: x={xxX,P(x)=1}x=\{x|x\in X,P(x)=1\} 其中P就是我們的well-define的抽象寫法,可以看成是函式P: P(x)={0x 不滿足well-defined的定義 1x 滿足well-defined的定義  P(x)= \begin{cases} 0& \text{x 不滿足well-defined的定義 }\\ 1& \text{x 滿足well-defined的定義 } \end{cases}

概率只有針對事件的時候才有意義 舉幾個? :

  1. 扔硬幣10次,出現五次正面的概率是多少?
  2. Thomas Jefferson出生在1741的概率是多少?

分析:

  1. 例1中事件是出現五次正面,outcome集合是可以出現1次2次…10次
  2. 例2中的時間是出生在1741年,outcome集合是可以出生於人類出現那年~2019年

注意,event可以是空集哦

必然事件

肯定會發生的,扔骰子,點數小於7的事件是肯定發生的,也即必然事件是所有outcome的全集

不可能事件

不可能事件對應必然事件,那就是其是個空集,比如扔骰子結果是-1點數的這個事件,或者結果既是基數又是偶數這個事件。

試驗與事件

這兩個概念之間還有一些其他的內容,這裡補充一下,試驗有的時候是人工的,比如扔硬幣,但有時候是不參與的,比如下雨,如果我們不參與試驗只是記錄試驗結果,這類試驗可以叫做“觀察”,在概率論中可能沒啥區別,但是在數理統計裡面有區別。 上面例子2中我們不能明確的確定全部可能的outcome(我們不知道人類哪年出現的),但是結果範圍不會超出某個範圍,後面隨機變量出現的時候就是把這範圍進一步的用數學抽象,處理起來就更方便了。

關於概率的幾種觀點

對於概率的定義,目前沒有明確的一種定義被證明是真理而且他定義是謬論,而且這個問題的討論也不是我們目前這個階段要考慮的,很多事物我們並不知道其本身是什麼,但我們卻在研究事物之間的關係。以下幾種觀點可以從不同角度學派來定義概率

The Frequency Interpretation

頻率派認為:事件的概率就是經過大量重複試驗後,此事件出現的次數與試驗總次數的比,也就是事件出現的頻率,這個定義非常模糊,比如大量試驗,多大算大?一萬次?一億次?而且當我們用一萬次試驗定義某個事件概率後,又進行了一萬次試驗很有可能結果不一,也就是按照一個定義做了兩次,結果自相矛盾,那麼這個定義是定義不成功的,但是這兩個結果應該非常接近,或者說他們很接近真理了。 頻率派和統計派是一個派。

The Classical Interpretation

古典概率派:認為假設所有結果等可能性出現,然後每個結果出現的概率就是結果的個數分之一。 這個定義有點搞笑的是裡面出現了可能性這個字,而我們要定義的就是可能性,換種說法讓他們定義人的話,他們會說:有一種是人的生物叫做人。這邏輯,神了吧 而且等可能性這個事情本身就不可能發生,比如扔硬幣,你覺得可能出現正反面的可能性一致,但其實考慮到硬幣兩面不同的樣式,以及重心的微弱變化,其結果不可能是完全等可能的。 但是這個古典派定義是很有用在於我們後面要反覆研究丟硬幣,扔骰子來引出各種其他的概念

The Subjective Interpretation

主觀概率,這個更有意思了,是我們猜一個事件的概率,比如我們猜測一下一會兒下雨的可能性,張三可能是個老人家,他在這裡住了一輩子,他估計下雨的可能性是70%因為他很瞭解這個地方的天氣,李四剛來本地,他說下雨的可能性是60%,他不熟悉本地天氣,但是他根據他的人生經驗給出了一個概率,在問一個剛說話的小朋友一會兒下雨的概率是多少,他說10%,沒人信,他根本不知道10%什麼意思,但是這也是他主觀的概率。 事實上主觀概率對於這個實驗的概率計算沒啥幫助,但是並不是完全沒有用的,我們可以通過這個概率來研究這些人的某些性質,比如民調,那些萬惡的不自由沒人權的資本主義國家大選的時候不就經常搞個民調,研究下大家覺得誰更有可能當總統。

The Axiomatic Interpretation

數學公理化是近代數學的主要發展方向,所以概率這麼大的學科肯定也要進行公理化。 偉大的前蘇聯數學家柯爾莫哥洛夫通過極為簡單的若干個公理作為基礎,建立了概率論的巨集偉大廈。 後面我們關於概率的定義會引用柯氏公理,但是我們要知道柯氏公理的意義在於他用數學手段嚴格了數學化的概率論。

我們並不能說上述四個角度的優劣,頻率派,古典派這些我們都要進行一定研究,能夠準確的解決自然問題的都是好的,所以在沒有嚴格證偽的前提下,都要進行研究。

如何研究概率論

其實這個擴充套件到告訴我們如何進行科學研究。 對於任何學科我們應該仔細區分理論的三個方面,這三個方面相輔相成,拋開任何一個都沒辦法進行研究,或者研究完全會跑偏。

形式邏輯的內容

公理化的數學只論及無定義事物見的關係,最簡單的就是幾何中點和線的關係,我們並不知道點是什麼,也不知道線的定義是什麼,但是我們可以研究這兩個物件見得關係,點和線在這裡是無定義的概念,我們更關係其間的關係,比如兩個點確定一條直線,這是一個“規則的描述”,不同的公理系統能產生不同的規則,這樣研究不同的問題就有更方便貼切的工具了,這就是公理化數學的魅力,你可以自己建立自己的體系,當然你要足夠厲害。 國際象棋的例子也在於我們可以不知道每個棋子的本質是什麼,甚至我們可以給他們不同的名字,不叫皇后,馬什麼的,改名叫a,b。。。照樣可以按照規則來完成棋局,規則才是主要的,甚至我們沒棋盤都能照樣玩。

直觀的背景

對於幾何和物理,我們有非常直觀的觀察物件,比如對於重力,我們能觀察蘋果落地,對一件事很熟悉了之後我們的感官並不會感到迷茫,雖然路邊的老人不懂概率論,但是你問他有多大可能性下雨的時候,他能用語言給你描述個大概,這裡有部分是經驗,有部分是直覺,當對某個領域非常熟悉後,直覺可能更可貴,雖然沒辦法用公理解釋證明。 概率剛出現的時候,其結論與人們固有思維甚至統治集團的思想宣傳都有衝突,但是百年之後,我們看到書上提到可能性的時候完全不會排斥,而是很輕鬆的就能理解其要表達的資訊。

應用

應用是所有科學的最終目的,數學是抽象的工具,當要研究同一個自然現象的時候可以有無數多種抽象的數學模型:“數學理論的應用方式不依賴於事先形成的意見,他是一種有目的技術,依賴於經驗,而且隨經驗改變” 再深入就是哲學了,我們必須剝離哲學和公理化的數學以及經驗之間分別來研究,不然會跑偏。

以上三個方面是所有研究的基礎思想,公理邏輯是重要的工具和原料,背景,經驗靈感給了我們設計圖紙,應用是我們的目的,這樣捋順一下,豁然開朗不?

概率論的核心問題

以下部分是概率論現在研究以及以後都要研究的重點,也是概率論最核心的問題!

  1. 已知一個試驗的所有輸出及其概率,我們要確定一個方法來計算某個事件的概率。
  2. 當得到附加的資訊後如何調整修正當前事件的概率

總結

這是我寫過的最詳細的一篇介紹性文章,寫了很多知識,尤其是後面如何研究概率論,對其他科目也有極大幫助,我們算是正式開啟概率論了,明天繼續。。。