1. 程式人生 > >機器學習 - 樸素貝葉斯(上)- 概率論基礎

機器學習 - 樸素貝葉斯(上)- 概率論基礎

機器學習 - 樸素貝葉斯(上)- 概率論基礎

  • 概率

    1. 聯合概率,邊緣概率 and 條件概率

      有事件 A =

      { a 1 , a 2
      , , a m }
      A=\{a_1,a_2,…,a_m\}
      和事件 B = { b 1 , b 2 , , b n } B=\{b_1,b_2,…,b_n\}

      \bullet 條件概率 P ( B = b j A = a i ) P(B=b_j|A=a_i) ,表示在事件 A = a i A=a_i 發生的條件下,事件 B = b j B=b_j 發生的概率。

      \bullet 聯合概率 P ( A = a i , B = b j ) P(A=a_i,B=b_j) ,表示事件 A = a i A=a_i 和事件 B = b j B=b_j 同時發生的概率。其中:

      P ( A , B ) = { P ( A ) P ( B ) P ( A ) P ( B ) P ( A B ) P ( B ) = P ( B A ) P ( A ) P ( A ) P ( B ) P(A,B)=\begin{cases} P(A)*P(B),P(A) 與 P(B) 相互獨立\\ P(A|B)P(B)=P(B|A)P(A),P(A) 與 P(B) 不獨立\\ \end{cases}

      \bullet 邊緣概率 P ( A = a i ) P(A=a_i) ,表示在不考慮事件 B B 的情況,只需滿足 A = a i A=a_i 的概率。

    2. 先驗概率 and 後驗概率

      \bullet 先驗概率
      是指根據以往經驗和分析得到的概率,如全概率公式,它往往作為"由因求果"問題中的"因"出現的概率。

      \bullet 後驗概率
      是指在得到“結果”的資訊後重新修正的概率,是“執果尋因”問題中的"果"。先驗概率與後驗概率有不可分割的聯絡,後驗概率的計算要以先驗概率為基礎。可通過貝葉斯公式求得。

      先驗概率是通過現有歷史資料計算得到,而不是根據有關自然狀態的全部資料測定的。後驗概率是在歷史資料上又添加了新的資料,使用了有關自然狀態更加全面的資料的基礎上,對先驗概率的修正。

    3. 全概率公式

      \bullet Y = { c 1 , c 2 , , c n } Y=\{c_1,c_2,…,c_n\} Y Y 包含有限或無限個事件,這些事件兩兩互斥且在每次試驗中至少發生一個,它們將樣本空間進行了劃分,把具有這些性質的一組事件稱為一個 完備事件組
      完備事件組
      圖中,樣本空間被完備事件組 Y = { c 1 , c 2 , c 3 , c 4 , c 5 } Y=\{c_1,c_2,c_3,c_4,c_5\} 劃分成 5 各區域。


      \bullet X = { x 1 , x 2 , , x m } X=\{x_1,x_2,…,x_m\} 為另一個事件( X X 同樣也可把某一樣本空間進行區域劃分,在這裡不予展示)。且在此假設 Y = { c 1 , c 2 , c 3 , c 4 , c 5 } Y=\{c_1,c_2,c_3,c_4,c_5\} 對事件 X X 的發生會產生影響。
      全概率公式

      全概率公式 P ( X ) = k P ( Y k = c k ) P ( X Y = c k ) P(X)=\sum_{k}P(Y_k=c_k)P(X|Y=c_k)