自然語言處理(二)概率論資訊理論基礎

阿新 • • 發佈：2018-12-27

概率論

概率

概率的統計定義

頻率
事件A在n次重複隨機試驗中出現的次數與n的比值。
概率
在同一條件下做的大量重複試驗中，若事件A發生的頻率總是在一個確定的常數p附近擺動，並且逐漸穩定於p，那麼數p就表示事件A發生的可能性大小，併成為事件A的概率.

概率的公理化定義
設E是隨機試驗，Ω是E的樣本空間，對於E 的每一個事件A賦予一個實數值，
表示事件發生的可能性（記為 $P (A$

) P(A)

P (A)

），則

P(A)

為事件A的概率.概率必須滿足如下公理：

非負性

規範性
$P(\Omega)=1$
可加性

最大似然估計(MLE)

最大似然估計(Maximization likelihood estimation, MLE)

如果一個實驗的樣本空間是 $s_1,s_2,\dots,s_n$ ，在相同情況下重複實驗N次，觀察到樣本 $s_k(1\leq k\leq n)$ 的次數維 $n_N(s_k)$ ，則 $s_k$ 的相對頻率為：
$q_N(s_k) = \frac{n_N(s_k)}{N}$
由於 $\sum_{i=1}^nn_N(s_k) = N$ ，因此 $\sum_{i=1}^nq_N(s_k)=1$
當N越來越大時，相對頻率 $q_N(s_k)$ 就越來越接近 $s_k$ 的概率 $P(s_k)$ .
$\lim_{N\rightarrow \infty}q_N(s_k) = P(s_k)$
在N很大情況下，我們用相對頻率來作為概率的估計值，即最大似然估計.

條件概率(conditional probability)

如果A和B是樣本空間 $\Omega$ 上的兩個事件， $P(B)>0$ ，那麼在給定B時A的條件概率 $P(A|B)$ 為
$P(A|B) = \frac{P(A\cap B)}{P(B)}$

全概率公式

$P(A) = P(\cup_{i=1}^nAB_i) = \sum_{i=1}^nP(AB_i) = \sum_{i=1}^nP(B_i)P(A|B_i)$

貝葉斯法則(Bayes’ theorem)

$P(B_i|A) = \frac{P(B_i)P(A|B_i)}{\sum_{j=1}^nP(B_j)P(A|B_j)}$

貝葉斯決策理論

假設研究的分類問題有c個類別，各類別的狀態用 $w_i$ 表示， $i=1,2,\dots,c$ ，對應於各類別 $w_i$ 出現的先驗概率 $P(w_i)$ ，在特徵空間中觀察到某一向量 $\bar{x}$ 是d維特徵空間上的某一點，且條件概率密度函式 $P (x$

自然語言處理(二)概率論資訊理論基礎

概率論

概率

最大似然估計(MLE)

條件概率(conditional probability)

全概率公式

貝葉斯法則(Bayes’ theorem)

貝葉斯決策理論

自然語言處理(二)概率論資訊理論基礎

自然語言處理（一）——基礎

統計自然語言處理概率論和資訊理論基本概念及其推導過程

NLP系列(1)_從破譯外星人文字淺談自然語言處理的基礎

文本情感分析的基礎在於自然語言處理、情感詞典、機器學習方法等內容。以下是我總結的一些資源。

Spark2.0 特征提取、轉換、選擇之二：特征選擇、文本處理，以中文自然語言處理(情感分類)為例

【自然語言處理篇】--以NLTK為基礎講解自然語?處理的原理

Hanlp中文自然語言處理入門基礎知識

Python自然語言處理筆記【二】文本分類之監督式分類的細節問題

自然語言處理NLP（二）

斯坦福大學-自然語言處理入門筆記第十二課詞性標註（Part-of-speech tagging）

python自然語言處理（二）

《統計自然語言處理基礎》作者Christopher D. Manning指出的NLP研究趨勢

Python自然語言處理—演算法基礎

自然語言處理基礎知識

自然語言處理基礎技術之依存句法分析

自然語言處理基礎技術之命名實體識別實戰

自然語言處理基礎技術之命名實體識別簡介

自然語言處理基礎技術之詞性標註實戰

自然語言處理基礎技術之分詞實戰

自然語言處理(二)概率論資訊理論基礎

概率論

概率

最大似然估計(MLE)

條件概率(conditional probability)

全概率公式

貝葉斯法則(Bayes’ theorem)

貝葉斯決策理論

相關推薦