1. 程式人生 > >生成模型和判別模型

生成模型和判別模型

特征 數據 學習方法 最大 mem 針對 表示 不能 問題

1、定義:

生成模型(或稱產生式模型)和判別模型(或稱判別式模型)的本質區別在於模型中觀測序列x和狀態序列y的決定關系。前者假設y決定x,後者假設x決定y。

2、生成模型特點

2.1、生成模型以“狀態序列y按照一定的規律生成觀察輸入序列x”為假設,針對聯合分布p(x,y)建模,通過估計生成概率最大的生成序列來估計y。

2.2、生成模型是所有變量的全概率模型,因此可以模擬所有變量的值。

2.3、有嚴格的獨立性假設,特征是事先給定的,並且特征之間的關系比較清楚,模型可以通過增量學習獲得。可以用於數據不完整的情況。

2.4、弱點是推導和學習比較復雜。

2.5、常見的生成模型有:n-gram,HMM,NB等

2.6、收斂速度快(《統計學習方法》李航)

3、判別模型特點

3.1、y由x決定,直接使用p(y|x)建模;特征任意給定,通過函數表示。

3.2、優點:處理多類問題或分辨某一類問題與其他類之間的差異是比較靈活,模型簡單,容易學習。

3.3、缺點:描述能力有限;變量之間的關系不清楚;大多數都是有監督模型,不能推廣到無監督。

3.4、代表:ME(LR),CRF、SVM、MEMM、感知機。

3.5、準確度高(《統計學習方法》李航)

生成模型和判別模型