統計學習方法 6-邏輯斯諦迴歸與最大熵模型
阿新 • • 發佈:2019-01-20
邏輯斯諦迴歸模型
邏輯斯諦分佈
二元邏輯斯諦迴歸模型
模型引數估計
多元邏輯斯諦迴歸
最大熵模型
最大熵原理
最大熵原理認為,學習概率模型時,在所有可能的概率模型(分佈)中,熵最大的模型是最好的模型。通常用約束條件來確定概率模型的集合,所以,最大熵原理也可以表述為在滿足約束條件的模型集合中選取熵最大的模型。
最大熵模型的定義
假設滿足所有約束條件的模型集合為
定義在條件概率分佈P(Y|X)上的條件熵為
則模型集合
最大熵模型的學習
最大熵模型的學習過程就是求解最大熵模型的過程。
約束最優化問題:
s.t.
最大熵模型:
其中,
極大似然估計
對偶函式的極大化等價於最大熵模型的極大似然估計。
模型學習的最優化演算法
常用的方法有改進的迭代尺度法、梯度下降法、牛頓法或擬牛頓法。牛頓法或擬牛頓法一般收斂速度更快。
改進的迭代尺度法
最大熵模型的對數似然函式:
目標是通過極大似然估計學習模型引數,即求對數似然函式的極大值
IIS的想法是:假設最大熵模型當前的引數向量是