1. 程式人生 > >線性條件隨機場程式碼解讀

線性條件隨機場程式碼解讀

  NERCRF是必不可少的環節,特地看了一遍CRF相關理論以及中CRF的程式碼,特在這裡筆記記錄下來!

1.線性CRF簡介

1.1一般形式

  關於線性條件隨機場的詳細介紹,請參考李航老師的《統計學習方法》或者這裡,這裡僅僅給出一般的公式定義。
  設P(Y|X)為線性鏈條件隨機場,則在隨機變數X取值為x的條件下,隨機變數Y取值為y的條件概率具有如下形式(注意x, y都是序列):

P(y|x)=1Z(x)exp(i,kλktk
(yi1,yi,x,i)+i,lμlsl(yi,x,i))(11.10)

其中,
Z(x)=yexp(i,kλktk(yi1,yi,x,i)+i,lμlsl(yi,x,i))(11.11)
式子中,tk轉移特徵函式,依賴於當前和前一個位置sl狀態特徵函式,依賴於當前位置λkμl是對應的權重。Z(x)是規範化因子,求和是在所有可能的輸出序列上進行的(注意這個所有可能不是任意的組合,這需要依賴於x的取值)。

1.2簡化形式

  注意到條件隨機場式(11.10)中同一特徵在各個位置都有定義,可以對同一個特徵在各個位置求和,將區域性特徵函式轉哈U為一個全域性特徵函式,這樣就可以將條件隨機場寫成權值向量和特徵向量(包括轉移特徵和狀態特徵)的內積形式,即條件隨機場的簡化形式。
  首先將轉移特徵和狀態特徵及其權值用統一的符號表示,設有

K1個轉換特徵,K2個狀態特徵,K=K1+K2,記:

fk(yi1,yi,x,i<