條件隨機場CRF介紹

阿新 • • 發佈：2018-05-22

family play 存在分布 als 建立 geo 捕捉 times

鏈接：https://mp.weixin.qq.com/s/BEjj5zJG3QmxvQiqs8P4-w

softmax

CRF主要用於序列標註問題，可以簡單理解為是給序列中的每一幀，既然是分類，很自然想到將這個序列用CNN或者RNN進行編碼後，接一個全連接層用softmax激活，如下圖所示

技術分享圖片

逐幀softmax並沒有直接考慮輸出的上下文關聯

條件隨機場

然而，當我們設計標簽時，比如用s、b、m、e的4個標簽來做字標註法的分詞，目標輸出序列本身會帶有一些上下文關聯，比如s後面就不能接m和e，等等。逐標簽softmax並沒有考慮這種輸出層面的上下文關聯，所以它意味著把這些關聯放到了編碼層面，希望模型能自己學到這些內容，但有時候會“強模型所難”。

而CRF則更直接一點，它將輸出層面的關聯分離了出來，這使得模型在學習上更為“從容”：

技術分享圖片

CRF在輸出端顯式地考慮了上下文關聯

數學

當然，如果僅僅是引入輸出的關聯，還不僅僅是CRF的全部，CRF的真正精巧的地方，是它以路徑為單位，考慮的是路徑的概率。

模型概要

假如一個輸入有 $n$

$n$

4tag分詞模型中輸出網絡圖

而在序列標註任務中，我們的正確答案是一般是唯一的。比如“今天天氣不錯”，如果對應的分詞結果是“今天/天氣/不/錯”，那麽目標輸出序列就是bebess，除此之外別的路徑都不符合要求。換言之，在序列標註任務中，我們的研究的基本單位應該是路徑，我們要做的事情，是從 $k^{n}$

kⁿ條路徑選出正確的一條，那就意味著，如果將它視為一個分類問題，那麽將是kⁿ

k^{n}

這就是逐幀softmax和CRF的根本不同了：前者將序列標註看成是 $n$ 問題，後者將序列標註看成是 $1$ 問題。

具體來講，在CRF的序列標註問題中，我們要計算的是條件概率

技術分享圖片

為了得到這個概率的估計，CRF做了兩個假設：

假設一 該分布是指數族分布。

這個假設意味著存在函數 $f (y_{1}, \dots, y_{n}; x)$

$f (y_{1}, \dots, y_{n}; x)$

其中 $Z (x)$

假設二 輸出之間的關聯僅發生在相鄰位置，並且關聯是指數加性的

這個假設意味著f(y₁,…,y_n;x) $f (y_{1}, \dots, y_{n}; x)$

$f (y_{1}, \dots, y_{n}; x)$

這也就是說，現在我們只需要對每一個標簽和每一個相鄰標簽對分別打分，然後將所有打分結果求和得到總分。

線性鏈CRF

管已經做了大量簡化，但一般來說，上 $(3)$

技術分享圖片

這時候 $g$

$g$

這就是線性鏈CRF的概念。

歸一化因子

為了訓練CRF模型，我們用最大似然方法，也就是用

技術分享圖片

作為損失函數，可以算出它等於

技術分享圖片

其中第一項是原來概率式的分子的對數，它目標的序列的打分，雖然它看上去挺迂回的，但是並不難計算。真正的難度在於分母的對數 $\log Z (x)$

歸一化因子，在物理上也叫配分函數，在這裏它需要我們對所有可能的路徑的打分進行指數求和，而我們前面已經說到，這樣的路徑數是指數量級的（ $k^{n}$

事實上，歸一化因子難算，幾乎是所有概率圖模型的公共難題。幸運的是，在CRF模型中，由於我們只考慮了臨近標簽的聯系（馬爾可夫假設），因此我們可以遞歸地算出歸一化因子，這使得原來是指數級的計算量降低為線性級別。具體來說，我們將計算到時刻 $t$

$t$

其中 $Z_{t}^{(1)}, \dots, Z_{t}^{(k)}$ 分別是截止到當前時刻 $t$

技術分享圖片

它可以簡單寫為矩陣形式

$G$

技術分享圖片

歸一化因子的遞歸計算圖示。從t到t+1時刻的計算，包括轉移概率和j+1節點本身的概率

動態規劃

寫出損失函數 $- \log P (y_{1}, \dots, y_{n} | x)$

條件隨機場CRF介紹

family play 存在分布 als 建立 geo 捕捉 times 鏈接：https://mp.weixin.qq.com/s/BEjj5zJG3QmxvQiqs8P4-w softmax CRF主要用於序列標註問題，可以簡單理解為是給序列中的

條件隨機場CRF介紹

softmax

條件隨機場

數學

模型概要

線性鏈CRF

歸一化因子

動態規劃

條件隨機場CRF介紹

簡明條件隨機場CRF介紹（附帶純Keras實現）

概率模型（四）：條件隨機場(CRF)

NLP --- 條件隨機場CRF（預測演算法詳解）

NLP --- 條件隨機場CRF（概率計算問題）

NLP --- 條件隨機場CRF背景

用條件隨機場CRF進行字標註中文分詞（Python實現）

機器學習條件隨機場CRF

【中文分詞】條件隨機場CRF

NLP-初學條件隨機場(CRF)

隱馬爾可夫(HMM)/感知機/條件隨機場(CRF)----詞性標註

條件隨機場（CRF）-基礎

NLP —— 圖模型（二）條件隨機場（Conditional random field，CRF）

轉載】如何輕鬆愉快地理解條件隨機場（CRF）？

【演算法】CRF(條件隨機場)

【演算法】BILSTM+CRF中的條件隨機場

條件隨機場（Conditional random field，CRF）

條件隨機場(4)——CRF++分詞訓練和預測

條件隨機場之CRF++源碼詳解-開篇

條件隨機場之CRF++原始碼詳解-開篇

條件隨機場CRF介紹

softmax

條件隨機場

數學

模型概要

線性鏈CRF

歸一化因子

動態規劃

相關推薦