1. 程式人生 > >機器學習 條件隨機場CRF

機器學習 條件隨機場CRF

原文:http://blog.csdn.net/u010487568/article/details/46485673

CRF由來

條件隨機場(CRF)這種用來解決序列標註問題的機器學習方法是由John Lafferty於2001年發表在國際機器學習大會ICML上的一篇經典文章所引入,對後人的研究起到了非常大的引領作用。特別是標註問題在很多自然科學領域有廣泛應用,在自然語言處理領域對於自動分詞、命名實體標註等問題都以這篇文章作為開山之作。

CRF的特性

1.判別式模型

CRF是一種概率無向圖判別式模型,解決了HMM(隱馬爾科夫)和MEMM(最大熵馬爾科夫)模型在序列標註中的標註偏差(bias)問題。

2. 實用性高

CRF使用一個單獨的指數模型來表示在給定觀測序列條件下整個序列的標籤的聯合概率,不同狀態下的不同特徵能夠相互進行平衡。同時,可以把CRF當做一個具有非規範化的轉移概率的有限狀態模型,使用MLE或者MAP進行學習之後可以得到一個定義良好的可能標註的概率分佈。同時,訓練的損失函式是凸函式,保證了全域性收斂性,是無約束凸優化問題,具有非常好的實用性

模型詳解

模型定義

隨機變數X表示待標註的序列資料,隨機變數Y表示序列資料對應的標籤,其中Y的每一個分量Yi取值於一個有限個標籤的集合Y。 
定義:給定圖G=(V,E)表示概率分佈P(Y),即在圖中頂點確定的隨機變數Y

=(Yv)vV屬於圖G,圖中的邊eE表示隨機變數之間的依賴性。當隨機變數Yv在給定條件X滿足馬爾科夫性質時,那麼(X,Y)構成了一個條件隨機場(CRF)。其中馬爾科夫性質是指: 

P(Yv|X,Yw,wv)=P(Yv|X,Yw,wv) 其中的wv表示圖中與節點v相連的節點 。 
在序列標註問題中,所有元素連線成為一條鏈式結構,因此定義中的圖結構在處理序列標註問題時預設為線性鏈式結構,也就是G=(V={1,2,...m})E={(i,i+1),i=1,2...m1},定義中沒有規定XY有同樣的結構,但是現實中一般假定XY具有同樣的結構,常使用的是X=(X1,X
2
,...Xm)
Y=(Y1,Y2,...Ym)。 
根據上述假設,可以得出如下的線性鏈條件隨機場: 

相關推薦

機器學習 條件機場CRF

原文:http://blog.csdn.net/u010487568/article/details/46485673 CRF由來 條件隨機場(CRF)這種用來解決序列標註問題的機器學習方法是由John Lafferty於2001年發表在國際機器學習大

條件機場CRF介紹

family play 存在 分布 als 建立 geo 捕捉 times 鏈接:https://mp.weixin.qq.com/s/BEjj5zJG3QmxvQiqs8P4-w softmax CRF主要用於序列標註問題,可以簡單理解為是給序列中的

簡明條件機場CRF介紹(附帶純Keras實現)

筆者去年曾寫過博文《果殼中的條件隨機場(CRF In A Nutshell)》,以一種比較粗糙的方式介紹了一下條件隨機場(CRF)模型。然而那篇文章顯然有很多不足的地方,比如介紹不夠清晰,也不夠完整,還沒有實現,在這裡我們重提這個模型,將相關內容補充完成。 本文是對CRF基本原理的一個簡明的介紹

概率模型(四):條件機場(CRF)

條件隨機場(Conditional Random Field,CRF)是一個比較重要的概率模型,在詳細介紹CRF之前,首先簡單介紹一下概率圖(Probabilistic Graphical Model,PGM),有時候簡稱圖模型(Graphical Model,

NLP --- 條件機場CRF(預測演算法詳解)

前幾節我們大概的介紹了學習演算法,即GIS和IIS的演算法,這兩個演算法在最大熵模型中講的比較詳細,想要深入理解這兩個演算法,需要你理解動態規劃演算法。這裡的條件隨機場實際上是根據最大熵模型的思想過來的,因為通過前面我們可以看出CRF演算法的目標公式就是按照最大熵演算法構造而來的,不同的是特徵函

NLP --- 條件機場CRF(概率計算問題)

上一節詳解的闡述了條件隨機場的定義和簡單的學習演算法推倒,這裡不懂的前翻看前兩節的部落格,這裡不再贅述,本節將主要求期望的問題,為什麼要求解期望?本節主要參考的內容是一篇論文和李航的書,論文是《Conditional Random Fields: An Introduction》 Hanna M

NLP --- 條件機場CRF背景

上一節我們主要講解了最大熵模型的原理,主要是解釋了什麼是最大熵,已經最大熵的背景知識,其實還是多建議大家讀讀論文,如果讀英語有點難度,那就看李航的《統計學習方法》的最大熵模型和條件隨機場,這本書的質量很高,本節主要講一些條件隨機場的背景知識,解釋為什麼需要引入條件隨機場,廢話不多說,下面開始:

條件機場CRF進行字標註中文分詞(Python實現)

        本文運用字標註法進行中文分詞,使用4-tag對語料進行字標註,觀察分詞效果。模型方面選用開源的條件隨機場工具包“CRF++: Yet Another CRF toolkit”進行分詞。         本文使用的中文語料資源是SIGHAN提供的backof

【中文分詞】條件機場CRF

之前介紹的MMEM存在著label bias問題,因此Lafferty et al. [1] 提出了CRF (Conditional Random Field). BTW:比較有意思的是,這篇文章的二作與三作同時也是MEMM的作者。 1. 前言 本節將遵從tutorial [2] 的論文結構,從概率模型(Pr

NLP-初學條件機場(CRF)

說明:學習筆記,內容參考《機器學習》《數學之美》和七月線上課件 條件隨機場 定義1: 條件隨機場(conditional random field,簡稱CRF)是一種判別式無向圖模型。生成式模型是直接對聯合分佈進行建模,而判別式模型則是對條件分佈

隱馬爾可夫(HMM)/感知機/條件機場(CRF)----詞性標註

筆記轉載於GitHub專案:https://github.com/NLP-LOVE/Introduction-NLP 7. 詞性標註 7.1 詞性標註概述 什麼是詞性 在語言學上,詞性(Par-Of-Speech, Pos )指的是單詞的語法分類,也稱為詞類。同一個類別的詞語具有相似的語法性質,所有詞性的集

[白話解析] 用水滸傳為例學習條件機場

# [白話解析] 用水滸傳為例學習條件隨機場 ## 0x00 摘要 本文將盡量使用易懂的方式,儘可能不涉及數學公式,而是從整體的思路上來看,運用感性直覺的思考來解釋條件隨機場。並且用水滸傳為例學習。並且從名著中找了具體應用場景來幫助大家深入這個概念。 在機器學習過程中,會遇到很多晦澀的概念,相關數學公式

機器學習實戰——條件機場CRF

CRF由來 條件隨機場(CRF)這種用來解決序列標註問題的機器學習方法是由John Lafferty於2001年發表在國際機器學習大會ICML上的一篇經典文章所引入,對後人的研究起到了非常大的引領作用。特別是標註問題在很多自然科學領域有廣泛應用,在自然語言

機器學習 —— 概率圖模型(馬爾科夫與條件機場

種類 方向 方法 所有 href 個人 tro 傳遞 很好 機器學習 —— 概率圖模型(馬爾科夫與條件隨機場)   再一次遇到了Markov模型與條件隨機場的問題,學而時習之,又有了新的體會。所以我決定從頭開始再重新整理一次馬爾科夫模型與條件隨機場。   馬

李巨集毅機器學習2016 第二十一講 隱馬爾可夫模型和條件機場

Hidden Markov Model & Conditional Random Field 本章主要通過舉例詞性標註的例子講解了隱馬爾可夫模型和條件隨機場。 1.詞性標註(part-of-speech tagging,POS tagging)

條件機場CRF)-基礎

condition xmlns tro 介紹 第二篇 依賴 算法 時間 element   條件隨機場(conditional random fields,簡稱 CRF,或CRFs)下文簡稱CRF,是一種典型的判別模型,相比隱馬爾可夫模型可以沒有很強的假設存在,在分詞、詞性

NLP —— 圖模型(二)條件機場(Conditional random field,CRF

而在 mar 依賴 alt strong $$ href 否則 block 本文簡單整理了以下內容: (一)馬爾可夫隨機場(Markov random field,無向圖模型)簡單回顧 (二)條件隨機場(Conditional rand

轉載 】如何輕鬆愉快地理解條件機場CRF)?

理解條件隨機場最好的辦法就是用一個現實的例子來說明它。但是目前中文的條件隨機場文章鮮有這樣乾的,可能寫文章的人都是大牛,不屑於舉例子吧。於是乎,我翻譯了這篇文章。希望對其他夥伴有所幫助。 原文在這裡http://blog.echen.me/2012/01/03/introduction-to

【統計學習方法-李航-筆記總結】十一、條件機場

本文是李航老師《統計學習方法》第十一章的筆記,歡迎大佬巨佬們交流。 主要參考部落格: https://www.cnblogs.com/YongSun/p/4767734.html   主要內容: 1. 概率無向圖模型 2. 條件隨機場的定義與形式 3. 條件隨機

【演算法】CRF(條件機場)

CRF(條件隨機場) 基本概念 場是什麼 場就是一個聯合概率分佈。比如有3個變數,y1,y2,y3, 取值範圍是{0,1}。聯合概率分佈就是{P(y2=0|y1=0,y3=0), P(y3=0|y1=0,y2=0), P(y2=0|y1=1,y3=0), P(y3=0|y1=1,y2=0), ...