1. 程式人生 > >多示例學習 multiple instance learning (MIL)

多示例學習 multiple instance learning (MIL)

        最近看了幾篇關於多示例學習的文章,雖然都是醫學方面的,但是還是對我很有啟發。另外,多示例學習近幾年已經逐漸被用於基於機器學習框架的組織病理學影象癌症檢測等方面,是計算機輔助診斷這一學科中一種新崛起的方法,下面就按照我在論文和網上學到的知識對多示例學習進行一下簡單的介紹。

        在介紹多示例學習之前,首先要了解兩個概念:包(bags)和示例(instance)。包是由多個示例組成的,舉個例子,在影象分類中,一張圖片就是一個包,圖片分割出的patches就是示例。在多示例學習中,包帶有類別標籤而示例不帶類別標籤,最終的目的是給出對新的包的類別預測。有人說多示例學習是監督學習的一種擴充套件,不過我更加傾向於認為多示例學習是介於監督學習與無監督學習之間且不同於半監督學習的一種學習方法,因為用於訓練分類器的示例是沒有類別標記的,但是包卻是有類別標記存在的,這一點與以往的所有框架均不甚相同。還有一點就是多示例學習特有的規則:如果一個包裡面存在至少一個被分類器判定標籤為+的示例,則該包為正包;如果一個包裡面所有的示例都被分類器判定標籤為-,則該包為負包。

                                                                   

        多示例學習僅僅在全域性註釋的圖片上進行訓練,但卻往往可以給出patch級或者畫素級的標籤。在我看過的幾篇論文中,如果要求MIL框架可以給出patch級別的標籤也就是給出instance級別的標籤,那麼訓練樣本中的instance必須存在標籤(僅僅標註一部分也可以),不太清楚是不是這回事。。。還請大家指教!

        另外,多示例學習中存在一個很嚴重的問題就是示例標籤的不穩定性,也就是說,如果訓練集出現了輕微的變動(例如數量略微增加和減少),那麼輸出的示例標籤就會出現不穩定的情況。針對這一問題,2015年MICCAI給出了一種新的度量方法,用來度量MIL分類器的不穩定性從而選出最優秀的分類器。各位朋友有需要的話可以看一下:

http://link.springer.com/chapter/10.1007/978-3-319-24553-9_66

        以上的內容屬於我自己的總結,可能有很多疏漏之處,希望各位朋友多多批評指正~~