1. 程式人生 > >論文筆記:Histology Image Classification using Supervised Classification and Multimodal Fusion

論文筆記:Histology Image Classification using Supervised Classification and Multimodal Fusion

該部落格由EMMA原創,隨意轉載,部落格原連結

Histology Image Classification using Supervised Classification and Multimodal Fusion

原文連結:paper
出處:2010 IEEE International Symposium on Multimedia

最近在使用小波變換做原始影象預處理,然後用CNN訓練多個模型進行分類,想找一個fusion的方法,所以找到了這篇論文。雖然最後本文使用的多數權重投票方法深不得我心,不過引言還是讓我漲了姿勢。文章通俗易懂,除了有些地方小題大做,在當時應該不錯的論文吧。mark

[16]19

摘要

如今顯微鏡技術的快速發展極大地促進了資料的生成。這些資料不僅在理論生物學研究起重要作用同時對於臨床也有很大影響。為了降低內外部觀測的差異性,以及保護人們對這些資料進行的各種努力(標註和分類),大量的努力貢獻到生物學影象演算法的發展中。在這些努力中,病理學影象分類是其中一個重要的領域,由於其在病理學診斷(比如,癌症診斷)中的廣泛應用。本文提出一個新穎的框架Collateral Representative Subspace Projection Modeling (C-
RSPM) 。這是一個監督分類模型適用於大部分的病理學影象分類。在這個框架中,一個影象被分成25個塊,目的是降低計算的空間複雜度,每個塊都構建一個CRSPM模型,這個模型包含所有影象中該塊位置的塊。意思就是所有影象的同一位置構建一個模型,總共構建25個模型,因為一張圖有25塊。對於測試影象,我們先對它的每個塊進行分類,然後使用多模型混合方法利用權重投票策略來決定整張圖最後的類別。實驗採用了3折交叉驗證。

關鍵詞:病理學影象分類;多模型混合;多數權重投票演算法;C-RSPM模型

引言

病理學影象分類有幾個難點:1. 病理學影象不穩定,因為影象的任何一個區域都有不同的特性(這是所有影象分類的問題好嗎,就是因為有不一樣的特性才能分類呀,搞不懂原作者寫這句話時怎麼想的);2. 染色環境的差異以及個體的而不同,也給分類帶來了困難;3. 類內差異有時很小,有時對於人類專家來說也很難正確分類。 在參考文獻12中,我們可以看到相比於其他型別的資料,病理學影象分類的任務正確率要低很多。
有兩個研究方向:
1. 提取特定特徵,比如離散小波變換在提取特徵之前實施為了提高分類系統的魯棒性[16]. 不規則碎片,基於紋理特徵的研究。
2. 目的是更好的分割物體。最近鄰分類演算法,通過腺體和細胞被分割之後提取的特徵來進行前列腺癌評分,乳腺癌檢測和乳腺癌評分[19]。
本文提出的C-RSPM方法是監督分類模型,它嘗試訓練一個主成分分析序列。每個成分都學習訓練資料一類的分佈為了判斷測試影象的類別。
本文提出的模型具有general特性,

框架

這裡寫圖片描述
整個框架分成兩部分:特徵準備分類

  • 特徵準備:
    每張圖首先被分成25塊,所有 圖片同一位置的塊形成一組Bk,1<=k<=25.每組有505個特徵,包含顏色紋理特徵,從每個塊中提取出來的。然後資料集被分成訓練資料和測試資料。進行正則化。

  • 分類:
    每塊訓練一個模型,所以擁有25個模型。
    根據多數投票演算法( Weighted Majority Voting Algorithm )得到最終的分類結果。

C-RSPM模型

訓練多個主分量分類器Principal Component Classifiers (PCCs),

The Weighted Majority Voting Alogrithm (WMVA)

每個test經過分類後,有有25個模型,所以得到25個labels。因此能夠得到概率矩陣。假設有U類,那麼每個模型將產生U個概率預測值,那麼概率值最大的就是這個模型的預測結果。我們把25個U維向量拼接起來,構成25 * U權重維矩陣。矩陣同一列相加,形成相加後的U維向量,哪維最大就是哪類。
(原文寫的比較繁瑣,居然還用到了公式,基本原理就是我上面翻譯的,真搞不懂原作者為啥要小題大做。)

EMMA
SIAT
2017.04.19