論文筆記：Histology Image Classification using Supervised Classification and Multimodal Fusion

阿新 • • 發佈：2019-01-04

該部落格由EMMA原創，隨意轉載，部落格原連結

Histology Image Classification using Supervised Classification and Multimodal Fusion

原文連結：paper
出處：2010 IEEE International Symposium on Multimedia

最近在使用小波變換做原始影象預處理，然後用CNN訓練多個模型進行分類，想找一個fusion的方法，所以找到了這篇論文。雖然最後本文使用的多數權重投票方法深不得我心，不過引言還是讓我漲了姿勢。文章通俗易懂，除了有些地方小題大做，在當時應該不錯的論文吧。mark

[16]19

摘要

如今顯微鏡技術的快速發展極大地促進了資料的生成。這些資料不僅在理論生物學研究起重要作用同時對於臨床也有很大影響。為了降低內外部觀測的差異性，以及保護人們對這些資料進行的各種努力（標註和分類），大量的努力貢獻到生物學影象演算法的發展中。在這些努力中，病理學影象分類是其中一個重要的領域，由於其在病理學診斷（比如，癌症診斷）中的廣泛應用。本文提出一個新穎的框架Collateral Representative Subspace Projection Modeling (C-
RSPM) 。這是一個監督分類模型適用於大部分的病理學影象分類。在這個框架中，一個影象被分成25個塊，目的是降低計算的空間複雜度，每個塊都構建一個CRSPM模型，這個模型包含所有影象中該塊位置的塊。意思就是所有影象的同一位置構建一個模型，總共構建25個模型，因為一張圖有25塊。對於測試影象，我們先對它的每個塊進行分類，然後使用多模型混合方法利用權重投票策略來決定整張圖最後的類別。實驗採用了3折交叉驗證。

關鍵詞：病理學影象分類；多模型混合；多數權重投票演算法；C-RSPM模型

引言

病理學影象分類有幾個難點：1. 病理學影象不穩定，因為影象的任何一個區域都有不同的特性（這是所有影象分類的問題好嗎，就是因為有不一樣的特性才能分類呀，搞不懂原作者寫這句話時怎麼想的）；2. 染色環境的差異以及個體的而不同，也給分類帶來了困難；3. 類內差異有時很小，有時對於人類專家來說也很難正確分類。在參考文獻12中，我們可以看到相比於其他型別的資料，病理學影象分類的任務正確率要低很多。
有兩個研究方向：
1. 提取特定特徵，比如離散小波變換在提取特徵之前實施為了提高分類系統的魯棒性[16]. 不規則碎片，基於紋理特徵的研究。
2. 目的是更好的分割物體。最近鄰分類演算法，通過腺體和細胞被分割之後提取的特徵來進行前列腺癌評分，乳腺癌檢測和乳腺癌評分[19]。
本文提出的C-RSPM方法是監督分類模型，它嘗試訓練一個主成分分析序列。每個成分都學習訓練資料一類的分佈為了判斷測試影象的類別。
本文提出的模型具有general特性，

框架

這裡寫圖片描述
整個框架分成兩部分：特徵準備 和分類

特徵準備：
每張圖首先被分成25塊，所有圖片同一位置的塊形成一組Bk,1<=k<=25.每組有505個特徵，包含顏色紋理特徵，從每個塊中提取出來的。然後資料集被分成訓練資料和測試資料。進行正則化。
分類：
每塊訓練一個模型，所以擁有25個模型。
根據多數投票演算法（ Weighted Majority Voting Algorithm ）得到最終的分類結果。

C-RSPM模型

訓練多個主分量分類器Principal Component Classifiers (PCCs),

The Weighted Majority Voting Alogrithm (WMVA)

每個test經過分類後，有有25個模型，所以得到25個labels。因此能夠得到概率矩陣。假設有U類，那麼每個模型將產生U個概率預測值，那麼概率值最大的就是這個模型的預測結果。我們把25個U維向量拼接起來，構成25 * U權重維矩陣。矩陣同一列相加，形成相加後的U維向量，哪維最大就是哪類。
（原文寫的比較繁瑣，居然還用到了公式，基本原理就是我上面翻譯的，真搞不懂原作者為啥要小題大做。）

EMMA
SIAT
2017.04.19

論文筆記：Histology Image Classification using Supervised Classification and Multimodal Fusion

該部落格由EMMA原創，隨意轉載，部落格原連結 Histology Image Classification using Supervised Classification and Multimodal Fusion 原文連結：paper 出處

論文筆記：Deep Image Prior

&nbs

論文筆記：Residual Attention Network for Image Classification

前言深度學習中的Attention，源自於人腦的注意力機制，當人的大腦接受到外部資訊，如視覺資訊、聽覺資訊時，往往不會對全部資訊進行處理和理解，而只會將注意力集中在部分顯著或者感興趣的資訊上，這樣有助於濾除不重要的資訊，而提升資訊處理的效率。最早將A

論文筆記：An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application

1.歷史方法 1）基於字元的DCNN,比如photoOCR.單個字元的檢測與識別。要求單個字元的檢測器效能很強，crop的足夠好。 2）直接對圖片進行分類。9萬個單詞，組合成無數的單詞，無法直接應用 3）RNN,訓練和測試均不需要每個字元的位置。但是需要預處理，從圖片得到特

論文筆記：Tag-Aware Personalized Recommendation Using a Hybrid Deep Model

感想這篇論文，我斷斷續續的看了幾天，作者做的工作也挺多的，我感覺論文的資料集還是不夠大，還不足以支撐訓練其它深度神經網路的地步。本文提出的混合深度學習完全是autoencoder的一個變體，用來解決標籤資料稀疏性，不可控詞彙表等問題，由於添加了重構誤差函式，和一般深度學習

論文筆記：Image Caption(Show, attend and tell)

Show, Attend and Tell: Neural Image Caption Generation with Visual Attention Show, Attend and Tell 1、四個問題要解決什麼問題？ Image Cap

論文筆記：Image Caption(Show and Tell)

Show and Tell: A Neural Image Caption Generator Show and Tell 1、四個問題要解決什麼問題？ Image Caption（自動根據影象生成一段文字描述）。用了什麼方法

論文筆記：Fisher Kernels on Visual Vocab ularies for Image Categorization

Fisher Kernels on Visual Vocabularies for Image Categorization 論文連結：CVPR 2006 在模式分類領域，Fisher Vector（FV）是一個強有力的構架，因為他結合了生成式（概率密

論文筆記：DRAW: A Recurrent Neural Network For Image Generation

DRAW: A Recurrent Neural Network For Image Generation 2019-01-14 19:42:50 Paper：http://proceedings.mlr.press/v37/gregor15.pdf 本文將 V

論文筆記：Self-critical Sequence Training for Image Captioning

引言現在image caption主要存在的問題有： exposure bias：模型訓練的時候用的是叫“Teacher-Forcing”的方式：輸入RNN的上一時刻的單詞是來自訓練集的ground-truth單詞。而在測試的時候依賴的是自己

論文筆記：Connectionist Temporal Classification: Labelling Unsegmented Sequence

標記未分割的序列資料是現實世界序列學習中普遍存在的問題，並且在一些感知任務中是普遍實用的，例如手寫字型識別，語音識別，手勢識別（gesture recognition）。在感知任務中，帶有噪聲的實值輸入流用一串離散的標籤進行標註。例如字母或者單詞。當前，圖模型，例如HMM,CRFs和他們的變體是序列標註

論文筆記：Learning Social Image Embedding with Deep Multimodal Attention Networks

感想這篇文章我看了一下作者是北航和微軟亞洲研究院合起來做的一篇文章，我感覺最深的是它的那個image-text network embedding的思想，用取樣的方法來降低訓練的複雜度。這也是一個深度學習注意力模型，更開心的是，論文裡面說程式碼是用keras來寫的，論文接

論文筆記：SGM: Sequence Generation Model for Multi-label Classification

感想這篇文章是我在參加DeeCamp 2018課程的時候，發現的，當時原作者還只是研一，就中了一篇CCF B類的Best paper，這篇文章的工作跟我的工作非常的像，不過我沒作者做得多，所以我發的論文的檔次沒他的高，anyway，我也學習一下，找一下靈感，模型的程式碼用

論文筆記：目標追蹤-CVPR2014-Adaptive Color Attributes for Real-time Visual Tracking

exploit orm dom ons tail red 最好早期形式化基於自適應顏色屬性的目標追蹤 Adaptive Color Attributes for Real-Time Visual Tracking 基於自適應顏色屬性的實時視覺追蹤 3月講的第一

論文筆記：Fast(er) RCNN

這也物體檢測因此 sele 疑惑修正 width 輸入重點在 RCNN 初步試水取得成功後，研究人員又迅速跟進，針對 RCNN 中的幾點不足提出改進，接連推出了 fast-rcnn 和 faster-rcnn。關於這兩篇論文，網上相關的文章實在是多如牛毛，因此，本

論文筆記：時間序列分析

論文筆記：Causal Inference on EventSequences 論文綜述解決的問題：兩個不同的序列xn與yn，是否能斷定他們相互關聯，或者說存在因果關係。依託的主要知識：概率論名詞解釋：格蘭傑因果關係 Granger c

論文筆記：Empirical Evaluation of Gated Recurrent Neural Networks on Sequence Modeling

感想最近深度學習面試的時候，有個面試官問了我LSTM，我一下子傻眼了，確實不怎麼好懂，學LSTM已經有半年的時間了，但是對這個玩意兒卻還不怎麼明白，可能是沒用過它的緣故吧，我找了一篇它和GRU比較的論文，這篇論文沒有從理論上證明哪個模型的好壞，只是從實驗，應用場景的角度發現GRU在一些場景比LST

論文筆記：Interpret Neural Networks by Identifying Critical Data Routing Paths

這是一篇做可解釋性AI的文章，文章的主要內容就是提出了一種新的資料表示分析方法，在此之上做了一些分析工作。 Abstract：大概就是說定義了一個叫CDRPs（可分離路徑），這是文章的主要內容。 Introduction：大多的視覺化分析方法多是定性的，沒法定量分

深度學習論文筆記：Deep Residual Networks with Dynamically Weighted Wavelet Coefficients for Fault Diagnosis of Planetary Gearboxes

這篇文章將深度學習演算法應用於機械故障診斷，採用了“小波包分解+深度殘差網路(ResNet)”的思路，將機械振動訊號按照故障型別進行分類。文章的核心創新點：複雜旋轉機械系統的振動訊號包含著很多不同頻率的衝擊和振盪成分，而且不同頻帶內的振動成分在故障診斷中的重要程度經常是不同的，因此可以按照如下步驟設計深度

論文筆記：Deep Attentive Tracking via Reciprocative Learning

Deep Attentive Tracking via Reciprocative Learning NIPS18_tracking Type:Tracking-By-Detection 本篇論文地主要創新是在將注意機制引入到目標跟蹤摘要：源自認知神經科學地視覺注意促進人類對相關的內

論文筆記：Histology Image Classification using Supervised Classification and Multimodal Fusion

Histology Image Classification using Supervised Classification and Multimodal Fusion

摘要

引言

框架

C-RSPM模型

The Weighted Majority Voting Alogrithm (WMVA)

相關推薦