1. 程式人生 > >基於視覺化檢測的文件質量提升

基於視覺化檢測的文件質量提升

cvpr2018論文。論文主要基於3d點雲的方法,對文件圖片進行去陰影操作,進而提升檢測和識別。

整體流程:

首先作者將一副影象想象成具有哦3d資訊的點雲。畫素值的大小表示3d表面的凹凸。白色背景表示為高原,汙跡,陰影表示為火山地帶,黑色的字表示為峽谷。由b中綠色的點對整個3d點雲進行觀察,產生c中的可見性檢測圖。陰影上有好多紅色點的可見畫素,字型上基本沒有紅色的點,然後對陰影進去除,得到最終去陰影后的d圖。

可見性檢測的2種方法:

HPR:檢測可見的點的方法

TPO:檢測遮擋的點的方法

假設紅色點為視點,藍色為可見的點,綠色為遮擋的點

影象二值化流程:

首先對於輸入影象a,基於3d點雲的方法可以獲得b這種帶紅色可見陰影點的結果。對b中的紅色陰影點做圖片平均滑動,類似於均值濾波操作,可以得到c圖背景圖片。然後通過a圖減去c圖,就獲得了去除背景陰影的低光圖d。由於去掉了陰影,因此用d圖做二值化操作,可以得到比直接用原始a圖做二值化操作更好的結果。最終二值化結果f由於傳統的e。

A為原始影象的直方圖分佈,b為經過處理得到的低光圖。從兩者的直方圖分佈可以看出,前景藍色和悲劇紅色可以更好的分開,具有更好的分界嶺。

總結:

  1. 論文的思想非常novel,將平面的圖片想象為3d的點雲,並提出行之有效的方法來去掉背景陰影。
  2. 相比ocropy中去背景的方法。兩者同為傳統方法。Ocropy中基於背景畫素為濾波中滑動視窗中70%位置的畫素,而本文則通過可見性來檢測背景畫素。
  3. 相比Hybrid Deep Architecture中基於筆畫識別+GMM,再去處背景的方法,本文的思想更好
  4. 相比ocropus中基於神經網路2dlstm的方法,也許結果上未必有神經網路的好。神經網路的方法也許才是當前的主流,不管處理過程,速度,效果上都佔有優勢。