1. 程式人生 > >【自然場景文字檢測】PSENet: Shape Robust Text Detection with Progressive Scale Expansion Network

【自然場景文字檢測】PSENet: Shape Robust Text Detection with Progressive Scale Expansion Network

github:https://github.com/whai362/PSENet

論文:https://arxiv.org/abs/1806.02559

 

 主要思想:

網路主要學習,Sn,Sn-1,.......,S1, 其中Sn佔文字區域100%, Sn-1佔文字區域90%,...........S1佔文字區域50%

標籤可以利用clipper來實現(pip install clipper-python==0.1.0)

後期處理:先求聯通區域,即很多個S1,再利用S1作為文字區域核在S2中進行膨脹,依次進行,最後到Sn

例如:當n=4,Sn的預測可以如下表示

F_score = slim.conv2d(F, 4, 1, activation_fn=tf.nn.sigmoid, normalizer_fn=None)