這篇論文開源的車牌識別系統打敗了目前最先進的商業軟體
(歡迎關注“我愛計算機視覺”公眾號,一個有價值有深度的公眾號~)
來自巴西阿雷格里港大學的學者發表於ECCV2018的論文《License Plate Detection and Recognition in Unconstrained Scenarios》,給出了一整套完整的車牌識別系統設計,著眼於解決在非限定場景有挑戰的車牌識別應用,其效能優於目前主流的商業系統,程式碼已經開源,非常值得參考。
作者資訊:

先來看看作者釋出的demo視訊:
展示了該系統在室外環境,角度變換等場景強大的車牌定位、識別能力。
很多車牌識別論文中常用的資料庫往往是正面拍攝的,但實際應用中,各種可能的情況都有,作者首先給出了一些對車牌識別有挑戰的資料示例:

該文提出的系統很好的解決了這類有挑戰的車牌識別問題。
系統架構
作者提出的車牌識別系統,包含車牌識別的所有環節,主要有三大步驟:車輛檢測、車牌檢測與校正、OCR。
下圖展示了整個系統流程:

輸入影象首先使用YOLOv2進行車輛檢測(作者使用原始的YOLOv2,沒有做任何改動),檢測到的車輛影象再輸入到WPOD-NET網路,進行車牌檢測和車票捲曲校正系統的迴歸,然後對車牌進行校正輸入到OCR-Net網路,識別出車牌字元。
WPOD-NET用於車牌區域檢測於校正系統迴歸示意圖:
平面目標的全卷積網路檢測,對於系統輸出的車牌區域特徵圖,劃分成(m,n)個cell,查詢高目標概率的cell,根據這些cell的位置,計算將該區域轉換成方形車牌的仿射係數。
WPOD-NET架構圖

為訓練WPOD-NET對資料進行了各種常規的資料增廣:

車牌識別OCR部分使用一種改進的YOLO網路,其架構如下:
為訓練該OCR系統也進行了大量資料增廣:
為評估該系統,作者收集了常用的資料集,並自建了挑戰的資料集CD-HARD。

實驗結果
作者將該文系統與目前主流的商業車牌識別系統相比較,包括OpenALPR、Sighthound、Amazon Rekognition。

在整個資料集上取得了遠超過其他系統的效能,在OpenALPR資料集上取得了與最好系統相匹敵的效能,尤其在具有挑戰的CD-HARD資料集上取得了異常明顯的效能優勢。
一些校正並識別後的車牌示例:
執行速度
在配置為Intel Xeon CPU 、12Gb RAM、 NVIDIA Titan X GPU的機器上,平均達到5fps。
工程主頁:
http://www.inf.ufrgs.br/~crjung/alpr-datasets/
https://github.com/sergiomsilva/alpr-unconstrained
論文、程式碼、資料下載:
在“我愛計算機視覺”公眾號對話介面回覆“alpr”,即可收到百度雲下載地址。
更多精彩推薦:
ofollow,noindex">快準狠!Intel論文揭示自家車牌識別演算法:LPRNet
(歡迎關注“我愛計算機視覺”公眾號,一個有價值有深度的公眾號~)
【本文由“我愛計算機視覺”釋出,2018年09月10日】