1. 程式人生 > >應用於影象視訊處理的影象識別與神經網路

應用於影象視訊處理的影象識別與神經網路

電子科技大學 格拉斯哥學院 通訊二班 鮑佳慧 2017200602004

一. 背景介紹

在大一下學期我參加了格拉斯哥學院所開展的一系列新生研討課活動,其中曾兵院長介紹了有關影象處理,三維電視和“可視”大資料,讓我對我們日常的影象和視訊有了全新的認識並激發了我對視訊影象處理的興趣。

二. 應用於影象視訊處理的影象識別

  1. 發展
    影象處理的發展依賴於計算機的應用和發展,它是計算機應用領域中非常活躍的一部分。影象處理系統分為通用影象處理系統和專用影象處理系統兩大類。影象識別,是指利用計算機對影象進行處理、分析和理解,以識別各種不同模式的目標和對像的技術。

  2. 應用
    影象視訊處理在各個領域應用都十分廣泛。
    航天航空方面:主要運用在太空成像、飛機遙感和衛星遙感技術中。這些影象無論是在成像、儲存、傳輸過程中,還是在判讀分析中,都必須採用影象處理方法。
    軍事公安方面:主要用於公安業務圖片的判讀分析,指紋識別,人臉鑑別,不完整圖片的復原,以及交通監控、事故分析等。目前己投入執行的高速公路不停車自動收費系統中的車輛和車牌的自動識別都是影象處理技術成功應用的例子。

  3. 現狀(社會問題)
    影象識別一直是現今熱門話題,對於人來說,識別物體並不困難。對於計算機,卻比較艱鉅。因為我們不需要學習就可以判斷物體種類,而計算機需要不斷學習,不停地識別才能判斷出它是什麼。例如現在大眾十分關心的無人駕駛汽車的問題。當涉及無人駕駛汽車的導航系統,計算機將如何將道路上的行人與各種其他車輛區分開來或過濾,這對計算機的影象識別能力提出了更高的挑戰。
    識別
    雖然現在的影象識別較為普及,例如電子科大的圖書館也已經應用了人臉識別系統,但識別仍不是非常精準,也出現了不少機器無法識別或者識別到其他人臉的情況。如若用此精確度的計算機應用在判案辨別上,可能會出現判案不準的情況,傷及無辜,讓罪犯逃之夭夭。同時在觀看視訊錄影時,尤其是光線較暗肉眼難以分辨五官等形象特徵時,影象識別就顯得格外重要。就是因為如今影象識別在我們的日常生活中起著不可替代的作用,我們在提高影象識別的精確度的同時,也要避免操作的複雜程度。
    解決這個問題的一個方法是利用神經網路。
    三.神經網路與影象識別
    1.卷積神經網路的定義
    卷積神經網路(Convolutional Neural Networks, CNN)是一類包含卷積或相關計算且具有深度結構的前饋神經網路(Feedforward Neural Networks),是深度學習(deep learning)的代表演算法之一。CNN 由不同的卷積層和池化層組成。它廣泛應用於計算機視覺。例如影象識別(image classification),物體識別(object recognition),行為認知(action recognition),姿態估計(pose estimation)以及神經風格轉換(neural style transfer)。
    2.卷積神經網路的工作過程
    卷積神經網路工作過程


    卷積神經網路將進行多次取樣,多次記錄物體的多種特徵。除了這些連線層,還有池化和卷積層。CNN使影象識別中保留了重要特徵資訊的同時也減少了輸入的大小。卷積層的輸入和輸出都是多重矩陣。卷積層包含多個卷積核,每個卷積核都是一個矩陣,每一個卷積核相當於是一個濾波器,它可以輸出一張特定的特徵圖,每張特徵圖也就是卷積層的一個輸出單元。
    基於卷積網路識別的鳥類識別
    舉個例子。計算機要進行影象處理。首先要讀取圖片。計算機並不能像人一樣幾秒內捕捉完物體的所有特徵特點,它需要理解。為了方便理解,它會將每個影象轉化為一系列特定排序的圖點(畫素)。如果你改變畫素的順序或顏色,影象也隨之改變。計算機會試圖通過使用影象的空間的安排從影象中提取特徵。為了理解影象,理解畫素如何安排對於一個網路極其重要。這就是卷積網路所要做的。
    3.使用卷積網路的好處
    (1)我們可以採用輸入影象,定義權重矩陣,並且輸入被卷積以從影象中提取特殊特徵而無需損失其有關空間安排的資訊。
    (2)減少影象的引數數量。CNN把含義相似的特徵合併成相同特徵,以及把位置上相鄰的特徵合併到更接近的位置。由於形成特定主題的每個特徵的相對位置可能發生微小變化,因此可以通過取樣的方法輸入特徵圖中強度最大的位置,減小了中間表示的維度(即特徵圖的尺寸),從而,即使區域性特徵發生了一定程度的位移或者扭曲,模型仍然可以檢測到這個特徵。