1. 程式人生 > >人工智能教程 - 1.2.1 如何將數據輸入到神經網絡中

人工智能教程 - 1.2.1 如何將數據輸入到神經網絡中

可能 世界 需要 識別 img 圖像 沒有 計算 詳細

通過對前面文章的學習,我們已經知道神經網絡可以實現真正的人工智能。本小節我會進行詳細地講解,讓大家徹底地弄懂神經網絡。在僅僅只學完一篇文章後,你肯定依然感覺朦朧,這是正常的,因為不可能用一篇文章就把神經網絡給講清楚了。當你學完本小節所有文章後,你就會感覺豁然開朗了。

技術分享圖片

我們需要弄懂的第一步就是如何將數據輸入到神經網絡中。例如,在語音識別、人臉識別這些應用中,是如何將語音、人臉輸入到神經網絡中的?

下面我繼續拿識別貓的例子來給大家介紹如何將貓的圖片數據輸入到神經網絡中。

技術分享圖片

此例中,待輸入的數據是一張圖像。為了存儲圖像,計算機要存儲三個獨立的矩陣(矩陣可以理解成二維數組),分別與此圖像的紅色、綠色和藍色相對應(世界上的所有顏色都可以通過紅綠藍三種顏色調配出來)。如果圖像的大小是64 * 64個像素(一個像素就是一個顏色點,一個顏色點由紅綠藍三個值來表示,例如,紅綠藍為255,255,255,那麽這個顏色點就是白色),所以3個64 * 64大小的矩陣在計算機中代表了這張圖像,矩陣對應於圖像的紅綠藍強度值。上圖中只畫了個5 * 4的矩陣,而不是64 * 64,為什麽呢?因為沒有必要,搞復雜了反而不易於理解。

為了更加方便後面的處理,我們一般把上面那3個矩陣轉化成1個向量x(向量可以理解成1 * n或n * 1的數組,前者為行向量,後者為列向量)。那麽這個向量x的總維數就是64 * 64 * 3,結果是12288。在人工智能領域中,每一個輸入到神經網絡的數據都被叫做一個特征,那麽上面的這張圖像中就有12288個特征。這個12288維的向量也被叫做特征向量。神經網絡接收這個特征向量x作為輸入,並進行預測,然後給出相應的結果。

對於不同的應用,需要識別的對象不同,有些是語音有些是圖像有些是傳感器數據,但是它們在計算機中都有對應的數字表示形式,通常我們會把它們轉化成一個特征向量,然後將其輸入到神經網絡中。

本篇文章我們已經知道了數據是如何被輸入到神經網絡中的。那麽神經網絡是如何根據這些數據進行預測的呢?我們將一張圖片輸入到神經網絡中,神經網絡是如何預測這張圖中是否有貓的呢?下篇文章我將給大家揭曉。

人工智能教程 - 1.2.1 如何將數據輸入到神經網絡中