1. 程式人生 > >機器學習-第二天-線性分類器

機器學習-第二天-線性分類器

實際上最後機器學習輸出的是一個關於模型中所有引數的函式h(x)
Xi為模型中各種引數的引數值,Wi為權值,表示每個引數所佔的重要性。
threshold為閾值,在所有引數加權求和後得到的值減去閾值後得到h(x)
稱h(x)為感知機

假設說只有兩種型別的引數,那很顯然h(x)是一個二元一次函式,在平面上表示為一條直線。那麼實際上在直線上方的輸入資料表示感知機輸出為+的結果,而在直線下方的資料表示感知機輸出為-的結果。圖中藍色圓圈表示實際上輸入資料的結果為+,紅色叉叉表示為-,藍色區域和紅色區域表示劃分的結果

因此機器學習的過程實際上就是尋找權重和這條劃分線的過程,那麼如何尋找到這條線,使它滿足我們的要求呢。首先在一開始的輸入資料中,我們標記了哪些資料是+,哪些資料是-。那麼在二維情況下一開始我們初始化這條線由輸入引數的兩個點組成。接著通過尋找標記和劃分結果不同的資料,並且設定錯誤的權重wt向量,通過該向量與線的法向量相加,將線拉到正確的位置上,這就是一個權值確定和收斂的過程。