1. 程式人生 > >機器學習的理解

機器學習的理解

技術 集合 概率分布 目標變量 src img 表示 全部 精確

區分不同的鳥類(機器學習主要的任務是分類)

需要使用不同的屬性(特征):體重(十進制),翼展,有無腳蹼(二值型),後背顏色(枚舉類型,可以為整數)

技術分享圖片

若想找象牙喙啄木鳥,已經獲取全部特征信息,接下來就是任務分類。

  算法訓練,為算法輸入大量已分類數據作為算法的訓練集。

  訓練集:用於算法的數據樣本集合,圖1-1為6個訓練集,每個有4種特征,一個目標變量(必須確定,物種)。

  目標變量(類別):算法的預測結果,在分類算法通常類型為標稱型,回歸算法通常為連續型。

  通常為2套樣本集:訓練數據和測試數據。測試集無目標變量,由程序決定樣本屬於哪個類別。

  實際的精確度:比較測試樣本預測目標變量值與實際樣本類別的差異。

  知識表示:規則集,概率分布。

  

機器學習的理解