1. 程式人生 > >機器學習筆記1

機器學習筆記1

1.監督學習(supervised learning):利用一組已知類別的樣本調整分類器的引數,使其達到所要求效能的過程。 在監督學習的過程中,我們只需要給定輸入樣本集,機器就可以從中推演出指定目標變數的可能結果。 監督學習一般使用兩種型別的目標變數:標稱型和數值型。分類和迴歸屬於監督學習。

2.機器學習的comments

  • 機器學習就是把無序的資料轉換成有用的資訊。
  • 為了測試機器學習演算法的效果,通常使用兩套獨立的樣本集:訓練資料和測試資料。
  • 機器學習的演算法 在這裡插入圖片描述
  • 選擇實際可用的演算法,必須考慮下面兩個問題: 一、使用機器學習演算法的目的,想要演算法完成何種任務? 二、需要分析和收集的資料是什麼?

3… k-近鄰演算法(kNN) 存在一個樣本資料集合(訓練樣本集),並且樣本集中每個資料都存在標籤,即我們知道樣本集中每一資料與所屬分類的對應關係。輸入沒有標籤的新資料後,將新資料的每個特徵與樣本集中資料對應的特徵進行比較,然後演算法提取樣本集中特徵最相似資料(最近鄰)的分類標籤。一般來說,我們只選擇樣本資料集中前k個最相似的資料,通常k是不大於20的整數。最後,選擇k個最相似資料中出現次數最多的分類,作為新資料的分類。 在這裡插入圖片描述