1. 程式人生 > >《機器學習實戰》第一章——機器學習基礎——筆記

《機器學習實戰》第一章——機器學習基礎——筆記

1.機器學習的一個主要任務就是分類

2.學習如何分類需要做演算法訓練,為演算法輸入大量已分類資料作為演算法的訓練集

3.分類問題中的目標向量稱為類別,並假定分類問題只存在有限個數的類別。

4.訓練資料測試資料

5.假定某一個演算法,經過測試滿足精確度要求,已經學會了如何分類,這部分工作稱之為知識表示

6.機器學習的另一個主要任務就是迴歸,主要用於預測數值型資料。

7.分類和迴歸屬於監督學習,之所以稱為監督學習,是因為這類演算法必須知道預測什麼,即目標的分類資訊。

8.與監督學習對應的是無監督學習,在無監督學習中,將資料集合分成由類似的物件組成的多個類的過程被稱為聚類

;將尋找描述資料統計值的過程稱之為密度估計

9.分類:k-近鄰演算法、樸素貝葉斯演算法、支援向量機、決策樹

迴歸:線性迴歸、區域性加權線性迴歸、Ridge迴歸、Lasso最小回歸係數估計

聚類和密度估計:K-均值、最大期望演算法、DBSCAN、Parzen窗設計

10.選擇實際可用的演算法必須考慮:1)使用機器學習演算法的目的,想要演算法完成何種任務;2)需要分析或收集的資料是什麼。

11.學習和使用機器學習演算法開發應用程式步驟:1)收集資料;2)準備輸入資料;3)分析輸入資料;4)訓練演算法;5)測試演算法;6)使用演算法。

12.Python語言的優勢:易於理解,豐富的函式庫(尤其是矩陣操作)、活躍的開發者社群等。

13.Python適用於機器學習演算法:1)Python的語法清晰;2)易於操作純文字檔案;3)使用廣泛,存在大量的開發文件。

Python不足:效能問題。