1. 程式人生 > >學習 Machine Learning Mastery With Python (1)

學習 Machine Learning Mastery With Python (1)

測試套件 實際應用 十分 機器學習 小數 機器學習算法 很多 結果 分鐘

1 介紹

1.1 機器學習的錯誤的想法

  • 一定要對python 編程和python語法非常了解
  • 深入學習scikit learn使用的機器學習算法的理論和參數
  • 避免或者不能接觸實際項目中的其他部分。
    對某些人可能是適用的, 但是對於很多人, 這樣會讓人覺得望而生畏,經過很長的準備過程學習理論和算法 , 才能開始實際的項目。 很遺憾的是, 這是市面上大部分書籍所采取的辦法。

1.2 python 機器學習

這本書主要介紹機器學習的一個子領域叫做預測模型。這個是機器學習在工業界最有用的應用。 本書的組織主要是三種:

  • 課程: 學習一個機器學習項目的子任務如何用python來實現, 以及對於這個任務的最佳實踐。
  • 項目:把所有的子任務通過實際的項目串聯起來, 用於具體的預測模型問題。
  • 代碼段: 展示一些python的代碼段,這樣你可以直接拷貝粘貼用於新的項目。

1.2.1 課程

你需要知道如何用python生態系統來完成機器學習中的每個子任務。 一旦你知道如何使用這個平臺來完成一個完整的任何, 並且取得一個可靠的結果,你就可以在以後的項目中重復這個過程。 讓我們從一個機器學習項目的一般流程開始。 一個預測模型機器學習項目可以分成六個大的任務:

  • 定義問題: 調查並且特性化問題為了更好的理解項目的目標。
  • 分析數據: 使用描述性的統計以及可視化來更好的理解你所擁有的數據
  • 準備數據: 使用數據的轉化來更好的暴露預測問題的結構給建模的算法。
  • 評估算法: 設計一個測試套件來評估各種標準算法, 並且選擇最好的算法來進行下一步的研究。
  • 提升結果: 使用算法的調優和提升方法來得到你的數據集上最好表現的算法。
  • 展示結果: 確定模型, 實施預測並且展示結果。

好處是有如此之多的技術和方法來用這個平臺做同樣的事情。 在第二部分你會找到一個簡單或者最好的實踐辦法來完成通用機器學習項目的每個子任務。 下面是第二部分的一個摘要以及你可以學習到的子任務

  • 第一課: 機器學習的python生態系統
  • 第二課:python和scipy 十分鐘課程
  • 第三課: 從CSV 來導入數據集
  • 第四課: 使用描述統計方法來描述數據 - 分析數據
  • 第五課: 使用可視化來理解數據- 分析數據
  • 第六課: 預處理數據- 準備數據。
  • 第七課: 特征選擇 - 準備數據
  • 第八課: 重組方法 - 評估算法
  • 第九課: 算法評估的度量 - 評估算法
  • 第十課: 抽樣分類算法 - 評估算法
  • 第十一課: 抽樣回歸算法 - 評估算法
  • 第十二課: 模型選擇 - 評估算法
  • 第十三課: 流水線 - 評估算法
  • 第十四課: 提升算法 - 提升結果
  • 第十五課: 算法參數調優 - 提升結果
  • 第十六課: 確定模型 - 展示結果

你可以通過這些課程了解整個機器學習的過程, 每個課程都應該可以在30分鐘以內完成。 這本書是可能一個周末完成的, 你也可以深入研究某些章節,使用本書作為一個參考。

1.2.2 項目

代碼段是很重要的, 在上面的課程中你可以獲得這些,但是這些對於你的實際應用是不夠的, 因為你需要一個從頭到尾的完整的項目來理解如何使用python來做整個模型的預測。 這本書使用小的容易理解的數據集來向你展示這一點:

  • 項目很小。
  • 很容易操作。 數據集不需要太多的特征工程就可以得到比較好的結果。
  • 有基準。 很多人都用過這些數據集, 這樣你可以體會好的算法的效果, 並理解你可以期望的準確性。
    你可以看到三個項目:
  • hello wold 鳶尾花
  • 回歸 波士頓房價
  • 二分類- 聲納數據集
    這些項目使用了第二部分的所有的步驟, 然後讓你可以對整個機器學習過程有一個理解。 你未來的工程就可以從這裏開始。

1.2.3 代碼段

代碼段可以幫助你從一個初學者到一個快學習著, 可以很快的開始對任何新的工程開始預測。

1.2.4 你可以學習到的

  • 如何從頭到尾的工作從一個小數據集到一個中等規模的數據集
  • 如何交付一個可以在未知數據上可以準確預測的數據集
  • 用python 完成所有的步驟
  • 如何python學習新的技術

1.3 這部書不是

  • 不是教科書。 沒有基本理論。 - 這個用到了需要加上。 畢竟如果不懂基本的概念, 其實是沒有辦法理解他想幹什麽的。
  • 不是算法書 - 沒有算法的介紹。 - 這個自己有一些理解。
  • 不是python 編程書。

1.4 開始吧。

學習 Machine Learning Mastery With Python (1)