1. 程式人生 > >機器學習-2(機器學習程式的步驟)

機器學習-2(機器學習程式的步驟)

1 收集資料 

    這一塊你要的知識是如何獲得資料 如果不是自己的生產環境產生的真實資料,你還需要獲得爬蟲的技能,來從外部獲取資料到自己的分析庫。

 

2 準備輸入資料

    這一塊可以理解為資料轉換,把資料格式轉換為符合自己的。不近要匹配你的程式語言的習慣,而且要做到簡化。還有一點就是還要匹配某些演算法對資料格式的要求。這裡就不細講,到了相關知識點我相信大家都一目瞭然了

 

3 分析輸入資料

   簡單理解就是人工分析,單步除錯的意義。人工去把資料拿出來觀察,是否有空值,特殊的字元,特殊的樣式,個別的異常值等等。這是為了排除垃圾資料,比如開發環境裡面的髒資料。我們就叫做資料清洗吧。

 

4 訓練演算法

    此時我們將格式化的資料輸入到演算法,從中抽取我們想要的東西。我們就叫做資料抽取,然後記得要把抽取後的資料儲存起來,方便我們後續使用。

5 測試演算法

    這一步是為了評估演算法,測試下我們的演算法的工作效果。如何評估演算法的成功率,這裡就是我們測試人員需要關心的了

對於監督學習的話,我們就必須清楚目標變數的值。而對於無監督學習,我們可以根據具體情況用其他評測手段來驗證演算法的成功率。

 

6 使用演算法

    這裡我們就要把我們的演算法整合到我們的系統中去,讓它執行實際任務,用來檢驗在真實環境下是否能保持同樣的成功率