1. 程式人生 > >機器學習-資料分析之樸素貝葉斯過濾垃圾郵件

機器學習-資料分析之樸素貝葉斯過濾垃圾郵件

資料分析之過濾垃圾郵件

前沿

之前也學了一些資料分析的案例從一直沒有記錄,所有準備從現在開始把所學的都記錄在CSDN中。如果大家看到我的博文有什麼不理解或者還想學習更深入的可以去上面的網站。

樸素貝葉斯之過濾垃圾郵件

使用樸素貝葉斯解決一些生活中的問題。先從文字內容得到字串列表,然後生成詞向量。我們看一下使用樸素貝葉斯對電子郵件進行分類的步驟:

  • 收集資料:提供文字檔案
  • 準備資料:將文字檔案解析成詞條向量
  • 分析資料:檢查詞條卻保解析的正確性
  • 訓練演算法:使用我們自己簡歷的trainNB0()函式
  • 測試演算法:使用classifyNB0(),並構建一個新的測試函式來計算文件集的錯誤率。
  • 使用演算法:構建一個完整的程式對一組文件進行分類,講錯分的文件輸出到螢幕上。

1、收集資料