1. 程式人生 > >基於機器學習的網路異常流量識別系統——工具篇

基於機器學習的網路異常流量識別系統——工具篇

考慮三個問題:

如何使用機器學習的演算法對做好特徵的網路流量進行異常識別?

用什麼語言?

用什麼工具或者軟體?

Weka簡介

   WEKA作為一個公開的資料探勘工作平臺,集合了大量能承擔資料探勘任務的機器學習演算法,包括對資料進行預處理,分類,迴歸、聚類、關聯規則以及在新的互動式介面上的視覺化。如果想自己實現資料探勘演算法的話,可以看一看weka的介面文件(doc資料夾)。在weka中整合自己的演算法甚至借鑑它的方法自己實現視覺化工具並不是件很困難的事情。   
   回答了第一個和第三個問題。  

可參考Weka使用教程,翻譯的官方的

使用語言

    推薦的就是Java,也是weka的開發語言。原始碼:http://www.cs.waikato.ac.nz/ml/weka/
    機器學習的演算法在weka提供的API中都可以找到,仔細閱讀就可以加以利用。當然,最簡單的方式要屬weka人性化的介面,直接按鈕就可以了,但是很顯然,做一個系統如何才可以體現工作量?不是點幾下出來結果就好了。
    回答了第二個問題。

語言、工具介紹完了,再加上前面提到的資料集,開始系統的構建。