Concept Drift(概念漂移)
Introdution
concept drift在機器學習、時間序列以及模式識別領域的一種 現象 。如果是在機器學習領域中,這個概念指的就是一個模型要去預測的一個 目標變數 ,概念漂移就是這個目標變數隨著 時間 的推移發生改變。概念漂移在很多領域都具有很重要的意義,例如對金融衍生品價格預測、動態控制等。
Data stream
目前有很多廣泛存在的資料,像金融資料、交通資料等,這類資料不同於傳統的static data(靜態資料),而是作為一種 資料量大 、 實時性強 的data stream(流式資料)而存在。流式資料分為 穩定的資料流 和 動態的資料流 ,穩定的資料流具有穩定獨立同分布的特點,而動態資料流則是不獨立同分布的,所以會產生概念漂移的現象。
Concept drift
概念漂移可以從很多角度進行劃分,其中一種是按照變化的速度來進行劃分的。在 [1] 中將概念漂移劃分為sudden、incremental、gradual、recurring、blip、noise。

sudden指的是 迅速同時又不可逆 的改變,強調的是發生的迅速。
incremental和gradual都是強調改變發生的 緩慢 ,incremental強調值的隨時間改變,gradual則是資料分佈的改變。也有些研究者將這兩種變化劃分為同一類,用incremental gradual這個術語來代替。
recurring則是一種temporary( 臨時性 )的改變,在一段短時間內會恢復之前的狀態。所以也有些研究者將其稱為 local drift ,它不具有周期性,是在不規則的時間間隔內反覆轉換。
blip是代表一種很 稀少 的事件,它可以被視為一種anomaly或者outlier(異常)。
noise是一種 隨機 的改變,通常這種資料會從樣本資料中filter out。
Several Drift Detectors
DDM(Drift Detection Method)
EDDM(Early Drift Detection Method)
DDD(Diversity for Dealing with Drifts) Ensemble with different diversity
Hoeffding trees
Ensemble Learnings
[1]、A Review on Real Time Data Stream Classification and Adapting To Various Concept Drift Scenarios
[2]、DDD: A new ensemble approach for dealing with concept drift