Curriculum Learning和Self-paced Learning的相關知識及應用
Curriculum Learning和Self-paced Learning的介紹如下:
Curriculum Learning和Self-paced Learning代表了最近提出的學習制度,其受到人類和動物學習過程的啟發,這些學習過程逐漸從訓練中的簡單複雜樣本開始。這兩種方法具有相似的概念學習正規化,但在具體的學習方案上有所不同。
在Curriculum Learning中,課程由先前知識預先確定,並在此之後保持固定。因此,這種方法在很大程度上依賴於先前知識的質量而忽略了關於學習者的反饋。
在Self-paced Learning中,課程是動態決定的,以適應學習者的學習節奏。但是,Self-paced Learning無法處理先前的知識,使其容易過度擬合。
Curriculum Learning
Curriculum Learning有點類似人類學習機制——先學簡單的技能,再學困難的。學習有意義的訓練資料順序可以使各種任務受益,即首先選擇更容易學習的例子,然後逐漸增加難度。
課程學習的概念是2009年Yoshua Bengio等人在《Curriculum learning》一文中提出來的。其特點包括:
- 提高生成速度和加快收斂速度
- 在非凸的訓練準則上找到更好的區域性極小值
今天分享的第一篇文章是《Curriculum Learning for Heterogeneous Star Network Embedding via Deep Reinforcement Learning》。
該文主要研究異構星型網路的學習節點表示,該異構星型網路的中心節點型別通過不同型別的邊與多屬性節點型別相連。
並提出了一個基於深度增強學習的方法,使用LSTM模型來編碼狀態,並進一步估計每個state-actionpair的期望cumulative reward。該文在深度增強學習的基礎上融合了learning和planning的策略。實驗證明該方法有效且高效。
規劃模組的動作是選擇某種邊緣型別,在每一步中,狀態被定義為到目前為止選擇的邊緣型別序列。在節點分類任務中,將獎勵定義為準確度增益,懲罰每一個動作。目標是採取一系列行動以最大化累積獎勵。
學習模組是通過利用LSTM層對狀態進行編碼,我們可以有效地捕獲不同狀態的相關性,以推斷新的狀態 - 動作對的Q值。
Self-paced Learning
今天分享的第二篇文章是《 Self-paced network embedding》。
由於傳統的抽樣分佈不能捕獲每個節點的真實資訊,並且不能反映訓練的狀態,本文提出了一種新的self-paced network embedding方法來解決此問題。
該方法能夠根據當前訓練狀態自適應地捕獲每個節點的資訊量,並根據其資訊量對負上下文節點進行取樣。所提出的self-pace取樣策略能夠隨著訓練過程的進行,逐步選擇困難的負面上下文節點,以學習更好的節點表示。
此外,為了更好地捕捉節點資訊性以學習節點表示,將該文的方法擴充套件到具有更大發現節點資訊能力的生成性對抗網路框架。在基準網路資料集上進行了大量的實驗,驗證了所提出方法的有效性。