1. 程式人生 > >監督學習,無監督學習和半監督學習

監督學習,無監督學習和半監督學習

思想 learn 尋找 很多 ear 目標 dsm 工作 變量

概念:監督學習、無監督學習與半監督學習

監督學習 : supervised learning
無監督學習 : unsupervised learning
半監督學習 : semi-supervised learning

2 、 概念

監督學習:用一部分已知分類、有標記的樣本來訓練機器後,讓它用學到的特征,對沒有還分類、無標記的樣本進行分類、貼標簽。

一句話概括: 給定數據,預測標簽。

總之,監督學習中只要輸入樣本集,機器就可以從中推演出制定目標變量的可能結果.如協同過濾推薦算法,通過對訓練集進行監督學習,並對測試集進行預測,從而達到預測的目的.

無監督學習:即非監督學習,是實現沒有有標記的、已經分類好的樣本,需要我們直接對輸入數據集進行建模,例如聚類,最直接的例子就是我們常說的“人以群分, 物以類聚”。我們只需要把相似度高的東西放在一起,對於新來的樣本,計算相似度後,按照相似程度進行歸類就好。至於那一類究竟是什麽,我們並不 關心。

一句話概括:給定數據,尋找隱藏的結構

以上兩者的區別 : 監督學習則只利用標記的樣本集進行學習,而無監督學習只利用未標記的樣本集。

半監督學習:有兩個樣本集,一個有標記,一個沒有標記。綜合利用有類標的樣本( labeled sample)和沒有類標的樣本( unlabeled sample),來生成合適的分類 函數。
半監督學習出現的背景是 :實際問題中,通常只有少量的有標記的數據,因為對數據進行標記的代價有時很高,比如在生物學中,對某種蛋白質的結構分析或者功能 鑒定,可能會花上生物學家很多年的工作,而大量的未標記的數據卻很容易得到。

3、思考

監督學習主要是根據已有標記,進行分類,區分;
無監督學習主要是用相似度,進行聚類,歸類;
半監督學習一般結合了分類與聚類的思想;
還有一點,這裏的樣本標記,都是人為事先進行標記的,然後進行使用。

有些情況比如無法提供訓練數據樣本或者提供訓練數據樣本的成本太高的話,或許我們就應該采取無監督學習的策略了。

監督學習,無監督學習和半監督學習