1. 程式人生 > >監督學習,無監督學習,弱監督學習,無監督學習

監督學習,無監督學習,弱監督學習,無監督學習

什麼是機器學習?

機器學習的定義有很多種,而且到目前為止也沒有一個公認的定義,想要了解更多可以參考一下知乎https://www.zhihu.com/question/33892253的解答,有客觀的回答,有深刻的幽默。
在這裡我從定義的角度來讓大家淺顯的瞭解一下什麼叫做機器學習,機器學習的定義有許多,比如:

“機器從原始的資料中提取模式的能力”(lan goodfellow)
“在不直接針對問題進行程式設計的情況下,賦予計算機學習能力的一個研究領域。”(1959 Arthur Samuel)
“機器學習這門學科所關注的問題是:計算機程式如何隨著經驗積累自動提高效能。”(1998 Mitchell)
“對於某類任務T和效能度量P,如果一個計算機程式在T上以P衡量的效能隨著經驗E而自我完善,那麼我們稱這個計算機程式在從經驗E學習。”(1998 Tom Mitchell )

就比如在豬的識別問題中,我們不通過直接的程式設計教導機器說,豬是陸地行走四個蹄子肥頭大耳的動物,而是間接的告訴機器哪些是豬哪些不是,通過經驗的積累,計算機自我完善,從而區分是或者不是。

當然我的舉例只是有監督的一個例子,還有半監督,弱監督,無監督學習等等很多都屬於機器學習問題。


什麼是監督學習、無監督學習、強化學習、弱監督學習、半監督學習、多示例學習?

隨著機器學習問題不斷深入人心,人們也將現實中遇到不同的問題分為不同的學習方式,其中,最基礎的應屬監督學習,無監督學習和強化學習了。

監督學習(supervised learning):已知資料和其一一對應的標籤,訓練一個智慧演算法,將輸入資料對映到標籤的過程。監督學習是最常見的學習問題之一,就是人們口中常說的分類問題。比如已知一些圖片是豬,一些圖片不是豬,那麼訓練一個演算法,當一個新的圖片輸入演算法的時候演算法告訴我們這張圖片是不是豬。

無監督學習(unsupervised learning):已知資料不知道任何標籤,按照一定的偏好,訓練一個智慧演算法,將所有的資料對映到多個不同標籤的過程。相對於有監督學習,無監督學習是一類比較困難的問題,所謂的按照一定的偏好,是比如特徵空間距離最近,等人們認為屬於一類的事物應具有的一些特點。舉個例子,豬和鴕鳥混雜在一起,演算法會測量高度,發現動物們主要集中在兩個高度,一類動物身高一米左右,另一類動物身高半米左右,那麼演算法按照就近原則,75釐米以上的就是高的那類也就是鴕鳥,矮的那類是第二類也就是豬,當然這裡也會出現身材矮小的鴕鳥和身高爆表的豬會被錯誤的分類。

強化學習(reinforcement learning):

智慧演算法在沒有人為指導的情況下,通過不斷的試錯來提升任務效能的過程。“試錯”的意思是還是有一個衡量標準,用棋類遊戲舉例,我們並不知道棋手下一步棋是對是錯,不知道哪步棋是制勝的關鍵,但是我們知道結果是輸還是贏,如果演算法這樣走最後的結果是勝利,那麼演算法就學習記憶,如果按照那樣走最後輸了,那麼演算法就學習以後不這樣走。

弱監督學習(weakly supervised learning): 已知資料和其一一對應的弱標籤,訓練一個智慧演算法,將輸入資料對映到一組更強的標籤的過程。標籤的強弱指的是標籤蘊含的資訊量的多少,比如相對於分割的標籤來說,分類的標籤就是弱標籤,如果我們知道一幅圖,告訴你圖上有一隻豬,然後需要你把豬在哪裡,豬和背景的分界在哪裡找出來,那麼這就是一個已知若標籤,去學習強標籤的弱監督學習問題。

半監督學習(semi supervised learning) :已知資料和部分資料一一對應的標籤,有一部分資料的標籤未知,訓練一個智慧演算法,學習已知標籤和未知標籤的資料,將輸入資料對映到標籤的過程。半監督通常是一個數據的標註非常困難,比如說醫院的檢查結果,醫生也需要一段時間來判斷健康與否,可能只有幾組資料知道是健康還是非健康,其他的只有資料不知道是不是健康。那麼通過有監督學習和無監督的結合的半監督學習就在這裡發揮作用了。

多示例學習(multiple instance learning) :已知包含多個數據的資料包和資料包的標籤,訓練智慧演算法,將資料包對映到標籤的過程,在有的問題中也同時給出包內每個資料的標籤。多事例學習引入了資料包的概念,比如說一段視訊由很多張圖組成,假如1000張,那麼我們要判斷視訊裡是否有豬出現,一張一張的標註每一幀是否有豬太耗時,所以人們看一遍說這個視訊裡有豬或者沒豬,那麼就得到了多示例學習的資料,1000幀的資料不是每一個都有豬出現,只要有一幀有豬,那麼我們就認為這個包是有豬的,所有的都沒有豬,才是沒有豬的,從這裡面學習哪一段視訊(1000張)有豬哪一段視訊沒有就是多事例學習的問題。

什麼是機器學習?