1. 程式人生 > >淺談人工智慧之機器學習,機器學習之監督學習

淺談人工智慧之機器學習,機器學習之監督學習

淺談機器學習與深度學習的區別

在人類歷史發展的這個階段,我們所談的AI(artificial intelligence)主要指的是弱人工智慧(narrow AI),也就是機器可以實現幫助人類實現一些任務,比如小區入口的業主人臉識別;另外,還有一個強人工智慧(General AI)概念,即機器可以擁有人類的感知,像人一樣思考,在AlphaGo與李世石的對抗中,AlphaGo就相當於達到了出擊的強人工智慧概念。

那麼,涉及到一個問題,弱人工智慧是怎麼實現的?而機器學習是一種實現AI的方法。簡單地說,機器學習通過演算法解析資料,加以學習,然後對預測部分進行預測,下文提到到監督學習和無監督學習均是實現機器執行任務的一種方式。

其實,人工智慧領域已經分化為兩大領域,一個是rule-based也就是規則式方法,也就是上段提到的機器學習便屬於rule-based方法,在這個方法中, 人們通過寫好的邏輯規則來教導計算機如何思考,如"若X,則Y";另外一個是神經網路(neural network)方法,人們已經不滿足於把人類的邏輯規則傳授給計算機,而是乾脆在機器上重建大腦。也就是模仿人腦結構,構建類似生物神經元網路的結構來手法資訊。**這也就是深度學習是實現機器學習的一種技術。**在深度學習中的人工神經網路(Artificial Neural Networks )中,該演算法模擬人類的神經元連線方式,形成獨特的人工神經網路。在這個網路裡,有獨立的層,連結方式還有資料傳播方向。比如抽取一張貓的圖片,將它剪下成許多塊,然後植入神經網路第一層,第一層獨立神經元會將資料傳輸到第二層,第二層神經元完成自己的使命,一直持續下去,直到最後一層,並生成最終結果。

機器學習之監督學習

在Supervised learning 當中,training database 包含了特徵和類別資訊,如在判斷一輛公交車是否準時到站檢測系統中,其訓練資料包含是否到站的類別:到站和未到站,標籤可分別標為{1,0}. 在監督學習中,classification and regression 演算法是兩類中最重要的演算法,其中classification標籤是離散的值,而regression標籤是連續的值,比如前面提到的公交車是否準時到站,就屬於分類演算法範疇,而如果通過一個人的職業,學歷,公司來預測一個人的收入,因為收入是連續的數字,因此標籤可標為y屬於【1000,10000000】.在supervisor learning中,主要分為兩大部分,一部分是訓練部分,一部分是預測部分。其中訓練部分包括:獲取資料,特徵提取,監督學習,最後評價;而預測部分包括模型和預測。

在監督學習中,有別於分類問題,還有一個重要的迴歸問題,即通過訓練資料學習一個從觀測樣本到連續的標籤的對映,在迴歸問題中的標籤是一系列連續的值。典型的有,如前段提到的收入預測,還有根據股票的歷史價格預測未來股票的價格,房屋價格預測等等。

機器學習之無監督學習

在unsupervised learning當中,其訓練集只有特徵,不包含標籤資訊。其流程較監督學習簡單,分為資料獲取,特徵提取和無監督學習。比如有M個訓練資料,首先對m個樣本進行處理,得到有用資訊,這個過程就成為特徵提取,最後利用無監督學習演算法處理這些樣本。在無監督學習中,一個典型的例子就是通過是否有翅膀和是否能夠水下呼吸來區別魚類和鳥類,也就是聚類演算法。在聚類演算法中,無需知道該類別具體是什麼,而只需要知道其歸屬於某一個類別,比如鯽魚鯉魚都屬於魚類。