1. 程式人生 > >AI(1)認知 人工智慧、機器學習、神經網路、深度學習。

AI(1)認知 人工智慧、機器學習、神經網路、深度學習。

寬為限 緊用功 功夫到 滯塞通

開篇

AI領域是個水很深的新領域,對於非科學研究專業人士來說更是深不可測。選擇自己喜歡的學科,興趣是最好的老師,攻克下去總會有意想不到的收穫。AI時代,我們要更加努力!

什麼是人工智慧?

以下內容摘自知乎

什麼是人工智慧?它和神經網路、機器學習、深度學習、資料探勘這類熱門詞彙有什麼關係?撇開復雜的概念和高冷的定義,一圖看懂人工智慧相關領域的錯綜複雜的關係

這裡寫圖片描述

»由圖可見,人工智慧、機器學習、深度學習並非是層層包含的關係,而最近火熱的神經網路也只是與人工智慧有交叉而非人工智慧的實現方式或者子集。

這裡寫圖片描述

»在谷歌趨勢上搜索人工智慧、大資料、機器學習、深度學習的中英文可以比對不同的關注走向。

»人工智慧和大資料此消彼長,早在2004年人工智慧就受到中英文領域的雙重關注。在2006-2007年人工智慧中文搜尋開始下降,大資料的概念開始火過於人工智慧。

»在英文搜尋領域,大資料的浪潮直到2012年後才開始超過中文領域。 »深度學習在中文領域的搜尋熱度,一度在2009年和人工智慧齊平。相反在英文領域,深度學習的搜尋關注度直到2013年後才開始逐步提升。

以下內容摘錄自維基百科

人工智慧

人工智慧(英語:Artificial Intelligence, AI)亦稱機器智慧,是指由人制造出來的機器所表現出來的智慧。通常人工智慧是指通過普通電腦實現的智慧。

人工智慧的研究是高度技術性和專業的,各分支領域都是深入且各不相通的,因而涉及範圍極廣。

人工智慧的研究可以分為幾個技術問題。其分支領域主要集中在解決具體問題,其中之一是,如何使用各種不同的工具完成特定的應用程式。AI的核心問題包括推理、知識、規劃、學習、交流、感知、移動和操作物體的能力等。強人工智慧目前仍然是該領域的長遠目標。目前比較流行的方法包括統計方法,計算智慧和傳統意義的AI。目前有大量的工具應用了人工智慧,其中包括搜尋和數學優化、邏輯推演。而基於仿生學、認知心理學,以及基於概率論和經濟學的演算法等等也在逐步探索當中。

機器學習

機器學習是人工智慧的一個分支。人工智慧的研究是從以“推理”為重點到以“知識”為重點,再到以“學習”為重點,一條自然、清晰的脈絡。顯然,機器學習是實現人工智慧的一個途徑,即以機器學習為手段解決人工智慧中的問題。機器學習在近30多年已發展為一門多領域交叉學科,涉及概率論、統計學、逼近論、凸分析、計算複雜性理論等多門學科。

機器學習理論主要是設計和分析一些讓計算機可以自動“學習”的演算法。機器學習演算法是一類從資料中自動分析獲得規律,並利用規律對未知資料進行預測的演算法。因為學習演算法中涉及了大量的統計學理論,機器學習與推斷統計學聯絡尤為密切,也被稱為統計學習理論。演算法設計方面,機器學習理論關注可以實現的,行之有效的學習演算法。很多推論問題屬於無程式可循難度,所以部分的機器學習研究是開發容易處理的近似演算法。

機器學習已廣泛應用於資料探勘、計算機視覺、自然語言處理、生物特徵識別、搜尋引擎、醫學診斷、檢測信用卡欺詐、證券市場分析、DNA序列測序、語音和手寫識別、戰略遊戲和機器人等領域。

定義

機器學習有下面幾種定義:

  • 機器學習是一門人工智慧的科學,該領域的主要研究物件是人工智慧,特別是如何在經驗學習中改善具體演算法的效能。
  • 機器學習是對能通過經驗自動改進的計算機演算法的研究。
  • 機器學習是用資料或以往的經驗,以此優化計算機程式的效能標準。

一種經常引用的英文定義是:A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E.

分類

機器學習可以分成下面幾種類別:

  • 監督學習從給定的訓練資料集中學習出一個函式,當新的資料到來時,可以根據這個函式預測結果。監督學習的訓練集要求是包括輸入和輸出,也可以說是特徵和目標。訓練集中的目標是由人標註的。常見的監督學習演算法包括迴歸分析和統計分類。
  • 無監督學習與監督學習相比,訓練集沒有人為標註的結果。常見的無監督學習演算法有聚類。
  • 半監督學習介於監督學習與無監督學習之間。
  • 增強學習通過觀察來學習做成如何的動作。每個動作都會對環境有所影響,學習物件根據觀察到的周圍環境的反饋來做出判斷。

演算法

具體的機器學習演算法有:

  • 構造間隔理論分佈:聚類分析和模式識別
    • 人工神經網路
    • 決策樹
    • 感知器
    • 支援向量機
    • 整合學習AdaBoost
    • 降維與度量學習
    • 聚類
    • 貝葉斯分類器
  • 構造條件概率:迴歸分析和統計分類
    • 高斯過程迴歸
    • 線性判別分析
    • 最近鄰居法
    • 徑向基函式核
  • 通過再生模型構造概率密度函式:
    • 最大期望演算法
    • 概率圖模型:包括貝葉斯網和Markov隨機場
    • Generative Topographic Mapping
  • 近似推斷技術:
    • 馬爾可夫鏈
    • 蒙特卡羅方法
    • 變分法
  • 最優化:大多數以上方法,直接或者間接使用最優化演算法。

人工神經網路

機器學習認知科學領域,人工神經網路(英文:artificial neural network,縮寫ANN),簡稱神經網路(英文:neural network,縮寫NN)或類神經網路,是一種模仿生物神經網路(動物的中樞神經系統,特別是大腦)的結構和功能的數學模型或計算模型,用於對函式進行估計或近似。神經網路由大量的人工神經元聯結進行計算。大多數情況下人工神經網路能在外界資訊的基礎上改變內部結構,是一種自適應系統。現代神經網路是一種非線性統計性資料建模工具。典型的神經網路具有以下三個部分:

  • 結構(Architecture)結構指定了網路中的變數和它們的拓撲關係。例如,神經網路中的變數可以是神經元連線的權重(weights)和神經元的激勵值(activities of the neurons)。
  • 激勵函式(Activity Rule)大部分神經網路模型具有一個短時間尺度的動力學規則,來定義神經元如何根據其他神經元的活動來改變自己的激勵值。一般激勵函式依賴於網路中的權重(即該網路的引數)。
  • 學習規則(Learning Rule)學習規則指定了網路中的權重如何隨著時間推進而調整。這一般被看做是一種長時間尺度的動力學規則。一般情況下,學習規則依賴於神經元的激勵值。它也可能依賴於監督者提供的目標值和當前權重的值。例如,用於手寫識別的一個神經網路,有一組輸入神經元。輸入神經元會被輸入影象的資料所激發。在激勵值被加權並通過一個函式(由網路的設計者確定)後,這些神經元的激勵值被傳遞到其他神經元。這個過程不斷重複,直到輸出神經元被激發。最後,輸出神經元的激勵值決定了識別出來的是哪個字母。

神經網路的構築理念是受到生物(人或其他動物)神經網路功能的運作啟發而產生的。人工神經網路通常是通過一個基於數學統計學型別的學習方法(Learning Method)得以優化,所以人工神經網路也是數學統計學方法的一種實際應用,通過統計學的標準數學方法我們能夠得到大量的可以用函式來表達的區域性結構空間,另一方面在人工智慧學的人工感知領域,我們通過數學統計學的應用可以來做人工感知方面的決定問題(也就是說通過統計學的方法,人工神經網路能夠類似人一樣具有簡單的決定能力和簡單的判斷能力),這種方法比起正式的邏輯學推理演算更具有優勢。

和其他機器學習方法一樣,神經網路已經被用於解決各種各樣的問題,例如機器視覺語音識別。這些問題都是很難被傳統基於規則的程式設計所解決的。

深度學習

深度學習(英語:deep learning)是機器學習拉出的分支,它試圖使用包含複雜結構或由多重非線性變換構成的多個處理層對資料進行高層抽象的演算法。

深度學習是機器學習中一種基於對資料進行表徵學習的方法。觀測值(例如一幅影象)可以使用多種方式來表示,如每個畫素強度值的向量,或者更抽象地表示成一系列邊、特定形狀的區域等。而使用某些特定的表示方法更容易從例項中學習任務(例如,人臉識別或面部表情識別)。深度學習的好處是用非監督式半監督式特徵學習分層特徵提取高效演算法來替代手工獲取特徵。

表徵學習的目標是尋求更好的表示方法並建立更好的模型來從大規模未標記資料中學習這些表示方法。表達方式類似神經科學的進步,並鬆散地建立在類似神經系統中的資訊處理和通訊模式的理解上,如神經編碼,試圖定義拉動神經元的反應之間的關係以及大腦中的神經元的電活動之間的關係。

至今已有數種深度學習框架,如深度神經網路卷積神經網路深度置信網路遞迴神經網路已被應用計算機視覺、語音識別、自然語言處理、音訊識別與生物資訊學等領域並獲取了極好的效果。

另外,“深度學習”已成為類似術語,或者說是神經網路的品牌重塑。

結語

對於高中就放棄數學的學渣來說就一句話:“真TM難!”

[出來混總是要還的!這裡寫圖片描述]]

站在巨人肩膀上