1. 程式人生 > >【人工智慧】人工智慧與機器學習有關概念的理解

【人工智慧】人工智慧與機器學習有關概念的理解

一、什麼是智慧

什麼叫智慧,智慧是什麼?

這個問題簡單嗎,看似簡單;能回答清楚嗎?非常難!這是一個深刻的哲學問題,是一個有關於人何以為人的哲學問題!

Intelligence has been defined in many ways to include the capacity for logic, understanding, self-awareness, learning, emotional knowledge, reasoning, planning, creativity, and problem solving. It can be more generally described as the ability to perceive or infer information, and to retain it as knowledge to be applied towards adaptive behaviors within an environment or context.

維基百科是這麼描述的:

智慧是邏輯能力、理解力、自我意識、學習、情感認知、推理、規劃、創造、及解決問題等種種能力的統稱。可概括的理解為——感知並處理資訊,進而將資訊轉換為知識並在特定環境中利用知識的能力!

在這裡插入圖片描述

這個定義很好,很契合本人對智慧的思考,也符合程式設計師的思維方式!就是——資訊!資訊!資訊!簡而言之,智慧就是資訊處理的能力!

資訊處理包括資訊的定義,獲取,轉換,儲存,傳輸。人腦就是一臺異常精密的資訊處理系統,資訊就是人的靈魂,人的喜怒哀樂,思考,決策,遺忘,慾望,信念,都是資訊在神經系統中轉換處理的結果;除此之外,人類還有無語倫比的控制與輸入輸出系統,人的眼耳鼻舌,人遍佈全身的感知感測器,讓人能夠精確的獲取到“聲色香味觸”相關的各種資訊;人的口(發聲)、手(精確控制)、足(移動),則賦予人資訊傳輸及與環境互動的能力。

  1. 獲取資料、資訊和知識的能力,聲音,影象,文字,聲色香味觸;
  2. 將獲取的資料、資訊、知識,轉化為系統掌握的知識,叫做資訊加工,儲存在知識系統中;
  3. 知識創造,通過聯想、創作、歸納、分析、概括等等,促進自身知識系統的進化;
  4. 影響力,通過輸出將資訊反饋給外界,併產生影響;傳播,分享,教授;

人很智慧,人很完美,很高階!但是,如果資訊就是靈魂的話,那麼石頭也有靈魂,樹也有靈魂,因為它們至少能獲取儲存資訊,比如年輪就是一種資訊,比如隕石中的資訊!今人不見古時月,今月曾經照古人,君不見,恰是這些冰冷、無情的石頭,儲藏著宇宙遠古的祕密。

另外,在我看來,所謂意識(Consciousness)、自我(self-awareness)、思維(mind)等等概念,無非是人類對大腦神經系統資訊處理的方式進行的歸類,是人類為了理解自己而抽象出來的概念。

二、人工智慧

如果智慧的定義為:資訊處理的能力!那麼人工智慧的定義應該是——幫助人類提升資訊處理能力的理論、方法、技術和工具。

由此可見,人工智慧的範圍很廣,在人類發展的不同階段,人工智慧的狹義概念也大不相同,在古代,飛鴿傳書就已經很高階了,大大提高了人類資訊傳輸的效率,活字印刷也很智慧。文言文作為一種書寫系統,在古代資訊傳輸與儲存不便的情況下,其所具有的資訊壓縮的特性,對中華文明的統一性與連續性起到舉足輕重的作用,儘管常常需要解碼(經典註解)。文言文很智慧,至少比其它幾個古文明的書寫系統更智慧!

目前,人工智慧特指電腦科學的一門分支學科,它研究、開發用於 模擬(像人一樣行動,如彈琴,跳舞,像人一樣交流,交談,像人一樣思考,有感情)擴充套件(跑到更快,記得更多,想的更深,像AlphaGo) 人類智慧的機器或系統。人工智慧涉及到電腦科學、心理學、哲學和語言學等學科知識。

簡而言之,人工智慧發展的驅動力就是:

  1. 人很優秀,要創造出來像人一樣的機器,來完成本應由人來完成的那些事情,比如自動駕駛,機器翻譯(語音識別,語言理解),機器戰警,工業機器人,機器外科醫生等等。
  2. 人不完美,人跑的慢,聲音傳不遠,活不長,記得少,等等等等,所以需要擴充套件人的能力,比如大資料儲存與檢索,行動通訊,智慧決策,機器學習。

在這裡插入圖片描述

人工智慧有以下問題域:

  • 推理(Reasoning)與決策(Decision):資訊理論,統計與概率,決策樹,…
  • 知識(Knowledge): 存在論,本體論與認知論,世界觀,
  • 規劃(Planning):方法論,目標、過程、方法
  • 學習(Learning):訓練,歸納,
  • 語言(Natural Language Processing):語音/文字識別,語義理解,翻譯,表述,問答
  • 感知(Perception):視覺(vision),聽覺,計算機視覺,語音識別…
  • 移動(Motion)與控制(Manipulation):自動駕駛,工業機器人
  • 社交(Social):機器人女友,情感,siri

三、機器學習

Machine learning is a field of artificial intelligence that uses statistical techniques to give computer systems the ability to “learn” (e.g., progressively improve performance on a specific task) from data, without being explicitly programmed.

機器學習是人工智慧的一個分支,通過研究人類的“學習”機制,賦予機器“學習”的能力!由此可見,機器學習是一門專注於研究人類是如何“學習”的技術,研究物件是人類的學習機制(過程和方法),然後將研究成果轉換為計算機語言或演算法,讓機器具備學習的能力,再結合計算機特有的儲存與計算能力,來解決現實問題。

在這裡插入圖片描述

那麼,什麼是學習?學習的本質是什麼呢?

  • 學:就是獲取資料或資訊!(大資料)
  • 習:反覆的做(調整)!(訓練)

學習的目的是“得道”,道就是規律,是知識,“形而上者謂之道,形而下者謂之器"。在機器學習中,就是訓練後的模型。金木水火土,陰陽八卦,七經八脈…這些其實本質上也都可以視為“模型”,在我看來跟神經網路訓練出來的模型也沒有什麼區別,只不過它們是超驗的,難以證偽的,不科學。

資料/資訊不等同於知識,比如,( 6670, 6300, 5464 ),如果不加描述,這三個資料毫無意義,資訊量為0;如果告訴你,這些資料是某些河流的長度,它們就具有資訊了;如果再進一步指出,它們分別是(尼羅河,長江,黃河)的長度,它就成了知識點。

通過不斷的“學”來獲取資料/資訊,通過不斷的“習”來發現規律。

人類的學習系統複雜、精妙和神祕,因此機器學習作為一門研究和模擬人類學習機制的學科,極富有挑戰。

機器學習的主要任務是:

  • 分類:k-近鄰演算法,樸素貝葉斯演算法,支援向量機,決策樹
  • 迴歸:線性迴歸,區域性加權線性迴歸,Ridge迴歸,Lasso最小回歸係數估計
  • 聚類:K-均值,DBSCAN
  • 密度估計:最大期望演算法,Parzen窗設計

分類與迴歸的主要區別是資料型別不同,分類演算法處理離散(discrete)資料,迴歸演算法處理連續(continuous )資料。

從型別上,可分為監督式(Supervised)學習,非監督式(Unsupervised)學習,半監督式(Semi-supervised)學習,主動學習(Reinforcement learning),強化學習(Active learning)

Machine learning is sometimes conflated with data mining,[5] where the latter subfield focuses more on exploratory data analysis and is known as unsupervised learning.

機器學習有時也稱作資料探勘,兩組概念上有重疊的部分,但視角不同,後者更強調“探索性資料發現”,也就是所謂“非監督性學習”。資料探勘的目的本來就是知識發現(Knowledge Discovery),而發現知識這一過程的本質其實就是學習,因此機器學習與資料探勘這兩個概念常常交織在一起。