國匠智慧製造培訓|人工智慧核心的機器學習技術為什麼這麼難?
人工智慧是一門交叉學科,從被提出到現在也有六十多年的歷史,目前仍處在AI初級階段。
人工智慧技術可應用於安防、醫療、家居、交通、智慧城市等各行各業,其前景是毋庸置疑的,未來絕對是一個萬億級市場。根據應用領域的不同,人工智慧研究的技術也不盡相同,目前以機器學習、計算機視覺等成為熱門的AI技術方向,本文以機器學習為例,通過分析其關鍵技術與當前面臨的難點,一起探索人工智慧的發展與未來。
機器學習是人工智慧的核心
機器學習也被稱為人工智慧的核心,它主要是研究計算機怎樣模擬或實現人類的學習行為以獲取新的知識或技能,幫助計算機重新組織已有知識結構使之不斷改善自身的效能。
機器學習是人工智慧研究的一個分支,人們對機器學習的研究也有很多年了。它的發展過程大體上可分為幾個時期,第一是在20世紀50年代中葉到60年代中葉,屬於熱烈時期;第二是在20世紀60年代中葉至70年代中葉,被稱為機器學習的冷靜時期;第三是從20世紀70年代中葉至80年代中葉,稱為復興時期;第四階段的機器學習開始於1986年,目前我們仍處在這個時期。
現在很多應用領域都可以看到機器學習的身影,如資料探勘、自然語言處理、生物特徵識別、搜尋引擎、醫學診斷、證券、遊戲、機器人等。
學習是一項非常複雜的過程,學習與推理分不開,按照學習中使用推理的多少,機器學習所採用的策略可分為四種:機械學習、傳授學習、類比學習和通過事例學習。學習中所用的推理越多,說明系統的能力越強。
機器學習的難度在哪?
對於機器學習的開發者而言,除了需要對數學知識掌握得非常熟練之外,選擇什麼工具也很重要。一方面,機器學習的研究需要創新、實驗和堅持,很多人半途而廢;另一方面,如何將機器學習模型應用到實際工作中也有難度。
除了工程師因素,機器學習的系統設計也有難度。影響學習系統設計的最重要的因素是環境向系統提供的資訊,資訊質量直接影響系統性能,知識庫裡存放的是指導執行部分動作的一般原則,但環境向學習系統提供的資訊卻是各種各樣的。
如果資訊質量高,與一般原則的差別比較小,則機器學習比較容易處理。如果向學習系統提供的是無規律的指令資訊,則學習系統需要在獲得足夠資料之後,刪除不必要的細節,總結後才能形成指導動作,並放入知識庫;這樣機器學習的任務就比較繁重,設計起來也較為困難。
對於機器學習而言,還有一個技術難度就是機器學習的除錯很複雜,如在進行常規軟體設計時,編寫的問題不能按預期工作,可能是演算法和實現出現問題;但在機器學習裡面,實際的模型和資料是兩個關鍵因素,這兩個的隨機性非常強,除錯難度倍增。除了複雜性,機器學習的調試周期一般都很長,因為機器得到指令進行實施修正和改變通常需要十幾個小時甚至幾天。
谷歌是機器學習的推動者
提到機器學習,就不得不提到谷歌,2017年,它展示了聚焦人工智慧的名為張量處理單元(TPU)的晶片,這是一款谷歌打造的處理器,是專為機器學習量身定做的。
TPU的特點是執行每個操作所需的電晶體數量更少,自然效率更高,據谷歌介紹,TPU與同期的CPU和GPU相比,可以提供15-30倍的效能提升及30-80倍的效率提升。谷歌表示,它們專門為這款TPU設計了MXU作為矩陣處理器,可以在單個時鐘週期內處理數十萬次運算。谷歌提到,TPU的核心是脈動陣列,MXU有著與傳統CPU、GPU截然不同的架構,稱為脈動陣列;“脈動”名字的來源是因為在這種結構中,資料一波一波地流過晶片,與心臟跳動供血的方式類似。
機器學習技術助力人工智慧