1. 程式人生 > >深度學習的發展,AI硬體是時候要拼一下!

深度學習的發展,AI硬體是時候要拼一下!

隨著深度神經網路不斷改進和發展,將需要硬體創新以滿足不斷增長的計算需求。

深度學習一直處於人工智慧(AI)近期發展的最前沿。 它涉及一組受生物神經網路啟發的機器學習演算法,可以教機器查詢大量資料中的模式。 這些深度神經網路已經在語音和物件識別等領域取得了重大進步,併成為在特定任務中表現出超人能力的計算機程式的基礎。

人工智慧大亂鬥,AI硬體成下一盤廝殺局?有點慌

 

這種方法當前功能最引人注目的演示可能是AlphaGo。該專案由谷歌旗下DeepMind的研究人員開發,在2016年3月的五場比賽中擊敗了遊戲Go,Lee Sedol的世界冠軍; 得分為4:1:1。此時,AlphaGo唯一的競爭來自更好的版本。

2017年10月,DeepMind團隊報告了一個更新的計劃--AlphaGo Zero--它使用強化學習,僅通過玩遊戲來訓練自己; AlphaGo依靠數百萬人類專家行動的無監督學習。 與淘汰Sedol的AlphaGo計劃相比,AlphaGo Zero贏得了100場比賽的勝利。

“DeepMind正在進行一項長期的科學探索研究,打造智慧解決方案,並造福全世界。我們很自豪,部分工作成果已經應用在了醫療保健、能源等領域。”作為網際網路科技巨頭,谷歌人工智慧的重視和投入程度都在不斷加大。比如去年推出的AI開源專案——AIY Projects(全稱為 Artificial Intelligence Yourself),就是為了讓AI人工智慧更加平民化、普及化,讓人人都可以瞭解AI、接觸IA、並動手開發自己的AI人工智慧產品。

人工智慧大亂鬥,AI硬體成下一盤廝殺局?有點慌

 

深度神經網路涉及通過數字“突觸”連線的多層“神經元”。 他們接受大型資料集的培訓,並伴有所需任務的答案,在此期間,調整神經元之間連線的強度或重量,直到頂級輸出正確為止。 然後,訓練的神經網路以訓練階段期間確定的權重執行,然後可以在稱為推斷的步驟中應用於新資料。

深度神經網路的最近成功是由演算法和網路架構的進步推動的,但也值得注意的是,通過不斷增長的大量資料的可用性以及更強大的計算機的不斷髮展。 在這一點上,具有最先進精度的深度神經網路的計算需求是相當大的。 正如Yiyu Shi及其同事在本期“自然電子”雜誌的一篇“透視”中所說,這為深度神經網路提出了一個新興問題,特別是它們在移動和嵌入式裝置上的潛在實現,例如智慧感測器或可穿戴裝置,其中電力資源有限。

位於聖母大學的研究人員 ,以及加州大學洛杉磯分校和華中科技大學 - 負責研究深度神經網路的準確性和規模以及不同硬體平臺的容量。他們表明,在用於邊緣推理的深度神經網路的縮放(在嵌入式平臺上本地進行推理)和互補金氧半導體(CMOS)技術的縮放之間存在差距,並且這些差距正在增長。隨著深度神經網路變得更加準確,它們的大小(層數,引數和運算元量)急劇增加。但是,正如Shi及其同事所表明的那樣,典型硬體平臺 - 圖形處理單元(GPU),現場可程式設計門陣列(FPGA)和專用積體電路(ASIC)的效能無法跟上領先的領先規模。深度神經網路設計。類似地,硬體平臺容納網路所需的儲存器的能量效率不能跟上網路規模的增加。

人工智慧大亂鬥,AI硬體成下一盤廝殺局?有點慌

 

Shi及其同事指出,“CMOS縮放對滿足日益苛刻的計算密度和能效要求沒有太大幫助,因此需要在架構,電路和裝置方面進行創新。”因此,他們繼續研究不同的架構和演算法 可以共同幫助彌合這些差距的創新。

一種這樣的方法是試圖擺脫傳統的馮·諾依曼計算系統,其中儲存器和處理單元在物理上是分開的。例如,納米級電阻儲存器件(憶阻器件)可用於處理和儲存器。然而,裝置可變性仍然是一個問題,這限制了可以執行計算的準確性。在本期雜誌中,IBM研究院的蘇黎世和蘇黎世聯邦理工學院的Manuel Le Gallo及其同事表示,通過將使用電阻式儲存裝置的記憶體處理與傳統的數字處理相結合,可以避免這個問題。這裡的記憶體處理器單元 - 具體地說是相變儲存器裝置陣列(如圖) - 執行大量計算任務,並且傳統處理單元迭代地提高解決方案的準確性。 Le Gallo及其同事通過求解線性方程組來說明該方法的功能,即它們稱為混合精度記憶體計算。但該方法已經應用於深度神經網路的訓練。

開發特別適用於AI應用的器件和晶片的潛力也喚醒了人們對晶片初創企業的興趣。 今年早些時候,“紐約時報”報道說,目前至少有45家初創公司正在研發此類晶片,去年風險資本家投資超過15億美元的晶片初創企業,這幾乎是兩年錢投資的兩倍。

比如,谷歌也釋出自己的TPU以及Edge TPU——TPU是針對TensorFlow上的機器學習工作負載量身定製的定製應用專用積體電路(ASIC)。 去年,谷歌宣稱它的TPU比現代GPU和推理CPU快15到30倍,並且TOPS / Watt測量值提高了30-80倍。並且谷歌在同年還發布了用於邊緣計算的Edge TPU,以及相關裝置:AIY Projects Edge TPU Dev Board和Edge TPU Accelerator 圍繞谷歌新推出的專用邊緣TPU。

人工智慧大亂鬥,AI硬體成下一盤廝殺局?有點慌

 

這項技術可能帶來的好處是相當大的,來自學術界和工業界的研究人員正在應對硬體挑戰 - 機遇 - 機器學習和人工智慧。