1. 程式人生 > >《深度學習革命》作者:GAN令我驚豔,現在的人們對AI操之過急了

《深度學習革命》作者:GAN令我驚豔,現在的人們對AI操之過急了

近日,學習演算法先驅人物、《深度學習革命》一書作者Terrence Sejnowski在接受The Verge訪談時簡要介紹了AI的起源和發展,同時表示,關於“殺人AI”和“機器人代替人類”等概念更多是過度炒作的結果,因為人們對AI新技術的期待有些過於著急了。令他印象最深刻的技術是生成對抗網路。

近日,計算神經科學家、《深度學習革命》一書作者Terrence Sejnowski在接受採訪時表示,現在像“深度學習”和“神經網路”這樣的流行語無處不在,但是大多數對這些詞語的理解都被誤導了。

Sejnowski是研究學習演算法的先驅,《深度學習革命》(The Deep Learning Revolution)一書的作者,該書新版本將於下週由麻省理工學院出版社出版。

他認為,關於“殺手AI”或“機器人超越人類”的話題熱議過於關注危機的一面,忽視了電腦科學和神經科學領域中令人興奮的可能,也忽視了當人工智慧與人類智慧時發生碰撞時會發生什麼。

近日,Sejnkowski接受The Verge訪談時,談到了“深度學習”一詞為何突然變得無處不在,深度學習能做什麼、不能做什麼,以及對這一概念的炒作問題。

首先,我想問一下定義問題。人們幾乎可以完全互換地使用“人工智慧”、“神經網路”、“深度學習”和“機器學習”等詞。但實際上這些詞指的是不同的東西,您能解釋一下有哪些不同嗎?

人工智慧(AI)的誕生可以追溯到1956年,當時美國的一些工程師們決定編寫一個能夠嘗試模仿人類智慧的計算機程式。而機器學習是在AI中逐步壯大的一個新領域。傳統的人工智慧方法是編寫一個循序漸進的程式來實現某件事情,而機器學習是收集大量試圖理解其內容的資料。

比如你正在嘗試識別目標,你可以收集大量的影象。然後,通過機器學習這個自動化的過程,就可以剖析各種功能,可以確定某個目標是一輛汽車,而另一個目標是一臺訂書機。

機器學習是一個非常大的領域,並且可以追溯到最初人們稱之為“模式識別”的階段,但現在的演算法在數學上變得更加廣泛和複雜。在機器學習中包括受大腦啟發而建立的神經網路,然後才是深度學習。深度學習演算法具有特定的體系結構。基本上可以這樣講,深度學習是機器學習的一部分,而機器學習是人工智慧的一部分。

有哪些事情是機器學習能做,其他程式做不了的?

編寫程式非常耗費人力。在過去,計算機運算速度很慢,記憶體又非常昂貴,以至於必須求助於邏輯,這就是計算機的工作原理,是控制資訊的基本機器語言。因為計算機太慢了、計算成本太高了。

但現在,計算已經越來越便宜,勞動力越來越昂貴。計算力甚至便宜到了這種程度:讓計算機去學習,比讓人類編寫程式更有效率。從那時起,深度學習實際上已經開始解決以前在計算機視覺和翻譯等領域的問題。而在此之前,人類的程式設計未踏足過這些領域。

深度學習是計算密集型活動,但使用者只需編寫一個程式,並提供不同的資料集,就可以解決不同的問題。使用者不必非要是相關領域專家。因此,對於存在大量資料的任何事物,都可以產生成千上萬的應用程式。

 “深度學習”現在似乎無處不在。這個詞是如何變得如此流行的?

關於這個時間點我其實可以明確確認:就是在2012年12月的NIPS會議上,這是最大的人工智慧會議。這次會議上,Geoff Hinton和他的兩個研究生表明,使用一個名為ImageNet的大型資料集,其中包含10000個類別和1000萬個影象,並使用深度學習將分類錯誤率降低了20%。

一般來說,該資料集的影象分類錯誤率每年只能降低不到1%。這一年的改進頂了20年的研究。從此之後,閘門就被打開了。

深度學習的靈感來自大腦。那麼這些不同領域之間,比如電腦科學和神經科學之間,是如何協同工作的?

深度學習的靈感來自神經科學,最成功的深度學習網路是Yann LeCun開發的卷積神經網路(CNN)。

考察一下CNN的架構,它不僅僅是由很多單元組成的,而且這些單元的連線方式基本反映出大腦的結構。在關於視覺系統和視覺皮層的基礎研究中,表明大腦的一部分存在簡單細胞和複雜細胞。在CNN的架構中,也存在簡單細胞和複雜細胞的等價結構,CNN的架構設計直接來源於我們對視覺系統的理解。

Yann沒有盲目地試圖複製大腦皮層。他嘗試了許多不同的變化,但他選擇嘗試的是那些自然融合的變化。這是一個重要的觀察結果。我們在自然與人工智慧的融合中可以學到很多東西,而且還有很長的路要走。

我們對電腦科學的理解,在多大程度上取決於我們對大腦的理解程度?

我們現在研究和使用的大部分AI都是基於我們在上世紀60年代對大腦的瞭解。我們現在知道的更多了,可以將更多的知識融入到神經網路架構中。

擊敗世界圍棋冠軍的AlphaGo的架構中不僅包括皮質模型,還包括大腦的另一部分模型,稱為基底神經節,這部分結構對於制定一系列決策來實現目標非常重要。有一種稱為時間差異的演算法,是Richard Sutton在上世紀80年代開發的,將這種演算法與深度學習相結合,能夠進行人類前所未見的複雜遊戲。

當我們瞭解了大腦的結構,開始明白如何將其整合到人工系統中時,AI的功能將會越來越強大。

人工智慧也會影響神經科學嗎?

這兩個領域是並行的。神經技術創新已經取得了巨大的進步,從一次記錄一個神經元,到同時記錄數千個神經元,同時記錄大腦中的多個部分的反應,可以說完全開闢了一個全新的世界。

我認為,人工智慧與人類智慧之間存在著一種趨同。隨著我們越來越多地瞭解大腦的工作原理,這些新知識將會反映在AI中。而與此同時,我們實際上也創造出了一整套可用於理解大腦的學習理論,可以讓我們分析成千上萬的神經元及其活動是如何產生的。所以說,神經科學和人工智慧之間存在著這種相互反饋和迴圈,我認為這一點更令人興奮,也更為重要。

您即將出版的《深度學習革命》一書中討論了許多不同的深度學習應用,從自動駕駛汽車到交易。您覺得哪個領域最有趣?

我覺得是生成對抗網路(GAN)。如果使用傳統的神經網路,你給出一個輸入,得到一個輸出。 而GAN能夠在沒有輸入的情況下生成輸出。

我第一次聽說GAN的時候,正值由網路建立的假視訊風行的時候。GAN真的會產生足以亂真的假視訊,對吧?

從某種意義上說,它們是在生成內部活動。事實證明,人的大腦就是這樣運作的。你可以看到並理解一些東西,然後閉上眼睛,開始想象實際並不存在的東西。你的腦子裡會產生一個視覺影象,周圍安靜下來時,你會有想法。那是因為你的大腦是生成性的。現在,這種新型網路可以生成從未存在過的新模式。

所以打個比方,你可以給GAN輸入幾百張汽車圖片,它就會建立內部結構,可以生成實際上不存在的汽車的新影象,這些影象看起來完全和汽車相似。

另一方面,您認為哪些想法或概念可能被過度炒作了?

沒有人可以預測或想象這種新技術的引入會對未來產生什麼影響。這裡邊當然存在炒作。我們還沒有解決真正困難的問題。現在我們還沒有實現通用智慧,但人們都說機器人就在那裡靜靜等著,等著取代人類,儘管目前機器人的發展遠遠落後於AI,因為其實模仿人類的身體比模仿大腦更加複雜。

這裡以一項技術進步為例:鐳射。鐳射是在大約50年前發明的,當時的鐳射發射器大到佔據了整個一間房。從那時起,一直到現在的鐳射器可以縮小到做講演時使用的“鐳射筆”大小,而且僅售5美元,鐳射技術的商業化過程長達50年。

同樣的事情也將發生在像自動駕駛汽車之類的技術上。自駕車可能明年無法普及,10年內無法普及,要普及可能需要50年,但重點是,在整個普及過程中,技術會不斷進步,會變得越來越靈活和安全,與我們的交通運輸網路的組織形式更加相容。現在的問題是,人們太著急了,過分期待新技術儘快到來,其實假以時日,新技術總會到來的。

參考連結:

https://www.theverge.com/2018/10/16/17985168/deep-learning-revolution-terrence-sejnowski-artificial-intelligence-technology