一點AI和機器人革命的思考
0 是該再思考一下AI和機器人的未來了
時間已經到了2019年,而曾設想的機器人革命應該在下一個十年到來。我們距離機器人革命到底還有多遠?還需要怎樣的核心技術突破?
沉浸在眼前的技術和演算法往往會侷限住我們的視野,束縛住我們的想象力。我們是不是應該拋開具體的技術先brainstorm一下未來:
2020-2030的世界應該是什麼樣的?
然後我們再想想:
2020-2030 AI和機器人還需要突破什麼革命性技術?
1 2020-2030的世界會是什麼樣的?
如果讓我選擇三個趨勢來代表未來的世界,那麼我會選擇:
AI化
機器人化
虛擬化

AI化 在於所有的人造物包括資訊處理,軟體和硬體都將具備AI屬性。鑑於深度神經網路(Deep Neural Network)是這場AI革命的主體,我們可以認為任何人造物都將基於深度神經網路來驅動或輔助驅動。AI化將帶來的是極致個性化的未來,並且取代非常多能夠由AI來進行直接處理的工作。這一點相信是所有人的共識,並且就是現在整個世界正在大力推進的AI革命。然而,當前的AI化主要面向的是軟體的智慧化,比如最基本的人臉識別,語音識別,這些東西的變革並不是對現實世界的直接互動,真正的現實世界的影響只能屬於機器人。

機器人化 目前還遠遠沒有到來的趨勢。什麼是機器人化?就是通過機器人來真正意義上的取代大部分需要人的體力勞動才能處理的工作,並真正的進入到現實生活,千家萬戶之中。所有人都明白未來的老齡化非常嚴重,這對於老齡護理機器人的需求是非常大的,然而現在的技術還遠遠未來打造出這種服務型的機器人。機器人化的基礎當然依然是AI。

虛擬化 則屬於AR和VR領域,這其實是互動介面的革命,與AI一起並行發生。VR是完全的虛擬世界,AR則是將現實世界虛擬化。未來,真正的虛擬化經濟將到來。我們會擔心,機器人化了,機器人革命了,這個世界就不需要太多勞動力了,大家該怎麼辦?今年一年,很明顯的變化,所有的停車場都無人化了,停車場的保安不需要了。這是直接的不需要。我們總是說那麼未來只能從事創意類的工作了。或許虛擬化的未來為人類提供了完全另外一種生存方式,那就是虛擬化經濟。就類似於現在的遊戲,遊戲裡面的交易也是實實在在的交易。只是在未來,虛擬化經濟的重要性將會巨幅提升,成為不可或缺的一部分。
總的來看,AI必然是所有東西的必備元素,虛擬化為人類提供一種 全新的互動及社交介面 ,甚至生活的介面,而機器人則將在現實世界產生顛覆性的影響。在這三項革命之後,整個世界將會完全不一樣,到那個時候,如果人類可以在理論物理上實現突破,那麼 星際文明時代 或許就可以到來了。
可能這三個方向已經被廣大媒體說爛了,並沒有什麼新東西。但這三個方向又是確確實實對人類社會產生最直接影響的東西。顯示技術,5G,超精確定位技術,新能源技術等等都是輔助這三個方向的實現。有時候只考慮這些外在的技術也是侷限的,比如說如果未來十年生物技術,醫療技術取得突飛猛進的發展,那麼可能對人類世界的影響不比這三個方向低。

Ok,接下來我們聚焦到AI和機器人上,特別是機器人。之所以特別關注機器人,是因為機器人是最最直接對現實世界產生革命性變化的東西。如果大部分人類勞動都可以由機器人取代,人類社會必然產生深刻的變化,這種變革絕對比僅僅在手機app上,在資訊處理上加點AI強無數倍。
2 2020-2030 AI和機器人還需要突破什麼革命性技術?
首先是AI,我們現在的AI距離AGI到底還有多遠?
非常遠。一個非常簡單的例子,現在的AI依然無法真正學會基本的數學計算,因為直接的擬合使得現在的AI根本無法實現out of range的計算。我們需要能夠教會AI懂得真正的邏輯運算規則,讓其能夠按照規則去做。
直接的End-to-End 端到端神經網路是AI的終極解決之道嗎?
神經網路肯定是基本單元,但是直接的端到端神經網路我看不到出路。因為現在的AI本質上依然是簡單的x到y的mapping,這似乎完全忽略了人類是通過思考來輸出y的事實。也許我們可以把神經網路的前向傳播看做是一個AI思考的過程,但是這種過程和人類真正的思考完全是兩個概念吧。雖然AlphaGo,AlphaStar已經取得了很大的成功,我仍然認為直接mapping無法解決所有問題,而實際上AlphaGo也依賴於蒙特卡洛。
所以,
怎麼讓AI真正學會思考?邏輯思考?
這或許是接下來研究AI真正應該做的事情。簡單的mapping不用做了。
不解決這個問題,NLP是無法突破的,必然漏洞百出,前後不搭,只不過是輸出的一句話看起來是語法ok的,內在的邏輯性沒有。機器人和NLP一樣,無法解決,如果機器人只能做簡單的mapping任務而無法思考,那麼機器人永遠無法處理需要邏輯性的任務。雖然說目前的機器人學習的研究還在處理簡單mapping的問題(比如走路,抓取東西)
我們知道深度增強學習做的就是決策,但是這種決策依然是輸入到輸出的簡單mapping過程,而我們人類的決策複雜太多。也因此,大家都在關注Hierarchical Reinforcement Learning,因為這有點接近於人類思考的過程,從粗到細,從上到下。但到現在HRL實際上也沒有本質上的突破。
最近,Deepmind也開始在研究讓AI做數學題,做智商題這種研究上,我想是因為大家慢慢意識到現在AI的侷限性,我們已經需要深入到現有AI完全無法處理的問題上。
所以,接下來AI的發展道路必然只有一個,就是開發真正意義的具備邏輯思考能力的AI,去解決無法直接mapping的任務。
我還不清楚應該如何去解決這個問題,但是可以看到目前的幾個研究方向是在朝這個方向發展的:
- Meta Learning
- Hierarchy Model
- Modular Neural Networks
Meta Learning不僅僅是提供一種方式來學會學習,從而學得更快更好,更本質的是提供了一種提取不同資訊相互聯絡的方法。既然仍然是監督學習,meta learning可以學到無監督學習,就如Learning unsupervised learning rules那篇paper所實現的。Meta Learning不再是簡單的mapping,而是可以內在的做無監督學習,這種架構將有可能自動實現hierarchy,實現邏輯性。
然後Hierarchy model和Modular Neural Networks是在網路結構層面進行改進了,神經網路模組化一定是一種趨勢,因為我們未來將會看到一個神經網路系統能夠同時處理視覺,語音,控制等等各種輸入輸出,沒有模組化是辦不到的,這類似於人類大腦不同區域不同的功能,但是裡面有很多資訊可以共用及遷移。然後Hierarchy我認為不僅僅是在時間尺度上,我們人做的任何決策都是一種hierarchy.
那麼,機器人學習呢?
可以看到,在更強的算力和更好的模擬的加持下,機器人通過sim-to-real實現簡單任務的mapping將不會成問題。這是具備落地能力的,單單這個問題的解決也就會產生很多新的機器人創業公司了。因為機器人終於可以做點通用性的任務了,即使這種通用性依然很侷限,比如就抓取個東西,疊個衣服。
然後接下來機器人學習要發展依然需要回到我們上面提到的問題,邏輯思考!!!
我們設計機器人的時候當然可以把人類的先驗知識輸入進去,然後讓機器人具備一定的邏輯行為。比如就是把每一個物品放到垃圾桶,然後把垃圾桶倒掉。但是這意味著機器人的邏輯是完全人類設計而固定的,有點類似於現在工業機器人,只是現在底層已經通用了,頂層依然是死板的。讓機器人在頂層決策上具備思考能力是完全另一個概念。就類似於愛死亡與機器人裡面的zuma blue那一集,機器人自主決定怎麼打掃游泳池,和人類給機器人規劃出一條邏輯來打掃游泳池是不一樣的。
AI是一個向內發展的過程,就像西部世界裡面的迷宮,最外層就是我們現在AI能做的簡單mapping,裡面一點就是邏輯了,最裡面可能是情感,然後是自我意識。

所以,就讓我們進入到更深層次的AI研究吧!這才是解鎖AGI及機器人革命的路徑!
To Make AI learn to Think!!!