人工智慧牛在什麼地方?

圖片發自簡書App
1.
如果要找出2018年最令我震撼的時刻,那麼,作為一個Dota愛好者,一定是ti8國際邀請賽的全明星環節。
那時,我見證了超級電腦戰勝人類巔峰高手的一幕:全世界最強的solo選手與電腦AI進行影魔對戰,最終,包括dandi,sumail,miracle在內的世界頂級中單都輸了,而且,他們輸的心服口服!
我至今仍然記得dandi雙手捂臉無可奈何的表情。
如果你是一名英雄聯盟或者王者榮耀的玩家,可以腦補這個畫面:敵方電腦英雄和你一對一對線,你殘血落魄地躲在塔下,看著對方肆無忌憚的補刀,而你卻只能猥瑣混經驗。
其實,人工智慧戰勝人類高手的例子很早就有了。在圍棋界就有過幾次大戰,最終人類高手不敵人工智慧,遺憾輸掉這場人類與機器的對決。
2016年3月,阿爾法圍棋與圍棋世界冠軍、職業九段棋手李世石進行圍棋人機大戰,以4比1的總比分獲勝;2016年末2017年初,該程式在中國棋類網站上以“大師”(Master)為註冊帳號與中日韓數十位圍棋高手進行快棋對決,連續60局無一敗績;2017年5月,在中國烏鎮圍棋峰會上,它與排名世界第一的世界圍棋冠軍柯潔對戰,以3比0的總比分獲勝。
2.
那麼,到底是什麼原因,人工智慧竟然可以輕鬆戰勝人類,它到底是如何思考和決策的呢?
在dota2國際邀請賽上,開發超級電腦的技術人員解釋說,電腦AI是通過最優演算法來執行程式的。也就是說,電腦可以設定兩個模型,讓它們按照一定規則對抗,經過無數次的對決,從模擬中學習,分析總結,找出最好的行為方式。每次對抗都會糾正一些錯誤的決策,排除其中一些錯誤行為模式,最後選擇最優的執行。
這有點類似於城市交通網路中的“最短路徑分析”。使用過百度地圖或者谷歌地圖的人都知道,查找出發點和終點的最優路線分為兩種:一種是路程最短,另一種是時間最短。這個“最短路徑”,是系統通過計算所有可行性方案得到的資料中對比得來的,相當於每一條可行的路線都走了一遍,然後再比較出最好的那一條路線。
而阿爾法圍棋(AlphaGo)就更加複雜了。
它結合了監督學習和強化學習的優勢,通過訓練形成一個策略網路,將棋盤上的局勢作為輸入資訊,並對所有可行的落子位置生成一個概率分佈。然後,訓練出一個價值網路,對自我對弈進行預測。阿爾法圍棋產生大量自我對弈棋局,為下一代版本提供了訓練資料,此過程迴圈往復。在獲取棋局資訊後,阿爾法圍棋會根據策略網路探索哪個位置同時具備高潛在價值和高可能性,進而決定最佳落子位置。在分配的搜尋時間結束時,模擬過程中被系統最頻繁考察的位置將成為阿爾法圍棋的最終選擇。
理論上,經過無數次模擬練習後的電腦,是可以稱得上完美的。而人類不可能做到完美,人有各種缺陷,比如情緒波動,意外失誤,計算誤差,而這些問題電腦都可以避免。
3.
在感慨人類的弱點的同時,我發現人和人工智慧學習模式上的異同。人類依靠總結經驗和模仿來學習,而電腦通過模擬和計算來學習。電腦會在反覆的模擬中計算成功概率最高的路徑,並選擇勝率最高的去執行,每一步都如此,每一步都是最優的,堪稱完美。人無法把其中哪怕一個步驟做到完美,更別說每一步了。不過,我們可以借鑑這種模式,來完善我們的學習系統和決策方式。
人工智慧有三個重要演算法:模擬、反覆和最優。
如果要借鑑這些演算法,就要深入理解它們的含義。
“模擬”即在實戰之前的訓練,是一種刻意練習。建立一個和實際戰場相似的環境背景,遵循一定的遊戲規則,通過一系列手段和戰術達到一個最終的目標。
“反覆”即多次的重複嘗試,試錯。反覆不但可以增加熟練程度,還試過了許多陷阱,對陷阱有一定的認知,可以在下次決策時避免犯下同樣錯誤。還對其他行為方式有過探索,從這些行動中總結出許多遊戲規則。
“最優”即做出成功概率最高的決策。這是建立在試錯,排除錯誤答案之後做出的選擇。類似於查理芒格的“迅速殲滅不該做”的事情。對電腦來說,許多路徑都是嘗試過的,即使沒有嘗試過,一旦學會了同類規則下的行為模式,就可以遵循這個模式進行最佳決策。
4.
我們很容易理解“模擬”和“反覆”,但真正實行起來卻需要毅力和耐心。
機器只要不損壞,可以按照程式無限執行命令,而人卻不行。大多數人意志力薄弱,根本無法長期反覆練習一項技能,即使有時候精力充沛,卻因為缺乏自我約束而耗費在一些無關緊要的事情上。
“最優”的關鍵在於如何選擇。做選擇一直是困擾很多人的問題。比如,是去圖書館看書還是跟舍友打遊戲?是該全心投入學習還是找份兼職賺點生活費?大學畢業是該就業還是考研?一旦你選對了最佳答案,那麼這個選擇或許就決定了你的人生。
很多時候,我們都會因為各種原因錯過那個“最優”選擇。只有明確自己真正想要的東西並專注其中,不被外物干擾,我們最終才能選對那個最優的答案。
人工智慧是人類智慧的一部分,是深度學習技術的產物。於此同時,它也有許多值得人類借鑑的“思考模式”,我們應該從中學習,擯棄一些人類的弱點,塑造一個更加完善的自己。