區塊鏈的分佈與共識:囚徒困境
— 囚徒困境 博弈論 合作激勵 —
我們很多人看過中國導演姜文的《讓子彈飛》,電影中姜文飾演的綠林俠匪張麻子和他的兄弟們,希望通過喚起民眾的鬥爭意識除掉欺壓百姓的鵝城惡霸黃四郎。發了錢、發了槍,民眾都沒有奮而起義,直到張麻子等人將黃的替身捉拿並斬首示眾,大家以為黃本人已經死了,才一哄而上踩平了黃四郎的老巢。
黃四郎在鵝城作威作福,百姓們生活十分困苦,本應該團結起來反對他才是。尤其在有了錢財和武器資助之後,反抗一方的實力已經大大超過了黃四郎的武裝力量,聯合起來顯然是對大家更為有利的選擇。可為什麼直到大家以為黃已經被處死,才匆忙去“擁護”革命的步伐?這裡面涉及到的其實就是群體利益和個人利益之間衝突的問題。
鵝城處在黑暗統治之下,追求群體也即社會利益的實現應該重建一套更為公正的秩序,達到這個目的就需要人們揭竿而起,共同鬥爭。留在原地不反抗是不行的,然而最早衝上去的人又有可能受到傷害,甚至成為犧牲品,於是我們看到大家即使紛紛撿起了發到家門口的槍,但仍然只會小心翼翼地跟在隊伍後面觀望。
解釋上述問題的理論基礎來自博弈論,讓我們來看一個著名的這方面的例子:囚徒困境。說的是警方逮捕了甲、乙兩名嫌疑犯,但並沒有足夠證據指控二人入罪。這時候警方採用的辦法是分開囚禁甲和乙,分別和二人見面,並向雙方提供以下相同的選擇:如果兩個人都不揭發對方,則由於證據不確定,每個人都坐牢半年;若一人揭發,而另一人沉默,則揭發者因為立功而立即獲釋,沉默者因不合作而入獄十年;若互相揭發,則因證據確實,兩個人都判刑兩年。
顯然我們看到,雙方均保持沉默對彼此都最為有利,然而由於囚徒被分開,沒有辦法瞭解到對方的資訊,因此最終結果是他們基於自身的利益考量,都會選擇互相揭發,而不是同守沉默。假設我們將整個社會模擬成由這兩個人組成,那麼社會集體的利益最大化,即兩人都各坐牢半年的結果(加起來總共只有一年的損耗),就會因為彼此缺乏合作而受到損害。
“囚徒困境”的例子在我們生活的周圍還有很多,這涉及到人類社會一個最根本的合作問題。可以說,整個文明的歷史都是一部不同種族、階層和思想方式的人們之間的合作歷史,人類一直以來面臨的最大問題就是如何通過通力合作認識自然,並且取得自身的極大發展。我們在過去遇到過無數的“囚徒困境”,問題的本質其實就是個體和集體的衝突。個體理性的選擇是追求個人利益的最大化,而這種選擇的結果往往又不能與集體理性,也即全社會的共同利益目標完全一致。
我們的個體潛藏了豐富的智慧,但是由於種種原因,人類常常體現出缺乏合作精神,我們因此遭受了很多的經濟損失、生活不幸乃至流血衝突。在每一次摩擦和失敗的經驗教訓中,我們不斷地總結並找到了一個又一個的解決方法,進而有效提升了我們應對難題的能力。
在張維迎教授的《博弈與社會》一書中,針對合作問題總結出的最有效的方法就是採取激勵。簡單來說就是對於合作的行為予以獎勵,對於不合作的行為予以處罰。這其中最主要的是採用物質激勵的方式,當然有時候精神激勵也很有效。此外在激勵的過程中,我們還需要注意儘量讓資訊公開透明,從而讓我們能夠從中識別出誰選擇了合作,誰選擇了不合作,以保證激勵行為被正確實施。
所以我們就可以清楚解釋電影中出現的情況了,由於民眾每個人自身的利益和整個鵝城的社會利益不完全統一,想要推動百姓拿起槍反抗惡霸,最核心是要給予反抗的參與者適當地激勵。我們看到最開始給錢的時候姜文說有三成勝算,到了給槍的時候姜文說有七成,最後大家看見黃四郎被處決,便真正行動了起來,這時候也就完成了激勵的最後一棒。
現實社會中,類似囚徒困境的例子還廣泛存在於價格設定、公共禮儀乃至國與國的競爭等領域。我們在商場上看到過不少價格戰,比如美國上世紀70年代聯邦快遞和UPS為了向對方領域滲透不斷降價,以及2014年中國共享出行領域的兩大巨頭滴滴和快的瘋狂補貼司機和使用者。
在類似的情形中,由於競爭雙方資訊不對稱,所以誰也沒法先停手,往往導致兩敗俱傷。事實上,這種補貼大戰最後的結果經常只能是監管部門出手加以制止,或者採取資本併購的方式人為結束博弈(滴滴快的的合併就是如此)。
在公共領域,一個日常的例子是我們經常會遇到修路的情況,假使右側在施工,會讓本應該靠右走的車輛改到靠左行駛(英聯邦國家和地區與此相反),導致人們需要降低車速來相互調整。這個時候如果大家選擇合作,交替使用左行車道就不會擁堵,當然這需要每個人都為此多等待一些時間。
但如果誰也不願意等待,都爭著想先行駛,就很容易僵在一起,導致整個道路都無法通行。現實情況是除非司機們普遍擁有很好的素質,否則一般都會有一排車堵在一起彼此怨憤,我們很多人也都在生活中遇到過類似的情況。
國與國之間同樣如此,比如上世紀下半葉的美蘇爭霸,兩國競相大肆擴充核武器,以及近年來塵囂直上的“碳排放量”分配問題的爭吵。從人類整體利益出發顯然應該儘量遠離核威脅,停止大氣汙染的行為,但由於缺乏溝通與合作,大家擔心如果自己停止危害,對方卻繼續類似行為的話,會對自身的權利造成損害。此外也有一些國家,正面臨經濟快速發展和環境治理的艱難權衡,所以各個參與國從自己的利益出發,往往會做出不少威脅到人類社會發展,最終也會危害到自己的事情。
我們試圖運用激勵的方法解決各種囚徒困境的問題,在此基礎上,我們進一步形成了一系列的產權機制、社會規範和法律規則等,以期將激勵手段變成具備連貫性的,能夠被普遍理解和大範圍應用的方式。
我們希望通過明晰產權,比如公司合併行為和分配股東利益,降低不必要的經濟效率折損;我們通過教育司機養成互相尊重、禮讓他人的文明駕駛習慣,用來減少人為造成的交通堵塞;我們站在人類命運與共的角度號召減少衝突,並對國際秩序的違反者予以譴責和制裁,以此促進全世界的和平與穩定。
圍繞這些問題,我們曾經撰寫了無數經典的理論和著作,也藉此推動人類社會取得了不小的進步,但都沒有能夠完美的平息我們不斷經歷的各項衝突。我們始終沒有達到柏拉圖在《理想國》一書中描繪的情景,即形成一個正義感的社會,其中的每個人都尊重禮儀和規則、充滿榮譽感並且為全體社會福祉不懈努力。時至今日,我們仍舊時不時會看到高速路上人為引發的汽車長龍。在我們生存的地球上,空氣、水和生態環境整體也還是朝著惡化的方向在發展。
(作者:劫波李凱龍,內容來自鏈得得內容開放平臺“得得號”;本文僅代表作者觀點,不代表鏈得得官方立場)