1. 程式人生 > >MOOC-浙江大學-博弈論基礎-學習筆記(四)

MOOC-浙江大學-博弈論基礎-學習筆記(四)

第三講 囚徒困境和破解之道

對應 書中的第五、六、七章,囚犯困境及原因、真實世界的囚犯困境、如何走出囚犯困境。

1.囚徒困境的來源

在這裡插入圖片描述

“囚徒困境”是1950年美國蘭德公司的梅里爾·弗勒德(Merrill Flood)和梅爾文·德雷希爾(Melvin Dresher)擬定出相關困境的理論,後來由顧問艾伯特·塔克(Albert Tucker)以囚徒方式闡述,並命名為“囚徒困境”。

兩個共謀犯罪的人被關入監獄,不能互相溝通情況。如果兩個人都不揭發對方,則由於證據不確定,每個人都坐牢一年;若一人揭發,而另一人沉默,則揭發者因為立功而立即獲釋,沉默者因不合作而入獄五年;若互相揭發,則因證據確實,二者都判刑兩年。 由於囚徒無法信任對方,因此傾向於互相揭發,而不是同守沉默。

囚徒困境(prisoner’s dilemma ):兩個被捕的囚徒之間的一種特殊博弈,說明為什麼甚至在合作對雙方都有利時,保持合作也是困難的。

囚徒困境是博弈論的非零和博弈中具代表性的例子,反映個人最佳選擇並非團體最佳選擇。雖然困境本身只屬模型性質,但現實中的價格競爭、環境保護等方面,也會頻繁出現類似情況。

類似的,攻守同盟(承諾博弈)提前商量好,依然不管用,坦白與否變成了遵守承諾與否。

類似的,還有說謊博弈。 如果確實是沒做過,沒達到,是否就一定會坦白?

例項: 放衛星事件:放衛星,指的是從1958年開始的、在“大躍進”中的、一場急於求成的社會主義建設悲情運動。在“大躍進”中各地浮誇風盛行,虛報誇大宣傳糧食產量,這些上報虛假“小麥衛星”、“水稻衛星”、“包穀衛星”、“烤煙衛星”等在各行各業中發生的類似行為被統一稱為“放衛星”。 你放,別人不放,你就得到提拔了。 別人放,你不放,你就被免職了。 那麼,你是放,還是不放?

類似的還有偷懶博弈。 例如:人民公社的偷懶博弈(即:偷懶的收益是獨享的,偷懶的損失是共同承擔。) 你是偷懶,還是不偷懶?

兩個概念:

佔優策略:

是指無論其他參與者採取什麼策略,某參與者採用該策略的結果都優於其他策略。

佔優策略均衡:

是指由博弈中的所有參與者的佔優策略組合所構成的均衡。

參照囚徒困境,在無法信任彼此的情況下,坦白是各自的佔優策略。

特別提示:

很多時候均衡的結果跟事實真相沒有關係。 遊戲規則決定遊戲的結局。

2.囚犯困境的定義及原因分析

一般條件下的囚犯困境 在這裡插入圖片描述 (1)一般條件下的囚犯困境 1、雙方都有佔優策略,即: a1>a3,a2>a4,b1>b2,b3>b4 在a1>a3,a2>a4的條件下,張三選擇背叛是佔優策略; 在b1>b2,b3>b4的條件下,李四選擇背叛是佔優策略。 2、存在一個合作解,使雙方的收益都優於其 在佔優策略均衡下的收益, 即: a1<a4,b1<b4

如果雙方能夠選擇合作,本可以得到更好的結果。

(2) 對稱條件下的囚犯困境 在這裡插入圖片描述 在一個2人雙策略對稱博弈中,如果滿足以下條件:P>S>R>T,那麼其佔優策略均衡(R,R)就構成了囚犯困境。(個人理性與集體非理性)

囚徒困境的原因分析:

表面上看,囚犯對自身利益的追求是導致囚犯困境的原因, 其實,真正的原因是:囚犯們在追求自身利益的同時,以更多的損害他人利益為代價。

君子愛財,取之以道

囚犯困境的根本原因在於:私人成本與社會成本的差異,即個人行為的負外部性。

負外部性,也稱外部成本或外部不經濟,是指一個人的行為或企業的行為影響了其他人或企業,使之支付了額外的成本費用,但後者又無法獲得相應補償的現象。或是對交易雙方之外的第三者所帶來的未在價格中得以反映的成本費用。 例如:汽車廢氣,對車本身是好的,但是對於他人而言是煙霧。

相反的,還有正外部性。 例如:修復歷史建築

特別提示: 損人利已和損己利人本質上是一樣的,是一個硬幣的正反兩面;從一方面來看是損己利人的行為,在另一方來看是損人利已的行為,問題的關鍵是所損(失)的部分和所利(得)的部分哪個更多。

盜竊與搶劫,一線之隔。

如果有一種制度,在該制度下,每個人都只能通過利人才能實現利己的目標,這一定是一種好的制度。(市場的邏輯)

最近,螞蟻森林的給好友澆水得雙十一碼,是一種好的遊戲規則。

3.真實世界的囚犯困境

① 經濟大蕭條; ② 價格戰(貨比三家); ③ 獨裁與多數人的懦弱; ④ 民主與多數人的暴政(民主必須與法治(不是法制)相輔相成,才能避免多數人的暴政。法治:rule of law;法制:rule by law) eg:希特勒的上臺

美國波士頓猶太人紀念碑上,一段德國新教神父馬丁·尼莫拉的懺悔: 起初他們追殺共產主義者, 我不是共產主義者, 我不說話; 接著他們追殺猶太人, 我不是猶太人, 我不說話; 後來他們追殺工會成員, 我不是工會會員, 我繼續不說話; 此後他們追殺天主教徒, 我不是天主教徒, 我還是不說話; 最後,他們奔我而來, ------這時再沒有人站起來為我說話了。

聯想近日的重慶萬州公交車墜江案,公交車上的其他乘客是否需要站起來說話?

4.如何破解囚徒困境

4.1 如何利用他人的囚犯困境 ① 貨比三家 --選擇最優價格 ② 分而治之 --保有權力

4.2 如何破解囚犯困境 ① 道德教化(文化建設)

社會學基本定理 金迪斯(H. Gintis) :如果一個社會都是由自利主義者構成的,那麼,長期而言,這個社會將消亡。而如果一個社會,通過“說服教育”以及其他說教機構的努力,長期保持一定比例的利他主義者,它就能夠穩定地繁衍下去。((羅森塞蜈蚣博弈(Rosenthsal,1981))) ② 財產私有(制度建設) 圈地運動(土地70年產權) <–> 人民公社的消亡 (兩個相反的案例) ③ 溫故知新 讓歷史告訴未來(重複博弈)

特別提問:

1.你願意被搭便車嗎? 2.搭便車後,你願意給對方費用嗎? 3.如何讓別人願意和你合作?