博弈論概述 (轉自百度百科)
阿新 • • 發佈:2019-01-08
編輯本段歷史
約翰·馮·諾依曼
博弈論是二人在平等的對局中各自利用對方的策略變換自己的對抗策略,達到取勝的目的。博弈論思想古已有之,我國古代的《孫子兵法》就不僅是一部軍事著作,而且算是最早的一部博弈論著作。博弈論最初主要研究象棋、橋牌、賭博中的勝負問題,人們對博弈局勢的把握只停留在經驗上,沒有向理論化發展。 博弈論考慮遊戲中的個體的預測行為和實際行為,並研究它們的優化策略。 近代對於博弈論的研究,開始於策墨洛(Zermelo),波雷爾(Borel)及馮·諾伊曼(von Neumann)。 1928年,馮·諾依曼證明了博弈論的基本原理,從而宣告了博弈論的正式誕生。1944年,馮·諾依曼和摩根斯坦共著的劃時代鉅著《策墨洛(Zermelo)
基礎。納什的開創性論文《n人博弈的均衡點》(1950),《非合作博弈》(1951)等等,給出了納什均衡的概念和均衡存在定理。此外,塞爾頓、哈桑尼的研究也對博弈論發展起到推動作用。今天博弈論已發展成一門較完善的學科。 21世紀,應站在博弈論的前沿。儘管博弈經濟學家很少,但其獲諾貝爾獎的比例最高。最能震動人類情感的是博弈,對未來最有影響力的還是博弈。 博弈論(Game Theory)和編輯本段博弈論定義
博弈論的定義:Definition of the game theory: 我們把動物利用大自然移動的癮魂,在決策人期待的空間裡,形成相對均衡的語文學理論,稱為博弈論。 (摘自《博弈聖經》中《人類未知的藍色檔案》一文)。 The theory of relative balance about the mobile addicts and soul of animals in the nature and in the expectation of decision makers is called the game theory. (quoted from the article “The Blue Files Unknown to Humankind” in Bible of Game Theory 編輯本段博弈論 - 博弈論的發展
對博弈論的研究可以追溯到19世紀,甚至更早。對於博弈論的研究,開始於策墨洛(Zermelo,1913),波雷爾(Borel,1921)及馮·諾伊曼(von Neumann, 1928),後來由馮·諾伊曼和奧斯卡·摩根斯坦(von Neumann and Morgenstern,1944,1947)(《博弈論與經濟行為》)首次對其系統化和形式化(參照Myerson, 1991)。隨後約翰·福布斯·納什(John Forbes Nash Jr., 1950, 1951)利用不動點定理證明了均衡點的存在,為博弈論的一般化奠定了堅實的基礎。 直至《博弈聖經》的出現, 《博弈聖經》與原有博弈論書籍最大的不同就在於,獨創了國正論、國正雙贏理論和粒子行為論,書中博弈取勝的文化理論統一了人類的博弈佔優行為。更重要的是,它讓博弈理論終於可以在現實生活中具體操作,讓普通大眾通過研習,成為真正的博弈高手。因此, 《博弈聖經》中的博弈理論在政治、經濟、文化、生活、娛樂等社會的各個領域具有可應用性,並且對於個人的工作、生活也有具體的指導意義。此外,塞爾頓、哈桑尼的研究也對博弈論發展起到推動作用。今天博弈論已發展成一門較完善的的學科。 我們應用科學發展觀的博弈哲學思想,闡明瞭博弈論、矛盾論、概率論的戰術性質。 博弈論是二人對局,一個叫決策人,一個稱對抗者。 矛盾論是兩個同性質的二人對決。 概率論則是通過二人對局的個數之比得出。 博弈論、矛盾論、概率論各自都是兩個相同性質的對決只能提供經驗,只有對實體與性質的區分才能稱為知識。西方文化大宗教理論都是極其渺小的個體性質的戰術屬性,決不能處理博弈實體裡的戰略。在任何博弈實體的系統裡,在具體事件中,用矛盾論建立的二人博弈對局都是在悖論中自圓其說,都不能通達博弈實體的事實真相。博弈論、矛盾論、概率論這些文化大宗教理論已經不能解決未來博弈實體裡的文明,到了極不正常的歷史死亡階段。因為這些抄來抄去的非物質文化概念,界定模糊,無法定性,無法區分,無法操作,無法驗證,不能證明,又不能證偽。它讓人沒有自在,沒有自我,沒有哲學,更沒有科學。科學不是為哪個階級服務的,科學是大自然前進的規則,科學又像似監工,《博弈聖經》中說:“科學是專門批判他人的。”任何邪惡和迷信都會後退,科學的任務是如實地讓人們認識自然本來的面貌。粒子行為論、國正論、國邊常數1.992187是對政府和人民的提醒,也是讓懷疑論者百口難辨。博弈基因取勝的理論會引發更多人對戰略文化的思考。
編輯本段博弈論與諾貝爾獎
博弈論已經成為經濟學的標準分析工具之一。從1994年諾貝爾經濟學獎授予3位博弈論專家開始,共有5屆的諾貝爾經濟學獎與博弈論的研究有關,分別為: 1994年,授予美國伯克利加利福尼亞大學的約翰·海薩尼(J.Narsanyi)、普林斯頓大學約翰·納什(J.Nash)和德國波恩大學的賴因哈德·澤爾滕(Reinhard Selten)。 1996年,授予英國劍橋大學的 詹姆斯·莫里斯(James A. Mirrlees)與美國哥倫比亞大學的威廉·維克瑞(William Vickrey)。 2001年,授予美國加州大學伯克萊分校的喬治·阿克爾洛夫(George A. Akerlof )生於1940年、美國斯坦福大學的邁克爾·斯賓塞(A. Michael Spence )和美國紐約哥倫比亞大學的約瑟夫·斯蒂格利茨(Joseph E. Stiglitz)。 2005年,授予美國馬里蘭大學的托馬斯·克羅姆比·謝林 (Thomas Crombie Schelling)和耶路撒冷希伯來大學的羅伯特·約翰·奧曼(Robert John Aumann)。 2007年,授予美國明尼蘇達大學的里奧尼德·赫維茨(Leonid Hurwicz)、美國普林斯頓大學的埃裡克·馬斯金(Eric S. Maskin)以及美國芝加哥大學的羅傑·邁爾森(Roger B. Myerson)。 作為一門工具學科能夠在經濟學中如此廣泛運用並得到學界垂青實為罕見。編輯本段博弈論的基本概念
博弈要素: (1)決策人:在博弈中率先作出決策的一方,這一方往往依據自身的感受、經驗和表面狀態優先採取一種有方向性的行動。 (2) 對抗者:在博弈二人對局中行動滯後的那個人,與決策人要作出基本反面的決定,並且他的動作是滯後的、預設的、被動的,但最終佔優。他的策略可能依賴於決策人劣勢的策略選擇,佔去空間特性,因此對抗是唯一佔優的方式,實為領導人的階段性終結行為。 (3)局中人(players):在一場競賽或博弈中,每一個有決策權的參與者成為一個局中人。只有兩個局中人的博弈現象稱為“兩人博弈”,而多於兩個局中人的博弈稱為 “多人博弈”。 (4)策略(strategies):一局博弈中,每個局中人都有選擇實際可行的完整的行動方案,即方案不是某階段的行動方案,而是指導整個行動的一個方案,一個局中人的一個可行的自始至終全域性籌劃的一個行動方案,稱為這個局中人的一個策略。如果在一個博弈中局中人都總共有有限個策略,則稱為“有限博弈”,否則稱為“無限博弈”。 (5)得失(payoffs):一局博弈結局時的結果稱為得失。每個局中人在一局博弈結束時的得失,不僅與該局中人自身所選擇的策略有關,而且與全域性中人所取定的一組策略有關。所以,一局博弈結束時每個局中人的“得失”是全體局中人所取定的一組策略的函式,通常稱為支付(payoff)函式。 (6)次序(orders):各博弈方的決策有先後之分,且一個博弈方要作不止一次的決策選擇,就出現了次序問題;其他要素相同次序不同,博弈就不同。 (7)博弈涉及到均衡:均衡是平衡的意思,在經濟學中,均衡意即相關量處於穩定值。在供求關係中,某一商品市場如果在某一價格下,想以此價格買此商品的人均能買到,而想賣的人均能賣出,此時我們就說,該商品的供求達到了均衡。所謂納什均衡,它是一穩定的博弈結果。 納什均衡(Nash Equilibrium):在一策略組合中,所有的參與者面臨這樣一種情況,當其他人不改變策略時,他此時的策略是最好的。也就是說,此時如果他改變策略他的支付將會降低。在納什均衡點上,每一個理性的參與者都不會有單獨改變策略的衝動。納什均衡點存在性證明的前提是“博弈均衡偶”概念的提出。所謂“均衡偶”是在二人零和博弈中,當局中人A採取其最優策略a*,局中人B也採取其最優策略b*,如果局中人B仍採取b*,而局中人A卻採取另一種策略a,那麼局中人A的支付不會超過他採取原來的策略a*的支付。這一結果對局中人B亦是如此。 這樣,“均衡偶”的明確定義為:一對策略a*(屬於策略集A)和策略b*(屬於策略集B)稱之為均衡偶,對任一策略a(屬於策略集A)和策略b(屬於策略集B),總有:偶對(a, b*)≤偶對(a*,b*)≥偶對(a*,b)。 對於非零和博弈也有如下定義:一對策略a*(屬於策略集A)和策略b*(屬於策略集B)稱為非零和博弈的均衡偶,對任一策略a(屬於策略集A)和策略 b(屬於策略集B),總有:對局中人A的偶對(a, b*) ≤偶對(a*,b*);對局中人B的偶對(a*,b)≤偶對(a*,b*)。 有了上述定義,就立即得到納什定理: 任何具有有限純策略的二人博弈至少有一個均衡偶。這一均衡偶就稱為納什均衡點。 納什定理的嚴格證明要用到不動點理論,不動點理論是經濟均衡研究的主要工具。通俗地說,尋找均衡點的存在性等價於找到博弈的不動點。 納什均衡點概念提供了一種非常重要的分析手段,使博弈論研究可以在一個博弈結構裡尋找比較有意義的結果。 但納什均衡點定義只侷限於任何局中人不想單方面變換策略,而忽視了其他局中人改變策略的可能性,因此,在很多情況下,納什均衡點的結論缺乏說服力,研究者們形象地稱之為“天真可愛的納什均衡點”。 塞爾頓(R·Selten)在多個均衡中剔除一些按照一定規則不合理的均衡點,從而形成了兩個均衡的精煉概念:子博弈完全均衡和顫抖的手完美均衡。夏普里值
考慮這樣一個合作博弈:a、b、c、投票決定如何分配100萬,他們分別擁有50%、40%、10%的權力,規則規定,當超過50%的票認可了某種方案時才能通過。那麼如何分配才是合理的呢?按票力分配,a50萬、b40萬、c10萬c向a提出:a70萬、b0、c30萬b向a提出:a80萬、b20萬、c0…… 權力指數:每個決策者在決策時的權力體現在他在形成的獲勝聯盟中的“關鍵加入者”的個數,這個“關鍵加入者”的個數就被稱為權利指數。 夏普里值(Shapley value):在各種可能的聯盟次序下,參與者對聯盟的邊際貢獻之和除以各種可能的聯盟組合。 次序 abc acb bac bca cab cba 關鍵加入者 b c a a a a 由此計算出a,b,c的夏普里值分別為4/6,1/6,1/6 所以a,b,c應分別獲得100萬的2/3,1/6,1/6智豬博弈
智豬博弈(Pigs’payoffs)講的是:豬圈裡有兩頭豬,一頭大豬,一頭小豬。豬圈的一邊有個踏板,每踩一下踏板,在遠離踏板的豬圈的另一邊的投食口就會落下少量的食物。如果有一隻豬去踩踏板,另一隻豬就有機會搶先吃到另一邊落下的食物。當小豬踩動踏板時,大豬會在小豬跑到食槽之前剛好吃光所有的食物;若是大豬踩動了踏板,則還有機會在小豬吃完落下的食物之前跑到食槽,爭吃到另一半殘羹。 那麼,兩隻豬各會採取什麼策略?答案是:小豬將選擇“搭便車”策略,也就是舒舒服服地等在食槽邊;而大豬則為一點殘羹不知疲倦地奔忙於踏板和食槽之間。 原因何在?因為,小豬踩踏板將一無所獲,不踩踏板反而能吃上食物。對小豬而言,無論大豬是否踩動踏板,不踩踏板總是好的選擇。反觀大豬,已明知小豬是不會去踩動踏板的,自己親自去踩踏板總比不踩強吧,所以只好親力親為了。 “小豬躺著大豬跑”的現象是由於故事中的遊戲規則所導致的。規則的核心指標是:每次落下的食物數量和踏板與投食口之間的距離。 如果改變一下核心指標,豬圈裡還會出現同樣的“小豬躺著大豬跑”的景象嗎?試試看。 改變方案一:減量方案。投食僅原來的一半分量。結果是小豬大豬都不去踩踏板了。小豬去踩,大豬將會把食物吃完;大豬去踩,小豬將也會把食物吃完。誰去踩踏板,就意味著為對方貢獻食物,所以誰也不會有踩踏板的動力了。 如果目的是想讓豬們去多踩踏板,這個遊戲規則的設計顯然是失敗的。 改變方案二:增量方案。投食為原來的一倍分量。結果是小豬、大豬都會去踩踏板。誰想吃,誰就會去踩踏板。反正對方不會一次把食物吃完。小豬和大豬相當於生活在物質相對豐富的“共產主義”社會,所以競爭意識卻不會很強。 對於遊戲規則的設計者來說,這個規則的成本相當高(每次提供雙份的食物);而且因為競爭不強烈,想讓豬們去多踩踏板的效果並不好。 改變方案三:減量加移位方案。投食僅原來的一半分量,但同時將投食口移到踏板附近。結果呢,小豬和大豬都在拼命地搶著踩踏板。等待者不得食,而多勞者多得。每次的收穫剛好消費完。 對於遊戲設計者,這是一個最好的方案。成本不高,但收穫最大。 原版的“智豬博弈”故事給了競爭中的弱者(小豬)以等待為最佳策略的啟發。但是對於社會而言,因為小豬未能參與競爭,小豬搭便車時的社會資源配置的並不是最佳狀態。為使資源最有效配置,規則的設計者是不願看見有人搭便車的,政府如此,公司的老闆也是如此。而能否完全杜絕“搭便車”現象,就要看遊戲規則的核心指標設定是否合適了。 比如,公司的激勵制度設計,獎勵力度太大,又是持股,又是期權,公司職員個個都成了百萬富翁,成本高不說,員工的積極性並不一定很高。這相當於“智豬博弈”增量方案所描述的情形。但是如果獎勵力度不大,而且見者有份(不勞動的“小豬”也有),一度十分努力的大豬也不會有動力了----就象“智豬博弈”減量方案一所描述的情形。最好的激勵機制設計就象改變方案三----減量加移位的辦法,獎勵並非人人有份,而是直接針對個人(如業務按比例提成),既節約了成本(對公司而言),又消除了“搭便車”現象,能實現有效的激勵。 許多人並未讀過“智豬博弈”的故事,但是卻在自覺地使用小豬的策略。股市上等待莊家擡轎的散戶;等待產業市場中出現具有贏利能力新產品、繼而大舉仿製牟取暴利的遊資;公司裡不創造效益但分享成果的人,等等。因此,對於制訂各種經濟管理的遊戲規則的人,必須深諳“智豬博弈”指標改變的箇中道理。編輯本段博弈的型別
博弈的分類根據不同的基準也有不同的分類。一般認為,博弈主要可以分為合作博弈和非合作博弈。 合作博弈和非合作博弈的區別在於相互發生作用的當事人之間有沒有一個具有約束力的協議,如果有,就是合作博弈,如果沒有,就是非合作博弈。 從行為的時間序列性,博弈論進一步分為靜態博弈、動態博弈兩類: 靜態博弈是指在博弈中,參與人同時選擇或雖非同時選擇但後行動者並不知道先行動者採取了什麼具體行動; 動態博弈是指在博弈中,參與人的行動有先後順序,且後行動者能夠觀察到先行動者所選擇的行動。通俗的理解:"囚徒困境"就是同時決策的,屬於靜態博弈;而棋牌類遊戲等決策或行動有先後次序的,屬於動態博弈 按照參與人對其他參與人的瞭解程度分為完全資訊博弈和不完全資訊博弈。 完全博弈是指在博弈過程中,每一位參與人對其他參與人的特徵、策略空間及收益函式有準確的資訊。 不完全資訊博弈是指如果參與人對其他參與人的特徵、策略空間及收益函式資訊瞭解的不夠準確、或者不是對所有參與人的特徵、策略空間及收益函式都有準確的資訊,在這種情況下進行的博弈就是不完全資訊博弈。 目前經濟學家們現在所談的博弈論一般是指非合作博弈,由於合作博弈論比非合作博弈論複雜,在理論上的成熟度遠遠不如非合作博弈論。非合作博弈又分為:完全資訊靜態博弈,完全資訊動態博弈,不完全資訊靜態博弈,不完全資訊動態博弈。與上述四種博弈相對應的均衡概念為:納什均衡(Nash equilibrium),子博弈精煉納什均衡(subgame perfect Nash equilibrium),貝葉斯納什均衡(Bayesian Nash equilibrium),精煉貝葉斯納什均衡(perfect Bayesian Nash equilibrium)。 博弈論還有很多分類,比如:以博弈進行的次數或者持續長短可以分為有限博弈和無限博弈;以表現形式也可以分為一般型(戰略型)或者展開型,等等。編輯本段意義
博弈論的研究方法和其他許多利用數學工具研究社會經濟現象的學科一樣,都是從複雜的現象中抽象出基本的元素,對這些元素構成的數學模型進行分析,而後逐步引入對其形勢產影響的其他因素,從而分析其結果。 基於不同抽象水平,形成三種博弈表述方式,標準型、擴充套件型和特徵函式型利用這三種表述形式,可以研究形形色色的問題。因此,它被稱為“社會科學的數學”從理論上講,博弈論是研究理性的行動者相互作用的形式理論,而實際上正深入到經濟學、政治學、社會學等等,被各門社會科學所應用。 博弈論是指某個個人或是組織,面對一定的環境條件,在一定的規則約束下,依靠所掌握的資訊,從各自選擇的行為或是策略進行選擇並加以實施,並從各自取得相應結果或收益的過程,在經濟學上博弈論是個非常重要的理論概念。 什麼是博弈論?古語有云,世事如棋。生活中每個人如同棋手,其每一個行為如同在一張看不見的棋盤上佈一個子,精明慎重的棋手們相互揣摩、相互牽制,人人爭贏,下出諸多精彩紛呈、變化多端的棋局。博弈論是研究棋手們 “出棋” 著數中理性化、邏輯化的部分,並將其系統化為一門科學。換句話說,就是研究個體如何在錯綜複雜的相互影響中得出最合理的策略。事實上,博弈論正是衍生於古老的遊戲或曰博弈如象棋、撲克等。數學家們將具體的問題抽象化,通過建立自完備的邏輯框架、體系研究其規律及變化。這可不是件容易的事情,以最簡單的二人對弈為例,稍想一下便知此中大有玄妙:若假設雙方都精確地記得自己和對手的每一步棋且都是最“理性” 的棋手,甲出子的時候,為了贏棋,得仔細考慮乙的想法,而乙出子時也得考慮甲的想法,所以甲還得想到乙在想他的想法,乙當然也知道甲想到了他在想甲的想法… 面對如許重重迷霧,博弈論怎樣著手分析解決問題,怎樣對作為現實歸納的抽象數學問題求出最優解、從而為在理論上指導實踐提供可能性呢?現代博弈理論由匈牙利大數學家馮·諾伊曼於20世紀20年代開始創立,1944年他與經濟學家奧斯卡·摩根斯特恩合作出版的鉅著《博弈論與經濟行為》,標誌著現代系統博弈理論的初步形成。對於非合作、純競爭型博弈,諾伊曼所解決的只有二人零和博弈--好比兩個人下棋、或是打乒乓球,一個人贏一著則另一個人必輸一著,淨獲利為零。在這裡抽象化後的博弈問題是,已知參與者集合(兩方),策略集合(所有棋著),和盈利集合(贏子輸子),能否且如何找到一個理論上的“解” 或“平衡” ,也就是對參與雙方來說都最“合理” 、最優的具體策略?怎樣才是“合理” ?應用傳統決定論中的“最小最大” 準則,即博弈的每一方都假設對方的所有功略的根本目的是使自己最大程度地失利,並據此最優化自己的對策,諾伊曼從數學上證明,通過一定的線性運算,對於每一個二人零和博弈,都能夠找到一個“最小最大解” 。通過一定的線性運算,競爭雙方以概率分佈的形式隨機使用某套最優策略中的各個步驟,就可以最終達到彼此盈利最大且相當。當然,其隱含的意義在於,這套最優策略並不依賴於對手在博弈中的操作。用通俗的話說,這個著名的最小最大定理所體現的基本“理性” 思想是“抱最好的希望,做最壞的打算” 。 博弈論不僅僅存在於數學的運籌學中,也正在經濟學中佔據越來越重要的地位,但如果你認為博弈論的應用領域僅限於此的話,那你就大錯了。實際上,博弈論甚至在我們的工作和生活中無處不在!在工作中,你在和上司博弈,也在和下屬博弈,你也同樣會跟其他相關部門人員博弈;而要開展業務,你更是在和你的客戶以及競爭對手博弈。在生活中,博弈仍然無處不在。博弈論代表著一種全新的分析包羅·薩繆爾遜
方法和全新的思想。 諾貝爾經濟學獎獲得者包羅·薩繆爾遜如是說: 要想在現代社會做個有價值的人,你就必須對博弈論有個大致的瞭解。 也可以這樣說,要想贏得生意,不可不學博弈論;要想贏得生活,同樣不可不學博弈論。編輯本段應用舉例
納什均衡
1950年和1951年納什的兩篇關於非合作博弈論的重要論文,徹底改變了人們對競爭和市場的看法。他證明了非合作博弈及其均衡解,並證明了均衡解的存在性,即著名的納什均衡。從而揭示了博弈均衡與經濟均衡的內在聯絡。納什的研究奠定了現代非合作博弈論的基石,後來的博弈論研究基本上都沿著這條主線展開的。 1944年馮·諾依曼與奧斯卡·摩根斯特恩合著的鉅作《博弈論與經濟行為》出版,標誌著現代系統博弈理論的的初步形成。儘管對具有博弈性質的問題的研究可以追溯到19世紀甚至更早。例如,1838年古諾(Cournot)簡單雙寡頭壟斷博弈;1883年伯特蘭和1925年艾奇沃奇思研究了兩個寡頭的產量與價格壟斷;2000多年前中國著名軍事家孫武的後代孫臏利用博弈論方法幫助田忌賽馬取勝等等都屬於早期博弈論的萌芽,其特點是零星的,片斷的研究,帶有很大的偶然性,很不繫統。馮·諾依曼和摩根斯特恩的《博弈論與經濟行為》一書中提出的標準型、擴充套件型和合作型博弈模型解的概念和分析方法,奠定了這門學科的理論基礎。合作型博弈在20世紀50年代達到了巔峰期。然而,諾依曼的博弈論的侷限性也日益暴露出來,由於它過於抽象,使應用範圍受到很大限制,在很長時間裡,人們對博弈論的研究知之甚少,只是少數數學家的專利,所以,影響力很有限。正是在這個時候,非合作博弈———“納什均衡”應運而生了,它標誌著博弈論的新時代的開始!納什不是一個按部就班的學生,他經常曠課。據他的同學們回憶,他們根本想不起來曾經什麼時候和納什一起完完整整地上過一門必修課,但納什爭辯說,至少上過斯蒂恩羅德的代數拓撲學。斯蒂恩羅德恰恰是這門學科的創立者,可是,沒上幾次課,納什就認定這門課不符合他的口味。於是,又走人了。然而,納什畢竟是一位英才天縱的非凡人物,他廣泛涉獵數學王國的每一個分支,如拓撲學、代數幾何學、邏輯學、博弈論等等,深深地為之著迷。納什經常顯示出他與眾不同的自信和自負,充滿咄咄逼人的學術野心。1950年整個夏天納什都忙於應付緊張的考試,他的博弈論研究工作被迫中斷,他感到這是莫大的浪費。殊不知這種暫時的“放棄”,使原來模糊、雜亂和無緒的若干念頭,在潛意識的持續思考下,逐步形成一條清晰的脈絡,突然來了靈感!這一年的10月,他驟感才思潮湧,妙筆生花。其中一個最耀眼的亮點就是日後被稱之為“納什均衡”的非合作博弈均衡的概念。納什的主要學術貢獻體現在1950年和1951年的兩篇論文之中(包括一篇博士論文)。1950年他才把自己的研究成果寫成題為“非合作博弈”的長篇博士論文,1950年11月刊登在美國全國科學院每月公報上,立即引起轟動。說起來這全靠師兄戴維·蓋爾之功,就在遭到馮·諾依曼貶低幾天之後,他遇到蓋爾,告訴他自己已經將馮·諾依曼的“最小最大原理”(minimax solution)推到非合作博弈領域,找到了普遍化的方法和均衡點。蓋爾聽得很認真,他終於意識到納什的思路比馮·諾伊曼的合作博弈的理論更能反映現實的情況,而對其嚴密優美的數學證明極為讚歎。蓋爾建議他馬上整理出來發表,以免被別人捷足先登。納什這個初出茅廬的小子,根本不知道競爭的險惡,從未想過要這麼做。結果還是蓋爾充當了他的“經紀人”,代為起草致科學院的簡訊,系主任列夫謝茨則親自將文稿遞交給科學院。納什寫的文章不多,就那麼幾篇,但已經足夠了,因為都是精品中的精品。這一點也是值得我們深思的。國內提一個教授,要求在“核心的刊物”上發表多少篇文章。按照這個標準可能納什還不一定夠資格。 1996年諾貝爾經濟學獎得主莫爾里斯當牛津大學艾奇沃思經濟學講座教授時也沒有發表過什麼文章,特殊的人才,必須有特殊的選拔辦法。 納什在上大學時就開始從事純數學的博弈論研究,1948年進入普林斯頓大學後更是如魚得水。20歲出頭已成為聞名世界的數學家。特別是在經濟博弈論領域,他做出了劃時代的貢獻,是繼馮·諾依曼之後最偉大的博弈論大師之一。他提出的著名的納什均衡的概念在非合作博弈理論中起著核心的作用。後續的研究者對博弈論的貢獻,都是建立在這一概念之上的。由於納什均衡的提出和不斷完善為博弈論廣泛應用於經濟學、管理學、社會學、政治學、軍事科學等領域奠定了堅實的理論基礎。囚徒困境
在博弈論中,含有佔優戰略均衡的一個著名例子是由塔克給出的“囚徒困境”(prisoners’ dilemma)博弈模型。該模型用一種特別的方式為我們講述了一個警察與小偷的故事。假設有兩個小偷A和B聯合犯事、私入民宅被警察抓住。警方將兩人分別置於不同的兩個房間內進行審訊,對每一個犯罪嫌疑人,警方給出的政策是:如果兩個犯罪嫌疑人都坦白了罪行,交出了贓物,於是證據確鑿,兩人都被判有罪,各被判刑8年;如果只有一個犯罪嫌疑人坦白,另一個人沒有坦白而是抵賴,則以妨礙公務罪(因已有證據表明其有罪)再加刑2年,而坦白者有功被減刑8年,立即釋放。如果兩人都抵賴,則警方因證據不足不能判兩人的偷竊罪,但可以私入民宅的罪名將兩人各判入獄1年。表2.2給出了這個博弈的支付矩陣。 表2.2 囚徒困境博弈 [Prisoner's dilemma]A╲B | 坦白 | 抵賴 |
坦白 | -8,-8 | 0,-10 |
抵賴 | -10,0 | -1,-1 |