2005年10月10日下午1時,瑞典皇家科學(xué)院常任秘書貢諾·厄奎斯特和諾貝爾經(jīng)濟(jì)學(xué)獎評委會主席約爾根·韋布爾一起來到皇家科學(xué)院議事廳。他們莊重地宣布,2005年諾貝爾經(jīng)濟(jì)學(xué)獎授予有以色列和美國雙重國籍的羅伯特·奧曼(Robert J.Aumann)和美國人托馬斯·謝林(Thomas C.Schelling),以表彰他們在博弈論領(lǐng)域做出的突出貢獻(xiàn)。他們將分享1000萬瑞典克朗(約130萬美元)的獎金。
為什么有些國家、團(tuán)體和個人可以和平地解決沖突,而另一些國家、團(tuán)體和個人卻不斷地被沖突困擾呢?
在說明他們的獲獎理由時,約爾根·韋布爾說:“為什么有些國家、團(tuán)體和個人可以和平地解決沖突,而另一些國家、團(tuán)體和個人卻不斷地被沖突困擾呢?感謝奧曼和謝林的研究,為這一自古以來困擾我們的問題帶來啟迪?!?/p>
博弈論(Game Theory)是研究理性的人們在合作和沖突中如何決策和行動的理論,最初開始于策墨洛(1913年)、波雷爾(1921年)和約翰·馮·諾伊曼(1928年)的研究工作。1944年,數(shù)學(xué)家約翰·馮·諾伊曼和經(jīng)濟(jì)學(xué)家奧斯卡·摩根斯坦合著了偉大的奠基性著作 《博弈論與經(jīng)濟(jì)行為》 ,概括了經(jīng)濟(jì)主體的典型行為特征,提出了策略型與廣義型等基本博弈模型、解的概念和主要分析方法,全面奠定了作為當(dāng)代經(jīng)濟(jì)學(xué)研究前沿的博弈論的理論基礎(chǔ)。
按照博弈參與方的相互合作與否,博弈論可以劃分為合作博弈與非合作博弈兩大研究領(lǐng)域。1994年納什(John Nash)、澤爾滕(Reinhard Selten)、海薩尼(JohnHarsanyi)憑借在非合作博弈方面的均衡分析方面做出的開創(chuàng)性的貢獻(xiàn),一起率先獲得了當(dāng)年諾貝爾經(jīng)濟(jì)學(xué)獎。這次奧曼和謝林作為博弈論學(xué)者再獲殊榮,則歸功于他們在合作博弈方面做出的出色研究與巧妙應(yīng)用。
當(dāng)年得獎的納什研究了什么
比奧曼他們早11年得獎的納什主要研究非合作博弈,即人們在不合作狀態(tài)下是如何進(jìn)行決策的。非合作博弈研究中最重要的概念之一就是納什均衡。著名的囚徒困境問題(Prison’s Dilemma)可以說明納什均衡這個所謂“完美均衡”的主要思想。
比如警方抓到了兩個罪犯,但是警察對于他們的罪行了解得不是非常清楚。這時,如果他們都招供了,按照罪行他們每人會被判5年徒刑;如果都不招供,根據(jù)警方實(shí)際掌握的證據(jù),只能每人判一年;但是如果其中一個人招供,另一個人不招供,則招供的人將被赦免不判刑,而拒不招供的人會被重判6年。
警方一開始就把這兩個罪犯分開關(guān)押。這時,每個罪犯都會盤算,在招供和不招供的兩個選擇中,如果自己招供了,而對方還沒有招供,那么自己可以被赦免不判刑。理性的他們都會選擇招供。這樣兩個人都招供了,根據(jù)他們自己招供的罪行,兩人都被判5年刑。
我們可以發(fā)現(xiàn)這兩個聰明的罪犯,為了減輕對自己的處罰,從個人利益最大化出發(fā),理性地選擇了招供,而最終自作自受地把自己處于被判5年徒刑的糟糕結(jié)局中。那么他們當(dāng)初的選擇錯了嗎?為什么當(dāng)初的如意算盤會落空!
按照納什非合作博弈的觀點(diǎn),這兩個罪犯最終的結(jié)果必然就是這種“聰明反被聰明誤”的下場。
奧曼這次為什么會得獎
可是這種“聰明的錯誤”在現(xiàn)實(shí)世界中好像并不普遍,更多的情況是這兩個罪犯都拒不招供,最終往往是警方根據(jù)掌握的證據(jù)只能使每個人被判一年徒刑。這是為什么呢?
按照奧曼的研究,對博弈當(dāng)事人之間長期互動的性質(zhì)進(jìn)行考察后可以發(fā)現(xiàn),博弈的不同階段是相互依賴的,其結(jié)果是理性博弈當(dāng)事人的決策不僅受到其過去經(jīng)歷的影響,而且還要受未來潛在可能性的影響。對于那兩個罪犯而言,雖然可能在一些困境中大家會“聰明反被聰明誤”。但是,在某一次選擇中,雙方都可能“慷慨”一次而“不自私”地選擇不招供。他們事后卻發(fā)現(xiàn),最后的結(jié)果反而會比招供更好,這樣在以后他們就很容易做出同時拒不招供的默契。
在現(xiàn)實(shí)生活中,這種適當(dāng)“不理性”的“慷慨”而使得自己的利益增加的情況仿佛更多。這就是奧曼所研究的重復(fù)合作博弈的一個簡單示意。
在諾貝爾經(jīng)濟(jì)學(xué)獎頒獎典禮上,頒獎嘉賓稱頌奧曼,“羅伯特·奧曼是正式對所謂‘無限重復(fù)博弈’作全面分析的第一人。他的研究準(zhǔn)確確認(rèn)了倚賴于長期關(guān)系,一段時間內(nèi)可以維持什么樣的結(jié)果?!?/p>
在研究重復(fù)博弈中,奧曼提出了“強(qiáng)均衡”概念,即任何參與博弈的人都不可能通過單方面改變策略來增加其收益。對于那兩個罪犯而言,他們都不可能通過招供使得自己的處罰變輕。
“公共地的悲劇”同樣也可以說明他的思想。比如大家出海打魚,竭澤而漁,魚很快就會沒有了。這時大家相互之間的矛盾沖突也很多,但是相互達(dá)成“捕魚協(xié)議”的可能性也就更大了。
奧曼認(rèn)為重復(fù)博弈是一個討價還價的過程,為此他設(shè)計了一個討價還價模型把最初當(dāng)作外生變量的議價者之間的溝通與交流內(nèi)生化。同時,他還在一般均衡分析、最優(yōu)配置、非線性系統(tǒng)、控制論、測度理論、不動點(diǎn)理論等方面進(jìn)行了大量的基礎(chǔ)性研究,其成果被廣泛應(yīng)用于經(jīng)濟(jì)學(xué)、數(shù)學(xué)、運(yùn)籌學(xué)等諸多領(lǐng)域。
20世紀(jì)80年代以后,博弈論研究取得了飛速進(jìn)展,作為研究前沿在經(jīng)濟(jì)學(xué)領(lǐng)域中日益顯貴。這不少都應(yīng)該歸功于奧曼的功勞。他所做那些基礎(chǔ)性的研究工作,就博弈論的核心問題所進(jìn)行的開創(chuàng)性研究,深刻地影響并推動了博弈論研究的發(fā)展。此外,他還培養(yǎng)了Hart、Kreps和Tauman等一大批優(yōu)秀的經(jīng)濟(jì)學(xué)家。
目前奧曼任耶路撒冷希伯萊大學(xué)理性分析中心教授、紐約州立大學(xué)斯坦尼分校經(jīng)濟(jì)系和決策科學(xué)院教授、以色列數(shù)學(xué)俱樂部主席、美國經(jīng)濟(jì)聯(lián)合會榮譽(yù)會員等。同時,他還擔(dān)任《國際對策論》雜志(IJGT)、《數(shù)理經(jīng)濟(jì)學(xué)》雜志、《經(jīng)濟(jì)學(xué)理論》雜志、《運(yùn)籌學(xué)數(shù)學(xué)》等多家學(xué)術(shù)刊物的編輯,并先后獲得以色列頒發(fā)的科學(xué)技術(shù)哈維獎和經(jīng)濟(jì)學(xué)獎。
謝林運(yùn)用博弈論分析了些什么
不同于奧曼運(yùn)用數(shù)學(xué)進(jìn)行了大量博弈論基礎(chǔ)性理論研究工作,謝林更多地從經(jīng)濟(jì)學(xué)的角度應(yīng)用博弈論理論來分析現(xiàn)實(shí)問題。本屆諾貝爾評獎委員對他的評價是:“謝林,這位自稱‘周游不定的經(jīng)濟(jì)學(xué)家’,被證明是一位非常杰出、具有開創(chuàng)性的探險者?!?/p>
謝林在談到自己和奧曼之間的區(qū)別時也說到:“我把自己看成是博弈論的使用者,而不是博弈論學(xué)者,能跟羅伯特·奧曼這位真正的博弈論學(xué)者共同獲此殊榮,我感到非常的榮幸?!?/p>
已經(jīng)85歲高齡的謝林是目前獲得諾貝爾經(jīng)濟(jì)學(xué)獎年紀(jì)最大的學(xué)者。他在1951年獲得哈佛大學(xué)經(jīng)濟(jì)學(xué)博士學(xué)位,在哈佛大學(xué)肯尼迪政府學(xué)院擔(dān)任政治經(jīng)濟(jì)學(xué)教授,執(zhí)教長達(dá)20年,并獲得退休名譽(yù)教授的稱號。他還在美國馬里蘭大學(xué)公共政策學(xué)院和經(jīng)濟(jì)系擔(dān)任教授。他教授的課程除包括經(jīng)濟(jì)學(xué)理論外,還涉及外交、國家安全、核戰(zhàn)略以及軍控等多個不同領(lǐng)域。他也是美國國家科學(xué)院和醫(yī)學(xué)院的榮譽(yù)會員及藝術(shù)科學(xué)學(xué)院會員,并擔(dān)任過美國經(jīng)濟(jì)學(xué)協(xié)會主席和東方經(jīng)濟(jì)學(xué)協(xié)會主席。獲得過RAND政策分析研究生院榮譽(yù)博士、塞德曼政治經(jīng)濟(jì)學(xué)大獎和國家科學(xué)院獎。
謝林作為當(dāng)代非主流經(jīng)濟(jì)學(xué)家的代表人物之一,對于事物的本質(zhì)有一種深刻的洞察。他的學(xué)術(shù)思想超越了主流經(jīng)濟(jì)學(xué)的“理性人”假設(shè),摒棄了用數(shù)學(xué)表示經(jīng)濟(jì)學(xué)理論的研究范式,創(chuàng)立并發(fā)展了“非數(shù)理博弈理論”,運(yùn)用精煉的語言和各種小模型,將博弈論的思想巧妙地運(yùn)用到了軍備控制、恐怖主義與犯罪、能源環(huán)境政策與氣候變化、種族隔離、供不應(yīng)求市場的分析、談判以及人群的相互行為等社會政治經(jīng)濟(jì)諸多領(lǐng)域。
他認(rèn)為討價還價是個非零和博弈,通過對該現(xiàn)象進(jìn)行深刻剖析,提出了一個不同于一般常識的結(jié)論:“在討價還價的過程中,勢弱的一方通常會成為強(qiáng)者?!?當(dāng)一方認(rèn)為對方不會作出讓步時,協(xié)議就達(dá)成了。一方之所以會讓步,是因?yàn)樗缹Ψ揭呀?jīng)不可能讓步了。因此,我們可以認(rèn)為,談判的秘訣在于讓對方相信你不會再讓步了。對此我們也可以這樣理解,把自己放到不利的談判地位反而是有利的,即破釜沉舟反而可以轉(zhuǎn)敗為勝。
謝林的卓越睿智突出地體現(xiàn)在他于1960年發(fā)表的《沖突戰(zhàn)略》(The Strategy ofConflict)中運(yùn)用博弈論對國家之間的討價還價行為的分析。這本書也是國際關(guān)系領(lǐng)域最具有開創(chuàng)性的理論著作之一。書中他指出導(dǎo)致戰(zhàn)爭發(fā)生的原因是人們?nèi)媾袛嗪蟮臎Q定而不是偶然事件。如果一方堅信另一方會發(fā)動突然襲擊,戰(zhàn)爭就會爆發(fā);一方發(fā)動突然襲擊的原因在于確信對方?jīng)]有反擊能力,因此防止突然襲擊的辦法是給對方顯示自己具有還擊的能力。他還認(rèn)為,報復(fù)能力遠(yuǎn)比抵抗能力有用;具有不確定性的報復(fù)比可以確定的報復(fù)更具有威懾力。這些獨(dú)到的見解都被事實(shí)證明是解決國家沖突問題的上上簽。
他說“20世紀(jì)后50年最重要的一件事情是有一件事情沒有發(fā)生”,這是基于他對于核戰(zhàn)爭問題的精辟研究。在他另一本同樣具有重大影響的著作《武器與影響》中,謝林對軍備控制進(jìn)行了深入淺出的研究。他指出:最好的核武器分布是雙方都有還擊能力,即沒有一方可以一次性摧毀對方的還擊能力,和平的基礎(chǔ)就來自雙方都具有二次還擊的能力。在分析穩(wěn)定威懾問題時,他描述了一場西部牛仔決斗的場景,“如果雙方都確定自己在臨死之前能夠進(jìn)行有把握的準(zhǔn)確還擊,那么先開槍的一方將無任何優(yōu)勢而言,這樣也就無需害怕對方先開槍了”。
同時,基于自己的認(rèn)識,他還提出了使用核武器的諸多規(guī)矩。雖然艾森豪威爾政府認(rèn)為核武器和其他武器并沒有什么不同,但是肯尼迪政府采納了他的觀點(diǎn)。
另外,謝林還曾在美國戰(zhàn)爭學(xué)院給軍官們教授軍事戰(zhàn)略課程。由于他在軍事戰(zhàn)略方面所作出的理論貢獻(xiàn),哈特利與桑德勒在《國防經(jīng)濟(jì)學(xué)手冊》第4頁中寫道:“1960年,以三本當(dāng)代經(jīng)典著作的問世為標(biāo)志,國防經(jīng)濟(jì)學(xué)正式創(chuàng)立。……這三本著作是:查爾斯·希奇和羅蘭·麥基恩的《核時代的國防經(jīng)濟(jì)學(xué)》,劉易斯·理查森的《軍備與不安全》,托馬斯·謝林的《沖突戰(zhàn)略》。”
1988年美國經(jīng)濟(jì)學(xué)聯(lián)合會將謝林評為“杰出資深會員”,給他的評語是:“謝林關(guān)于社會關(guān)系的理論以及他對該理論多方面的應(yīng)用,源于他富有成效地將理論與實(shí)踐相結(jié)合。他有著異于常人的天賦,這使得他能切實(shí)涉及到有著相同或不同利益的參與人的社會和經(jīng)濟(jì)狀況的本質(zhì),并能具體而生動地把這種本質(zhì)描述出來”。