回顧人類的歷史,是戰(zhàn)爭的時期多還是和平的時期多?沒有查到這方面的準(zhǔn)確統(tǒng)計數(shù)據(jù)。即便是和平時期,人類的沖突與合作,哪個占的比例重?這個問題恐怕不需要統(tǒng)計數(shù)據(jù),人們也能感覺到結(jié)論。沖突與合作,這一人類古老的問題,可以說是整個社會科學(xué)研究的焦點,經(jīng)濟(jì)學(xué)也罷,社會學(xué)也罷,政治學(xué)、軍事學(xué)也罷。
當(dāng)一九九四年瑞典皇家科學(xué)院將諾貝爾經(jīng)濟(jì)學(xué)獎授予哈薩尼(Harsanyi,J.C.Jr)、納什(Nash,J.F.)、澤爾騰(Selten,R.)以后,曾經(jīng)發(fā)源于數(shù)學(xué)的博弈論,終于跳出了象牙塔,現(xiàn)在,“博弈”二字,已成人們的口頭禪。去年十月十日,一則消息又與博弈論聯(lián)系在了一起,二○○五年度諾貝爾經(jīng)濟(jì)學(xué)獎再度授予兩位博弈論學(xué)者,以色列希伯來大學(xué)理性研究中心的奧曼(Robert, J. Aumann)和美國馬里蘭大學(xué)公共政策學(xué)院、經(jīng)濟(jì)系的謝林(Thomas C. Schelling),以表彰他們“通過博弈分析使人們增強(qiáng)了對沖突和合作的理解”所作的貢獻(xiàn)。博弈論,已經(jīng)成為經(jīng)濟(jì)分析的一個重要工具。
博弈分析的思想盡管早在古諾(Cournot, A. A.)對寡頭的分析中已見萌芽,但博弈論的正式提出則是馮·諾伊曼(von Neumann, J.)和摩根斯坦恩(Morgenstern, O.)一九四四年出版的巨著《博弈論與經(jīng)濟(jì)行為》,而現(xiàn)代博弈論的建立則應(yīng)歸功于納什的研究工作,納什奠定了非合作博弈的一般理論和合作博弈的談判理論的基礎(chǔ),納什均衡已成為博弈論中的經(jīng)典概念。
納什曾這樣區(qū)分合作博弈與非合作博弈:“馮·諾伊曼與摩根斯坦恩發(fā)展的合作博弈理論,是對局中人可能形成的各式各樣的聯(lián)盟的相互關(guān)系的分析,而非合作博弈的假設(shè)則是,每個局中人獨(dú)立行動,與任何別的局中人都不合作或不溝通?!焙髞淼倪M(jìn)一步研究表明,局中人之間是否溝通并不是根本的依據(jù),關(guān)鍵是能否達(dá)成協(xié)議以及協(xié)議是否有約束力。比如歐佩克,定期要對各成員國的產(chǎn)量進(jìn)行談判,應(yīng)該說是各局中人是相互溝通了的,但為什么又要定期談判呢,是因為總是有局中人要擅自偏離協(xié)議,也就是說,協(xié)議的約束力有問題。因此,現(xiàn)在的經(jīng)濟(jì)學(xué)家根據(jù)局中人在相互作用過程中能否達(dá)成一個具有約束力的協(xié)議,把博弈劃分為非合作博弈與合作博弈兩個大類,而不是簡單地根據(jù)研究的問題是沖突還是合作來劃分。無論沖突問題還是合作問題,都可以是非合作博弈論研究的范疇。沖突與合作是彼此關(guān)聯(lián)的,要研究合作問題,必然要以研究沖突為基礎(chǔ);而研究沖突問題,則希望能夠通過博弈規(guī)則,建立局中人之間的合作關(guān)系,以避免沖突對福利的損失。
如果從最基本的假設(shè)前提來看,也可以根據(jù)是以個人理性為基礎(chǔ)還是以集體理性為基礎(chǔ),把博弈區(qū)分為非合作博弈與合作博弈。如果博弈是建立在個人理性的基礎(chǔ)上的,則是非合作博弈研究的范疇,而如果是建立在集體理性的基礎(chǔ)上的,則屬于合作博弈。
現(xiàn)在,經(jīng)濟(jì)學(xué)家談到博弈論,一般指非合作博弈,這是因為納什等人建立的現(xiàn)代博弈理論,就是非合作博弈論,這已經(jīng)成為博弈分析的主流。而且,從現(xiàn)實情況來看,如果沒有一個有效的約束機(jī)制,局中人的個人理性肯定占上風(fēng),結(jié)果往往是不合作。
但作為博弈研究的“另一半”,合作博弈理論也受到部分經(jīng)濟(jì)學(xué)家的重視,比如此次獲獎的奧曼,就是因為在合作博弈理論方面的貢獻(xiàn)而獲獎的,正如博弈論專家克瑞普斯(Kreps,D.)和魯賓斯坦(Rubinstein,A.)一九九七年在為庫恩選編的《博弈論經(jīng)典文獻(xiàn)》一書所寫的評論中所預(yù)言的:雖然目前合作博弈理論還沒有對經(jīng)濟(jì)學(xué)家產(chǎn)生廣泛的影響,但將來肯定會產(chǎn)生影響。
從博弈論發(fā)展的歷史來看,早期研究的零和博弈,是典型的非合作博弈,研究的是嚴(yán)格競爭的情況,不存在合作的可能;到了馮·諾伊曼和摩根斯坦恩的《博弈論與經(jīng)濟(jì)行為》一書,則除了詳盡論述前面的嚴(yán)格競爭理論外,開辟了全新的研究方向,包括合作博弈的觀念、它的聯(lián)盟形式、馮·諾伊曼-摩根斯坦恩穩(wěn)定集(也稱馮·諾伊曼-摩根斯坦恩解)等;納什的研究,則奠定了非合作博弈理論的基礎(chǔ),所以,公認(rèn)為是現(xiàn)代博弈論的奠基者。奧曼對合作博弈的研究,為現(xiàn)代博弈論開拓了新的研究領(lǐng)域。
博弈論分析的是理性人之間的互動行為,其基本假設(shè)仍然是古典經(jīng)濟(jì)學(xué)中的理性人假設(shè),即每個局中人都以自身利益的最大化為目的。這也是發(fā)源于數(shù)學(xué)的博弈論之所以能夠在經(jīng)濟(jì)學(xué)應(yīng)用最廣的原因。由于資源的稀缺性,換成博弈論的語言來說,就是博弈的支付(payoff)不可能完全符合局中人的意愿,更不可能完全符合每個局中人的意愿,因此,博弈的各方必然要為了自己的利益而考慮,這樣,博弈中的利益沖突就是必然存在的,著名的囚徒困境博弈反映的就是一個利益沖突問題,一個個人理性與集體理性之間的矛盾。
經(jīng)濟(jì)學(xué)家們自然不甘于這樣的選擇結(jié)果,希望能夠通過機(jī)制設(shè)計來避免利益損失,也就是博弈的局中人如何能夠合作,這就是合作的問題。比如囚徒困境,如果改變局中人的支付,比如黑社會的幫規(guī)(在黑社會,如果某成員告發(fā)了自己的同伙,那么,得到的將是死亡、親友被害等悲慘的結(jié)局,所以,黑社會成員往往能夠“守口如瓶”),那么,博弈的結(jié)果就會改變。如果不改變支付,而改變博弈規(guī)則,從一次博弈變?yōu)榇螖?shù)不確定的重復(fù)博弈,那么,博弈的結(jié)果也會改變。因此,人們有理由相信,通過機(jī)制設(shè)計,能夠得到長期合作的博弈結(jié)果。
沖突與合作問題,不僅僅是經(jīng)濟(jì)學(xué)研究的問題,也是其他眾多領(lǐng)域研究的問題,比如軍事、國家事務(wù)、社會問題、種族問題、宗教問題,甚至生物學(xué)、醫(yī)學(xué)問題。因此,這也是博弈論能夠在政治學(xué)、社會學(xué)、軍事學(xué)等眾多領(lǐng)域得到廣泛應(yīng)用的原因。
正如前述,沖突與合作,是人類的一個古老課題。人們不禁要問:為什么有的團(tuán)體成員能夠不斷地促進(jìn)合作,而另外的團(tuán)體則陷入沖突的深淵?奧曼和謝林為解決這一古老問題做出了自己的貢獻(xiàn),他們的理論已成為研究這一問題的主流方法,并且,其研究成果應(yīng)用于其他眾多學(xué)科,如社會學(xué)、犯罪學(xué)、軍事科學(xué)、環(huán)境科學(xué)、醫(yī)療保健學(xué)等。
如果要進(jìn)行劃分的話,那么,奧曼主要研究合作問題,而謝林主要研究沖突問題。當(dāng)然,謝林研究沖突問題的目的是為了減少沖突,而奧曼研究合作問題則是以對沖突的研究為基礎(chǔ)的。但無論是奧曼還是謝林,都認(rèn)為博弈論最重要的應(yīng)用在于對安全、裁軍、市場價格形成、經(jīng)濟(jì)與政治談判等的認(rèn)識和預(yù)測。
謝林一九二一年出生于美國奧克蘭,一九五一年獲哈佛大學(xué)經(jīng)濟(jì)學(xué)博士學(xué)位。謝林的研究領(lǐng)域非常廣泛,包括國外事務(wù),國家安全,核策略,軍隊控制,能源和環(huán)境政策,氣候變化,恐怖主義與組織犯罪,沖突和議價理論,種族隔離與融合,保健政策,煙草和毒品政策,公共政策和商業(yè)中的倫理問題等。
謝林的代表作是《沖突的策略》和《微觀動機(jī)與宏觀行為》,這些都已成為博弈論經(jīng)典。謝林在他的著作中,通過對人類的動機(jī)和行為的分析,指出了造成沖突的根本原因,是局中人的個人理性和集體理性的沖突。他在自己的著作中,通過對現(xiàn)實案例的深入淺出的分析,提出了人們?nèi)绾谓鉀Q沖突的系統(tǒng)的對策。他對沖突的分析框架,在社會科學(xué)各個學(xué)科中得到了廣泛的應(yīng)用,使沖突分析應(yīng)用到上述的廣泛研究領(lǐng)域。他的研究成果,影響了一代又一代的策略分析專家,對博弈論的發(fā)展產(chǎn)生了重要的影響。
二十世紀(jì)五十年代中期,謝林把博弈論應(yīng)用于對全球安全和軍備競賽的研究。謝林注意到,只要改變軍備競賽的規(guī)則,對不同情況下局中人的支付進(jìn)行系統(tǒng)的考慮,處境就會得到明顯的改善,并且,這也適用于其他有關(guān)沖突的決策問題。謝林特別注意到,局中人的談判能力受到很多因素的影響,比如局中人的初始選擇,局中人在博弈過程中影響自己和其他局中人的能力。他證明,通過限制自己的選擇范圍,甚至惡化自己的選擇,可以帶來優(yōu)勢,比如說破釜沉舟,可以置之死地而后生?!捌聘林邸毕喈?dāng)于給對方一個信號:我沒有退路了,我別無選擇,我只有兩種選擇,要么勝利,要么死亡,而我是不怕死的。當(dāng)對方認(rèn)為這個信號是可置信的,就會屈服,從而形成對自己有利的局面。中國有句俗話,叫“好人怕惡人”,其實就是因為惡人給人的信號是:我已經(jīng)做了很壞的打算,也做了很壞的選擇,我什么都不怕,你不可能什么都不怕吧。因為他是惡人,所以,他的這個信號在好人看來就是可置信的,好人一看,如果一旦形成壞人所預(yù)示的局面,那我的損失更大,于是只有屈服。但如果對方也是惡人,甚至是“更惡”的惡人,那惡人的這一套就會失效。所以,“兩軍相逢勇者勝”,其實這個“勇”字,也就是“惡”。
謝林在《沖突的策略》中提出了邊緣政策(brinkmanship)的概念,意思是,局中人故意制造一種可以辨認(rèn)的風(fēng)險,讓對方知道;并且要讓對方知道,這種風(fēng)險是我不能完全控制的;因此,一旦某種形勢出現(xiàn),不管我愿不愿意,我都只能越過邊緣界線,采取行動與他同歸于盡。這是一種威脅,但要創(chuàng)造條件使對方相信這種威脅是可置信的,因此,就要把自己推入一種看來不利的處境。比如美國的核威脅策略,就是典型的邊緣政策。一九六二年十月,前蘇聯(lián)在古巴布置核導(dǎo)彈,引發(fā)了古巴導(dǎo)彈危機(jī)。那兒距美國只有九十英里,對美國構(gòu)成了威脅。肯尼迪總統(tǒng)召集政要開會,經(jīng)過十天的討論,決定對古巴實行海上封鎖。如果前蘇聯(lián)接受這一挑戰(zhàn),那么,古巴導(dǎo)彈危機(jī)可能升級為美蘇之間的核戰(zhàn)爭。但蘇聯(lián)看到美國的“真動作”后,加之美國又通過秘密談判,說如果你怎么樣我會怎么樣,給前蘇聯(lián)兩種選擇:要么撤回導(dǎo)彈,我會給你好處,給你挽回面子;要么不撤回導(dǎo)彈,那大家只好干一仗,那雖然對我也不好,但對你更不好。善變的赫魯曉夫只好從古巴撤回導(dǎo)彈。當(dāng)然,美國也給了蘇聯(lián)面子,從土耳其撤回美國導(dǎo)彈。
謝林還證明了,對于局中人來說,報復(fù)的能力比抵抗的能力更有用,并且,不確定的報復(fù)比確定的報復(fù)更加可置信也更有效。如果是一次博弈,由于不存在報復(fù),所以,合作的可能性幾乎是不可能的。但如果是一種長期的關(guān)系,那么,局中人為了長期利益,可以在短期做出讓步,這也是為什么合作關(guān)系必須是在長期關(guān)系中才能建立的原因。這些洞見,被證明在解決沖突和避免戰(zhàn)爭等方面是非常中肯的。
謝林的研究促進(jìn)了博弈論的發(fā)展以及在整個社會科學(xué)中的應(yīng)用,他對策略承諾(strategic commitments)的分析能夠應(yīng)用于從企業(yè)競爭策略到政治權(quán)力的廣泛領(lǐng)域。他提出的可置信的威脅(credible threats)以及自我選擇限制(limitations on one’s own alternatives)等概念后來由澤爾騰公式化,他的關(guān)于合作的先決條件的公式引發(fā)了更廣泛的研究。謝林對沒有強(qiáng)烈利益沖突的情況下個人協(xié)調(diào)行為的能力進(jìn)行了研究,不成功的協(xié)調(diào)對于任何一方都會抬高成本。協(xié)調(diào)能力與社會習(xí)俗、規(guī)范等有關(guān)。
謝林提出的聚點(focal points)概念也得到了廣泛的應(yīng)用,他還在班上通過學(xué)生做了很多實驗,發(fā)現(xiàn)聚點的出現(xiàn)比原來理論上預(yù)測的均衡結(jié)果的出現(xiàn)的概率更高。
謝林反復(fù)研究的一個主題是,在社會這個競技場上,人們的行為模式為什么是對抗的?他的《微觀動機(jī)與宏觀行為》一書,對此進(jìn)行了全面的分析。該書對各種各樣的日?,F(xiàn)象進(jìn)行了分析,比如職業(yè)冰球隊員要戴頭盔(戴頭盔的目的是為了防止受到傷害。而之所以要防止受到傷害,是因為人們的行為是對抗性的。人們總是對別人持有一種防御和抵制的心理),大禮堂中觀眾對位置的選擇(當(dāng)觀眾少的時候,人們總是選擇附近沒有人的位置,也就是說,人們總是要與別人保持一定的距離。公共汽車上也是一樣,如果一排可以坐兩個人,乘客不會按照從車頭到車尾的順序選擇座位,而是先占沒有人坐的那排的位置,然后再坐已經(jīng)坐了一個人的那排的位置),性別和種族歧視(人們對于與自己不同的人,總是懷著懷疑、保持距離的心理,當(dāng)這種心理因素的強(qiáng)烈性達(dá)到一定的程度后,就會形成抵制和歧視)等等。
在以往的研究中,種族隔離總是與壓迫等概念聯(lián)系在一起。謝林通過建立一個簡單的模型對此進(jìn)行了分析,假定人們是寬容的,愿意和不同文化、宗教信仰、膚色的人接近,即便如此,人們也會選擇與他的特征相一致的鄰居,否則,他會搬遷到一個另外的地方,也就是盡量尋找“同類”擇鄰相處。所以,即使沒有種族隔離的明文法律規(guī)定,或者有禁止種族隔離的明文法律規(guī)定,人們?nèi)匀粫x擇與自己的同類居住在一起,這正應(yīng)了中國的古話“物以類聚”。
奧曼一九三○年生于德國法蘭克福的一個以色列和美國移民的家庭,一九五五年在麻省理工學(xué)院(MIT)獲得數(shù)學(xué)博士學(xué)位。奧曼是一位非常勤于筆耕的學(xué)者,發(fā)表論文八十余篇,對博弈論的許多方面進(jìn)行了深入的研究,當(dāng)然,重點是對重復(fù)博弈以及合作博弈的研究。
與謝林喜歡寫書相比,奧曼除了出版了多部著作外,更多的是寫論文,他的代表作是《無附加支付的合作博弈的馮·諾伊曼-摩根斯坦恩解》(Aumann and Peleg,1960)、《合作博弈的談判集》(Aumann and Maschler,1964)、《具有連續(xù)交易者的市場的競爭均衡存在性》(Aumann, 1966)、《隨機(jī)策略中的主觀性和相互關(guān)系》(Aumann, 1974)等論文。
奧曼認(rèn)為,相對于單次博弈來說,長期的關(guān)系更容易促進(jìn)合作。奧曼第一次導(dǎo)出了無限重復(fù)博弈的正式分析框架,證明了在長期博弈中能夠?qū)崿F(xiàn)合作。奧曼的重復(fù)博弈理論使人們更加清楚地認(rèn)識到合作的必要條件,為什么在以下情況下,合作是更加困難的,這些情況包括:多個局中人,局中人之間的相互關(guān)系很少發(fā)生,局中人之間的相互關(guān)系容易中斷,時間坐標(biāo)很短,對方的行動不容易觀察等。對這些問題的研究能夠解釋價格戰(zhàn),貿(mào)易戰(zhàn),一些組織為什么比另一些組織能夠更好地管理公共資源等現(xiàn)象。重復(fù)博弈方法也能夠解釋一些制度的形成,如商會制度,有組織的犯罪,工資談判,國際貿(mào)易協(xié)議等。
奧曼著力于對重復(fù)博弈的研究,他的研究結(jié)果表明,在重復(fù)博弈中,合作是一種容易達(dá)到的均衡,即便是短期關(guān)系中存在很強(qiáng)的利益沖突的博弈。奧曼和其他研究者把這一理念擴(kuò)展到其他領(lǐng)域,比如與合作不同的“懲罰威脅(threats of punishment)”的可信度,并努力得到一個一般化的結(jié)果。奧曼與合作者M(jìn)aschler. M對重復(fù)博弈的研究,建立了不對稱(一般來說也是不完全)信息條件下的重復(fù)博弈理論。重復(fù)博弈理論已成為社會科學(xué)的基本分析工具,得到了廣泛的應(yīng)用,如競爭性廠商之間如何通過合作維持高價,農(nóng)民之間如何分享公共的牧場和灌溉系統(tǒng),國家之間如何在環(huán)境、領(lǐng)土爭端等問題上取得一致意見等等。
奧曼的另一項基礎(chǔ)性的貢獻(xiàn)是,對博弈理論的認(rèn)知基礎(chǔ)進(jìn)行了探討,即局中人的知識,或者說,“有關(guān)彼此的知識的知識(knowledge about each others’knowledge)”,是如何影響博弈的參與者的策略以及博弈的結(jié)果的。奧曼對于共同知識(common knowledge)的公式化,有助于對局中人的知識與博弈結(jié)果之間的關(guān)系進(jìn)行系統(tǒng)研究。
奧曼引入了一個新的均衡概念,相關(guān)均衡(correlated equilibrium),一種比納什均衡更弱的均衡。相關(guān)均衡概念能夠說明,為什么中介人(或仲裁人)的存在能夠為談判各方帶來更好的結(jié)果,不管這個中介人(或仲裁人)是單獨(dú)還是同時向各談判方陳述觀點,甚至傳達(dá)不同的信息。
奧曼和謝林的研究有一個共同的特點,那就是通過對人們?nèi)菀缀鲆暤膯栴}的分析,建立概念、分析工具和理論,從而拓展研究的領(lǐng)域。通過他們的研究,人們對理性的認(rèn)識得到了拓展,理性的范圍拓寬了,曾經(jīng)被認(rèn)為是不理性的行為,現(xiàn)在看來是可以理解的,甚至是理性的。
與謝林很少用到數(shù)學(xué)工具相比,奧曼則主要利用數(shù)學(xué)工具,在概念、假設(shè)的基礎(chǔ)上證明,采用公式化的方法,以圖得出精確的結(jié)論。縱觀奧曼的主要論文,都是非常嚴(yán)謹(jǐn)?shù)臄?shù)學(xué)推導(dǎo)。即便是《分歧的同意》這樣一篇短短三個頁碼的論文,也充滿了數(shù)學(xué)語言。而像《博弈論能做什么》這樣不用數(shù)學(xué)的綜述性論文,在奧曼的論文中是很少見的。他曾把自己的研究比作藝術(shù)創(chuàng)造,要通過艱難的、有持久力的方法來表述自己的觀點。
寫到這里,聯(lián)想到目前國內(nèi)的一種對經(jīng)濟(jì)學(xué)數(shù)學(xué)化的批評,認(rèn)為期刊經(jīng)濟(jì)學(xué)論文中數(shù)學(xué)化的比例太高,有的論文公式、模型連篇累牘,因而是濫用數(shù)學(xué)。我對此不敢茍同。是否濫用,不是看有多少篇論文在運(yùn)用數(shù)學(xué),也不是看一篇論文中數(shù)學(xué)的比重,而是要看是不是本來可以不用,并且用了反而不如不用。如果是用了反而不如不用的,哪怕文中只有一個公式,也是濫用數(shù)學(xué);而如果是用了數(shù)學(xué)比不用好的,哪怕公式、模型“連篇累牘”,也不是濫用數(shù)學(xué)。