“納什均衡”法則內(nèi)容
當(dāng)對手知道了你的決定之后,就能做出對自己最有利的決定。
——普林斯頓大學(xué)數(shù)學(xué)家約翰·納什
戰(zhàn)國時(shí)期,楚成王與太子商臣發(fā)生矛盾,想廢商臣,立小兒子職為太子,但又怕商臣謀反作亂。猶豫之時(shí),宮內(nèi)已有人把這個(gè)動(dòng)向傳給了商臣。商臣向老師潘崇問計(jì)。潘崇說:“你的姑母江芊久住宮中,必定知曉此事。她性情急躁,你設(shè)宴招待她,故意加以怠慢,激她發(fā)怒,怒中之言,必定泄漏?!?/p>
商臣依計(jì)行事,把江芊請到宮中,恭恭敬敬地迎拜。上了三道菜之后,商臣就不遞菜了,而是讓仆人直接把菜罐子放在姑媽面前,自己也不起身,還故意和別人說小話,江芊兩次問話,他也帶答不理。
這種不禮貌的舉動(dòng)果然激怒了姑媽,她拍桌打椅地罵道“賤東西,你休得如此無禮,大王早就想殺你而立職為太子”然后,一邊罵一邊上車走了。
商臣連夜與潘崇商議,部署宮中兵甲,半夜圍住王宮。潘崇拿著劍和繩子奔入王宮,勒死楚成王。商臣隨后出訃告說,父親害急病死了。遂自立為王,即楚穆王。
在這場父與子之間血淋淋的博弈中,除了“禍從口出”這個(gè)古訓(xùn)外,我們還看到了博弈論中最重要的概念——“納什均衡”當(dāng)你知道了對手的決定之后,就能做出對自己最有利的決定。
這個(gè)概念是由普林斯頓大學(xué)數(shù)學(xué)家約翰·納什于1950年建立的。由于對博弈論做出奠基性的貢獻(xiàn),他在1984年榮獲諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。
囚徒困境
著名的“囚徒困境”,是“納什均衡”理論的經(jīng)典案例。
1950年,梅里爾·弗勒德和梅爾文·德雷希爾擬定出相關(guān)困境的理論,后來由顧問艾伯特·塔克以囚徒方式闡述,并命名為“囚徒困境”。經(jīng)典的囚徒困境如下:
警方逮捕甲、乙兩名嫌疑犯,但沒有足夠證據(jù)指控二人入罪。于是警方分開囚禁嫌疑犯,分別和二人見面,并向雙方提供以下相同的選擇:
若一人認(rèn)罪并作證檢控對方(“背叛”對方),而對方保持沉默,此人將即時(shí)獲釋,沉默者將判監(jiān)10年。
若二人都保持沉默(互相“合作”),則二人同樣判監(jiān)半年。
若二人都互相檢舉(互相“背叛”),則二人同樣判監(jiān)2年。
如同博弈論的其他例證,囚徒困境假定每個(gè)囚徒都是利己的,即都尋求最大自身利益。囚徒到底應(yīng)該選擇哪一項(xiàng)策略,才能將自己個(gè)人的刑期縮至最短?兩名囚徒由于隔絕監(jiān)禁,并不知道對方選擇。試設(shè)想困境中兩名理性囚徒會如何作出選擇:
若對方沉默,背叛會讓我獲釋,所以會選擇背叛。若對方背叛指控我,我也要指控對方才能得到較低的刑期,所以也是會選擇背叛。
二人面對的情況一樣,所以二人的理性思考都會得出相同的結(jié)論——選擇背叛。背叛是兩種策略之中的支配性策略。因此,這場博弈中唯一可能達(dá)到的納什均衡,就是雙方參與者都背叛對方,結(jié)果二人同樣服刑2年。
這場博弈的納什均衡,顯然不是最優(yōu)解決方案。如果兩人都保持沉默,兩人都只會被判刑半年。但根據(jù)以上假設(shè),二人均為理性的個(gè)人,均衡狀況會使兩個(gè)囚徒都選擇背叛。這就是“困境”所在。
尋找“納什均衡點(diǎn)”
在現(xiàn)實(shí)中,“納什均衡”理論影響著人們的行為。比如,在有些國家,報(bào)亭既無管理員也不上鎖,買報(bào)紙的人自行放下錢后拿走報(bào)紙。當(dāng)然某些人可能取走報(bào)紙卻不付錢(背叛),但由于大家認(rèn)識到如果每個(gè)人都偷竊報(bào)紙(共同背叛)會造成以后不方便的有害結(jié)果,這種情形很少發(fā)生。
社會科學(xué)中的經(jīng)濟(jì)學(xué)、政治學(xué)和社會學(xué),以及自然科學(xué)的動(dòng)物行動(dòng)學(xué)、進(jìn)化生物學(xué)等學(xué)科,很多事件都可用上述理論分析。
在政治學(xué)中,經(jīng)常發(fā)生兩國之間出現(xiàn)軍備競賽的事件。兩國都可以有兩種選擇:增加軍備(背叛),或是達(dá)成削減武器協(xié)議(合作)。兩國都無法肯定對方會遵守協(xié)議,因此兩國最終會傾向增加軍備。雖然增加軍備會是兩國的“理性”行為,但結(jié)果卻顯得“非理性”,比如,軍費(fèi)投入過多,會對本國經(jīng)濟(jì)發(fā)展造成影響。這可視作遏制理論的推論,就是以強(qiáng)大的軍事力量來遏制對方的進(jìn)攻,以達(dá)到和平。
在商業(yè)活動(dòng)中,也會出現(xiàn)各種囚徒困境例子。兩個(gè)公司互相競爭,他們的廣告互相影響,即一公司的廣告較被顧客接受則會奪取對方的部分收入。但若二者同時(shí)期發(fā)出質(zhì)量類似的廣告,收入增加很少但成本增加。因此,這兩家公司可以有兩個(gè)選擇1.互相達(dá)成協(xié)議,減少廣告的開支(合作);2.增加廣告開支,設(shè)法提升廣告的質(zhì)量,壓倒對方(背叛)。若兩家公司不信任對方,無法合作,背叛成為支配性策略時(shí),他們將陷入廣告戰(zhàn),而廣告成本的增加損害了兩家公司的收益,這就是陷入囚徒困境。在現(xiàn)實(shí)中,要互相競爭的公司達(dá)成合作協(xié)議是較為困難的,多數(shù)都會陷入囚徒困境中。
在自行車賽事或者長跑賽事中,也會出現(xiàn)一種博弈。例如,每年都舉辦的環(huán)法自由車賽中有以下情況選手們在到終點(diǎn)前的路程常以大隊(duì)伍方式前進(jìn),他們采取這策略是為了令自己不至于太落后,又出力適中。而最前方的選手在迎風(fēng)時(shí)是最費(fèi)力的,所以選擇在前方是最差的策略。因此,在起先階段,大家都不愿意在最前面(共同背叛),所以,這個(gè)時(shí)段,整體的速度很慢:而后,通常會有幾位選手騎到前面,然后一段時(shí)間內(nèi)互相交換最前方位置,以分擔(dān)風(fēng)的阻力(共同合作),使得全體的速度有所提升:而這時(shí),如果前方的其中一人試圖一直保持前方位置(背叛),其他選手以及大隊(duì)伍就會趕上(共同背叛)。通常的情況是,在最前面次數(shù)最多的選手(合作),通常會到最后被落后的選手趕上(背叛),因?yàn)楹竺娴倪x手騎在前面選手的沖流之中,比較不費(fèi)力。
用科學(xué)的語言來描述納什均衡,指的是在一策略組合中,所有的參與者面臨這樣的一種情況當(dāng)其他人不改變策略時(shí),他此時(shí)的策略是最好的。在納什均衡點(diǎn)上,每一個(gè)理性的參與者都不會有單獨(dú)改變策略的沖動(dòng)。
聽起來很拗口,但卻是不折不扣的科學(xué),而且備受經(jīng)濟(jì)學(xué)家的青睞。諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者薩繆爾森有一句幽默的話:你可以將一只鸚鵡訓(xùn)練成經(jīng)濟(jì)學(xué)家,因?yàn)樗枰獙W(xué)習(xí)的只有兩個(gè)詞:供給與需求。博弈論專家坎多瑞引申說要成為現(xiàn)代經(jīng)濟(jì)學(xué)家,這只鸚鵡必須再多學(xué)一個(gè)詞,這個(gè)詞就是“納什均衡”。