劉奇 玄莉
【摘要】蜈蚣博弈(centipede game)是博弈論(Game Theory)中的一種經(jīng)典模型,在經(jīng)濟(jì)學(xué)、國際關(guān)系、軍事戰(zhàn)略等學(xué)科都有廣泛的應(yīng)用。傳統(tǒng)上采用的逆推法在分析完全且完美信息的動(dòng)態(tài)博弈時(shí)無疑是有用的工具,然而在蜈蚣博弈問題上邏輯嚴(yán)密的逆推法得到的結(jié)論卻與直覺相悖。筆者認(rèn)為經(jīng)典案例與現(xiàn)實(shí)的最大差異在于現(xiàn)實(shí)中存在的都是不完全信息的博弈,并舉經(jīng)濟(jì)學(xué)中的海盜分金模型和中國古代三國時(shí)期的孫劉聯(lián)盟分別作為完全和不完全信息之例加以輔證,以期使之在現(xiàn)實(shí)生活中得到更廣泛的應(yīng)用。
【關(guān)鍵詞】蜈蚣博弈,悖論,不完全信息動(dòng)態(tài)博弈,海盜分金
“蜈蚣博弈”是羅森塞爾(Rosenthal)于1981年提出的一個(gè)動(dòng)態(tài)博弈問題,由于其擴(kuò)展形很像一條蜈蚣而得名。兩個(gè)博弈方A和B,輪流進(jìn)行策略選擇,可供選擇的策略有“合作”或“背叛”,我們假設(shè)A和B均為完全理性人,博弈次數(shù)是有限次,且支付給定如下:
A ------ B ------ A --………….-- A ------ B ------ A ------ B ------ (10,10)
| * * * | * * * | * *………* * | * * * | * * * | * * * |
(1,1) (0,3) (2,2) (8,8) (7,10) (9,9) (8,11)
博弈從左向右進(jìn)行,橫向表示合作,縱向表示背叛,括號(hào)中表示(A的收益,B的收益)??紤]最后一步:B選擇背叛的收益為11,大于合作收益10,則B一定選擇背叛;A知道B這樣想,所以在上一步時(shí)不會(huì)選擇合作,如此推論下去,結(jié)論是A在一開始就不會(huì)選擇合作,兩人收益各得1,博弈結(jié)束。而直觀上看,如果合作下去兩人的收益似乎都要更多更有利,因此逆推法的邏輯和直覺出現(xiàn)了悖論。
另外一個(gè)利用逆推法的經(jīng)濟(jì)學(xué)模型是海盜分金。5個(gè)海盜搶了100枚金幣,他們通過抽簽來決定順序,每人提出一個(gè)分配方案進(jìn)行全體投票表決,超過半數(shù)的人贊成則方案通過,否則提出方案者就要被扔到海里喂鯊魚。假定所有海盜都是聰明的理智人,還是從后往前推:當(dāng)1至3號(hào)都被扔到海里只剩4號(hào)和5號(hào)時(shí),無論4號(hào)提出何種方案5號(hào)都可以投反對(duì)票以獨(dú)吞所有金幣,4號(hào)必死無疑,因此他定會(huì)無條件支持3號(hào)的方案。3號(hào)知道4號(hào)的想法,因此輪到他時(shí),會(huì)提出(100,0,0)的方案,這樣雖然4號(hào)一枚金幣都得不到仍然會(huì)投贊成票,再加上自己的票,3號(hào)的方案會(huì)獲得通過。而2號(hào)也洞悉了3號(hào)的想法,他會(huì)提出(98,0,1,1)的方案,這樣4號(hào)和5號(hào)的結(jié)果比3號(hào)主持分配時(shí)要好,因此2號(hào)得到了兩人的支持,方案獲得通過。1號(hào)推知2號(hào)的方案后,會(huì)提出(97,0,1,2,0)或(97,0,1,0,2),這樣3號(hào)能得到一枚金幣,比2號(hào)的方案要好,4號(hào)或5號(hào)也能比原先多得到一枚金幣,因此會(huì)支持1號(hào)的方案,最終結(jié)果1號(hào)獨(dú)得97枚!這樣,排在最前面的人看似不利,有著更高被扔到海里的風(fēng)險(xiǎn),結(jié)果成為這場博弈的最大贏家;而最后的人看似安全,甚至能坐收漁翁之利,卻不得不接受別人的方案只能分得一小杯殘羹。海盜分金可謂是逆推法在完全信息動(dòng)態(tài)博弈中應(yīng)用的經(jīng)典案例,但許多人不禁要問:其他四個(gè)海盜真的會(huì)眼睜睜看著1號(hào)把絕大部分金幣收入囊中嗎?其實(shí),我們?cè)谶@個(gè)模型中假設(shè)了所有博弈方均能完全了解其他人的策略,倘若有人不,那么博弈定不會(huì)在第一步就結(jié)束,這就涉及到了不完全信息動(dòng)態(tài)博弈。筆者認(rèn)為這種情況要比完全信息在現(xiàn)實(shí)中利用的更為廣泛,不妨舉三國鼎立時(shí)期的孫劉聯(lián)盟為例分析。
公元208年,孫劉兩家聯(lián)手抗曹,合作時(shí)間越長越有利,但其中有個(gè)誘使聯(lián)盟破裂的因素——荊州。兩人都可以選擇一開始就撕破臉皮開打,這樣協(xié)議撕毀,兩人都無法從合作中取得收益。他們也可以選擇擱置爭議,先合作下去,但荊州在劉備手里,擱置時(shí)間越長孫權(quán)要回來的可能性就越小。不妨假設(shè)N年后,孫權(quán)就永遠(yuǎn)要不回來了。博弈者孫權(quán)想,不如在第N-1年的時(shí)候撕毀協(xié)議把荊州搶回來,孫劉少聯(lián)盟一年損失也不太大。另一博弈方劉備想,與其等到第N-1年的時(shí)候?qū)O權(quán)把荊州搶了,不如先下手為強(qiáng),在第N-2年的時(shí)候翻臉,聯(lián)盟時(shí)間少那么一年對(duì)打敗曹操影響也微乎其微。博弈就這么進(jìn)行下去,直到孫權(quán)想,孫劉聯(lián)盟對(duì)抗曹操起碼要維持11年,在這之前劉備不敢跟我翻臉,那11年一到,就讓呂蒙搶了荊州。而劉備是博弈中占優(yōu)的一方,因?yàn)樗哂星G州的實(shí)際控制權(quán),因此行動(dòng)更為保守,他估計(jì)的聯(lián)盟時(shí)間要比孫權(quán)長,孫權(quán)擔(dān)心時(shí)間太久荊州要不回來,故比較激進(jìn),終于在公元219年直取荊州,孫劉聯(lián)盟破裂。在這個(gè)例子中,博弈雙方不知道對(duì)方的底線,所以最終只能是在某一時(shí)間點(diǎn)一方選擇背叛。孫權(quán)除了奪回荊州別無選擇,而劉備不得不繼續(xù)占據(jù),否則兩者的地位就會(huì)互換,劉備將面臨和孫權(quán)一樣的窘境。
其實(shí)對(duì)于蜈蚣悖論,西方研究博弈論的專家已經(jīng)嘗試通過實(shí)驗(yàn)來尋求解答。實(shí)驗(yàn)發(fā)現(xiàn),不會(huì)出現(xiàn)一開始選擇“不合作”策略而雙方各得收益1的情況,雙方會(huì)自動(dòng)選擇合作性策略,從而走向合作。這種做法違反逆推法的結(jié)論,然而我們會(huì)發(fā)現(xiàn),即使雙方開始能走向合作,這種合作也不會(huì)堅(jiān)持到最后一步。理性的人出于自身利益的考慮,肯定在某一步采取不合作策略。逆推法肯定在某一步要起作用,使得合作不能進(jìn)行下去。蜈蚣悖論在現(xiàn)實(shí)中的對(duì)應(yīng)情形是,參與者不會(huì)在開始時(shí)確定他的策略為“不合作”,但他難以確定在何處采取“不合作”策略,孫劉聯(lián)盟破裂的例子就是典型。
參考文獻(xiàn):
[1]張峰. 蜈蚣博弈悖論引發(fā)的思考[J].湖南科技大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2005.
[2]嚴(yán)天秀. 蜈蚣博弈悖論的探析[J].大觀周刊,2012.