摘要:囚徒困境在現(xiàn)實生活中有著廣泛的應(yīng)用。論文從囚徒困境的基本假設(shè)出發(fā),探討了現(xiàn)實生活中更為廣泛的博弈現(xiàn)象。
囚徒困境問題是博弈論的一個重要范例,對此的研究涉及經(jīng)濟學(xué)、社會學(xué)、生物學(xué)等廣泛領(lǐng)域。Axelrod R在《The Evolution of cooperation》一文中從進化的角度研究和探討了經(jīng)典囚徒困境的一個擴展——重復(fù)囚徒困境。這種博棄要求參與者反復(fù)進行囚徒困境的博弈,并且可以記住他們的對抗歷史。Axelrod還組織了兩次重復(fù)囚徒困晚的計算機競賽,最終勝出的都是簡單的“以牙還牙”策略。重復(fù)囚徒困境在現(xiàn)實生活中是一種廣泛的現(xiàn)象,而以牙還牙策略在現(xiàn)實中的應(yīng)用有一定的意義,其實現(xiàn)基礎(chǔ)是基于以下三個假設(shè):
(1)參與者必須進行多個回合的囚徒困境的博弈,并且在此過程中可以記住他們以前的對抗。
(2)雙方都不知道博弈要進行多少回合。
(3)雙方都認(rèn)為自己當(dāng)前回合的背叛會在將來遭到對方的報復(fù)。
但是現(xiàn)實生活中存在著更為廣泛的現(xiàn)象,而以牙還牙策略并非廣泛適用,本文就重復(fù)囚徒困境在現(xiàn)實生活中的策略運用進行更為廣泛范圍內(nèi)的探討。
一、現(xiàn)實生活中的理性人假設(shè)在個例中不成立的現(xiàn)象
理性人的假設(shè)是經(jīng)濟學(xué)和博弈論的理論基礎(chǔ),這是探尋問題在概率意義上的本質(zhì)所必須要進行的假設(shè)。但是在現(xiàn)實生活中,往往存在非理性人現(xiàn)象,由于其行為不可預(yù)測,才造就了現(xiàn)實世界多樣化的基礎(chǔ)。最為典型的例子則是股市中的非理性現(xiàn)象。在索羅斯的循環(huán)理論中認(rèn)為,人們會對當(dāng)前的經(jīng)濟與股市會產(chǎn)生盲目的樂觀或者悲觀。當(dāng)人們盲目樂觀時,會形成集聚效應(yīng),會忽視一些危險的信號并認(rèn)為未來要比現(xiàn)在要好的多,會做出一些錯誤的結(jié)論。在股市中,人們對某一股票的未來業(yè)績紛紛看看好,認(rèn)為高估值可以依靠好的業(yè)績來支撐。于是股價不斷的上漲,不斷上漲的股價反過來刺激著人們的預(yù)期,分析師不斷調(diào)高預(yù)期利潤,價格再次循環(huán)上升;當(dāng)公司財務(wù)報表顯示并沒有這樣良好的盈利能力,現(xiàn)實無力支撐這樣的高估時,人們在股市中匆忙出逃,劇烈下跌的股價加劇了人們的恐慌,這樣也導(dǎo)致了股價的非理性下跌,從而形成了股價的雪崩效應(yīng)。這就是索羅斯認(rèn)為的泡沫循環(huán)理論,而實際價值在其中的影響要遠遠低于人們的非理性行為所產(chǎn)生的影響。
二、雙方的博弈具有有限性的情況
現(xiàn)實生活中的博弈行為并非是無限的,人與人之間的博弈行為往往是在兩個人的行為交集的框架下進行的。雖然六度分割理論奠定了社交網(wǎng)站的理論基礎(chǔ),認(rèn)為通過網(wǎng)絡(luò)人們可以實現(xiàn)廣泛范圍內(nèi)的互動,但是人際之間博弈行為考察的是人際之間有利益互動的行為。不能說人的交流途徑廣泛了,互相遠離的兩個人之間一定會有不斷的博弈行為。
在這樣的情況下,存在著短期的投機機會:在兩個人利益發(fā)生交集的時候賺取對方的利益,而在分開之后轉(zhuǎn)而求取與對方的重新交好。也即,在利益交集的時候,由于時間和空間的有限性,博弈行為也會具有有限性,而相關(guān)利益對彼此來說也是分大小的。在面臨這一現(xiàn)象時人們會有兩種選擇,或選擇投機,稱之為投機者;或者選擇立足長遠,在規(guī)則內(nèi)行事,稱之為投資者。投機的一方會努力賺取對方的利益,即使遭到報復(fù),但只要損失在可控的范圍之內(nèi),就可以進行投機操作。但是對于投資者而言,短期的投機行為并不可取,因為“讀書人要愛惜自己的羽毛”(劉文典)。投資者會立足于長遠,并注重自身的信譽。從長遠的角度來說,選擇作為一個投資者是更理性的行為。但是不可否認(rèn),在有限條件的博弈中,投資者會居于劣勢,選擇作為投資者,無疑會困難重重。而為了獲得更多的投資機會,投資者是一個理性的選擇。
三、甲乙兩方在信息獲取和資源配置上存在差異
可重復(fù)囚徒博弈中有一個隱性的假設(shè),即兩個囚徒在信息獲取和資源配置上是平等的。但現(xiàn)實中,人與人之間在資源的獲取方面是存在差異的。盧梭在《政治學(xué)》卷一中指出,人與人之間的不平等分為兩種:一種稱之為自然的或身體上的不平等,因為它使被自然所確定的,包括年齡、健康、體力與精神或心靈的品質(zhì)之不同;另一種可以稱之為道德的或政治上的不平等,因為它必須有賴于某種約定,而且是由于人們的同意而確定下來的,或者至少是被人們的同意所認(rèn)可的。盧梭所謂的不平等,推廣開來就是人與人之間存在著差異。人與人之間的差異并非是特例,而是廣泛存在的。重復(fù)囚徒困境的隱形假設(shè)條件只有在特定的情況下才有可能發(fā)生,因此現(xiàn)實生活中的重復(fù)博弈問題,人與人之間存在差異的問題就需要考慮進來。由于一方擁有比另外一方明顯的信息或資源優(yōu)勢的時候,他在博弈中完全可以選擇投機行為,而不用考慮后果,或者這一方憑借資源與信息優(yōu)勢,完全可以將以后的報復(fù)所遭受的損失化為最小。在這樣的情況下,弱勢的一方只有選擇放棄合作,然后再尋求自身的發(fā)展。當(dāng)年微軟在收購谷歌時報出的收購價格僅為20億美元,這直接導(dǎo)致了谷歌的拒絕。戲劇化的是,谷歌的發(fā)展竟會如此迅速,在十年后的今天市值高達1700億美元,成為了微軟的一個強勁的競爭對手,這或許不是微軟當(dāng)年所能預(yù)料的了。
四、結(jié)論
我們從重復(fù)囚徒困境博弈的假設(shè)基礎(chǔ)出發(fā),探討了在現(xiàn)實中這些假設(shè)不能夠涉及的情況。在此值得指出的是,從長期的概率統(tǒng)計的意義出發(fā),重復(fù)囚徒困境的假設(shè)依然具有其合理性。而對于現(xiàn)實生活中的個例而言,文中的探討依然具有一定的現(xiàn)實意義。
參考文獻:
[1]張維迎:博弈論和信息經(jīng)濟學(xué)[M].上海:三聯(lián)書社,1996.
[2]謝識宇:經(jīng)濟博弈論[M].上海:復(fù)旦大學(xué)出版社,1996.