張文博
摘要:博弈論已經(jīng)是大家耳熟能詳?shù)拿~,無論是在人們的日常生活中,還是在許多學(xué)科的研究中,博弈無處不在。現(xiàn)在,博弈已經(jīng)從人們的決策行為發(fā)展成為一門獨(dú)立的學(xué)科,其在經(jīng)濟(jì)中的運(yùn)用日益廣泛,作用也越來越深廣。除了一般意義上的博弈決策,反向應(yīng)用博弈論,改變博弈條件以期得到更好的博弈結(jié)果,使博弈雙方獲得更高的效用,這在經(jīng)濟(jì)的發(fā)展中將起到更加重要的作用。
關(guān)鍵詞:博弈論;均衡;效用;反向應(yīng)用
中圖分類號(hào):F069.9文獻(xiàn)標(biāo)志碼:A文章編號(hào):1673-291X(2009)29-0240-02
“博弈論”這一名詞的流行僅僅始于幾十年前,但是,博弈論思想本身卻有著悠久的歷史,如兩千多年前的“田忌賽馬”就是出色利用博弈論的典型生動(dòng)的例子,至今仍然為中國的許多學(xué)者、老師應(yīng)用來作為博弈論的入門例子。
一、博弈論的發(fā)展進(jìn)程
博弈論思想雖然有著悠久的歷史,但是作為一門系統(tǒng)的學(xué)科來說還相當(dāng)?shù)哪贻p。近代以來,在學(xué)術(shù)研究的過程中許多學(xué)者逐漸認(rèn)識(shí)到了博弈論的重要作用,對(duì)博弈理論進(jìn)行了探索研究。一般認(rèn)為,對(duì)于博弈理論的最早研究可以追溯到18世紀(jì)初。瓦德格拉夫(W aldegrave)在1713年提出了兩人博弈的極小化極大混合策略解。古諾(Coumot)和波特蘭德(Bertrand)分別在1838年和1883年提出了博弈論最經(jīng)典的模型,兩位學(xué)者分別從產(chǎn)量決策和價(jià)格決策分析壟斷的雙寡頭競爭模型,確定了在競爭之下各自的最優(yōu)反應(yīng)函數(shù)。但是作為一種理論來說,1944年,馮·諾依曼(Von Neumann)和奧·摩根斯坦(Morgenstern)合著了《博弈論與經(jīng)濟(jì)行為》在總結(jié)了以往關(guān)于博弈的研究成果的基礎(chǔ)上,提出了博弈論的概念術(shù)語、一般框架和表述方法,提出了較系統(tǒng)的博弈理論,因此這被認(rèn)為是博弈理論初步形成的標(biāo)志。50年代初,納什(J.Nash)的兩篇非合作博弈論奠基性論文發(fā)表之后,博弈論飛速發(fā)展。作為博弈論的一部分,非合作博弈比合作博弈的發(fā)展更加迅速,在經(jīng)濟(jì)學(xué)等其他學(xué)科中的應(yīng)用也更為廣泛。提起博弈論,現(xiàn)在差不多總是指非合作博弈論。50年代以來,納什(Nash)、澤爾騰(Selten)、海薩尼(Harsanyi)等人是博弈論成熟并最終進(jìn)入使用。
最近三四十年,經(jīng)濟(jì)學(xué)經(jīng)歷了一場“博弈論革命”,經(jīng)濟(jì)學(xué)者們引入博弈論的概念和方法改造經(jīng)濟(jì)學(xué)的思維,推進(jìn)了經(jīng)濟(jì)學(xué)的研究,可以說博弈論在一定程度上已經(jīng)改寫了微觀經(jīng)濟(jì)學(xué),成為推動(dòng)經(jīng)濟(jì)學(xué)發(fā)展的一大動(dòng)力。一方面,納什均衡概念以及更多的博弈論知識(shí)的引入使寡頭競爭理論得到改造,在現(xiàn)實(shí)中應(yīng)用的普遍性更明顯,嚴(yán)格而深入的探討競爭現(xiàn)實(shí)的現(xiàn)代寡頭理論迅速發(fā)展起來;另一方面,在經(jīng)濟(jì)社會(huì)中,每個(gè)人的決策都是根據(jù)他所掌握的有關(guān)信息做出的,非對(duì)稱信息博弈論這種分析方法徹底改變了微觀經(jīng)濟(jì)學(xué)的面貌,極大地促進(jìn)了信息經(jīng)濟(jì)學(xué)的發(fā)展,信息經(jīng)濟(jì)學(xué)已經(jīng)真正成為當(dāng)今經(jīng)濟(jì)分析的主流。
二、博弈論的主要內(nèi)容
博弈論(Game Theory)又稱作對(duì)策論,是專門研究理性個(gè)體之間相互沖突和合作的學(xué)科。一個(gè)最基本的博弈結(jié)構(gòu),至少包括三個(gè)要素:局中人(player)、戰(zhàn)略空間(strategy space)和支付結(jié)構(gòu)(payoff structure)。
博弈論的基礎(chǔ)假定是博弈的參與者即局中人是理性而明智的;在每個(gè)局中人的所有可選行動(dòng)范圍(戰(zhàn)略空間)內(nèi),該局中人是獨(dú)立的,不受其他局中人任何形式的脅迫;一個(gè)局中人的支付結(jié)構(gòu)表示在不同情況(不同戰(zhàn)略組合)下博弈終了時(shí)他的收益(或“得分”)。在典型的支付結(jié)構(gòu)中,一個(gè)局中人所得的支付不僅與他自己選擇何種戰(zhàn)略有關(guān),而且還是其他局中人所選戰(zhàn)略的函數(shù),任何一個(gè)局中人改變自己的戰(zhàn)略都將影響所有局中人所獲的支付水平。這就是說,局中人之間的利益是相互牽連和相互制約的。除上述3個(gè)要素以外,要對(duì)一個(gè)博弈進(jìn)行分析,對(duì)博弈定義一個(gè)信息結(jié)構(gòu)也是必不可少的。研究者必須明確每個(gè)局中人知道什么和不知道什么。在局中人追求自己的支付最大化假定下,博弈論研究這些理性個(gè)體的行為選擇。一個(gè)博弈的“解”,也就是該博弈最可能出現(xiàn)的結(jié)果,稱為“均衡”(equilibrium)。一般情況下,博弈雙方的目的就是能夠得到一個(gè)均衡結(jié)果。
一個(gè)完整的博弈應(yīng)該包含五個(gè)方面的內(nèi)容:第一,博弈的參與人,即博弈過程中獨(dú)立決策、獨(dú)立承擔(dān)后果的個(gè)人和組織;第二,博弈信息,即博弈者所掌握的對(duì)選擇策略有幫助的情報(bào)資料;第三,博弈的行動(dòng)空間,即博弈方可選擇的全部行為或策略的集合;第四,博弈的次序,即博弈參加者做出策略選擇的先后;第五,博弈方的收益,即各博弈方做出決策后的得失。
三、博弈論的應(yīng)用和對(duì)博弈論反向應(yīng)用的思考
自從將博弈論引入經(jīng)濟(jì)學(xué)以后,經(jīng)濟(jì)學(xué)改變了傳統(tǒng)經(jīng)濟(jì)分析地那種以個(gè)人孤立決策,其他經(jīng)濟(jì)活動(dòng)者的行為影響則被典型地簡化為價(jià)格信號(hào)為基礎(chǔ)的分析方法,而側(cè)重于經(jīng)濟(jì)活動(dòng)中多個(gè)利益主體的行為所產(chǎn)生的相互作用和影響的分析,從而使經(jīng)濟(jì)分析更能反應(yīng)經(jīng)濟(jì)系統(tǒng)的本質(zhì)。
博弈的過程在一定程度上更接近經(jīng)濟(jì)生活中的實(shí)際,具體來說,博弈論是怎樣應(yīng)用到實(shí)際事務(wù)上的,下面將舉例說明,并且討論探索反向應(yīng)用博弈論是否可能、是否有意義。
我們以日常生活中最常見的學(xué)生與家長的博弈為例:
假設(shè)一小學(xué)生和其家長,學(xué)生每天都必須完成老師布置的家庭作業(yè),家長可能檢查也有可能不檢查其完成狀況。如果學(xué)生按時(shí)完成家庭作業(yè),玩的時(shí)間減少;家長檢查,學(xué)生沒有完成就會(huì)得到懲罰。家長當(dāng)然希望孩子按時(shí)完成作業(yè),如果檢查發(fā)現(xiàn)學(xué)生沒有做作業(yè),家長會(huì)感到生氣,而且天天檢查對(duì)家長來說是額外的負(fù)擔(dān)。因此如果學(xué)生做了作業(yè)家長也檢查了,那么學(xué)生得到的效用是-2,家長得到的效用是2;如果學(xué)生做了作業(yè)家長沒有檢查,那么學(xué)生得到的效用是-4,家長得到的效用為3;如果學(xué)生沒有做作業(yè)家長檢查了,學(xué)生增加了玩耍的時(shí)間卻受到了懲罰,得到的效用是0,家長得到的效用是-2;如果學(xué)生沒有做作業(yè)家長也沒有檢查那么學(xué)生得到的效用是4,家長的實(shí)際得到的效用是-1.博弈矩陣如圖1:
博弈的結(jié)果是學(xué)生會(huì)選擇不做作業(yè),家長會(huì)選擇不檢查,實(shí)際影響是無論是對(duì)學(xué)生自己還是對(duì)家長來說,得到的都是最差的結(jié)果。
面對(duì)這樣不盡如人意的博弈結(jié)果,我們應(yīng)該怎么辦呢?
博弈總是在一定的條件下進(jìn)行的,這些條件決定了博弈的結(jié)果。那么根據(jù)現(xiàn)有的博弈結(jié)果,我們是否可以反向應(yīng)用,找出可以改變的條件從而改變整個(gè)博弈的格局,改變博弈結(jié)果,改善博弈雙方的效用水平呢?
仍然以上面的學(xué)生家長博弈為例:
假設(shè)在相同的條件下,家長改變懲罰方法,變成懲罰與獎(jiǎng)勵(lì)并行。即如果學(xué)生不按時(shí)完成作業(yè),那么除了接受固定的懲罰外,如果該期測驗(yàn)考試在一定水平之下將會(huì)得到更嚴(yán)厲的懲罰,如果測驗(yàn)成績在一定水平之上那么會(huì)得到自己期待已久的少兒百科全書。測驗(yàn)的成績必然和平時(shí)是否好好學(xué)習(xí)、是否按時(shí)完成家庭作業(yè)相掛鉤,那么學(xué)生在希望增加玩耍時(shí)間的同時(shí)還會(huì)考慮到不做作業(yè)和測驗(yàn)成績的關(guān)聯(lián)。這樣,如果學(xué)生完成作業(yè)家長也檢查了,學(xué)生得到的效用是2,家長得到的效用也是2;如果學(xué)生完成作業(yè)家長沒有檢查,學(xué)生得到的效用是4,家長得到的效用是3;如果學(xué)生沒有完成作業(yè)家長檢查了,那么學(xué)生得到的效用是-4,家長得到的效用是-2;如果學(xué)生沒有做作業(yè)家長也沒有檢查,那么學(xué)生得到的效用是2,家長得到的效用是-1。博弈矩陣如圖2:
根據(jù)博弈矩陣,博弈的均衡結(jié)果是:學(xué)生能夠自覺地完成作業(yè),家長也可以不檢查,免除了勞累工作之后的額外工作。學(xué)生家長都達(dá)到了最佳的博弈結(jié)果。
可見,根據(jù)現(xiàn)有的博弈,分析出博弈結(jié)果,當(dāng)博弈結(jié)果不盡如人意時(shí),并不是必須消極接受這種博弈結(jié)果。根據(jù)現(xiàn)有的博弈結(jié)果反向推回博弈的條件,尋找可以改變的條件進(jìn)而改變博弈結(jié)果,實(shí)現(xiàn)雙贏。