張文博
摘要:博弈論已經是大家耳熟能詳的名詞,無論是在人們的日常生活中,還是在許多學科的研究中,博弈無處不在。現在,博弈已經從人們的決策行為發(fā)展成為一門獨立的學科,其在經濟中的運用日益廣泛,作用也越來越深廣。除了一般意義上的博弈決策,反向應用博弈論,改變博弈條件以期得到更好的博弈結果,使博弈雙方獲得更高的效用,這在經濟的發(fā)展中將起到更加重要的作用。
關鍵詞:博弈論;均衡;效用;反向應用
中圖分類號:F069.9文獻標志碼:A文章編號:1673-291X(2009)29-0240-02
“博弈論”這一名詞的流行僅僅始于幾十年前,但是,博弈論思想本身卻有著悠久的歷史,如兩千多年前的“田忌賽馬”就是出色利用博弈論的典型生動的例子,至今仍然為中國的許多學者、老師應用來作為博弈論的入門例子。
一、博弈論的發(fā)展進程
博弈論思想雖然有著悠久的歷史,但是作為一門系統的學科來說還相當的年輕。近代以來,在學術研究的過程中許多學者逐漸認識到了博弈論的重要作用,對博弈理論進行了探索研究。一般認為,對于博弈理論的最早研究可以追溯到18世紀初。瓦德格拉夫(W aldegrave)在1713年提出了兩人博弈的極小化極大混合策略解。古諾(Coumot)和波特蘭德(Bertrand)分別在1838年和1883年提出了博弈論最經典的模型,兩位學者分別從產量決策和價格決策分析壟斷的雙寡頭競爭模型,確定了在競爭之下各自的最優(yōu)反應函數。但是作為一種理論來說,1944年,馮·諾依曼(Von Neumann)和奧·摩根斯坦(Morgenstern)合著了《博弈論與經濟行為》在總結了以往關于博弈的研究成果的基礎上,提出了博弈論的概念術語、一般框架和表述方法,提出了較系統的博弈理論,因此這被認為是博弈理論初步形成的標志。50年代初,納什(J.Nash)的兩篇非合作博弈論奠基性論文發(fā)表之后,博弈論飛速發(fā)展。作為博弈論的一部分,非合作博弈比合作博弈的發(fā)展更加迅速,在經濟學等其他學科中的應用也更為廣泛。提起博弈論,現在差不多總是指非合作博弈論。50年代以來,納什(Nash)、澤爾騰(Selten)、海薩尼(Harsanyi)等人是博弈論成熟并最終進入使用。
最近三四十年,經濟學經歷了一場“博弈論革命”,經濟學者們引入博弈論的概念和方法改造經濟學的思維,推進了經濟學的研究,可以說博弈論在一定程度上已經改寫了微觀經濟學,成為推動經濟學發(fā)展的一大動力。一方面,納什均衡概念以及更多的博弈論知識的引入使寡頭競爭理論得到改造,在現實中應用的普遍性更明顯,嚴格而深入的探討競爭現實的現代寡頭理論迅速發(fā)展起來;另一方面,在經濟社會中,每個人的決策都是根據他所掌握的有關信息做出的,非對稱信息博弈論這種分析方法徹底改變了微觀經濟學的面貌,極大地促進了信息經濟學的發(fā)展,信息經濟學已經真正成為當今經濟分析的主流。
二、博弈論的主要內容
博弈論(Game Theory)又稱作對策論,是專門研究理性個體之間相互沖突和合作的學科。一個最基本的博弈結構,至少包括三個要素:局中人(player)、戰(zhàn)略空間(strategy space)和支付結構(payoff structure)。
博弈論的基礎假定是博弈的參與者即局中人是理性而明智的;在每個局中人的所有可選行動范圍(戰(zhàn)略空間)內,該局中人是獨立的,不受其他局中人任何形式的脅迫;一個局中人的支付結構表示在不同情況(不同戰(zhàn)略組合)下博弈終了時他的收益(或“得分”)。在典型的支付結構中,一個局中人所得的支付不僅與他自己選擇何種戰(zhàn)略有關,而且還是其他局中人所選戰(zhàn)略的函數,任何一個局中人改變自己的戰(zhàn)略都將影響所有局中人所獲的支付水平。這就是說,局中人之間的利益是相互牽連和相互制約的。除上述3個要素以外,要對一個博弈進行分析,對博弈定義一個信息結構也是必不可少的。研究者必須明確每個局中人知道什么和不知道什么。在局中人追求自己的支付最大化假定下,博弈論研究這些理性個體的行為選擇。一個博弈的“解”,也就是該博弈最可能出現的結果,稱為“均衡”(equilibrium)。一般情況下,博弈雙方的目的就是能夠得到一個均衡結果。
一個完整的博弈應該包含五個方面的內容:第一,博弈的參與人,即博弈過程中獨立決策、獨立承擔后果的個人和組織;第二,博弈信息,即博弈者所掌握的對選擇策略有幫助的情報資料;第三,博弈的行動空間,即博弈方可選擇的全部行為或策略的集合;第四,博弈的次序,即博弈參加者做出策略選擇的先后;第五,博弈方的收益,即各博弈方做出決策后的得失。
三、博弈論的應用和對博弈論反向應用的思考
自從將博弈論引入經濟學以后,經濟學改變了傳統經濟分析地那種以個人孤立決策,其他經濟活動者的行為影響則被典型地簡化為價格信號為基礎的分析方法,而側重于經濟活動中多個利益主體的行為所產生的相互作用和影響的分析,從而使經濟分析更能反應經濟系統的本質。
博弈的過程在一定程度上更接近經濟生活中的實際,具體來說,博弈論是怎樣應用到實際事務上的,下面將舉例說明,并且討論探索反向應用博弈論是否可能、是否有意義。
我們以日常生活中最常見的學生與家長的博弈為例:
假設一小學生和其家長,學生每天都必須完成老師布置的家庭作業(yè),家長可能檢查也有可能不檢查其完成狀況。如果學生按時完成家庭作業(yè),玩的時間減少;家長檢查,學生沒有完成就會得到懲罰。家長當然希望孩子按時完成作業(yè),如果檢查發(fā)現學生沒有做作業(yè),家長會感到生氣,而且天天檢查對家長來說是額外的負擔。因此如果學生做了作業(yè)家長也檢查了,那么學生得到的效用是-2,家長得到的效用是2;如果學生做了作業(yè)家長沒有檢查,那么學生得到的效用是-4,家長得到的效用為3;如果學生沒有做作業(yè)家長檢查了,學生增加了玩耍的時間卻受到了懲罰,得到的效用是0,家長得到的效用是-2;如果學生沒有做作業(yè)家長也沒有檢查那么學生得到的效用是4,家長的實際得到的效用是-1.博弈矩陣如圖1:
博弈的結果是學生會選擇不做作業(yè),家長會選擇不檢查,實際影響是無論是對學生自己還是對家長來說,得到的都是最差的結果。
面對這樣不盡如人意的博弈結果,我們應該怎么辦呢?
博弈總是在一定的條件下進行的,這些條件決定了博弈的結果。那么根據現有的博弈結果,我們是否可以反向應用,找出可以改變的條件從而改變整個博弈的格局,改變博弈結果,改善博弈雙方的效用水平呢?
仍然以上面的學生家長博弈為例:
假設在相同的條件下,家長改變懲罰方法,變成懲罰與獎勵并行。即如果學生不按時完成作業(yè),那么除了接受固定的懲罰外,如果該期測驗考試在一定水平之下將會得到更嚴厲的懲罰,如果測驗成績在一定水平之上那么會得到自己期待已久的少兒百科全書。測驗的成績必然和平時是否好好學習、是否按時完成家庭作業(yè)相掛鉤,那么學生在希望增加玩耍時間的同時還會考慮到不做作業(yè)和測驗成績的關聯。這樣,如果學生完成作業(yè)家長也檢查了,學生得到的效用是2,家長得到的效用也是2;如果學生完成作業(yè)家長沒有檢查,學生得到的效用是4,家長得到的效用是3;如果學生沒有完成作業(yè)家長檢查了,那么學生得到的效用是-4,家長得到的效用是-2;如果學生沒有做作業(yè)家長也沒有檢查,那么學生得到的效用是2,家長得到的效用是-1。博弈矩陣如圖2:
根據博弈矩陣,博弈的均衡結果是:學生能夠自覺地完成作業(yè),家長也可以不檢查,免除了勞累工作之后的額外工作。學生家長都達到了最佳的博弈結果。
可見,根據現有的博弈,分析出博弈結果,當博弈結果不盡如人意時,并不是必須消極接受這種博弈結果。根據現有的博弈結果反向推回博弈的條件,尋找可以改變的條件進而改變博弈結果,實現雙贏。