摘要:本文對“博弈”這個概念有更進一步的認識,概括來講,學(xué)術(shù)界對“博弈”有三種不同的理解,分別是“游戲”、“技藝”和“過程”。本文同時剖析了“田忌賽馬”博弈的具體類型,應(yīng)是非完全信息動態(tài)博弈,最后對它的一般擴展式即序列均衡問題做了簡要的概述。
關(guān)鍵詞:博弈論;田忌賽馬;一般擴展式
一、什么是“博弈”
博弈論的思想最早可以追溯到18世紀,但真正作為一種理論研究則始于20世紀20年代,公認的開山之作是1944年出版的由科學(xué)家馮諾依曼和經(jīng)濟學(xué)家奧斯卡摩根斯坦恩合著的《博弈論與經(jīng)濟行為的理論》一書。此時,“博弈論”才作為一個完整的新名詞被提了出來。此后,國內(nèi)外對博弈論有了廣泛的研究,博弈論取得了長足的發(fā)展。國內(nèi)方面,關(guān)于博弈論的文章、專著不勝枚舉,各位學(xué)者對“博弈”一詞的認識或定義也存在偏差。
按照《現(xiàn)代漢語詞典》的解釋,“博”是豐富多彩的意思,而“弈”則指下棋、打牌等對抗性游戲,因而“博弈”就是指豐富多彩的對抗性游戲。①在英文中,“博弈”一詞是“game”的復(fù)數(shù),表示各種各樣的游戲。因此,漢語中的“博弈”與英語中的“game”意思完全一致?!安┺摹迸c“游戲”有這密不可分的聯(lián)系。
學(xué)者王俊冰對“博弈”一詞有著不同的理解。他指出:博弈的“博”字是競爭的意思,“弈”是對弈,是一種關(guān)于在競爭中選擇策略,爭取最好結(jié)果的技藝。②概括來講,博弈是一種技藝。學(xué)者郭磊認為:博弈的基本意思是弈棋,博弈本身是一種游戲,但博弈更強調(diào)謀略……博弈則可能是一系列策略與行動的組合體,并且是一個由始而終并產(chǎn)生結(jié)果的完整過程。③可以理解為博弈是一個過程。還有學(xué)者認為:博弈即一些個人、隊組或其他組織,面對一定的環(huán)境條件,在一定的規(guī)則下,同時或先后,一次或多次,從各自允許選擇的行為或策略中進行選擇并加以實施,各自取得相應(yīng)結(jié)果的過程。④
二、“田忌賽馬”概述
忌數(shù)與齊諸公子馳逐重射。孫子見其馬足不甚相遠,馬有上、中、下輩。于是孫子謂田忌曰:“君弟重射,臣能令君勝。”田忌信然之,與王及諸公子逐射千金。及臨質(zhì),孫子曰:“今以君之下駟彼上駟,取君上駟與彼中駟,取君中駟與彼下駟。”既馳三輩,而田忌一不勝而再勝,卒得王千金。于是忌進孫子于威王。威王問兵法,遂以為師?!雹葸@是我國“田忌賽馬”故事的原型。這個故事可謂是眾所周知了,該故事發(fā)生在戰(zhàn)國時期,齊威王和大將田忌賽馬,根據(jù)馬跑的速度雙方各有上、中、下三種等級馬各一匹,其中田忌的馬比同一等級齊王的馬跑得慢,但比齊王低一級的馬跑得快。比賽規(guī)則為三局兩勝制,每局比賽各出一匹馬,負者向勝者支付黃金⑥一千,顯然相比之下齊王的馬占優(yōu)勢。在第一次比賽中,田忌以上等馬對齊王的上等馬,以中等馬對齊王的中等馬,以下等馬對齊王的下等馬,結(jié)果連負三局。在第二次比賽中,田忌采納孫臏的建議,以下馬對齊王的上馬,以中馬對齊王的下馬,以上馬對齊王的中馬,結(jié)果勝兩局負一局,贏齊王一千金,而自以為勝券在握的齊王反而輸?shù)粢磺Ы稹?/p>
首先要從語言上分析一下這個典故?!皩O子見其馬足不甚相遠”這一句是前提,否則這個故事就不會發(fā)生。我們可以這樣理解這句話,即“齊威王和田忌的馬根據(jù)速度劃分各有上、中、下三種等級各一匹,其中田忌的馬比同一等級齊王的馬跑得慢,但比齊王低一級的馬跑得快”。假如齊威王的馬按速度由快到慢分為A1、A2、A3,田忌的馬由快到慢分為B1、B2、B3,那么這六匹馬由快到慢依次是A1、B1、A2、B2、A3、B3。另外,還有一處是學(xué)者研究中普遍遺漏的,即“及臨質(zhì)”三個字,這一句起到了至關(guān)重要的作用。這句話在這個故事中應(yīng)該翻譯為“等到將要開始比賽的時候”,那么這句話告訴我們一個什么訊息呢?我認為是說孫臏獻計田忌改變馬的出場順序這一情況并不為齊威王所知,這也成就了田忌在第二輪賽馬中能夠勝出的重要因素?!巴鯁柋ǎ煲詾閹??!边@一句也是關(guān)鍵所在,通過這一句話得知,齊威王并不知道自己是怎么輸?shù)模哉埥虒O臏。假設(shè)如果齊威王知道其中玄機的話,那么田忌將必輸無疑。以上三點是“田忌賽馬”故事得以出現(xiàn)的基本前提。
而我國關(guān)于“田忌賽馬”博弈論研究的相關(guān)論著可謂不少,但鮮有人認真透徹地分析這個故事的原型,殊不知這關(guān)系到“田忌賽馬”是不是博弈、是怎樣的博弈等問題。在以往的文獻中,王俊冰在《白話博弈論》一文中指出“田忌賽馬”是一個非合作博弈;詹國樞在《博弈處處有,幾人能識之》中指出“田忌賽馬”是博弈論的實際運用,是典型的博弈案例;周瀚光認為“田忌賽馬”是一個“二人有限零和博弈”,⑦但他并沒有首先從語言學(xué)的角度分析這個故事的前提;此外學(xué)者袁國強、和蔚、逯彥彥、郭鵬等等均指出“田忌賽馬”是一個博弈,但沒有深入分析它到底屬于什么類型的博弈,是怎樣博弈的等問題。
三“田忌賽馬”的博弈論分析
前文分析了該故事的三個前提,一、田忌的每等級的馬均次于齊威王同等級的馬,但強于齊威王下個等級的馬;二、齊威王事先不知道田忌臨陣改變了馬的出場順序;三、齊威王不知道改變馬出場順序其中的玄機。本文以下的分析均基于此三前提。
首先要從博弈論定義上理解“田忌賽馬”。很明顯,“田忌賽馬”確實符合“博弈”的定義,但現(xiàn)在言“田忌賽馬”就是博弈還為時尚早。
其次需要分析“田忌賽馬”是否具備博弈理論的基本要素。國內(nèi)學(xué)術(shù)界對博弈論基本構(gòu)成要素有分歧,基本分為兩派。一派認為博弈論要素有四方面,即博弈的參加者、策略、進行博弈的次序、博弈的信息。但是主張博弈理論四要素這一派內(nèi)部也有分歧,學(xué)者胡靜認為博弈理論的第四個構(gòu)成要素是“博弈方的得益”,⑧而不是博弈的信息;另一派認為博弈理論具有五方面的要素,即博弈的參加者、策略、進行博弈的次序、博弈的信息、博弈方的得益??梢郧逦乜闯龊笳邔Σ┺睦碚摰囊赜辛艘粋€完整的歸納。那么“田忌賽馬”是否具備五個要素呢?齊威王和田忌是博弈的參加者;策略選擇按照排列組合來計算共有六種(這里不詳細敘述);博弈的次序是雙方非同時決策,齊威王是先手;博弈的信息是不完全的,齊威王不知道田忌策略的變化;得益是每勝一局有一千金的獎勵。通過分析這些要素,我們得出一個結(jié)論,即“田忌賽馬”是一個完整的博弈。
最后要弄清楚“田忌賽馬”到底屬于什么類型的博弈。首先要了解一下博弈論的分類情況。(1)合作博弈與非合作博弈。如果各博弈方能達成某種有約束力的契約或默契,以選擇共同的策略,此種博弈就是合作博弈。反之,就屬于非合作博弈。(2)零和博弈、常和博弈與變和博弈。這是按得益情況劃分的,一方得益必來自一方損失,這種博弈是零和博弈。常和博弈又叫非零和博弈,指博弈各方得益之和不為零。變和博弈中各方得益之和不確定,這是最一般的博弈,常和博弈和零和博弈是它的特例。(3)靜態(tài)博弈與動態(tài)博弈。根據(jù)博弈的次序,即參加者策略選擇并行動的先后次序博弈可以分為靜態(tài)博弈和動態(tài)博弈。靜態(tài)博弈指參加者可同時決策并行動的博弈,并不考慮決策的次序問題。動態(tài)博弈指參加者先后、依次決策并且后行動者能夠觀察到先動者所選擇的策略和行動。⑨(4)完全信息博弈與不完全信息博弈。在前一種博弈中,每一個參與者都擁有全部的相關(guān)信息,只擁有部分相關(guān)信息的便屬于后一種博弈。⑩博弈理論按照不同的標準基本可分為以上四種情況。
“田忌賽馬”這個典故是非合作博弈,也是零和博弈,這在上文中已經(jīng)提到。同時,依據(jù)上文的三個前提,它同時也是一種不完全信息狀態(tài)下的動態(tài)博弈。
四“田忌賽馬”博弈的一般擴展式及其序列均衡
上文我們提到“田忌賽馬”博弈是非完全信息動態(tài)博弈,而這種博弈則是博弈論中最為復(fù)雜的模型,也稱動態(tài)貝葉斯博弈。序列均衡是非完全信息動態(tài)博弈的核心概念。
一個動態(tài)貝葉斯博弈的擴展式為∟=﹛N,H,P,I,p,u﹜,其中N為參與者集合,N=﹛0,1,2,…,n﹜,0代表自然。B11H為全歷史集合,即從博弈開始到博弈結(jié)束所有可能的行動序列﹛a0,a1,…,am﹜,m為任一自然數(shù),表示一個全歷史包含的行動次數(shù)。P為參與者函數(shù)即對于每一個子歷史h,P(h)將其映射成自然或是其他參與者。I為信息空間。p為自然的概率分布函數(shù),其表示當自然行動時,自然以多大概率選擇某個行動。u表示參與者的偏好,其定義是在全歷史結(jié)果上的收益函數(shù)。B12
在“田忌賽馬”博弈中,參與者集合N=﹛0,1,2﹜,0代表自然。H是全歷史集合,表示所有可能的行動序列﹛上中下,上下中,中上下,下上中,下中上,中下上﹜,即共有六個可能的行動。在此博弈中,由于是齊威王先行動,所以無論馬出場順序如何,作為自然的孫臏總是可以幫助田忌,以下等馬對上等馬,以中等馬對下等馬,以上等馬對中等馬(順序無先后),這樣如果把三場全勝看做“1”的話,那么田忌總有“2/3”的收益。也就是說田忌有100%的可能獲得2/3的收益。齊威王由于過分自信或者智商不高,未能識破此中玄機,所以敗下陣來。但在現(xiàn)實生活中,一方的決策是嚴格保密的,作為自然的“孫臏”并不可能事先知道“齊威王”的決策,而齊威王有六種行動序列,相對應(yīng),“田忌”也有六種,我們說過,只有一種情況可以助“田忌”勝出,所以“田忌”獲勝的概率僅為1/6。P為參與者函數(shù)即對于每一個子歷史h,P(h)將其映射成自然或是其他參與者。在此博弈中,假設(shè)一個子歷史“上中下”,那么P(h)作為一個映射將有六種;一共有六個子歷史,所以P(h)應(yīng)該有36種。I是信息空間。假設(shè)I1 是齊威王的信息空間,I1=﹛上中下,上下中,中上下,下上中,下中上,中下上﹜,I2同I1,因為他同樣不知道對方的策略。
在“田忌賽馬”這個非完全信息動態(tài)博弈中,還有一個很重要的因素需要我們注意,即參與者可能臨時改變策略,這也更帶來了決策的復(fù)雜性和不穩(wěn)定性。因為一場賽馬是由三局比賽構(gòu)成的(非同時進行),假設(shè)第一局結(jié)束后,參與者肯定要根據(jù)這一局得結(jié)果變換策略,同時也能觀察到一部分對方的策略,這么說來,雙方獲勝的概率就不是齊威王5/6,而田忌1/6的概率了,需要更復(fù)雜的計算。
客觀而言,直到今天理論界也沒有找到能適用所有非完全信息動態(tài)博弈的均衡概念,也缺乏一個普遍的方法來求解動態(tài)博弈的序列均衡。B13
結(jié)論
“田忌賽馬”博弈不是人們想象中的那么簡單的一個博弈,反而是博弈類型中最復(fù)雜的非完全信息動態(tài)博弈,應(yīng)該對這個博弈有一個全新的認識。并且,在這個博弈中,至少包含著兩個子博弈,這更加劇了此博弈的復(fù)雜性。博弈論思想雖然在實際生活中適用性差,但它教會我們一種思考問題的方法,對合理規(guī)避風險,獲取最大收益還是有指導(dǎo)意義的。(作者單位:四川大學(xué))
注解
①姚國慶:《博弈論》,北京:高等教育出版社,2007年,第1頁。
②王俊冰:“白話博弈論”,《理論學(xué)習》,2006年第6期,第63頁。
③郭磊:“博弈論簡論”,《山東經(jīng)濟》,1999年第6期,第17頁。
④胡靜:“博弈論在數(shù)學(xué)中的應(yīng)用”,《商情》,2006年第4期,第213頁。
⑤《孫子吳起列傳第五》,《史記》卷六十五,中華書局,2007年4月。
⑥“黃金”在古代是一種貨幣,不同于現(xiàn)代意義上的黃金;“黃金一千”只一千兩黃金的意思。
⑦周翰光:“論孫臏的對策論和辯證法”,《齊魯學(xué)刊》,1984年第3期,第36頁。
⑧胡靜:“博弈論在數(shù)學(xué)中的應(yīng)用”,《商情》,2008年第5期,第213頁。
⑨逯彥彥:“博弈論前瞻探討”,《商丘職業(yè)技術(shù)學(xué)院學(xué)報》,2009年第1期,第33頁。
⑩胡靜:“博弈論在數(shù)學(xué)中的應(yīng)用”,《商情》,2008年第5期,第213頁。
11“自然”指在動態(tài)貝葉斯博弈中參與博弈,無收益,但可以決定不同歷史發(fā)生概率的參與者。
12姚國慶:《博弈論》,北京:高等教育出版社,2007年,第220頁。
13姚國慶:《博弈論》,北京:高等教育出版社,2007年,第218頁。