[摘 要] 本文首先簡要介紹了進化穩(wěn)定策略的定義和一些簡單性質,并主要就進化博弈上具有代表性的消耗戰(zhàn)博弈模型進行了深入地研究。
[關鍵詞] 進化博弈 進化穩(wěn)定策略 消耗戰(zhàn)博弈
進化上的穩(wěn)定策略(簡稱進化穩(wěn)定策略)是進化博弈理論最基本的均衡概念,它具有廣泛的應用性并在發(fā)展中得到了不斷完善。消耗戰(zhàn)博弈模型是進化博弈中典型的模型,它既可以用來分析生物居群中兩個個體的勝負取決于堅持對峙的時間的博弈,也可以分析有兩個國家參加的戰(zhàn)爭中勝利取決于誰堅持到最后的博弈以及一些實際的經濟問題。
一、進化穩(wěn)定策略
進化穩(wěn)定策略的基本思想:假設存在一個全部選擇某一特定策略的大群體和一個選擇不同策略的突變小群體,這個突變小群體進入到該大群體而形成一個混合群體,如果突變小群體在混合群體中博弈所得到的收益大于原群體中個體所得到的收益,那么小群體就能侵入到大群體,反之就不能侵入到大群體。
首先看 Maynard Smith和Price所定義的進化穩(wěn)定策略。
一個策略u1∈A是進化穩(wěn)定策略。如果對任意的u2∈A,u2≠u1,滿足:E(u1,u1)≥E(u2,u1);而當E(u1,u1)=E(u2,u1)時,有E(u1,u2)>E(u2,u2)成立。其中,A是進化博弈的策略集;E是群體中個體博弈時的收益函數(shù)。
1982年,Maynard Smith對上述定義做了改進,給出了如下定義:
一個策略u1是進化穩(wěn)定策略。如果對所有的備擇策略滿足如下條件之一,ESS條件(1):即E(u1,u2)>E(u2,u1),即u1一定是一個關于它自己的最好對策。ESS條件(2):若E(u1,u1)=E(u2,u1)則E(u1,u2)>E(u2,u2),即若u2是關于u1的最好的備擇策略,則u1對u2一定是一個比u2對自己較好的策略。
二、進化穩(wěn)定策略的性質
這一部分給出在推導和證明消耗戰(zhàn)博弈的進化穩(wěn)定策略時,將要用到的三個進化穩(wěn)定策略的簡單性質,這些性質都可以由進化穩(wěn)定策略的定義直接推出。
性質1:如果策略u是進化穩(wěn)定策略,那么對任意u’∈A都有E(u,u)≥E(u’,u)。
性質2:如果策略u是進化穩(wěn)定策略,且對任意策略u’∈A都有E(u,u)=E(u’,u),那么必有E(u,u’)≥E(u’,u’)。其中,A是進化博弈的策略集;E是收益函數(shù)。
在介紹性質3之前,首先看一個定義:如果u是一個進化穩(wěn)定策略,則組成u的純策略,稱為u的合算策略。
性質3:對任意的進化穩(wěn)定策略u,一方使用u的合算策略,而另一方使用策略u,所得到的收益與雙方都使用策略u所得的收益相同。
三、消耗戰(zhàn)博弈模型
生物學上,許多的交配特性往往體現(xiàn)為動物的炫耀行為。勝利往往屬于炫耀時間最長的一個。競爭的目的可能是占領一塊地盤或占有雌性等,這種炫耀方式問題是雙方花費時間,而本來這些時間可以使用的更有利一些。也可以參照對消耗戰(zhàn)博弈的描述:生物居群中兩個個體間博弈的勝負取決于堅持對峙的時間,個體的策略為對峙時間t的選擇。其中策略t表示對峙到時間t,然后停止。假定勝利方獲得的收益為ν,同時要接受來自時間損耗的懲罰值,如果懲罰值隨時間均勻增加(即為時間的線性函數(shù)),這種條件下的消耗戰(zhàn)博弈模型在本文中稱為線性損耗消耗戰(zhàn)博弈模型。
1.線性損耗模型
(1)模型描述:一生物居群中的兩個同種個體,它們?yōu)榱俗陨淼睦?尋求配偶、爭奪食物等)而進行對峙(斗爭)并且勝利屬于堅持到最后的一方。
設個體1選擇策略t1,個體2選擇策略t2,并且t1和t2均屬于[0,∞),則個體1的收益函數(shù)為:
其中,ν>0,c>0。
(2)模型的進化穩(wěn)定策略:根據(jù)王青川等學者所著《進化上的穩(wěn)定策略之數(shù)學模型研究》一文得到以下的結論:
①任何一個純策略都不是進化穩(wěn)定策略。
②混合策略以概率分布是一個進化穩(wěn)定策略。
2.二次損耗模型
針對一次損耗條件下的消耗戰(zhàn)模型只能描述博弈雙方的消耗隨時間均勻增加而無法應用到消耗隨時間逐漸加快時的缺點,提出了一種新的適用于消耗隨時間加快的二次損耗消耗戰(zhàn)模型。
(1)模型描述:在生物居群中兩同種個體為了自身的利益而進行爭奪。兩個體為了確保最后的勝利,首先進行戰(zhàn)前準備活動,然后投入到雙方的斗爭之中。由于體力、耐力等原因雙方會逐漸加大斗爭的投入來盡快結束這種斗爭,勝利屬于堅持到最后的一方。把這種兩個體間的爭奪看作是兩個體之間的博弈,把兩個體分別作為博弈的兩個參與者。
設個體1選擇策略t1,個體2選擇策略t2,并且t1和t2均屬于[0,∞),則個體1的收益函數(shù)為:
其中,ν>0,c>0,b≥0。
ν表示勝利方獲得的收益;c是損耗系數(shù);b是雙方的初始損耗。
(2)模型的進化穩(wěn)定策略:
①任何的一個純策略都不是進化穩(wěn)定策略。證明:對個體的任意一個純策略t,有E(t,t)=-(ct2+b)。對任意的h>0,E(t+h,t)=ν-(ct2+b),顯然E(t+h,t)>E(t,t)。根據(jù)前面的進化穩(wěn)定策略的性質3知:純策略不是進化穩(wěn)定策略。
②混合戰(zhàn)略u以概率分布是一個進化穩(wěn)定策略。這一部分首先找出了一個滿足進化穩(wěn)定策略必要條件(性質3)的混合策略u,然后證明它是一個進化穩(wěn)定策略。
假設u是一個混合策略,它可由分布函數(shù)F(t)給出(F(t)表示策略運用不超過t的概率),設f(t)是F(t)的概率密度函數(shù)。對于一個個體采取純策略t1,另一個體采取混合策略u時,根據(jù)進化穩(wěn)定策略的性質3得知,此時采取純策略t1的個體收益為一常數(shù)(設為A)。
即有:
由得到:
整理后得: (1)
對(1)兩邊求關于t1的導數(shù)得:(2)
對(2)兩邊求關于t1的導數(shù)得:
即為: (3)
解微分方程(3)滿足初始條件f(0)=0,f`(0)=的解為:
用t代換t1得到:
下面證明混合策略u以概率分布是一個進化穩(wěn)定策略。
證明:對任意策略g,g≠f,即證E(f,g)>E(g,g)。等價于證明下式成立T(f,g)=E(f,f)-E(f,g)-E(g,f)+E(g,g)≤0(因為g≠f,上式為嚴格不等式,又E(f,f)=E(g,f)從而有E(f,g)>E(g,g)。E(f,g)+E(g,f)是個體分別運用策略f和g所得收益之和。如果博弈持續(xù)到時間t,二人的收益和是2[-(ct2+b)],又博弈持續(xù)到時間t的概率為f(t)[1-G(t)]+g(t)[1-F(t)]。其中F(t)、G(t)分別是f(t)、g(t)的分布函數(shù)。所以有
E(f,g)+E(g,f)=ν-2(ct2+b){f(t)[1-G(t)]+g(t)[1-F(t)]}dt (4)
E(f,f)=-2(ct2+b)f(t)[1-F(t)]dt (5)
將(4)與(5)式代入到T(f,g)中得:
T(f,g)=2(ct2+b)[f(t)-g(t)][F(t)-G(t)]dt (6)
對(6)式分部積分,得:
2(ct2+b)[f(t)-g(t)][F(t)-G(t)]dt=2(ct2+b)[F(t)-G(t)]d[F(t)-G(t)]
=2(ct2+b)[F(t)-G(t)]2|∞0-2(ct2+b)[f(t)-g(t)][F(t)-G(t)]dt
-4ct[F(t)-G(t)]2dt (7)
又由知:
2(ct2+b)[F(t)-G(t)]2|∞0=0(8)
把(8)代入(7)并整理得:
2(ct2+b)[f(t)-g(t)][F(t)-G(t)]dt=-2ct[F(t)-G(t)]2dt (9)
從而由(6),(9)式得:T(f,g)=-2ct[F(t)-G(t)]2dt≤0。
所以,混合策略u以概率分布f是一個進化穩(wěn)定策略。
(3)模型中參數(shù)分析:
參數(shù)c:進化穩(wěn)定策略f(t)關于c的偏導數(shù)為,顯然在經過一定時間t0(t0=)之后,上式就會小于零。即在t 參數(shù)ν:進化穩(wěn)定策略f(t)關于ν的偏導數(shù)為,經過一定的時間t0(t0=)之后,上式就會大于零。即在t>t0時,f(t)是關于ν的增函數(shù)。這說明了利益的誘惑,使得博弈雙方更趨向于堅持下去。 3.兩種模型的簡單比較 由線性損耗和二次損耗消耗戰(zhàn)博弈模型知:在同一時間t的博弈個體的損耗分別為ct和ct2+b,而由它們的進化穩(wěn)定策略知:博弈個體選擇純策略t的概率卻分別是和。例如,取c=1,ν=1,b=0時,個體選擇t=10的概率分別為e10和e100,顯然e100要遠遠大于e10。也就是說,損耗速度的加快使得居群中的個體更趨向于盡早結束博弈,這與實際是相符的。 四、結束語 本文建立的二次損耗消耗戰(zhàn)博弈模型為解決一些損耗隨時間加快的消耗戰(zhàn)博弈問題提供了理論依據(jù)。例如,分析像居群中兩個體對峙的博弈問題;兩國間的戰(zhàn)爭博弈以及一些經濟問題等。不過現(xiàn)實生活中消耗戰(zhàn)博弈的損耗可以是多種多樣的,決不僅限于一次、二次損耗,因此還可以建立其他損耗條件下的消耗戰(zhàn)博弈模型,對這一方面的研究還存在著廣闊的空間。 參考文獻: [1]Maynard Smith, J., And Price , B.R.,1973. The Logic of Animal Conflict, Nature,246, P15~18 [2]Maynard Smith , J. , 1982 , Evolution and the Theory of Games(combridge university press) [3]Selten R. A note on evolutionarily stable stratifies in asymmetric animal conflicts[J]. J Theoret Biol , 1980,84,P 93~101 [4]Swinkels , J . , 1992. Evolution and Strategic Stability:From aynard Smith to Kohlberg and mertens . Journal of Economic Theory, 57, P333~342 [5]L·C·托馬斯(英)著 勒 敏 王輝青譯:《對策論及其應用》[M].解放軍出版社, 1988年, P243~244 [6]王青川 劉志斌 王海川 鄧哲民:進化上的穩(wěn)定策略之數(shù)學模型研究[J].陜西師大學報,1996年12月,24(4),P8~9 “本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文”