楊華明++周江霖
摘要:針對軍校教學(xué)效率的不理想,建立了教師群體之間以及教師群體與主管部門之間的博弈模型及其復(fù)制動態(tài)方程,分析在不同的博弈模型中,教師主體的行為選擇,分析博弈模型中各博弈方的策略選擇及其影響因素,為有關(guān)部門決策時提供理論依據(jù)。
關(guān)鍵詞:教學(xué)效率;進(jìn)化博弈;復(fù)制動態(tài)方程;進(jìn)化穩(wěn)定策略
一、進(jìn)化博弈理論介紹
進(jìn)化博弈論是以有限理性的博弈方作為博弈分析的基礎(chǔ),研究的是博弈群體成員的策略調(diào)整過程、趨勢和穩(wěn)定性。其中,最重要的概念是“進(jìn)化穩(wěn)定策略”和“復(fù)制動態(tài)方程”。進(jìn)化穩(wěn)定策略(ESS)的數(shù)學(xué)描述:進(jìn)化穩(wěn)定策略ESS 是這樣的一種策略,如果群體中所有成員都采取這種策略,而這種策略的好處為其他策略所不及,那么在自然的影響下,將沒有突變策略能侵犯這個群體;進(jìn)化博弈復(fù)制動態(tài)方程是描述某一個特定策略在一個群體中被采納的比例的動態(tài)微分方程。由進(jìn)化原理可知,一種策略的收益比群體的平均收益高時,那么這種策略就會在群體中被模仿、學(xué)習(xí)和發(fā)展,即適者生存體現(xiàn)在這種策略的變化率 ??梢杂靡韵挛⒎址匠虂肀硎荆?。其中,xk表示群體中采取策略的k比例,u(k,s)表示采取策略k的期望收益,u(s,s)表示群體的平均期望收益;k表示不同的策略。
二、教師之間的博弈
1.模型
為了研究方便,我們把教師群體抽象為兩個個體,它們都是有限理性的博弈方。我們假設(shè)m表示教師從主管那里得到的固定收入;c表示教師努力工作時負(fù)效益,v表示高效率教學(xué)所得到的獎勵p表示低效率教學(xué)得到的懲罰,x表示低效率教學(xué)被懲罰的概率。模型如下:
2.復(fù)制動態(tài)方程和ESS
下面研究教師群體之間的進(jìn)化動態(tài)規(guī)律,也就是復(fù)制動態(tài)方程。假設(shè)在教師群體中,有比例為y的博弈方采取的策略是積極努力高效率教學(xué),比例為(1-y)的博弈方采取的策略是不努力低效率教學(xué)。采取兩種策略博弈方的期望收益和群體平均期望收益分別為:
3.分析討論
當(dāng)c
當(dāng) 時,即采用積極努力高效率教學(xué)策略的成本不大于采用不努力低效率教學(xué)策略被發(fā)現(xiàn)所受到的懲罰,同時采用積極努力高效率教學(xué)策略的成本不小于采用不努力策略的期望懲罰。由上面進(jìn)化穩(wěn)定策略的性質(zhì),我們可以知道 為ESS,即在教師積極努力成本中等時,教師會以一定的概率采用積極努力策略。
當(dāng) ,即采用積極努力策略的成本比采用不努力策略的期望懲罰小。由上面進(jìn)化穩(wěn)定策略的性質(zhì),我們可知, 為ESS,即教師采用積極努力策略的成本是低成本時,理性的教師會發(fā)現(xiàn),采取積極努力策略是有利的,則此時教師采用不努力策略的比例會得到很好的遏制。此時,積極努力策略是教師的上策。
三、教師群體與主管部門之間的博弈
1.教師群體與主管部門之間的博弈模型和復(fù)制動態(tài)方程在前面的教師群體博弈模型中,我們知道教師選擇的策略不同對其收益有差異,同時主管部門的監(jiān)管力度也是影響教師是否采取高效率教學(xué)策略的重要因素。
m為教師得到的固定收入;c表示教師教學(xué)效率高時需要付出的成本;i表示主管部門發(fā)現(xiàn)教師采用低效率策略對其的懲罰;r表示主管部門固定收益;a表示教師低效率教學(xué)時對教學(xué)造成的不良影響,這部分損失算在主管部門的收益中;b表示主管部門的監(jiān)管成本,這里各個參數(shù)我們假設(shè)都為正數(shù),且有i>c,i>b。這是一個非對稱博弈,因此不能套用對稱博弈的分析框架?,F(xiàn)在有兩個不同的博弈群體,一個是監(jiān)管教師效率的主管部門,另一個是教師群體,每一次博弈實際都是這兩個群體中的成員隨機配對進(jìn)行博弈,博弈方的學(xué)習(xí)和策略模仿局限在各自所在的群體內(nèi)部,策略調(diào)整的機制仍然是與兩人對稱博弈中相似的復(fù)制動態(tài)。假設(shè)教師中采取高效率策略的比例為1-x,那么采取低效率策略的比例為x;主管部門采取監(jiān)管策略的比例是1-y,那么采取不監(jiān)管策略的比例為y。這樣,教師采取高效率、低效率教學(xué)策略時的期望收益和群體平均收益分別為:
2.分析討論
先討論教師的復(fù)制動態(tài)方程。根據(jù)該動態(tài)方程和進(jìn)化穩(wěn)定策略的性質(zhì)可知:當(dāng)y=c/i時,則 。這意味著所有軸水平都是穩(wěn)定狀態(tài),當(dāng) 時,則 , 分別是兩個穩(wěn)定狀態(tài),其中當(dāng) 時, 是ESS。
再討論主管部門的復(fù)制動態(tài)方程。根據(jù)該動態(tài)方程和進(jìn)化穩(wěn)定策略的性質(zhì)可知:當(dāng) 時,則 。這意味著所有y軸水平都是穩(wěn)定狀態(tài),當(dāng) 時, 分別是兩個穩(wěn)定狀態(tài),其中當(dāng)時 , 是ESS,即采取積極努力策略的教師超過一定比例時,主管部門就沒有必要采取監(jiān)管策略;當(dāng) 時, 是ESS,即采取積極努力策略的教師小于一定比例時,主管部門就有必要采取監(jiān)管策略。另外,在 時,通過通常求Nash均衡的方法我們可以得到(高效率,不監(jiān)管)為占優(yōu)策略;在 時,(低效率,監(jiān)管)為占優(yōu)策略。在這兩種情況下,可知要想達(dá)到減少不努力行為的發(fā)生,就必須采取增大i值,減少b值的措施。