周 斌,趙昊驤,許玉久,陳佳佳
(1.新鄉(xiāng)學(xué)院 經(jīng)濟學(xué)院,河南 新鄉(xiāng) 453003;2.安徽大學(xué) 經(jīng)濟學(xué)院,安徽 合肥 230601)
教育部于2007年啟動了“國家大學(xué)生創(chuàng)新性實驗項目計劃”,這一計劃的實施對于激發(fā)大學(xué)生的創(chuàng)新潛質(zhì),培養(yǎng)大學(xué)生獨立思考和解決問題的能力具有重要意義。2012年,教育部和中國科學(xué)院聯(lián)合啟動實施“科教結(jié)合協(xié)同育人”行動計劃,強調(diào)了科技創(chuàng)新滲透于本科教學(xué)的重要性,將本科生科研訓(xùn)練納入了新一輪的人才培養(yǎng)體系,努力培養(yǎng)一批具有科研潛質(zhì)的優(yōu)秀人才。在建設(shè)“新工科、新醫(yī)科、新農(nóng)科、新文科”的背景下,高校應(yīng)主動地?fù)肀Мa(chǎn)業(yè)變革與科技創(chuàng)新的浪潮,培養(yǎng)具有高素質(zhì)的優(yōu)秀學(xué)生[1]。本科生參與科學(xué)研究是傳統(tǒng)教學(xué)方式的拓展[2],它有助于培養(yǎng)他們獨立思考的習(xí)慣,提高他們的科研素養(yǎng)和科研能力[3]。
就目前而言,面向大學(xué)生的學(xué)科競賽很多,教師主持的研究項目也很多,但多數(shù)學(xué)生由于學(xué)習(xí)壓力較大,科學(xué)研究意識比較淡薄,在參與學(xué)科競賽或科學(xué)研究時迫切需要教師的指導(dǎo)[4]。教師在鼓勵學(xué)生參與學(xué)科競賽的同時,要引導(dǎo)學(xué)生參與項目研究。由于學(xué)生人數(shù)眾多,學(xué)院很難了解每個學(xué)生的真實科研能力,這就容易導(dǎo)致部分研究能力較弱的學(xué)生參與了難度較高的項目,而研究能力較強的學(xué)生參與了難度較低的項目。為了解決這一問題,我們在考慮參與風(fēng)險與收益的前提下,構(gòu)建以學(xué)院和學(xué)生作為主體的動態(tài)博弈模型,基于雙方的決策期望收益,根據(jù)博弈主體的復(fù)制者動態(tài)方程得到了演化博弈系統(tǒng)的漸進(jìn)穩(wěn)定性條件和各均衡點坐標(biāo),討論了3種不同的均衡點的穩(wěn)定性并進(jìn)行了數(shù)據(jù)仿真,為準(zhǔn)確引導(dǎo)學(xué)生參與學(xué)科競賽和科學(xué)研究提供參考。
演化博弈模型的先行條件是決策者的有限理性,即決策者在決策過程中通過不斷試錯尋求最優(yōu)策略。在信息不完全環(huán)境中,決策雙方在尋求決策過程中的策略在不斷變化,因此博弈雙方不可能一次找到均衡點,他們需要對決策行為進(jìn)行不斷的修正,以達(dá)到在既定成本不變時利益最大化或決策最優(yōu)的目的[5–6]。由于學(xué)生與學(xué)院都無法一次性找到最有效的決策方案,學(xué)院需要通過不斷地組織學(xué)科競賽來知悉學(xué)生的決策意圖,了解學(xué)生的能力與喜好,學(xué)生也需要知悉學(xué)院對項目的評估結(jié)果與扶持力度。
根據(jù)以上分析我們作如下假設(shè):1)面對學(xué)科競賽或科研項目,學(xué)生面臨兩種決擇,一是選擇難度和科技含量較高的(下稱A類)項目,二是選擇難度和科技含量較低的(下稱B類)項目。由于學(xué)生精力有限,他們只能參與一個項目。2)面對學(xué)科競賽或科研項目,學(xué)院面臨兩種決擇,一是扶持學(xué)生參與A類項目,二是扶持學(xué)生參與B類項目。由于條件限制,學(xué)院只能選擇一類項目。3)為了提高學(xué)生的積極性,學(xué)院無差異地鼓勵所有學(xué)生參與。4)學(xué)生參加任意一類項目,總能獲得一定的成果,學(xué)院扶持任意一類項目,總能獲得一定的成果。
當(dāng)學(xué)生選擇參與A類項目,學(xué)院重點扶持A類項目時,學(xué)生的最大收益為ra,學(xué)院的最大收益為ca,但
A類項目有一定技術(shù)含量,且以概率p產(chǎn)生不必要的額外成本e。當(dāng)學(xué)生選擇參與B類項目,學(xué)院重點扶持A類項目時,學(xué)生的最大收益變?yōu)閞b,學(xué)院的最大收益變?yōu)閏b,但由于學(xué)院重點扶持A類項目,額外成本依然存在。當(dāng)學(xué)生選擇參與A類項目,學(xué)院
選擇扶持B類項目時,由于學(xué)生未能得到學(xué)院的扶持,無法完成難度高的項目,故收益為0,而學(xué)院能獲得參與B類項目的成果收益c0。當(dāng)學(xué)院選擇扶持B類項目,學(xué)生選擇參與B類項目時,學(xué)生能夠獲得最基本的收益r0,學(xué)院也能獲得最基礎(chǔ)的收益c0。根據(jù)以上分析可得如表1所示的博弈收益矩陣。
表1 參與項目的博弈收益矩陣
在實際操作中,通常會出現(xiàn)以下情況:學(xué)院不會公開項目的難易程度,而是無差異地鼓勵學(xué)生參與,學(xué)生無法了解項目的難易程度;學(xué)生為了獲得參與的機會,可能會過分包裝自己,學(xué)院無法知道學(xué)生的真實水平。學(xué)院和學(xué)生在決策前都有自己的預(yù)期,但雙方的預(yù)期決策無法被對方察覺,因此雙方就會做出混合策略,即在一定概率條件下準(zhǔn)備不同的選擇,以實現(xiàn)策略的均衡,此時任何一方改變策略都不會增加額外收益,因此可建立動態(tài)演化博弈模型。
假設(shè)學(xué)生以概率x選擇參與A項目,以概率(1 ?x)參加B項目,假設(shè)學(xué)院以概率y扶持A項目,以概率 (1 ?y)扶持B項目,則選擇參加A類和B類項目的學(xué)生的收益分別為
學(xué)生的期望收益為
同理,選擇扶持A類和B類項目時,學(xué)院的收益分別為
學(xué)院的期望收益為
由以上推導(dǎo)可知,學(xué)生與學(xué)院的復(fù)制者動態(tài)方程組為
下面分析學(xué)院與學(xué)生兩個主體的決策均衡點。在穩(wěn)定狀態(tài)下,均衡點要具有穩(wěn)健性與抗干擾性,即行為主體選擇確定的最優(yōu)穩(wěn)定策略才是演化穩(wěn)定策略(ESS)。在博弈中,最優(yōu)策略是指任何行為主體改變策略都是無利可圖的,而穩(wěn)定策略則是指任何細(xì)小的擾動都不影響最終決策結(jié)果,即演化博弈的均衡點不受隨機因素干擾。
對方程組(5)的第一式求x的偏導(dǎo)數(shù),第二式求y的偏導(dǎo)數(shù),并令它們等于零,有
由方程組(5)可得其相應(yīng)的雅可比矩陣
雅可比矩陣的行列式和跡分別為各均衡點對應(yīng)的行列式和跡由表2給出。
表2 各均衡點的行列式和跡
均衡點局部穩(wěn)定條件為 detJ> 0,trJ<0。此時的均衡點即是穩(wěn)定策略。通過符號的判斷可知ra>rb>r0,0
情形1:當(dāng)c0?(cb?ep) <0,決策點坐標(biāo)不在策略空間內(nèi),此時均衡點的穩(wěn)定狀態(tài)見表3。
表3 情形1時均衡點的穩(wěn)定狀態(tài)
情形2:當(dāng) 0 表4 情形2時均衡點的穩(wěn)定狀態(tài) 情 形3:當(dāng)c0?(cb?ep) >(ca?cb),決 策 點 坐 標(biāo)不在策略空間內(nèi),此時均衡點的穩(wěn)定狀態(tài)見表5。 表5 情形3時均衡點的穩(wěn)定狀態(tài) 下面對各均衡點的穩(wěn)定性進(jìn)行分析。 當(dāng)c0?(cb?ep)<0時,扶持A類項目的收益大于扶持B類項目的收益,學(xué)院選擇激進(jìn)決策,扶持A類項目。此時學(xué)生無論參與A類項目還是B類項目都能獲得一定收益,學(xué)院也能獲得更高的收益。 當(dāng)0 當(dāng)項目難度較低時,學(xué)院更傾向扶持A類。 當(dāng)c0?(cb?ep) >(ca?cb)時,扶持A類項目收益大于扶持B類項目,此時學(xué)院選擇保守決策,扶持B類項目,此時學(xué)生參與B類項目能夠獲得穩(wěn)定收益,參與A類項目無法獲得收益。 由以上3種情形可知,學(xué)生參與科學(xué)研究與學(xué)院扶持之間博弈存在最終穩(wěn)定策略,但行為主體在實現(xiàn)最終行為決策前的博弈過程以及策略變化軌跡無法直觀刻畫,因此借助Matlab2020對變化路程、變化速度進(jìn)行了仿真,仿真參數(shù)設(shè)置見表6,仿真結(jié)果見圖1、圖2和圖3。 圖2 情形2的仿真結(jié)果 圖3 情形3的仿真結(jié)果 表6 仿真參數(shù)的設(shè)置 圖1 情形1的仿真結(jié)果 由以上結(jié)果可知,大部分學(xué)生在做科研參與決策時,選擇項目類別的依據(jù)在很大程度上取決于學(xué)院對參與收益的評估。當(dāng)學(xué)院認(rèn)為A類項目的收益遠(yuǎn)大于B類項目時,學(xué)院更愿意扶持參加A類項目的學(xué)生,此時學(xué)生的最優(yōu)策略就是參與A類項目。同樣,當(dāng)學(xué)院認(rèn)為A類項目收益與風(fēng)險損失之和小于B類項目收益時,學(xué)院就會選擇扶持B類項目,此時學(xué)生為了獲得收益,就會選擇B類項目。 當(dāng)學(xué)院無法準(zhǔn)確做出項目的收益評估時,風(fēng)險損失就成為決策的主要依據(jù)。當(dāng)項目的風(fēng)險較高時學(xué)院則會趨于保守,當(dāng)風(fēng)險較低時學(xué)校就會趨于激進(jìn),這符合前兩類決策依據(jù)。此時學(xué)生是相對被動的,他們需要考慮學(xué)院的認(rèn)可,并在此基礎(chǔ)上確定自身的最優(yōu)策略??赡艿暮蠊怯械膶W(xué)生為了獲得更高的收益而盲目參與A類項目的研究,且沒有取得什么成果,另一些有能力的學(xué)生由于得不到學(xué)院的支持而參與B類項目的研究,從而失去獲得更高收益的機會。 在扶持項目時,學(xué)院不能只注重科研項目帶來的收益,而需要結(jié)合學(xué)生的參與意愿和能力綜合研判。在一定情況下,適當(dāng)放棄部分收益也是一種決策。對于一些難度大、成果轉(zhuǎn)化率低的項目,可先對學(xué)生的能力進(jìn)行評估及調(diào)查,當(dāng)參與該類項目研究的學(xué)生的能力尚未到達(dá)預(yù)期時,如果扶持難度高的項目,成本風(fēng)險會被放大,學(xué)院應(yīng)當(dāng)采取較為保守的決策,扶持難度較低的項目。同樣,如果學(xué)生的能力普遍較強、素養(yǎng)較高,獲得高收益的成本風(fēng)險就會大大降低,學(xué)院扶持這類項目才是整體上的最優(yōu)決策。學(xué)院和學(xué)生不能盲目求高,也不能過分保守。學(xué)院應(yīng)對參與項目的學(xué)生有一定的了解,而不應(yīng)對學(xué)生進(jìn)行無差異選拔,否則就可能把項目與學(xué)生錯配,無法獲得最佳收益。因此,教師應(yīng)將項目融入教學(xué)過程,提升學(xué)生的學(xué)術(shù)思維與科研素養(yǎng)水平,引導(dǎo)學(xué)生參與感興趣的項目,這樣學(xué)生在選擇科研項目時才能更加理性,參與科研項目研究更加高效。3 結(jié)果分析與建議