劉君亮 王儒 王翠芝
(1.北京交通大學(xué)科學(xué)技術(shù)研究院,北京 100044;2.北京交通大學(xué)經(jīng)濟(jì)管理學(xué)院,北京 100044;3.北京郵電大學(xué)人工智能學(xué)院,北京 100876)
科研誠(chéng)信是科技創(chuàng)新的基石,是實(shí)施創(chuàng)新驅(qū)動(dòng)發(fā)展戰(zhàn)略、建設(shè)世界科技強(qiáng)國(guó)目標(biāo)的重要基礎(chǔ)。雖然我國(guó)科研誠(chéng)信建設(shè)在工作機(jī)制、制度規(guī)范、教育引導(dǎo)、監(jiān)督懲戒等方面取得了顯著成效,但整體上仍存在短板,科研項(xiàng)目成員出現(xiàn)失信行為的現(xiàn)象屢禁不止。如何有效促進(jìn)科研誠(chéng)信,成為學(xué)術(shù)界亟待解決的問(wèn)題。
不少學(xué)者圍繞科研信用進(jìn)行了相應(yīng)的研究,如李艾丹和趙啟蘭等,他們從國(guó)家政策方面出發(fā),提出一套信用評(píng)價(jià)指標(biāo)體系[1]。國(guó)麗娜等從相關(guān)主體的誠(chéng)信度、合規(guī)度和踐約度等角度構(gòu)建了政府科研信用的評(píng)估指標(biāo)體系[2]。肖小溪和李曉軒提出,科研單位和資助單位之間存在信息不對(duì)稱現(xiàn)象,且在這種現(xiàn)象下的契約合同關(guān)系決定了雙方的信息不對(duì)稱問(wèn)題[3]。袁堯清詳細(xì)分析了我國(guó)科研行為信用評(píng)價(jià)體系目前所存在的問(wèn)題,并結(jié)合管理學(xué)的理論提出了切實(shí)可行的科研誠(chéng)信評(píng)估方案[4]。熊小滿從信息分享角度,指出了我國(guó)科研信用信息的共享程度不夠,由此引發(fā)了較多的科研失信問(wèn)題[5]。張明龍和張瓊妮從懲罰角度對(duì)失信行為進(jìn)行了研究,在懲罰中綜合考慮了執(zhí)行者、評(píng)價(jià)者和管理者對(duì)失信信息的利用[6]。段華平研究了現(xiàn)代契約機(jī)制與科研項(xiàng)目管理的關(guān)系,并提出了契約機(jī)制在一定程度上可以遏制失信行為的發(fā)生[7]。
以上學(xué)者在研究科研人員信用問(wèn)題時(shí),多從信用指標(biāo)構(gòu)建、法律法規(guī)制定、契約關(guān)系設(shè)置以及信息共享等方面展開,并未考慮到科研人員自身所存在的不完全信息以及不完全理性問(wèn)題。因此,當(dāng)前研究還存在一些不足之處。而博弈理論可以綜合考慮到以上兩種問(wèn)題,更全面地描述科研人員信用行為,分析其背后的失信機(jī)理。當(dāng)前,學(xué)術(shù)界在信用研究方面已有部分學(xué)者利用博弈理論展開研究。王性玉等通過(guò)建立信號(hào)傳遞博弈模型分析了抵押品替代與農(nóng)戶信貸可得之間的內(nèi)在作用機(jī)理[8;游宗君等基于小額信貸機(jī)構(gòu)進(jìn)入市場(chǎng)的先后順序,構(gòu)建了策略選擇的競(jìng)爭(zhēng)博弈模型[9];王惠和王靜在有限理性假設(shè)下,對(duì)比分析了銀行和農(nóng)戶之間有無(wú)合作社的情況下的最終演化趨勢(shì),以及借貸雙方的策略選擇變化情況[10];趙成國(guó)和李萌運(yùn)用委托代理理論,研究了P2P網(wǎng)貸平臺(tái)的演化博弈均衡以及最終的演化趨勢(shì)[11];夏鵬和高輝研究了政府部門和私營(yíng)部門兩者的演化博弈均衡,分析了社會(huì)監(jiān)管力度對(duì)演化均衡的最終影響[12];張娟等把演化博弈模型應(yīng)用在網(wǎng)絡(luò)銷售商之間的信用關(guān)系演化當(dāng)中,通過(guò)模型對(duì)網(wǎng)絡(luò)銷售商信用治理進(jìn)行研究[13];肖莎等在小微企業(yè)融資的基礎(chǔ)博弈模型上,提出可以利用信用評(píng)級(jí)和懲罰成本來(lái)降低企業(yè)的信用貸款風(fēng)險(xiǎn)[14];博弈理論在信用研究上的廣泛應(yīng)用說(shuō)明了該方法的有效性,但目前在科研信用方面還少有學(xué)者應(yīng)用博弈論的方法對(duì)其進(jìn)行研究。鑒于演化博弈論在該領(lǐng)域的適用性,該理論可為科研行為主體在信用監(jiān)管上提供理論支撐。
故本文在之前學(xué)者的研究基礎(chǔ)上,綜合考慮了科研行為主體間的有限理性以及不完全信息等問(wèn)題,采用演化博弈分析了利益驅(qū)動(dòng)下的科研行為。通過(guò)構(gòu)建兩組科研行為主體的演化博弈模型,分析科技研發(fā)中誠(chéng)信策略的穩(wěn)定性、演變趨勢(shì)及演化穩(wěn)定點(diǎn),研究誠(chéng)信科研成本、不誠(chéng)信科研風(fēng)險(xiǎn)等要素對(duì)科研行為演化均衡的影響;再將監(jiān)管部門參數(shù)化后加入到改進(jìn)的模型,進(jìn)一步分析了監(jiān)管部門對(duì)演化均衡策略的影響和各影響因素對(duì)博弈演變的影響靈敏度,為提出推動(dòng)誠(chéng)信科研策略建議提供依據(jù)。
針對(duì)模型做如下假設(shè):
(1)假設(shè)主體信息是完全公開的,即各主體間能夠完全了解彼此特征的差異、戰(zhàn)略選擇空間和收益支付函數(shù)的不同。科研行為主體由于人數(shù)與項(xiàng)目能力不同,分為A類和B類,策略集合均為(誠(chéng)信,不誠(chéng)信)。A類科研人員的項(xiàng)目數(shù)為n1,B類為n2,基準(zhǔn)收益與項(xiàng)目數(shù)量成正比。
(2)假設(shè)各科研行為主體中的人員均處于有限理性,會(huì)根據(jù)群體收益情況合理調(diào)整自身的策略選擇。
(3)監(jiān)管部門可以從聯(lián)合獎(jiǎng)懲角度對(duì)科研人員的守信情況實(shí)施獎(jiǎng)懲。監(jiān)管部門作為獨(dú)立于各科研行為主體的第三方組織,需秉持公平公正監(jiān)管的同時(shí),還需要對(duì)失信人員實(shí)施嚴(yán)厲處罰,增大其失信成本,進(jìn)而減少失信行為的發(fā)生,針對(duì)A類項(xiàng)目組的懲罰值P1(P1≥0),對(duì)B類項(xiàng)目組給予懲罰值P2(P2≥0)。
(4)當(dāng)A類科研行為主體和B類科研行為主體都采取誠(chéng)信科研行為時(shí),此時(shí)呈現(xiàn)誠(chéng)信局面,但是A、B兩個(gè)項(xiàng)目組會(huì)產(chǎn)生一定的誠(chéng)信科研成本C,這里假設(shè),A類項(xiàng)目組的科研成本αC,B類項(xiàng)目組的科研成本為(1-α)C。
(5)當(dāng)A類科研行為主體與B類科研行為主體其中一個(gè)選擇誠(chéng)信科研,另一個(gè)選擇不誠(chéng)信科研時(shí),兩個(gè)科研行為主體之間會(huì)產(chǎn)生一定的項(xiàng)目數(shù)量轉(zhuǎn)移。假設(shè)A類科研行為主體采取誠(chéng)信科研策略,B類科研行為主體采取不誠(chéng)信科研策略時(shí),A類科研行為主體會(huì)損失S1,B類科研行為主體會(huì)增加S2,反則亦然。
由于策略集合的組合不同,會(huì)產(chǎn)生以下4種不同的策略情況:
(1)當(dāng)A類科研行為主體和B類科研行為主體都采取誠(chéng)信科研策略時(shí),兩個(gè)科研行為主體都會(huì)通過(guò)自身的努力將增加總體項(xiàng)目數(shù)量轉(zhuǎn)化并獲得收益,設(shè)增量分別為n3和kn3。在不影響基礎(chǔ)假設(shè)的情況下,設(shè)二者的收益率分別為r1和r2,科研行為主體的成本為C,并在兩類科研行為主體之間按照α和1-α的比例進(jìn)行分配。因此,A類科研人員的收益為(n1+n3)r1-αC,B類科研人員的收益為(n2+kn3)r2-(1-α)C。
(2)當(dāng)A類科研行為主體選擇誠(chéng)信科研策略而B類科研行為主體選擇不誠(chéng)信科研策略時(shí),對(duì)應(yīng)的收益情況為:A類科研行為主體收益:n1r1-αC-S1,B類收益為n2r2-T2+S2-P2,這里T2表示B類科研行為主體選擇不誠(chéng)信策略時(shí)產(chǎn)生的成本,且T2<(1-α)C。
(3)當(dāng)A類選擇不誠(chéng)信而B類選擇誠(chéng)信時(shí),對(duì)應(yīng)的收益情況為:A類科研行為主體:n1r1-T1+S1-P1,B類科研行為主體:n2r2-(1-α)C-S2,這里T1表示A類科研行為主體選擇不誠(chéng)信策略時(shí)產(chǎn)生的成本,且T1<αC。
(4)當(dāng)A類科研行為主體與B類科研行為主體都選擇不誠(chéng)信科研策略,會(huì)導(dǎo)致雙方項(xiàng)目收益發(fā)生改變。A類科研行為主體:(n1-hΔn)r1-T1-P1,B類科研行為主體:(n2-hΔn)r2-T2-P2,收益的變化主要是由項(xiàng)目數(shù)量引起的,比例系數(shù)h是一個(gè)介于-1和1之間的數(shù),相應(yīng)收益變化量為 |hΔn|。
A類科研行為主體與B類科研行為主體選擇誠(chéng)信科研的概率分別為x和y,反之不誠(chéng)信科研的概率為(1-x)和(1-y)。根據(jù)對(duì)博弈雙方的假設(shè),我們可以得到A類與B類科研科研行為主體的支付矩陣,具體如表1所示。
表1 監(jiān)管部門調(diào)控下科研行為主體支付矩陣
在監(jiān)督管理部門激勵(lì)機(jī)制下,兩類項(xiàng)目組支付結(jié)果的復(fù)制動(dòng)態(tài)方程如下:
A類科研行為主體:
B類科研行為主體:
令G(x)=0,G(y)=0,可以得到:在平面N={(x,y);0≤x,y≤1}上,科研行為主體間的策略博弈有5個(gè)局部均衡點(diǎn),分別是O(0,0),A(1 ,0),B( ,1),C(0,1)和鞍點(diǎn)D(xD,yD)。其中,。
根據(jù)前文的分析,我們求得了5個(gè)均衡點(diǎn),從Jacobian矩陣(記為J)分析得出系統(tǒng)的演化穩(wěn)定策略。
如果同時(shí)滿足以下兩個(gè)條件,則可判斷為演化穩(wěn)定策略。
①trJ=α11+α22<0(跡條件);
表2 局部均衡點(diǎn)處a11、a12、a21和a22的取值
這里,
應(yīng)用系統(tǒng)平衡點(diǎn)的判斷局部穩(wěn)定性,可以得到當(dāng)P1、P2均滿足:且同時(shí)滿足,
P1>αC+S1-hΔnr1-T1或P2>S2+(1-α)C-hΔnr2-T2,穩(wěn)定點(diǎn)將為(1,1)。即A類科研行為主體與B類科研行為主體都選擇誠(chéng)信科研策略,說(shuō)明此時(shí)監(jiān)管部門的懲罰對(duì)于A類科研行為主體與B類科研行為主體都是有效的,穩(wěn)定性情況為(0,0)是不穩(wěn)定點(diǎn),(0,1)和(1,0)是鞍點(diǎn),只有(1,1)是演化穩(wěn)定點(diǎn)。
綜合前文分析結(jié)果,可以繪制出博弈雙方的策略演化相位圖,如圖1所示。
圖1 科研行為主體行為選擇演化相位圖
圖1描述了A類科研行為主體與B類科研行為主體的博弈過(guò)程,其中折線ADC作為臨界線劃分出系統(tǒng)所收斂的不同狀態(tài),右側(cè)ABCD部分收斂于(誠(chéng)信科研,誠(chéng)信科研),即(1,1)點(diǎn)。左側(cè)ADCO部分收斂于(不誠(chéng)信科研,不誠(chéng)信科研),即(0,0)點(diǎn)。
可見(jiàn),在科研行為主體行為在無(wú)監(jiān)管或少監(jiān)管的情況下,A類科研行為主體與B類科研行為主體的最終演化均衡點(diǎn)取決于SABCD和SADCO的面積大小。若SABCD>SADCO,系統(tǒng)將更可能向誠(chéng)信科研的方向演化;若SABCD<SADCO,系統(tǒng)將更可能向不誠(chéng)信科研的方向演化;若SABCD=SADCO,策略選擇概率相等,演化方向不確定。根據(jù)圖3得出區(qū)域ADCO的面積為:。
影響SADCO的參數(shù)均與SADCO為單調(diào)關(guān)系,其對(duì)于科研行為主體信用策略的演化方向的影響情況為:科研風(fēng)險(xiǎn)S1、不誠(chéng)信科研成本T1和懲罰值P1的減少,會(huì)導(dǎo)致y*的下降,進(jìn)而使得SABCD增大,演化穩(wěn)定點(diǎn)向(誠(chéng)信,誠(chéng)信)方向演進(jìn);科研風(fēng)險(xiǎn)S2、不誠(chéng)信科研成本T2和懲罰值P2的減少,會(huì)導(dǎo)致x*的下降,進(jìn)而使得SABCD增大,演化穩(wěn)定點(diǎn)向(誠(chéng)信,誠(chéng)信)方向演進(jìn);誠(chéng)信科研成本C的減少,會(huì)導(dǎo)致x*和y*的下降,進(jìn)而使得SABCD增大,演化穩(wěn)定點(diǎn)向(誠(chéng)信,誠(chéng)信)方向演進(jìn)。
可以看出,通過(guò)減少科研行為主體的誠(chéng)信科研成本、誠(chéng)信科研風(fēng)險(xiǎn)和增加科研行為主體的不誠(chéng)信科研成本與懲罰,能夠使A類與B類項(xiàng)目組更趨于互相選擇誠(chéng)信科研,利于科技發(fā)展。
科研誠(chéng)信是科技創(chuàng)新的基石,如何對(duì)科研人員的信用水平進(jìn)行有效監(jiān)管是推動(dòng)科研誠(chéng)信建設(shè)的重要途徑。本文綜合考慮科研項(xiàng)目成員間的有限理性、不完全信息以及各類科研人員的收益情況,并考慮各自的風(fēng)險(xiǎn)偏好程度,構(gòu)建了演化博弈模型,通過(guò)算例進(jìn)一步分析了各影響因素對(duì)博弈演變的影響靈敏度,研究得出以下結(jié)論:
(1)項(xiàng)目組的博弈均衡演變受到不同因素影響,與誠(chéng)信科研成本、誠(chéng)信科研風(fēng)險(xiǎn)、誠(chéng)信科研收益增加率、不誠(chéng)信科研收益以及相應(yīng)成本等因素有關(guān)。監(jiān)管部門的存在,可以通過(guò)調(diào)節(jié)誠(chéng)信科研成本、誠(chéng)信科研風(fēng)險(xiǎn)、誠(chéng)信科研收益增加率、不誠(chéng)信科研收益率以及相應(yīng)成本,促進(jìn)科研行為均衡點(diǎn)向誠(chéng)信科研方向演化。重視對(duì)于科研人員科研行為的監(jiān)管與干預(yù),強(qiáng)化監(jiān)管行為,完善監(jiān)管體系,優(yōu)化監(jiān)管效果,可以有效減少科研失信行為。
(2)不同影響因素對(duì)科研行為主體策略選擇的影響方向不同。誠(chéng)信科研成本、誠(chéng)信科研風(fēng)險(xiǎn)、不誠(chéng)信科研收益等因素,對(duì)科研行為主體選擇誠(chéng)信科研行為策略具有負(fù)向影響;科研行為主體的不誠(chéng)信科研成本、誠(chéng)信科研收益增加等因素對(duì)科研行為主體選擇誠(chéng)信科研行為策略具有正向影響。監(jiān)管部門可以通過(guò)降低負(fù)向影響因素值,提高正向影響因素值,推動(dòng)科研行為主體的誠(chéng)信科研行為。
(3)不同影響因素對(duì)科研行為主體策略選擇的影響程度不同。影響科研行為主體策略選擇的因素中,誠(chéng)信科研行為收益率影響程度最大,誠(chéng)信科研成本影響較大。監(jiān)管部門可以通過(guò)提高科研行為主體收益轉(zhuǎn)化率、降低誠(chéng)信科研成本,進(jìn)而降低誠(chéng)信科研風(fēng)險(xiǎn),促進(jìn)科研行為主體選擇誠(chéng)信科研策略。