龍利娟, 王源昌, 呂 蕾
(云南師范大學 數(shù)學學院, 昆明 650500)
“堅持開放創(chuàng)新,加強國際科技交流合作”[1]是中國推動科技創(chuàng)新的重要舉措。自古以來,人類社會的每一項進步,都伴隨著科學技術(shù)的進步。隨著信息化與科技全球化時代的到來,新一輪科技革命和產(chǎn)業(yè)變革蓬勃興起,國際科技合作也將面臨全新的機遇和挑戰(zhàn)。
對于不同國家之間的科技合作,張公一等[2]分析了完全信息與參與者完全理性情形下不同國家間的靜態(tài)博弈,但由于在研究不同國家之間的科技合作時,每個國家選擇合作的概率屬于一個動態(tài)變化過程,且在現(xiàn)實世界中,不同國家之間的合作處于不完全信息與有限理性狀態(tài)中,則可以運用演化博弈的方法來刻畫不同國家之間的動態(tài)科技合作關系。
就演化博弈而言,1973年Smith[3]首次提出的演化穩(wěn)定策略標志著演化博弈理論的誕生,在此基礎上,研究人員將其應用于多個領域。在應用研究領域,國內(nèi)學者運用其基本原理對環(huán)境保護、電子商務、監(jiān)管機制及機會主義行為研究等領域進行了積極的探索[4-5]。其中,就國際合作而言,鄭軍等[6]分析了中國與海上絲綢之路沿途國家合作的演化方向及其實現(xiàn)條件。除此之外,楊文珂等[7]研究了跨國綠色創(chuàng)新國家合作中機會主義行為治理機制以及如何抑制機會主義相關問題。
對于加入政府控制因素下的演化博弈研究,臺德藝、潘海蘭[8]研究了政府影響力與執(zhí)行力對電商平臺與經(jīng)營者演化博弈中的影響;李林等[9]將政府作為一個市場主體,研究有無政府干預情況下的國家及高校和科研機構(gòu)協(xié)同創(chuàng)新合作的演化博弈規(guī)律;李柏洲等[10]構(gòu)建了“政府-國家-用戶”三方演化博弈模型用以研究政府的政策激勵對國家與用戶創(chuàng)新知識交互中的作用;李瑋等[11]基于外部性理論分別研究了有無政府激勵政策下的私人參與基礎設施融資行為選擇問題;楊文珂等[7]在研究跨國綠色創(chuàng)新國際合作時,引入政府監(jiān)管系數(shù),對合作中的機會主義進行相應的懲罰。
本文在現(xiàn)有的研究基礎上,選取了內(nèi)生能力系數(shù)、科技合作成本系數(shù)、科技合作收益系數(shù)、“搭便車”收益系數(shù)、外部影響系數(shù)、合作風險系數(shù)、信任水平及政府干預力度系數(shù)共8個影響合作因素系數(shù),全面分析了影響本國與外國科技合作的因素,并基于現(xiàn)實可能性,考察政府干預力度時,無法調(diào)控外國對其本國的干預力度,即本文只考慮政府干預力度對跨國科技合作的影響。同時,為研究方便,假定各國科技合作成本或收益為科技創(chuàng)新投入成本的線性函數(shù)。在此基礎上,構(gòu)建非對稱演化博弈支付矩陣,建立動態(tài)方程,尋求不同條件下的演化穩(wěn)定策略,并研究如何控制影響中國與其他國家科技合作的因素來促進兩國之間的合作。最后,基于上述研究,利用2019年中國與越南各類別數(shù)據(jù),進行博弈策略分析,對如何提高兩國合作概率提供建議。
對于政府干預下的本國與外國科技合作演化博弈研究而言,為了研究便利,對本國與外國科技合作策略問題做離散化假設,即{合作,不合作}二分法策略。將本國記為國家M,外國記為國家N,基于有限理性理論,在科技合作博弈問題中,本國與外國存在以下幾種博弈情形:
1)雙方均采取合作策略。國家M與國家N基于相互信任,在科技合作過程中雙方收益均大于科技合作所需成本,則博弈雙方在各自獨立科研、自主創(chuàng)新的基礎上,采取科技合作策略,在合作中將獲得超額收益。
2)一方采取合作策略,另一方采取不合作策略。對于國家M而言,當其發(fā)現(xiàn)采取合作策略收益大于成本或在政府干預下不得不采取合作策略時,外國國家N發(fā)現(xiàn)其采取合作策略其收益小于所需成本或采取不合作策略將會具有“搭便車”收益,即在跨國科技合作中,國家之間存在信息不對稱現(xiàn)象,當某一國選擇合作時,將會產(chǎn)生一定的技術(shù)溢出,此時博弈中另一個國家有可能產(chǎn)生機會主義心理,從而出現(xiàn)“搭便車”現(xiàn)象,產(chǎn)生“搭便車”收益。此時國家M將采取合作策略,國家N將采取不合作策略;當國家M發(fā)現(xiàn)在政府控制下其采取合作策略收益小于成本或發(fā)現(xiàn)有機會獲得“搭便車”收益,國家N發(fā)現(xiàn)采取合作策略其收益大于成本時,國家M將采取不合作策略,國家N將采取合作策略。
3)雙方均采取不合作策略。由于在科技合作中,博弈雙方均認為沒有利益可得或均想采取“搭便車”行為,以及雙方缺乏相互信任等原因而放棄合作,則國家M與國家N均采取不合作策略。
假設博弈雙方參與者之間存在足夠多的合作機會,每一階段博弈收益無差別,且在本文中,為研究方便,將以國家獨立研究發(fā)生的成本為基石,利用某個參數(shù)與研究成本乘積來表示其他收益或成本,基于此建立國家M與國家N二分法策略下的不對稱博弈收益矩陣,見表1。
表1 博弈雙方收益矩陣
基于上文分析,假設國家M選擇合作的概率為x,選擇不合作的概率為1-x,國家N選擇合作的概率為y,選擇不合作的概率為1-y。
由演化博弈理論,國家M選擇“合作”策略與“不合作”策略的期望函數(shù)分別為
EM合作=y[αMCM+γMCM+μNMCM-βMCM-(1-ηMN)δMγMCM+mMCM]+(1-y)(αMCM+μNMCM-βMCM+mMCM)
(1)
EM不合作=y(αMCM+μNMCM+ρMCN-mMCM)+(1-y)(αMCM+μNMCM-mMCM)
(2)
(3)
同理可得國家N選擇“合作”策略與“不合作”策略的期望函數(shù)分別為
UN合作=x[αNCN+γNCN+μMNCN-βNCN-(1-ηNM)δNγNCN]+(1-x)(αNCN+μMNCN-βNCN)
(4)
UN不合作=x[αNCN+μMNCN+ρNCM]+(1-x)(αNCN+μMNCN)
(5)
(6)
(7)
同理,國家N采取合作策略的復制動態(tài)方程為
(8)
令
可以得到博弈的局部均衡點分別為O(0,0)、A(0,1)、B(1,0)、C(1,1)、D(x*,y*)。其中
為進一步對5個局部均衡點的穩(wěn)定性進行分析,并對其合作演化路徑進行分析,將根據(jù)博弈復制動態(tài)方程的雅克比矩陣進行下一步的分析。令
則雅克比矩陣為
其中,
情形1:2mM<βM。
條件1:
在此情形下,對于O(0,0)而言,其雅克比行列式
雅克比矩陣的跡為
trJ=-βNCN+(2mMCM-βMCM)<0。
對于A(0,1)而言,其雅克比行列式為
雅克比矩陣的跡為
trJ=βNCN+[γMCM-(1-ηMN)δMγMCM-ρMCN+2mMCM-βMCM]>0。
對于B(1,0)而言,其雅克比行列式為
雅克比矩陣的跡為
trJ=(-2mMCM+βMCM)+[γNCN-(1-ηNM)δNγNCN-ρNCM-βNCN]>0。
對于C(1,1)而言,其雅克比行列式
雅克比矩陣的跡為
trJ=[-γMCM+(1-ηMN)δMγMCM+ρMCN-2mMCM+βMCM]+[-γNCN+(1-ηNM)δNγNCN+ρNCM+βNCN]<0。
對于D(x*,y*)而言,其雅克比行列式為
雅克比矩陣的跡為
trJ=0。
由Friedman[12]所提出的雅克比矩陣判別均衡點穩(wěn)定性分析可得系統(tǒng)的穩(wěn)定策略見表2,在此條件下演化博弈系統(tǒng)存在5個均衡點,分別為O(0,0)、A(0,1)、B(1,0)、C(1,1)、D(x*,y*),其中O(0,0)、C(1,1)具有局部穩(wěn)定性,稱為局部穩(wěn)定點,演化穩(wěn)定策略為(不合作,不合作)與(合作,合作)。A(0,1)、B(1,0)為不穩(wěn)定點,D(x*,y*)為鞍點。在此條件下,對國家M而言,當國家N以固定概率y*選擇合作,則當其選擇合作概率x
表2 情形1下條件1中均衡點穩(wěn)定性分析
條件2:
在此條件下,系統(tǒng)穩(wěn)定策略見表3,演化博弈系統(tǒng)存在5個均衡點,分別為O(0,0)、A(0,1)、B(1,0)、C(1,1)、D(x*,y*),其中O(0,0)具有局部穩(wěn)定性,稱為局部穩(wěn)定點,演化穩(wěn)定策略為(不合作,不合作),A(0,1)為不穩(wěn)定點,B(1,0)、C(1,1)、D(x*,y*)為鞍點。在此條件下,由于國家N選擇合作的收益會小于其選擇合作的風險與成本及其采取“搭便車”所帶來的收益之和,則國家N一定會選擇不合作策略,在此情形下,國家M由于一開始選擇合作的收益大于其所需付出的代價,則在開始時選擇合作策略,但當其發(fā)現(xiàn)收益越來越低,直至其超過成本時,國家M會改變其策略,選擇不合作策略,即就其長時間博弈而言,最終國家M與國家N都會選擇不合作策略。
表3 情形1下條件2中均衡點穩(wěn)定性分析
條件3:
在此條件下,系統(tǒng)穩(wěn)定策略見表4,演化博弈系統(tǒng)存在5個均衡點,分別為O(0,0)、A(0,1)、B(1,0)、C(1,1)、D(x*,y*),其中O(0,0)具有局部穩(wěn)定性,稱為局部穩(wěn)定點,演化穩(wěn)定策略為(不合作,不合作),B(1,0)為不穩(wěn)定點,A(0,1)、C(1,1)、D(x*,y*)為鞍點。在此條件下,由于國家M選擇合作的收益會小于其選擇合作的所需付出的代價,則國家M一定會選擇不合作策略,在此情形下,國家N即使選擇合作的收益大于合作的風險與成本及其采取搭便車所帶來的收益之和,在開始時選擇合作策略,但就其長時間博弈而言,最終國家M與國家N都會選擇不合作策略。
表4 情形1下條件3中均衡點穩(wěn)定性分析
條件4:
在此條件下,系統(tǒng)穩(wěn)定策略見表5,演化博弈系統(tǒng)存在5個均衡點,分別為O(0,0)、A(0,1)、B(1,0)、C(1,1)、D(x*,y*),其中O(0,0)具有局部穩(wěn)定性,稱為局部穩(wěn)定點,演化穩(wěn)定策略為(不合作,不合作),C(1,1)為不穩(wěn)定點,A(0,1)、B(1,0)、D(x*,y*)為鞍點。在此條件下,由于國家M選擇合作的收益會小于其選擇合作的所需付出的代價,當國家M采取合作策略時,其必定希望通過此策略從合作過程中獲得額外收益,而對于國家N而言,其選擇合作的收益同樣小于合作的風險與成本及其采取“搭便車”所帶來的收益之和,同理而言,其同樣希望通過合作來獲得額外收益,則博弈雙方在開始時都會選擇合作策略,以期在其中獲得收益,但其均衡狀態(tài)屬于劣勢均衡狀態(tài),雙方雖實現(xiàn)短期利潤增加,就其長時間博弈而言,最終國家M與國家N都會趨向于不合作策略。
表5 情形1下條件4中均衡點穩(wěn)定性分析
情形2:2mM>βM。
條件1:
在此條件下,系統(tǒng)穩(wěn)定策略見表6,演化博弈系統(tǒng)存在5個均衡點,分別為O(0,0)、A(0,1)、B(1,0)、C(1,1)、D(x*,y*),其中C(1,1)具有局部穩(wěn)定性,稱為局部穩(wěn)定點,演化穩(wěn)定策略為(合作,合作),A(0,1)為不穩(wěn)定點,O(0,0)、B(1,0)、D(x*,y*)為鞍點。在此條件下,對于國家N而言,其選擇合作的收益大于合作的風險與成本及其采取搭便車所帶來的收益之和,則其趨向于選擇合作策略,而對于國家M而言,與情形1下條件1相比(此時mM>0,即政府采取獎勵政策),政府獎勵力度加大,且其收益大于成本,則其選擇合作策略速度加快,國家M更傾向于選擇合作策略。即在博弈最后,國家M與國家N都會選擇合作策略。
表6 情形2下條件1中均衡點穩(wěn)定性分析
條件2:
在此條件下,系統(tǒng)穩(wěn)定策略見表7,演化博弈系統(tǒng)存在5個均衡點,分別為O(0,0)、A(0,1)、B(1,0)、C(1,1)、D(x*,y*),其中B(1,0)具有局部穩(wěn)定性,稱為局部穩(wěn)定點,演化穩(wěn)定策略為(合作,不合作),A(0,1),D(x*,y*)為不穩(wěn)定點,O(0,0)、C(1,1)為鞍點。在此條件下,對于國家N而言,其選擇合作的收益小于合作的風險與成本及其采取搭便車所帶來的收益之和,則其趨向于選擇不合作策略,其不合作策略為穩(wěn)定策略,但對于國家M而言,由于其選擇合作策略收益大于其選擇合作所需成本,則其合作策略為穩(wěn)定策略。在長時間的博弈中,國家M將會選擇合作策略,國家N會選擇不合作策略。
表7 情形2下條件2中均衡點穩(wěn)定性分析
條件3:
在此條件下,系統(tǒng)穩(wěn)定策略見表8,演化博弈系統(tǒng)存在5個均衡點,分別為O(0,0)、A(0,1)、B(1,0)、C(1,1)、D(x*,y*),且均為鞍點。在此條件下,對于國家N而言,其選擇合作的收益大于合作的風險與成本及其采取“搭便車”所帶來的收益之和,則其趨向于選擇合作策略,但對于國家M而言,雖然政府采取了一定的獎勵政策,由于力度較小,導致國家M選擇合作所得收益仍然低于其所需成本,即國家M更傾向于不合作,但此時,由于國家N選擇合作策略,國家M獲得“搭便車”收益,則國家N選擇合作策略的概率將會降低, 同時,由于國家M知曉國家N的策略選擇,國家M同樣希望獲得合作收益,即其選擇合作的概率將會上升,即在此時,兩國家之間的博弈不存在穩(wěn)定均衡現(xiàn)象,兩國家之間的策略選擇將一直處于動態(tài)變化過程。
表8 情形2下條件3中均衡點穩(wěn)定性分析
條件4:
在此條件下,系統(tǒng)穩(wěn)定策略見表9,演化博弈系統(tǒng)存在5個均衡點,分別為O(0,0)、A(0,1)、B(1,0)、C(1,1)、D(x*,y*),其中B(1,0)具有局部穩(wěn)定性,稱為局部穩(wěn)定點,演化穩(wěn)定策略為(合作,不合作),O(0,0)、D(x*,y*)、A(0,1)為鞍點,C(1,1)為不穩(wěn)定點。在此條件下,對于國家N而言,其選擇合作的收益小于合作的風險與成本及其采取“搭便車”所帶來的收益之和,則其趨向于選擇不合作策略,對于國家M而言,即使其選擇合作的收益小于其選擇合作的所需付出的代價,但由于政府對其采取的獎勵大于其所需的成本,則其將會選擇合作策略。即最終在長時間的博弈中,國家M將會選擇合作策略,國家N會選擇不合作策略。
表9 情形2下條件4中均衡點穩(wěn)定性分析
在以上分析中,在情形1下的條件2至條件4中,無論國家M與國家N選擇合作的概率為多少,最終都會趨向于(不合作,不合作)策略,且在情形2中的4種條件下,皆為雙方都選擇合作或其中一方選擇不合作,而對于情形1中的條件1而言,其均衡點為O(0,0),C(1,1),其更具有研究價值??疾煸诖饲樾蜗驴萍己献鞑┺哪P椭袇⑴c者的演化行為,各參數(shù)的取值為βM=1.2,βN=0.7,γM=3,γN=2,ηMN=0.6,ηNM=0.5,δM=0.3,δN=0.4,ρM=0.1,ρN=0.2,CM=10,CN=7,mM=0.2。仿真結(jié)果如圖1所示。
圖1 情形1下條件1中的系統(tǒng)動態(tài)演化圖
圖2 不同初始概率下的系統(tǒng)演化軌跡
顯而易見,參數(shù)的不同取值將會影響演化博弈系統(tǒng)的穩(wěn)定性。在實際情況中,基于政府控制下,可控參數(shù)為βM與mM,則下文將研究在控制其余參數(shù)不變的情形下,分別改變βM與mM對系統(tǒng)穩(wěn)定性的影響。
為考察不同程度的合作成本系數(shù)對國家M與國家N演化路徑的影響,因此βM分別取值0.5、1.5、2.5,分析在國家M合作成本系數(shù)βM不同狀況下的國家M與國家N演化行為的變化。觀察圖3可知,對于國家M而言,當βM=0.5與βM=1.5時,國家M向x=1的方向演化,且隨著科技合作所需成本的增加,國家M越不可能采取合作策略;當βM=2.5時,國家M向x=0的方向演化,即當科技合作成本增長到一定程度時,國家M會將合作策略改變?yōu)椴缓献鞑呗?,對于國家N而言也同樣如此,且在βM相同的情況下,國家M的策略選擇將會影響國家N的策略選擇,當國家M選擇合作策略時,由于其能為國家N帶來“搭便車”收益,則國家N也會隨之選擇合作策略,當國家M選擇不合作策略時,即使對于國家N而言,其收益大于風險、成本與“搭便車”收益之和,但由于國家N無法從中獲益,則其也會在國家M的策略影響下選擇不合作策略。
圖3 不同科技合作成本下的系統(tǒng)演化軌跡
為進一步討論政府對國家M與國家N科技合作博弈中策略選擇作用機理,考察政府采取怎樣的干預力度來有效地推動中國與其他國家科技合作發(fā)展。在博弈過程中,固定其余參數(shù)不變,對于mM分別取值-0.5、-0.05、-0.015、0、0.5,觀察圖4可知,當mM=0時,代表政府不采取任何干預措施,即無政府干預情形下的跨國科技合作演化博弈,此時國家M與國家N將趨向于科技合作策略,但在mM>0時,即政府采取獎勵政策時,相較于政府不采取任何措施而言,國家M收斂于x=1的速度加快,即其更樂于采取合作策略,并且在國家M的影響下,國家N也會采取合作策略,演化博弈系統(tǒng)收斂于(1,1)策略速度將加快,即政府采取獎勵政策有利于推動國家M與國家N的科技合作;當mM<0時,即政府對國家M采取懲罰政策;當mM=-0.015時,國家M與國家N收斂于(1,1)策略,此時與政府不采取任何措施而言,國家M收斂于x=1的速度降低,并在此情況下,國家N在國家M的影響下,收斂于x=1的速度也降低;當mM=-0.5與mM=-0.05時,由圖4顯而易見,此時兩國均傾向于不合作,且mM=-0.05時國家M與國家N收斂于(0,0)的速度明顯低于mM=-0.5時的國家M與國家N收斂于(0,0)策略的速度,即當施加懲罰時,若懲罰力度越大,國家M選擇不合作的時間越短,越傾向于不合作,同時,國家M的演化策略也會影響國家N策略的選擇,使其同樣將合作策略改變?yōu)椴缓献鞑呗浴?/p>
圖4 政府不同干預力度下的系統(tǒng)演化軌跡
2021年是中國與東盟建立對話關系30周年。在過去30年里,中國與東盟交流日益加深,2020年成為中國第一大貿(mào)易伙伴。據(jù)駐東盟使團經(jīng)濟商務處統(tǒng)計顯示,2020年,中國與東盟貿(mào)易額同比增長6.7%。并且,隨著RCEP在2020年11月15日的成功簽訂,中國與東盟之間的交流與聯(lián)系將會日益擴大,因此研究中國與東盟各國之間的交流也越發(fā)重要。數(shù)據(jù)顯示,越南為2020年中國在東盟的第一大貿(mào)易伙伴,分析中國與越南兩國間的合作具有代表性意義。因此,本文著重研究中國與越南之間的科技合作。
在此情況下,為促使兩國順應全球化趨勢,選擇參與科技合作,由本文的模擬分析可在此基礎上對科技合作成本進行控制,由于本文利用保護主義程度量化科技合作成本,則可通過降低兩國保護主義程度進而降低科技合作成本?;诒疚膮?shù)選擇,可通過降低關稅從而降低科技合作成本,這與2020年11月所提出的RCEP不謀而合。基于此,中國與越南應積極參與到RCEP中,積極遵守RCEP準則,從而提高兩國科技合作概率。并且,由上文分析可知,也可通過政府控制促使兩國家間進行科技合作。
圖5 中國與越南2019年科技合作演化博弈圖
基于演化博弈的思想構(gòu)建了中國與其他國家科技合作策略選擇的演化博弈模型,引入政府控制力度參數(shù),對本國與其他國家的行為選擇進行分析,并運用MATLAB軟件進行模擬仿真,得出以下結(jié)論:
1)從長期來看,科技合作博弈策略選擇處于動態(tài)變化中,是合作成本、政府干預力度、合作收益系數(shù)、合作風險、“搭便車”收益系數(shù)等因素共同作用的結(jié)果,且策略穩(wěn)定均衡點受博弈雙方參與者初始狀態(tài)影響。
2)在本文模擬仿真的情形下,國家M的科技合作成本系數(shù)將影響國家M與國家N演化路徑,科技合作成本越低,雙方合作欲望越強烈,若科技合作成本超過某一閾值,將驅(qū)使博弈雙方采取不合作策略;同時,政府對科技合作的干預力度也將影響國家M與國家N的演化路徑,當政府采取獎勵政策時,獎勵力度越大,博弈雙方參與者合作欲望越強烈;當政府采取懲罰政策時,當懲罰力度較小時,國家M發(fā)現(xiàn)相較于不合作,其選擇合作所獲收益更多,此時它將選擇合作策略,但隨著懲罰力度的加大,國家M發(fā)現(xiàn)利益減少,將會選擇不合作策略,并影響國家N策略選擇,此時博弈雙方參與者均傾向于選擇不合作策略,且懲罰力度越大,兩國更不愿意選擇合作。
基于當今復雜的世界環(huán)境,在復雜的國際關系中取得收益最大化是眾多研究者長期以來所追尋的目標。本文基于近年來中國與東盟貿(mào)易、文化等方面合作交流日益加深,以中國與越南為例,實證分析跨國間科技合作情況,發(fā)現(xiàn)中國與越南2019年科技合作中兩國均趨向于不合作?;谏衔膶蓢g科技合作影響因子分析,為加強中國與越南間科技合作,提出以下建議:兩國作為ACFTA與RCEP成員國,應把握住機遇,積極響應政策,降低關稅以增強兩國間合作程度,降低合作成本系數(shù),從而促使兩國加強科技合作。同時,中國作為世界上具有重要影響力的科技大國,政府應積極參與國際科技合作,對科技合作中的地區(qū)、企業(yè)、個人等加以有效策略干預,從而增強國際科技合作概率。
基于以上分析,本文建議:由于跨國科技合作博弈策略的選擇受合作成本、政府干預力度、合作收益系數(shù)、合作風險、“搭便車”收益系數(shù)等因素的共同影響,則如何調(diào)整以上因素是推動跨國科技合作的重中之重。就政府而言,增大對本國參與者的獎勵力度有助于促進國際科技合作;同時,采取有力措施降低科技合作成本也不可忽略。