劉敬偉,黃成節(jié),蒲勇健
(1.茅臺學院,貴州 仁懷 564500;2.重慶大學 經(jīng)濟與工商管理學院,重慶 400040)
創(chuàng)新是引領發(fā)展的第一動力,合作研發(fā)是國家創(chuàng)新戰(zhàn)略的核心內(nèi)容之一。合作研發(fā)作為一種互惠型合作關系,是以資源優(yōu)勢互補為前提,以合作方的共同利益為基礎,以合作創(chuàng)新為目的,通過彼此之間的契約等實現(xiàn)協(xié)同行動而自愿形成的組織[1]。它具有實現(xiàn)資源優(yōu)勢互補、降低研發(fā)風險、提高研發(fā)效率和成功可能性的優(yōu)勢。
針對合作研發(fā)問題,國內(nèi)外學者從不同角度開展了一系列富有成效的研究。在合作研發(fā)的合作機制方面,鄭月龍(2015)針對以企業(yè)為主體的共性技術合作研發(fā)形成機制,以演化博弈為理論基礎進行了研究[2]。朱晨、楊曄(2018)基于交易成本理論和演化博弈理論,以成本視角為出發(fā)點探究本土企業(yè)與跨國公司合作研發(fā)的誘發(fā)機制[3]。Sara Amoroso(2017)的研究表明:合作研發(fā)中的知識溢出、風險與成本的合理分攤、企業(yè)規(guī)模以及創(chuàng)新活動類型等與企業(yè)參與不同類型研發(fā)聯(lián)盟的決策有關[4]。
在合作研發(fā)的合作模式方面,陸玉梅等(2019)運用博弈論方法研究了資金和知識投入對產(chǎn)業(yè)技術創(chuàng)新戰(zhàn)略聯(lián)盟合作研發(fā)模式的影響,分析了獨立研發(fā)模式、資金分擔模式、共同研發(fā)模式下的產(chǎn)業(yè)技術創(chuàng)新戰(zhàn)略聯(lián)盟的知識和資金投入決策問題[5]。
在合作研發(fā)的激勵與績效方面,耿智琳、張耀峰(2012)基于多代理人的模擬仿真方法分析了自主創(chuàng)新企業(yè)合作研發(fā)中企業(yè)平均收益的影響因素,建立了考慮補貼激勵的縱向合作研發(fā)利潤分配的演化博弈模型,以解決自主創(chuàng)新企業(yè)中新產(chǎn)品合作研發(fā)的利潤分配問題[6]。RenéBelderbos等(2004)實證分析了競爭對手、供應商、客戶、高校及研究機構四類合作研發(fā)伙伴之間不同的研發(fā)合作組合形式對企業(yè)績效的影響[7]。
以合作研發(fā)中的機會主義行為研究方向,易余胤等(2005)運用演化博弈理論對企業(yè)間合作研發(fā)過程中的機會主義行為進行演化分析,以及監(jiān)督機制對防范機會主義行為的有效性[8]。蘇中鋒(2019)通過構建博弈模型,著重分析了合作研發(fā)的控制機制與機會主義行為的關系,豐富了對機會主義行為研究[9]。
另外,Nisvan&Daniel(2009)在允許自由進入研發(fā)競爭和產(chǎn)品市場的條件下,分析了隨機型研發(fā)產(chǎn)出溢出模型中合作研發(fā)協(xié)議的效果[10]。René等(2004)探討了創(chuàng)新企業(yè)進行合作研發(fā)決策的決定因素的異質(zhì)性[11]。Mário&Silva(2018)建立了一個理論框架來研究采用專有技術交易策略對研發(fā)合作程度的影響,證明了非合作企業(yè)向行業(yè)披露其專有技術的預先承諾可以有效地引導參與者進行合作研發(fā)投資[12]。Deming等(2017)通過區(qū)分兩種不同類型的合作伙伴,研究了非對稱溢出在研發(fā)合作穩(wěn)定性中的作用,并運用博弈論方法揭示了橫向和縱向合作研發(fā)中非對稱溢出與研發(fā)投資的關系[13]。
通過梳理相關文獻可以發(fā)現(xiàn),國內(nèi)外學者對合作研發(fā)的多個方面都進行了一些富有價值的研究,不管是研究內(nèi)容還是研究方法都取得了一定的成效。在企業(yè)之間合作研發(fā)的策略選擇問題上,一部分研究側(cè)重于運用經(jīng)典非合作博弈方法,在完全理性的假設下分析合作者之間的策略選擇問題[14],另一部分研究是運用合作博弈的思路,對合作研發(fā)策略進行分析?;谟邢蘩硇缘膭討B(tài)演化分析方法在合作研發(fā)的策略選擇問題上的研究多數(shù)集中在諸如機會主義或搭便車等合作研發(fā)的風險分析[8,9]。文章基于有限理性假設,以演化博弈的視角,運用動態(tài)演化的理論和方法,對合作研發(fā)的策略選擇問題進行分析。
演化穩(wěn)定策略(Evolutionary Stable Strategy,ESS)和復制動態(tài)(Replicator Dynamics)是演化博弈最核心的概念,它們分別描述了演化博弈的穩(wěn)定狀態(tài)和向這種穩(wěn)定狀態(tài)收斂的動態(tài)過程。其中,演化穩(wěn)定策略主要描述了系統(tǒng)在動態(tài)演化過程中的穩(wěn)定狀態(tài),單群體情形下,演化穩(wěn)定策略(ESS)的定義如下:
定義(Maynard Smith)[15]:如果策略s*∈S滿足以下兩個條件,則稱s*是演化穩(wěn)定策略(ESS)。
條件1:對任意的s∈S且s≠s*,有u(s*,s*)≥u(s*,s);
條件2:即使u(s*,s*)=u(s*,s),也有u(s*,s)>u(s,s)。
演化穩(wěn)定策略是:在自然選擇的作用下,如果整個種群中的每一個成員都采取這個策略,那么,不存在一個具有突變特征的策略(即突變策略)能夠侵入這個種群[15]。
而復制動態(tài)是演化博弈論中運用最為廣泛的選擇機制動態(tài)方程,它刻畫了一個群體中采用某種策略的個體所占比例的變化過程。單群體情形下復制動態(tài)方程可以用以下微分方程給出(Taylor&Jonker)[16]:
式中,xi表示在某時刻t選擇純策略si的個體在群體中所占的比例;
u(si,s)表示群體中選擇純策略si的個體的適應度或期望支付;
u(s,s)=∑xi·u(si,s)表示群體平均期望支付或適應度。
當dx/dt為x的單元函數(shù)時,上述復制動態(tài)方程可簡記為:若x*滿足F(x*)=0且F(x*)<0,則x*即為演化穩(wěn)定策略(ESS)。
在演化博弈中,博弈雙方的策略選擇收斂至均衡狀態(tài)的過程是一個動態(tài)過程,通過復制動態(tài)方程分析這個動態(tài)過程的穩(wěn)定性,可以確定系統(tǒng)的均衡性復制動態(tài)方程是描述某一特定策略在一個群體中被采用的頻數(shù)或頻度的動態(tài)微分方程。以“演化穩(wěn)定策略”和“復制動態(tài)方程”為建?;A,通過構建合作研發(fā)策略選擇問題的演化博弈模型,可以分析其動態(tài)演化的內(nèi)在機制。
為簡單起見,不妨假定進行合作研發(fā)的行為主體有兩個:企業(yè)A和企業(yè)B,他們的策略集均為(合作研發(fā)、獨立研發(fā))?!昂献餮邪l(fā)”策略下,雙方按照達成的協(xié)議進行合作研發(fā);“獨立研發(fā)”策略表示雙方不進行合作,各自進行獨立研發(fā),也表示在合作過程中有一方單方面違約,終止合作關系而進行獨立研發(fā)。
第一,若兩個企業(yè)都選擇“獨立研發(fā)”策略,假設在這種不合作狀態(tài)下各自進行獨立研發(fā)獲得的正常收益分別為π1、π2,且π1≠π2,π1,π2>0;
第二,若兩個企業(yè)都選擇“合作研發(fā)”策略,則假設在正常收益基礎上由雙方合作研發(fā)而獲得的超額收益為Δπ,且有Δπ>0;假設超額收益在雙方之間的分配系數(shù)為k,0≤k≤1。
第三,若兩個企業(yè)中有一方選擇“合作研發(fā)”策略,另一方選擇“獨立研發(fā)”策略,這種情況描述的是雙方合作關系達成后,一方由于反悔或者機會主義行為等原因背叛合作約定而造成違約,從而使得雙方的合作關系被迫終止。此時,違約方由于在合作過程中的信息、資源共享等原因,能夠依靠自身學習能力,通過知識溢出等途徑獲得額外收益,記為R,R>0,但同時需支付一定的違約成本C,C>0,即違約方支付給履約方的罰金等。為著眼于系統(tǒng)動態(tài)演化機理的分析,避免復雜的數(shù)學討論,又不失合理性,這里假設C>R。
基于上述對問題的描述和假設條件,可以構建雙方博弈策略的支付矩陣,如表1所示。
表1 博弈策略支付矩陣
演化博弈論中的復制動態(tài)方程源于群體概念,當其用于研究個體之間的博弈時,可以把個體選擇某個純策略的概率視為群體中選擇該純策略的個體所占的比例。因此,假設企業(yè)A選擇“合作研發(fā)”策略的概率為x,選擇“獨立研發(fā)”策略的概率為1-x;假設企業(yè)B選擇“合作研發(fā)”策略的概率為y,選擇“獨立研發(fā)”策略的概率為1-y。在有限理性和信息不對稱的前提下,上述支付矩陣不存在純策略納什均衡,但存在混合策略納什均衡,并且博弈雙方策略選擇的概率x和y存在動態(tài)調(diào)整,這種動態(tài)調(diào)整表現(xiàn)為雙方策略在博弈的動態(tài)復制中的演化[3]。根據(jù)演化博弈復制動態(tài)的分析方法,進行如下計算:
企業(yè)A選擇“合作研發(fā)”策略的期望收益:
企業(yè)A選擇“獨立研發(fā)”策略的期望收益:
企業(yè)A的平均期望收益為:
企業(yè)B選擇“合作研發(fā)”策略的期望收益:
企業(yè)B選擇“獨立研發(fā)”策略的期望收益:
企業(yè)B的平均期望收益為:
根據(jù)以上計算結(jié)果,可以分別建立企業(yè)A和企業(yè)B的復制動態(tài)方程。
企業(yè)A的復制動態(tài)方程為:
企業(yè)B的復制動態(tài)方程為:
顯然,當F(x)=0、F(y)=0時,博弈達到一種相對穩(wěn)定狀態(tài),此時可以得到該動態(tài)演化系統(tǒng)的五個局部均衡點:(x,y)={(0,0),(0,1),(1,0),(1,1),(x*,y*)},其中當且僅當0≤x*,y*≤1時,均衡點(x*,y*)存在。
根據(jù)Friedman提出的利用雅克比矩陣(Jacobi Matrix)分析動態(tài)系統(tǒng)局部穩(wěn)定性的方法,進行演化穩(wěn)定性分析并求解演化穩(wěn)定策略[17]。復制動態(tài)方程式(7)、式(8)分別對x和y求偏導數(shù),可得該博弈系統(tǒng)的雅克比矩陣(Jacobi Matrix,J),并計算該矩陣的行列式Det(J)和跡Tr(J)如下:
根據(jù)雅克比矩陣的行列式的符號和跡的符號,可以判定系統(tǒng)局部均衡點的穩(wěn)定性,即當Det(J)>0、Tr(J)<0時,系統(tǒng)處于演化穩(wěn)定狀態(tài)[18]。據(jù)此,對上述五個局部均衡點進行穩(wěn)定性分析。先計算各均衡點處雅克比矩陣的行列式和跡的表達式,結(jié)果如表2所示。
表2 各均衡點處雅克比矩陣的行列式及跡的表達式
根據(jù)表2中矩陣行列式和矩陣的跡的表達式,結(jié)合上文假設C>R,及x*與y*的解的表達式,可以分以下幾種情況進行討論:
第一,當kΔπ-R>0,(1-kΔπ)-R>0時,即雙方通過合作研發(fā)獲得的超額收益大于終止合作而因知識外溢等獲得的額外收益;第二,當kΔπ-R<0,(1-kΔπ)-R<0時,即雙方通過合作研發(fā)獲得的超額收益小于終止合作而因知識外溢等獲得的額外收益;第三,當kΔπ-R>0,(1-kΔπ)-R<0時,或當kΔπ-R<0,(1-kΔπ)-R>0時,即一方通過合作研發(fā)獲得的超額收益大于終止合作而因知識外溢等獲得的額外收益,而另一方則相反。分析結(jié)果如表3所示。
表3 各均衡點穩(wěn)定性分析結(jié)果
根據(jù)以上局部均衡點的穩(wěn)定性分析及演化穩(wěn)定策略的求解結(jié)果,可以利用matlab繪制四種不同情況下的動態(tài)演化相位圖(左圖)和動態(tài)演化路徑(右圖),如圖1-4所示。
圖1 kΔπ-R>0,(1-k)Δπ-R>0,取k=0.6,Δπ=3,R=1,C=1.5
從相位圖上看,四種情況下系統(tǒng)均收斂于(1,1),證實了E4(1,1)是演化穩(wěn)定策略(ESS),也就是說在模型假設條件下,博弈雙方的動態(tài)演化策略均為“合作研發(fā)”;從演化路徑來看,無論博弈雙方初始狀態(tài)如何,隨著時間的推移,最終也都會收斂于“合作研發(fā)”策略,同樣印證了E4(1,1)是演化穩(wěn)定策略[19]。
圖2 kΔπ-R<0,(1-k)Δπ-R<0,取k=0.4,Δπ=1.5,R=1,C=1.5
圖3 kΔπ-R>0,(1-k)Δπ-R<0,取k=0.6,Δπ=2,R=1,C=1.5
圖4 kΔπ-R<0,(1-k)Δπ-R>0,取k=0.4,Δπ=2,R=1,C=1.5
文章基于有限理性假設,建立動態(tài)演化博弈模型,分析企業(yè)之間合作研發(fā)策略選擇問題的演化路徑及演化穩(wěn)定策略,并通過數(shù)值模擬與仿真,得到:首先,企業(yè)之間合作研發(fā)的策略選擇問題可以看作是一個動態(tài)演化過程,在違約成本嚴格大于因違約而獲得的額外收益這一關鍵假設條件下,無論初始狀態(tài)如何,博弈雙方的策略選擇最終會收斂于合作研發(fā)而不是獨立研發(fā),從該動態(tài)演化系統(tǒng)的相位圖中可以清晰地觀察到。其次,合作研發(fā)獲得的超額收益的分配系數(shù)并不是關鍵變量,僅影響博弈雙方的收斂速度,而不影響收斂結(jié)果,從該動態(tài)演化系統(tǒng)的演化路徑圖中可以得到直觀的認識。最后,數(shù)值模擬顯示,合作研發(fā)產(chǎn)生的額外收益越大,雙方的收斂速度越快。
合作研發(fā)對于企業(yè)技術創(chuàng)新無疑有著重要的意義,合作研發(fā)的優(yōu)勢也是有目共睹的,但合作研發(fā)面臨的最大風險是機會主義行為的存在,在一定的條件下,需要采取有針對性的措施來克服機會主義行為對合作研發(fā)帶來的不良影響。根據(jù)以上模型分析的結(jié)論,文章得到如下促進合作研發(fā)的政策啟示。
一是加大對機會主義行為的懲罰力度,降低其機會主義行為的收益??梢栽诤献髌跫s中賦予雙方較大的違約成本作為懲罰因子。數(shù)值模擬表明:違約成本越高,合作研發(fā)的雙方越趨于演化穩(wěn)定策略。具體措施包括,在政府或者產(chǎn)業(yè)協(xié)會的指導下,建立企業(yè)聲譽機制,通過聲譽機制,增強企業(yè)之間合作研發(fā)的信任度,進而能夠使合作企業(yè)更方便地選擇合適的合作研發(fā)伙伴;合作研發(fā)雙方之間建立良好的、順暢的信息溝通機制,使合作雙方的合作信息公開化、透明化[20]。
二是降低合作研發(fā)成本,提高合作收益。通過數(shù)值模擬,合作研發(fā)產(chǎn)生的額外收益越高,合作雙方的策略選擇越趨于模型中的演化穩(wěn)定策略。降低合作研發(fā)成本的途徑包括建立合作研發(fā)過程中的知識共享、信息共享、設備共享、人才共享等合作共享機制。在降低直接成本的同時,可以在合作研發(fā)過程中適當增加監(jiān)督成本,加大監(jiān)督力度,其目的也是為了防范合作研發(fā)過程中機會主義行為的產(chǎn)生。
三是建立合理的收益分配機制。合理的收益分配機制能夠增強雙方的合作意愿,收益分配機制的建立不一定按照雙方的資金成本分攤比例來分配,也不一定按照雙方投入的人、財、物等資源的比例來進行分配,而是需要建立一套科學、合理、公平的分配機制來保證雙方的合作能夠進行下去,不至于中途因反悔或者機會主義行為而背叛合作,以保證合作關系的穩(wěn)定性。一個可行的方法是利用合作博弈的Shapley值來解決雙方合作收益的分配問題。
以上研究僅討論了兩方對稱博弈的情形,對于非對稱博弈和多方演化博弈未做考慮;同時,為了簡化分析,對合作研發(fā)的風險未做考慮,有些情況下,合作研發(fā)可能不成功,存在一定的合作風險,這可以通過在模型中增加風險系數(shù)予以適當處理。在后續(xù)研究中,可以從合作博弈的角度分析合作研發(fā)的收益分配關系從而建立穩(wěn)定的合作機制,也可以從機制設計的角度闡述合作研發(fā)的機制演化,又可以從產(chǎn)業(yè)內(nèi)以及不同產(chǎn)業(yè)之間的多方演化博弈機制來研究合作研發(fā)的群體動態(tài)演化路徑和演化機制。