武利琴,徐勇,王金環(huán),李杰
網(wǎng)絡上的演化博弈稱為網(wǎng)絡演化博弈,能夠很好地刻畫生物系統(tǒng)、物流系統(tǒng)、社會系統(tǒng)、多智能體系統(tǒng)的演化規(guī)律,引起了眾多學者的廣泛研究,如文獻[1-4]就將網(wǎng)絡演化博弈與各個系統(tǒng)緊密地聯(lián)系在了一起。在一個網(wǎng)絡演化博弈中,節(jié)點和邊分別代表玩家和玩家之間的相互關系。在某些特定的策略調(diào)整規(guī)則下,玩家根據(jù)鄰居上一時刻的策略和收益,不斷更新自己下一時刻的策略。隨著時間變化,整個網(wǎng)絡演化局勢和博弈動態(tài)都在不斷變化。網(wǎng)絡演化博弈理論有助于理解合作的涌現(xiàn)及演化規(guī)律,經(jīng)常被用于研究經(jīng)濟管理方面的問題[5-6]。
當下經(jīng)濟發(fā)展背景下,企業(yè)唯有不斷創(chuàng)新才能長久生存發(fā)展下去。由于創(chuàng)新成本高額,部分企業(yè)不愿意改變原有模式,每個企業(yè)都想追求自己的收益最大,然而對于政府或者整個社會來說,所有企業(yè)全部創(chuàng)新,才是最好的局勢。當前已有一些對企業(yè)間創(chuàng)新博弈的研究方法,如文獻[5-8],通過構建微分方程組,利用給定的初始條件,得到方程組的解。該解描述了企業(yè)的總體構成P(創(chuàng)新比例)隨時間的演化趨勢,并通過數(shù)據(jù)仿真方法將博弈動態(tài)趨勢以圖的形態(tài)呈現(xiàn)[9],然而并不能展示每一次博弈后整個企業(yè)網(wǎng)絡的博弈動態(tài)。
本文通過構建精確的理論框架來分析和控制企業(yè)創(chuàng)新網(wǎng)絡演化的博弈動態(tài),獲得每次博弈后各企業(yè)的收益、策略等性質(zhì),主要運用了矩陣半張量積這種新的方法。半張量最先由程代展教授提出,成功應用于邏輯網(wǎng)絡的分析與控制[10-13],包括布爾網(wǎng)絡穩(wěn)定性、可控性、可觀測性及最優(yōu)控制[14-17]。半張量積在網(wǎng)絡演化博弈動態(tài)行為及策略最優(yōu)控制方面的研究也取得了顯著成果[18-20],并在智能電網(wǎng)、經(jīng)濟破產(chǎn)機制等實際問題中得到了廣泛應用[21-22]。同時,也可用于企業(yè)創(chuàng)新方面的研究。
在企業(yè)創(chuàng)新網(wǎng)絡中,本文將所有企業(yè)按規(guī)模分為大小兩種企業(yè),建立企業(yè)創(chuàng)新雙層耦合網(wǎng)絡。網(wǎng)絡中各節(jié)點不同時刻采取的策略不同,會影響整個網(wǎng)絡的演化趨勢。因此可通過政府調(diào)控使得整個網(wǎng)絡都達到創(chuàng)新的穩(wěn)定局勢,并能永久保持下去。
本節(jié)給出關于半張量積的常用符號、定義和基本性質(zhì)。
定義1[10]設為與的最小公倍數(shù),那么與的半張量積定義為
半張量積是普通矩陣乘積的一般化, 因此通常省略半張量符號”。
定義2[10]設。它們的Khatri-Rao 積, 記, 定義為
命題1[11]1)設及為兩列向量,則,其中維矩陣被稱為換位矩陣, 且;
引理1[18]假設和,則有,其中。
引理2[11]設是一偽邏輯函數(shù), 則存在一個唯一的矩陣, 稱為的結構矩陣, 滿足
引理3[11]考慮一個值邏輯動態(tài)網(wǎng)絡:
本文主要考慮企業(yè)群體之間的創(chuàng)新問題。企業(yè)創(chuàng)新成本投入和風險承擔是必需的,由于其規(guī)模不同,導致資金周轉(zhuǎn)與風險抵御能力的差距巨大,因此將“智豬博弈”作為基本博弈是非常適合的。將參與博弈的企業(yè)群體按照規(guī)模分為兩類:大企業(yè)和小企業(yè)。將每個企業(yè)作為網(wǎng)絡中參與博弈的玩家,從而構建企業(yè)創(chuàng)新雙層耦合網(wǎng)絡,上層表示大企業(yè)群體,下層表示小企業(yè)群體。假設雙方創(chuàng)新成本為2,收益均為10。博弈分為4種情況:若大小企業(yè)都創(chuàng)新,雙方獲得創(chuàng)新收益比為7∶3;若僅大企業(yè)創(chuàng)新,小企業(yè)可剽竊大企業(yè)的創(chuàng)新成果,并搶先占領市場,兩者創(chuàng)新收益比為6∶4;若僅小企業(yè)進行創(chuàng)新,大企業(yè)可憑借其規(guī)模效應獲得更大的利潤,兩者收益比為9∶1;若大小企業(yè)都不創(chuàng)新,雙方收益均為零。對應基本凈收益矩陣:
對應上述雙層網(wǎng)絡演化博弈的過程構建模型。
2)基本網(wǎng)絡博弈:由兩個連通玩家(不同層)形成的基本博弈,且策略集,對應收益雙矩陣:
3)策略更新規(guī)則:采用確定性無條件模仿策略更新規(guī)則。玩家i 在時刻的策略模仿它同層鄰居在t時刻最優(yōu)收益對應的策略,設
則
那么整個網(wǎng)絡的策略更新表示為
4)策略模仿優(yōu)先權:若3)內(nèi)策略更新規(guī)則中被模仿的鄰居玩家不唯一,令
則優(yōu)先權如式(10):
網(wǎng)絡博弈隨著時刻的變化不斷更新策略局勢,對應收益函數(shù)也發(fā)生變化,從而形成動態(tài)網(wǎng)絡演化博弈。根據(jù)網(wǎng)絡的拓撲結構,可得到企業(yè)創(chuàng)新雙層耦合網(wǎng)絡的鄰接矩陣:
基于上述雙層耦合網(wǎng)絡演化博弈過程,考慮網(wǎng)絡純策略納什均衡(本文策略選擇是確定型的,因此在后文中全部簡稱為納什均衡)的存在性,本文采用確定型策略更新規(guī)則。
定義3[18]對于一個博弈,一個策略局勢是一個納什均衡,如果滿足對所有的均成立,其中是玩家集,是第i個玩家的策略集,且。
命題2[18]對于任給的,必然存在一個整數(shù)滿足,其中是值邏輯算子的結構矩陣,且滿足
引理4[18]對于雙層網(wǎng)絡演化博弈G =(S1,S2),支付函數(shù)滿足式(11)、(12),則存在一個納什均衡,當且僅當存在一個整數(shù),滿足0,對應是所有納什均衡的集合,其中對于,
引理4只考慮了某一時刻該網(wǎng)絡博弈的納什均衡,而無法判斷隨著演化某些不穩(wěn)定的局勢逐漸演化為穩(wěn)定的納什均衡局勢。因此,計算整個網(wǎng)絡演化的轉(zhuǎn)移矩陣是非常有必要的。
由引理2和支付函數(shù)表達式(11)、(12),可得到整個網(wǎng)絡演化博弈的轉(zhuǎn)移矩陣,步驟如下:
1)重寫式 (11)、(12)為
小企業(yè)玩家的最優(yōu)反應策略為
3)根據(jù)優(yōu)先權式(10)模仿同組鄰居收益最大玩家的策略,有如下形式:
4)將3)中不同層的策略相乘,有
通過半張量積方法,由博弈動態(tài)方程式(13)可得到博弈結構矩陣。分析結構矩陣可得到博弈的穩(wěn)定點、極限環(huán),因此有定理1。
本部分通過政府調(diào)控改變基本博弈矩陣,從而使整個網(wǎng)絡的演化達到理想的局勢狀態(tài),即大小企業(yè)全部創(chuàng)新,且為穩(wěn)定或者最優(yōu)穩(wěn)定納什均衡狀態(tài)。大小企業(yè)選擇創(chuàng)新,由于投資成本過高,且收益相對減少,短時不能獲取到創(chuàng)新帶來的收益,因此政府通過調(diào)控誘發(fā)企業(yè)選擇創(chuàng)新策略是非常必要的??刂圃O計如下。
上述控制表示政府對企業(yè)的補貼與懲罰是同時進行的。設計控制的宗旨是政府對企業(yè)創(chuàng)新只起調(diào)控作用,盡可能少地進行投資或者獲利。因此可假設補貼力度與懲罰力度相同,即。
博弈矩陣改變后,重新計算式(13),可得博弈的轉(zhuǎn)移矩陣L,通過定理1和推論1分析博弈的演化性質(zhì)。若達不到所有企業(yè)全部創(chuàng)新的理想狀態(tài),則調(diào)整控制力度,直到大小企業(yè)玩家全部選擇創(chuàng)新策略。
上述調(diào)控借鑒了“智豬博弈”中防止小豬搭便車,促使大豬小豬都行動的思想,即政府通過同時對創(chuàng)新企業(yè)進行補貼,對不創(chuàng)新企業(yè)進行懲罰,從而干預企業(yè)的創(chuàng)新決策,促使大小企業(yè)全部創(chuàng)新。
本節(jié)主要通過舉例,研究增加政府調(diào)控后整個企業(yè)創(chuàng)新網(wǎng)絡的演化動態(tài)。
為了計算簡便,以3個大企業(yè)和2個小企業(yè)組成的企業(yè)創(chuàng)新網(wǎng)絡為例,分析演化博弈過程。網(wǎng)絡拓撲結構圖如圖1所示,其中第一層為大企業(yè),;第二層為小企業(yè),。
圖1 不同規(guī)模企業(yè)博弈結構圖Fig. 1 The game structure graph of different scale enterprises
根據(jù)網(wǎng)絡拓撲結構圖,我們可得到網(wǎng)絡的鄰接矩陣:
首先,根據(jù)引理4中的計算,有
其次,由博弈動態(tài)方程
得到L為
比較上述兩種情形可知,政府對企業(yè)的調(diào)控,有效遏制了小企業(yè)“搭便車”的行為,從而促使大小企業(yè)實現(xiàn)全部創(chuàng)新。
本文將所有企業(yè)按規(guī)模分為大小兩種企業(yè),建立企業(yè)創(chuàng)新雙層耦合網(wǎng)絡。運用矩陣半張量積方法,以“智豬博弈”為基本博弈, 得到每一時刻各企業(yè)的策略,整個網(wǎng)絡局勢演化隨時間改變; 根據(jù)收益函數(shù)得到整個網(wǎng)絡的最優(yōu)穩(wěn)定納什均衡點; 最后,通過政府調(diào)控, 改變博弈的基本矩陣,從而達到最優(yōu)穩(wěn)定納什均衡狀態(tài),即所有企業(yè)全部創(chuàng)新。