王冬計,李 營,劉聯(lián)勝,劉春雨,賈思琪,董奇烜
(1.河北工業(yè)大學 能源與環(huán)境工程學院,天津 300401;2.河北工業(yè)大學 經(jīng)濟管理學院,天津 300401)
北方農(nóng)村地區(qū)燃煤采暖造成嚴重的環(huán)境污染,對居民身體健康產(chǎn)生嚴重威脅[1]。為營造舒適、清潔的居住環(huán)境,急需推廣清潔采暖方式。秸稈具有低灰、低硫、低氮、CO2零排放等優(yōu)點[2-3],用秸稈壓塊燃料替代散煤取暖已成為解決能源問題和改善生態(tài)環(huán)境的有效途徑之一[4]。然而,傳統(tǒng)的秸稈直燃方式因存在燃料收集與使用勞動強度高、堆放占用空間大等問題,而被逐漸富裕起來的農(nóng)民舍棄。采用成型技術(shù)將松散的秸稈(60~80 kg/m3)壓縮為壓塊燃料(700~1 300 kg/m3)既便于運輸、存儲,又可以有效提高燃料的能量密度[5],使其便于使用,用于農(nóng)村采暖不僅可以減少化石燃料消耗,還可減少溫室氣體排放,是一條可行的可持續(xù)發(fā)展道路[6-8]。
目前,中國的秸稈壓塊燃料供應鏈多呈“農(nóng)戶→秸稈經(jīng)紀人→壓塊生產(chǎn)企業(yè)→燃料市場”的模式。秸稈被農(nóng)民低價出售給秸稈經(jīng)紀人,經(jīng)多級秸稈經(jīng)紀人后由壓塊生產(chǎn)企業(yè)收購,成型后的產(chǎn)品在燃料市場出售。該供應鏈屬于單向多層的服務模式,成型燃料因多次利潤疊加而價格高昂,致使農(nóng)民使用壓塊燃料的意愿較弱,形成了農(nóng)民僅供應秸稈原料而不使用壓塊產(chǎn)品的開環(huán)結(jié)構(gòu),供需兩側(cè)的物質(zhì)與價格均不穩(wěn)定。造成該現(xiàn)象的主要原因是對農(nóng)戶的行為模式認識不夠準確,將農(nóng)戶行為模式認為是典型的經(jīng)濟人。實質(zhì)上,農(nóng)民既是秸稈供應者又是壓塊燃料消費者。在農(nóng)村地區(qū)構(gòu)建秸稈壓塊服務站公共服務設施,形成“農(nóng)戶→秸稈壓塊服務站→農(nóng)戶”,則可去除供應鏈的中間環(huán)節(jié),構(gòu)建穩(wěn)定可靠的區(qū)域能源市場體系,實現(xiàn)以可再生能源替代散煤供暖,進而達到節(jié)能減排的效果。
秸稈壓塊服務站在組織關(guān)系上涉及到當?shù)卣?、企業(yè)和農(nóng)民三部分,三者不是孤立的個體而是互利共贏的合作者。研究三方參與主體的行為策略是一個典型的博弈問題,解決博弈問題一直存在很多方法,如靜態(tài)博弈、動態(tài)博弈、重復博弈等[9]。但以上博弈理論沿襲經(jīng)典經(jīng)濟學的完全理性人假設[10],即政府、企業(yè)和農(nóng)民均被視為完全理性人,在一次博弈或重復博弈中即可找到最佳策略。然而這一假設與實際是不相符的。實際情況下各參與主體的知識、能力及智慧等方面是不同且有限的,而且僅僅通過簡單的重復博弈是不能使所有參與主體達到“共同知識”的[11]。秸稈壓塊服務站建設博弈過程,不僅涉及農(nóng)民、企業(yè)及政府各主體客觀的經(jīng)濟行為,還存在農(nóng)民和企業(yè)可能不知道其他參與主體收益函數(shù)的情況,并且各主體都有各自的習慣和經(jīng)驗,存在系統(tǒng)推理誤差等主觀因素。政府、企業(yè)及農(nóng)民都是有限理性人,且三方之間的博弈是一個信息不完全的復雜動態(tài)博弈過程。演化博弈論認為人的理性是有限的,不要求完全信息條件,它強調(diào)一種動態(tài)均衡[12]。為此選取演化博弈理論對秸稈壓塊服務站建設問題進行研究。
首先構(gòu)建政府、企業(yè)及農(nóng)民三方博弈模型;其次,結(jié)合演化博弈穩(wěn)定性理論尋找三方博弈的穩(wěn)定點,討論不同條件下模型的穩(wěn)定狀態(tài),分析各參與主體的行為策略;然后采用Shapley值法建立利潤分配模型;最后結(jié)合案例對政府的激勵和三方利潤分配占比進行量化分析,以期為政府制定合理的激勵策略提供理論支持。
演化博弈理論包括復制動態(tài)方程[13]和演化穩(wěn)定策略[14]兩方面內(nèi)容。前者強調(diào)的是選擇,后者強調(diào)的是變異。復制動態(tài)方程是描述博弈方的某一特定策略在一個種群中被采用頻數(shù)的動態(tài)微分方程。演化穩(wěn)定策略是指在多方博弈過程中,由于博弈方都是有限理性的,不可能在起初就找到各自最優(yōu)策略,博弈方需對有利策略不斷修正和改進,直至趨于某個穩(wěn)定策略。
秸稈壓塊服務站的建設由政府、企業(yè)和農(nóng)民三方群體組成。通過分析各群體行為,構(gòu)建三方演繹博弈模型。在三方博弈中,政府以社會效益和環(huán)境效益最大化為決策依據(jù);企業(yè)以自身利益最大化為決策依據(jù);農(nóng)民以自身受益最大化為決策依據(jù)。政府的決策為采取經(jīng)濟激勵政策或不采取經(jīng)濟激勵政策,企業(yè)的決策為投資建設秸稈壓塊服務站或不投資建設秸稈壓塊服務站,農(nóng)民的決策為采用秸稈壓塊取暖或不采用秸稈壓塊取暖?;谏鲜鰠⑴c主體的決策行為,做出如下假設。
假設1:政府、企業(yè)和農(nóng)民之間的博弈屬于不完全信息博弈,即三方掌握的信息均不完全。
假設2:農(nóng)民不采用秸稈壓塊取暖所帶來的環(huán)境損失,在政府采取經(jīng)濟激勵政策、企業(yè)建設情況下,政府和企業(yè)共同承擔該項損失,其中政府承擔比例為β,企業(yè)承擔比例為1-β;其余情況下政府承擔該項損失。
各參與主體的相關(guān)參數(shù)設定如下:
政府采取經(jīng)濟激勵政策需付出的成本記為C1,萬元;政府不采取經(jīng)濟激勵政策需付出的宣傳成本記為C2,萬元。其他參與主體均積極參與下政府獲得的社會效益和環(huán)境效益記為R1,萬元;其中因企業(yè)的積極參與政府獲取的效益比例為θ;其他參與主體均不參與下政府的損失記為D1,萬元。
企業(yè)投資建設秸稈壓塊服務站付出成本記為C3,萬元;獲得的經(jīng)濟效益記為R2,萬元;獲得的政府補貼記為W1,萬元。企業(yè)不建設秸稈壓塊服務站損失的社會聲譽記為C4,萬元。
農(nóng)民采用秸稈壓塊取暖需付出燃料成本記為C5,萬元;獲得的政府補貼記為W2,萬元。農(nóng)民不采用秸稈壓塊取暖需付出燃料成本記為C6,萬元;造成的環(huán)境損失記為D2,萬元。
根據(jù)以上假設,構(gòu)建圖1所示的政府G、企業(yè)E和農(nóng)民F之間的博弈樹模型。圖中yes代表主體的行為是參與秸稈壓塊服務站的建設和使用,no代表主體的行為是不參與秸稈壓塊服務站的建設和使用。數(shù)字1、2、3、4、5、6、7、8分別代表不同的情況,如數(shù)字1表示政府采取經(jīng)濟激勵政策、企業(yè)投資建設秸稈成型燃料服務站、農(nóng)民采用秸稈壓塊取暖的情況。
圖1 政府、企業(yè)以及農(nóng)民之間的博弈樹模型
根據(jù)上述博弈樹模型得出農(nóng)民采用秸稈壓塊取暖與不采用秸稈壓塊取暖的收益情況分別如表1、表2所示。
表1 農(nóng)民采用秸稈壓塊取暖時各主體的收益情況
表2 農(nóng)民不采用秸稈壓塊取暖時各主體收益情況
1.2.1 政府的博弈策略
設定政府采取經(jīng)濟激勵政策的概率為x,則政府不采取經(jīng)濟激勵政策的概率為1-x;企業(yè)投資建設秸稈壓塊燃料服務站的概率為y,則企業(yè)選擇不投資建設秸稈壓塊燃料服務站的概率為1-y;農(nóng)民采用秸稈壓塊取暖的概率為z,則農(nóng)民不采用秸稈壓塊取暖的概率為1-z。政府、企業(yè)、農(nóng)民的平均期望收益分別用H1、H2、H3表示。
政府的平均期望收益用式(1)進行計算,即
H1=xH11+(1-x)H12
(1)
式中H11、H12分別為政府采取經(jīng)濟激勵政策的期望收益和政府不采取經(jīng)濟激勵政策的期望收益,萬元,分別由式(2)、式(3)進行計算,即
H11=yz(-C1+R1-W1-W2)+(1-y)z[(1-θ)R1-C1-W2]+y(1-z)(-C1+θR1-W1-βD2)+(1-y)(1-z)(-C1-D1-D2)=yz[-D1+(β-1)D2]+y[(1-β)D2+D1+θR1-W1]+z[(1-θ)R1+D1+D2-W2]+(-C1-D1-D2)
(2)
H12=yz(-C2+R1)+(1-y)z[(1-θ)R1-C2]+y(1-z)(-C2+θR1-D2)+(1-y)(1-z)(-C2-D2-D1)=z[(1-θ)R1+D1+D2]+y(θR1+D1)-yzD1+(-C2-D1-D2)
(3)
隨著群體不斷演化,群體中的個體不斷選擇某策略進行博弈,采用某策略的個體的期望收益高于群體平均收益,則該類個體的數(shù)量會增加;反之,則該類個體的數(shù)量會減少。這就表明在演化過程中群體中個體總數(shù)量一直處于不斷變化中,而采取經(jīng)濟激勵政策策略的個體概率也在不斷變化,用于描述這個概率變化情況的方程即為復制動態(tài)方程。采用復制動態(tài)方程,即選擇某一特定策略概率的變化等于該策略的收益值與群體平均收益值之間的差值[14-15]?;诖耍扇〗?jīng)濟激勵政策策略的復制動態(tài)方程x′(t)由式(4)進行計算,即
x′(t)=x(H11-H1)
(4)
基于上述政府收益和復制動態(tài)方程,展開得到政府采取經(jīng)濟激勵政策策略的概率x的復制動態(tài)方程為
(5)
1.2.2 企業(yè)的博弈策略
企業(yè)的平均期望收益由式(6)進行計算,即
H2=yH21+(1-y)H22
(6)
式中H21、H22分別為企業(yè)投資建設秸稈壓塊服務站和不投資建設秸稈壓塊服務站的期望收益,萬元,分別由式(7)和式(8)進行計算,即
H21=xz(-C3+R2+W1)+(1-x)z(-C3+R2)+x(1-z)[-C3+R2+W1-(1-β)D2]+(1-x)(1-z)(-C3+R2)=x[W1-(1-β)D2]+xz(1-β)D2-C3+R2
(7)
H22=-C4
(8)
同理,企業(yè)采取建設策略的復制動態(tài)方程y′(t)由式(9)進行計算,即
y′(t)=y(H21-H2)
(9)
基于上述企業(yè)收益和復制動態(tài)方程,展開得到企業(yè)采取建設策略的概率y的復制動態(tài)方程為
(10)
1.2.3 農(nóng)民的博弈策略
農(nóng)民的平均期望收益由式(11)進行計算,即
H3=zH31+(1-z)H32
(11)
式中H31、H32為農(nóng)民采用秸稈壓塊取暖和不采用秸稈壓塊取暖的期望收益,萬元,分別由式(12)和式(13)進行計算,即
H31=xy(-C5+W2)+x(1-y)(-C5+W2)+(1-x)y(-C5)+(1-x)(1-y)(-C5)=xW2-C5
(12)
H32=xy(-C6)+x(1-y)(-C6)+(1-x)y(-C6)+(1-x)(1-y)(-C6)=-C6
(13)
同理,農(nóng)民采取秸稈壓塊取暖策略的復制動態(tài)方程z′(t)由式(14)進行計算,即
z′(t)=z(H31-H3)
(14)
基于農(nóng)民收益和復制動態(tài)方程,展開得到農(nóng)民采取秸稈壓塊取暖策略的概率z的復制動態(tài)方程為
(15)
令F1(x)=0,F(xiàn)2(y)=0,F(xiàn)3(z)=0,可以得到8個平衡點,分別為S1=(0,0,0),S2=(0,0,1),S3=(0,1,0),S4=(0,1,1),S5=(1,0,0),S6=(1,0,1),S7=(1,1,0),S8=(1,1,1)。除上述8個平衡點外,還存在平衡點S9=(x,y,z),其中x、y、z均在區(qū)間(0,1)內(nèi)。該平衡點的表達式為
(16)
根據(jù)式(16)求解得到平衡點S9=(x,y,z),即
(17)
根據(jù)演化博弈的穩(wěn)定性理論可得,若dF1(x)/dx<0,dF2(y)/dy<0,dF3(z)/dz<0,則S9=(x,y,z)為三方博弈的穩(wěn)定點,其中
(18)
1.3.1 政府的演化穩(wěn)定策略
1)當yz(β-1)D2-y[(1-β)D2-W1]-zW2-C1+C2=0,即y、z取式(17)中的數(shù)值時,表明x取任意值,系統(tǒng)都處于穩(wěn)定狀態(tài),不再演化。此時政府既可以選擇采取經(jīng)濟激勵政策,也可以選擇不采取經(jīng)濟激勵政策。
2)當yz(β-1)D2-y[(1-β)D2-W1]-zW2-C1+C2<0時,dF1(0)/dx<0,dF1(1)/dx>0。依據(jù)微分方程穩(wěn)定性判別條件,當F′(x)≤0時取得穩(wěn)定,則可得x=0為演化穩(wěn)定策略。表明政府逐漸從采取經(jīng)濟激勵政策的策略向不采取經(jīng)濟激勵政策的策略演化,即不采取經(jīng)濟激勵政策是此時政府的演化穩(wěn)定策略。
3)當yz(β-1)D2-y[(1-β)D2-W1]-zW2-C1+C2>0時,dF1(0)/dx>0,dF1(1)/dx<0。此時x=1為演化穩(wěn)定策略,表明政府逐漸從不采取經(jīng)濟激勵政策的策略向采取經(jīng)濟激勵政策的策略演化,即采取經(jīng)濟激勵政策是此時政府的演化穩(wěn)定策略。
1.3.2 企業(yè)的演化穩(wěn)定策略
1)當x[W1-(1-β)D2]+xz(1-β)D2-C3+R2-C4=0,即x,z取式(17)中的數(shù)值時,表明y取任意值,系統(tǒng)都處于穩(wěn)定狀態(tài),不再演化。此時企業(yè)既可以選擇投資建設秸稈壓塊服務站,也可以選擇不投資建設秸稈壓塊服務站。
2)當x[W1-(1-β)D2]+xz(1-β)D2-C3+R2-C4<0時,dF2(0)/dy<0,dF2(1)/dy>0。此時y=0為演化穩(wěn)定策略,表明企業(yè)逐漸從投資建設秸稈壓塊服務站的策略向不投資建設秸稈壓塊服務站的策略演化,即不投資建設秸稈成型燃料服務站是此時企業(yè)的演化穩(wěn)定策略。
3)當x[W1-(1-β)D2]+xz(1-β)D2-C3+R2-C4>0時,dF2(0)/dy>0,dF2(1)/dy<0。此時y=1為演化穩(wěn)定策略,表明企業(yè)逐漸從不投資建設秸稈壓塊服務站的策略向投資建設秸稈壓塊服務站的策略演化,即投資建設秸稈壓塊服務站是此時企業(yè)的演化穩(wěn)定策略。
1.3.3 農(nóng)民的演化穩(wěn)定策略
1)當xW2-C5+C6=0,即x取式(17)中的數(shù)值時,表明z取任意值,系統(tǒng)都處于穩(wěn)定狀態(tài),不再演化。此時農(nóng)民既可以選擇采用秸稈壓塊取暖,也可以選擇不采用秸稈壓塊取暖。
2)當xW2-C5+C6<0時,dF3(0)/dz<0,dF3(1)/dz>0。此時z=0為演化穩(wěn)定策略,表明農(nóng)民逐漸從采用秸稈壓塊取暖的策略向不采用秸稈壓塊取暖的策略演化,即不采用秸稈壓塊取暖是此時農(nóng)民的演化穩(wěn)定策略。
3)當xW2-C5+C6>0時,dF3(0)/dz>0,dF3(1)/dz<0。此時z=1為演化穩(wěn)定策略,表明農(nóng)民逐漸從不采用秸稈壓塊取暖的策略向采用秸稈壓塊取暖的策略演化,即采用秸稈壓塊取暖是此時農(nóng)民的演化穩(wěn)定策略。
根據(jù)Ritzberger和Weibull[16]提出的結(jié)論,只需對S1=(0,0,0),S2=(0,0,1),S3=(0,1,0),S4=(0,1,1),S5=(1,0,0),S6=(1,0,1),S7=(1,1,0),S8=(1,1,1)8個均衡點的穩(wěn)定性進行分析。有學者提出應用雅可比矩陣的局部穩(wěn)定性可得到均衡點的穩(wěn)定性[17]。根據(jù)博弈三方的復制動態(tài)方程,可以得到如表3所示的雅可比矩陣。
表3 雅可比矩陣
由李亞普諾夫第一法則可知,演化穩(wěn)定策略(ESS)對應的雅可比矩陣的特征根必須小于0[18]。各均衡點的特征根值如表4所示。
表4 各均衡點的特征根
主要關(guān)注服務站能夠順利建設和運行下各參與主體的策略行為,即主要關(guān)注S8=(1,1,1)點的穩(wěn)定性。依據(jù)表4可知,S8=(1,1,1)點的特征根分別為C1-C2+W2-W1+2D2(β-1),C4+C3-R2-W1,-C6+C5-W2。S8=(1,1,1)點為穩(wěn)定點時,其特征根需要同時滿足以下條件:
(19)
即當政府、企業(yè)及農(nóng)民的付出成本和收益大小符合上述條件時,政府采取經(jīng)濟激勵政策策略、企業(yè)采取建設策略、農(nóng)民采取采用秸稈壓塊取暖策略的概率均為1。
依據(jù)式(17)可得政府采取經(jīng)濟激勵政策的概率為x=(C5-C6)/W2。政府的策略選擇取決于農(nóng)民采用秸稈壓塊取暖需付出的燃料成本C5、農(nóng)民不采用秸稈壓塊取暖需付出的燃料成本C6及政府給予農(nóng)民的補貼W2。與農(nóng)民采用秸稈壓塊取暖需付出的燃料成本C5成正比,與農(nóng)民不采用秸稈壓塊取暖需付出的燃料成本C6和政府給予農(nóng)民的政府補貼W2成反比。這表明農(nóng)民采用秸稈壓塊取暖的成本越高,政府越需要加大經(jīng)濟激勵力度,以提高農(nóng)民的參與積極性。農(nóng)民不采用秸稈壓塊取暖的成本越高,政府的經(jīng)濟激勵力度可以相應減弱。
農(nóng)民選擇采用秸稈壓塊取暖的概率為z={W2(C3+C4-R2)-(C5-C6)[W1-(1-β)D2)]}/[(1-β)D2(C5-C6)]。當政府補貼W2=[(C5-C6)W1]/(C3+C4-R2)時,農(nóng)民選擇采用秸稈壓塊取暖的概率為1。通過政府補貼W2的表達式可看出政府對農(nóng)民的補貼力度與農(nóng)民采用秸稈壓塊取暖需付出的燃料成本C5成正比,與農(nóng)民不采用秸稈壓塊取暖需付出的燃料成本C6成反比。這表明當采用秸稈壓塊取暖成本過高時,為了提高農(nóng)民采用的積極性,政府需要加大對農(nóng)民的補貼力度;當農(nóng)民不采用秸稈壓塊取暖,仍采用燃煤取暖的成本越小時,農(nóng)民對燃煤取暖的認可度越高,相應也就需要政府加大對農(nóng)民采用秸稈壓塊取暖的補貼力度以促使農(nóng)民放棄燃煤取暖。因此,政府可以通過限制煤炭使用量、調(diào)整煤炭價格、對超額燃燒煤炭的農(nóng)民收取一定比例的懲罰費用等措施來提高農(nóng)民燃煤成本,從而提高農(nóng)民采用秸稈壓塊取暖的積極性。
根據(jù)博弈局中人之間是否具有約束力的協(xié)議,可以將一個博弈過程分為合作博弈和非合作博弈。合作博弈主要研究在博弈局中人之間具有約束力的協(xié)議并使得整體利益最大時,各局中人如何分配收益的問題。其中,合作是合作博弈的基礎,團體理性是其重點。根據(jù)前文政府、企業(yè)、農(nóng)民三者之間的博弈模型,假設三者達成合作協(xié)議,進行合作博弈模型建立,得出三者的合理利益分配。
Shapley值法由Shapley于1953年提出,為解決多個局中人在合作過程中因利益分配而產(chǎn)生矛盾的問題,屬于合作博弈領(lǐng)域。該方法是按照成員對聯(lián)盟的邊際貢獻率將利益進行分配,即成員i所分得的利益等于該成員為其所參與聯(lián)盟創(chuàng)造的邊際利益的平均值?;赟hapley值進行聯(lián)盟成員的利益分配避免了分配上的平均主義,比任何一種僅按資源投入價值、資源配置效率及將二者相結(jié)合的分配方式都更具合理性和公平性,也體現(xiàn)了各盟員相互博弈的過程[18-19]。因此,采用Shapley值法對政府、企業(yè)、農(nóng)民博弈進行利潤分配。
3.1.1 符號定義
定義Shapley值法需用到的符號如下:
1)n、N:假設合作博弈中有n個博弈局中人,由N={1, 2, …,n}表示n個博弈局中人的集合。
2)S:不同博弈局中人組成不同的聯(lián)盟,記為S,S是N的子集,N為總體聯(lián)盟。
3)v(S):定義在N上的一實函數(shù)v為特征函數(shù),即聯(lián)盟S的收益記為v(S)。特征函數(shù)v(S)具有超可加性,若聯(lián)盟S1和S2沒有交集,則S1和S2構(gòu)成新聯(lián)盟的利益大于等于聯(lián)盟S1和S2的收益之和,即當S1、S2符合S1∩S2=?條件時,v(S1+S2)≥v(S1)+v(S2)。
4)xi(v):表示聯(lián)盟中成員i獲得的利益。
3.1.2 Shapley值法
Shapley證明了Shapley值分配策略滿足有效性公理、對稱性公理、冗員性公理和可加性公理時,Shapley值是唯一的。4個公理的內(nèi)容如下:
2)對稱性。設π是N={1, 2, …,n}的一個排列,對于N的任意子集S={i1,i2,…,in},有πS={πi1,πi2,…,πim}。若在定義特征函數(shù)w(S)=v(πS),則對于每個成員i∈N都有xi(w)=xπi(v)。這表示合作獲利的分配不隨利益相關(guān)者的先后順序或者記號標記變化。
3)冗員性。若對于包含成員i的所有子集S都有v(S{i})=v(S),則xi(v)=0。其中S{i}為集合S去掉元素i后的集合。這說明如果一個成員對于任何他參與的合作聯(lián)盟都沒有貢獻,則他不應當從全體合作中獲利。
4)可加性。若在N上有兩個特征函數(shù)v1、v2,則有x(v1+v2)=x(v1)+x(v2)。這表明有多種合作時,每種合作的利益分配方式與其他合作結(jié)果無關(guān),總分配是兩項的和。
成員i從總體利益v(N)所分配的利益由式(20)進行計算,即
(20)
式中:Si為N中包含成員i的所有子集形成的集合;|S|為聯(lián)盟S所包含的成員數(shù),成員i在參與S聯(lián)盟時有(|S|-1)!種排序,而剩余(n-|S|)個成員的排序有(n-|S|)!種排序,[(|S|-1)!(n-|S|)!]/(n!)為成員i對于聯(lián)盟整體所應分得利益的權(quán)重;Si}為從集合S中刪除元素i后的集合,[v(S)-v(Si})]為成員i參與不同聯(lián)盟S為自身參與聯(lián)盟創(chuàng)造的邊際貢獻。
3.2.1 構(gòu)建利潤分配模型
秸稈壓塊服務站的合作博弈模型中有3個局中人:政府、企業(yè)和農(nóng)民,分別記為A、B、C,局中人的策略都是要么合作要么不合作?,F(xiàn)考慮的是合作博弈,3個局中人在博弈前都簽訂協(xié)議,合作形成一個聯(lián)盟,根據(jù)上述介紹的Shapley值法可以計算大聯(lián)盟中每個局中人的利益。下面首先計算各聯(lián)盟的利益情況。
1)當3個局中人相互獨立,即Shapley值法中的S=1時,各博弈局中人的利益情況如下:
政府(A)單獨采取經(jīng)濟激勵政策獲得收益為v(A)=(-C1-D1-D2)。
企業(yè)(B)單獨選擇建設服務站獲得收益為v(B)=(-C3+R2)。
農(nóng)民(C)單獨選擇采用秸稈壓塊取暖獲得收益為v(C)=(-C5)。
2)當3個局中人兩兩合作,即Sharpley值法中的S=2時,各聯(lián)盟的利益情況如下:
當政府(A)與企業(yè)(B)合作時,相當于政府采取經(jīng)濟激勵政策,企業(yè)選擇建設服務站,農(nóng)民選擇不采用秸稈壓塊取暖,此時兩者形成聯(lián)盟的利益為v(A,B)=(θR1+R2-D2-C1-C3)。
當政府(A)與農(nóng)民(C)合作時,相當于政府采取經(jīng)濟激勵政策,企業(yè)選擇不建設服務站,農(nóng)民選擇采用秸稈壓塊取暖,此時兩者形成聯(lián)盟的利益為v(A,C)=(-C1-D1-C5)。
當企業(yè)(B)與農(nóng)民(C)合作時,相當于政府不采取經(jīng)濟激勵政策,企業(yè)選擇建設服務站,農(nóng)民選擇采用秸稈壓塊取暖,此時兩者形成聯(lián)盟的利益為v(B,C)=(-C3+R2-C5)。
3)當3個局中人都參與合作形成大聯(lián)盟,即Sharpley值法中的S=3時,聯(lián)盟的利益情況如下:
當政府(A)、企業(yè)(B)與農(nóng)民(C)均合作時,相當于政府采取經(jīng)濟激勵政策,企業(yè)選擇建設服務站,農(nóng)民選擇采用秸稈壓塊取暖,此時三者形成聯(lián)盟的利益為v(A,B,C)=(R1+R2-C1-C3-C5)。
3.2.2 模型求解
根據(jù)式(20)以及各聯(lián)盟的利益情況,可以計算聯(lián)盟中各局中人的邊際貢獻。該合作博弈中共有3個局中人,聯(lián)盟S中的人數(shù)依次取1、2、3,分別對應各局中人相互獨立、兩兩合作以及形成統(tǒng)一大聯(lián)盟時的利益情況。下面求解各局中人的邊際貢獻。
3.2.2.1 政府獲利情況
政府(A)可以組成的聯(lián)盟有4種情況:{A}、{A,B}、{A,C}、{A,B,C}。依據(jù)Shapley公式計算得到政府(A)各聯(lián)盟概率值、利益情況及總利潤情況,如表5所示。
表5 政府(A)的Shapley值
依據(jù)表5可得:政府(A)單獨參與項目的概率為1/3,此時政府獲利-C1-D1-D2;政府分別與企業(yè)、農(nóng)民合作參與服務站建設項目的概率均為1/6,此時政府獲利分別為θR1-D2-C1、-C1-D1;政府、企業(yè)、農(nóng)民三方合作參與的概率為1/3,此時政府獲利為R1-C1。
綜上,政府總獲利xA(v)= 1/6[(θ+2)R1-6C1-3D1-3D2]。
3.2.2.2 企業(yè)獲利情況
企業(yè)(B)可以組成的聯(lián)盟有4種情況:{B}、{A,B},{B,C},{A,B,C}。依據(jù)Shapley公式計算得到企業(yè)(B)各聯(lián)盟概率值、利益情況及總利潤情況,如表6所示。
表6 企業(yè)(B)的Shapley值
依據(jù)表6可得:企業(yè)(B)單獨參與項目的概率為1/3,此時企業(yè)獲利(-C3+R2);企業(yè)分別與政府、農(nóng)民合作參與服務站建設項目的概率均為1/6,此時企業(yè)獲利分別為θR1+R2+D1-C3、-C3+R2;企業(yè)、政府、農(nóng)民三方合作參與的概率為1/3,此時企業(yè)獲利為R1+R2+D1-C3。
綜上,企業(yè)總獲利xB(v)=1/6[6R2+(θ+2)R1+3D1-6C3]。
3.2.2.3 農(nóng)民獲利情況
農(nóng)民(C)可以組成的聯(lián)盟有4種情況:{C}、{A,C}、{B,C}、{A,B,C}。依據(jù)Shapley公式計算得到農(nóng)民(C)各聯(lián)盟概率值、利益情況及總利潤情況,如表7所示。
表7 農(nóng)民(C)的Shapley值
依據(jù)表7可得:農(nóng)民(C)單獨參與項目的概率為1/3,此時農(nóng)民獲利-C5;農(nóng)民分別與政府、企業(yè)合作參與服務站建設項目的概率均為1/6,此時農(nóng)民獲利分別為D2-C5、-C5;農(nóng)民、企業(yè)、政府三方合作參與的概率為1/3,此時農(nóng)民獲利為(1-θ)R1+D2-C5。
綜上,農(nóng)民總獲利xC(v)= 1/6[2(1-θ)R1+3D2-6C5]。
3.2.2.4 利潤分配比例
得到3個局中人的邊際貢獻后,將其單位化即可得到每個局中人在大聯(lián)盟中的利益分配比例。令xT(v)=xA(v)+xB(v)+xC(v),則政府(A)應得的利益分配比例為xA(v)/xT(v),企業(yè)(B)應得的利益分配比例為xB(v)/xT(v),農(nóng)民(C)應得的利益分配比例為xC(v)/xT(v)。
根據(jù)各局中人的Shapley值,可以得到各局中人的利益分配比例如下。
政府的利潤分配比例wA由式(21)進行計算,即
(21)
企業(yè)的利潤分配比例wB由式(22)進行計算。
(22)
農(nóng)民的利潤分配比例wC由式(23)進行計算。
(23)
某企業(yè)計劃投資建設秸稈成型燃料服務站,計劃投入成本100萬(建廠費50萬,設備費30萬,人工20萬)。設定政府補貼期限為5年。由于該企業(yè)為工程建設企業(yè),依據(jù)非居民所得稅核定征收管理辦法中第五條規(guī)定,從事承包工程作業(yè)、設計和咨詢服務的成本利潤率為15%~30%。假定該企業(yè)每年預計利潤率為25%,即企業(yè)每年利潤為25萬,5年總利潤額為125萬元。企業(yè)不投資建設秸稈壓塊服務站,5年損失的社會聲譽總共為5萬元。農(nóng)民若采用燃煤取暖,每年需要煤2 t,每噸800元,即年成本為0.16萬元,5年總成本為0.8萬元;若采用秸稈壓塊取暖,每年需要4 t,每噸150元,即年成本為0.06萬元,5年總成本為0.3萬元。農(nóng)民不采用秸稈壓塊取暖每年所帶來的環(huán)境損失為6萬元,5年總成本為30萬元,其中政府承擔損失比例為2/3。政府年宣傳成本為7萬,5年總成本為35萬元。政府推行經(jīng)濟激勵政策付出的年成本為5萬,5年總成本為25萬元。政府獲得的年社會效益和環(huán)境效益為企業(yè)收益的1.4倍,即政府的5年總收益為175萬元,其中因企業(yè)的積極響應政府獲取的效益比例為3/5。企業(yè)和農(nóng)民均不參與項目下政府的年損失為8萬元,5年的總成本為40萬元。企業(yè)和農(nóng)民均不參與時政府沒有補貼支出。
依據(jù)企業(yè)和農(nóng)民參與概率均為1時的政府補貼表達式,將上述數(shù)據(jù)代入計算得知,政府每年需補貼企業(yè)8.729 5萬元,每年需補貼農(nóng)民0.218 2萬元,5年內(nèi)政府補貼開支為44.738 5萬元。同時,在秸稈壓塊服務站建設和運行過程中,企業(yè)和農(nóng)民始終是利益相關(guān)者,雙方的策略選擇都受到政府政策的影響,同時農(nóng)民的參與程度也會影響企業(yè)投資建設秸稈壓塊服務站的積極性。對于政府而言,其對雙方的補貼比例應該控制在一定范圍內(nèi),這樣既可以提高雙方參與積極性,又可以節(jié)省財務開支。若政府對雙方的補貼比例失衡,一方面這可能會降低某一方的參與積極性,另一方面也會增加政府財政支出。因此,確定一個相對合理的補貼比例對秸稈成型燃料服務站的建設和運行起著至關(guān)重要的作用。確定政府對企業(yè)和農(nóng)民的補貼比例范圍在40∶1時雙方參與積極性最高。
依據(jù)式(21)~式(23),將上述數(shù)據(jù)代入計算得知,政府的利益分配占比為9.06%,企業(yè)的利益分配占比為69.17%,農(nóng)民的利益分配占比為21.77%。
通過構(gòu)建政府、企業(yè)以及農(nóng)民三方參與主體的演化博弈模型,分析了不同情況下三方參與主體的演化結(jié)果,并對三方參與主體的行為進行了分析,得出以下主要結(jié)論:
1)政府采取經(jīng)濟激勵政策策略的概率受農(nóng)民采用秸稈壓塊取暖需付出的燃料成本以及不采用秸稈壓塊取暖需付出的燃料成本的影響。與農(nóng)民采用秸稈壓塊取暖需付出的燃料成本成正比關(guān)系,與農(nóng)民不采用秸稈壓塊取暖需付出的燃料成本成反比關(guān)系。兩種采暖方式的成本差距越大,政府越傾向于采取經(jīng)濟激勵政策。
2)企業(yè)采取建設策略的概率取決于政府滿足企業(yè)自身補貼需求的程度。當政府出臺相關(guān)財政補貼政策完全滿足企業(yè)補貼需求后,企業(yè)選擇參與建設秸稈壓塊服務站的概率為1。同時研究表明,政府對企業(yè)的補貼力度與企業(yè)建設秸稈壓塊服務站需付出的建設成本成正比關(guān)系,與企業(yè)建設所得的經(jīng)濟效益以及企業(yè)不建設損失的社會聲譽成反比關(guān)系。隨著企業(yè)建設成本降低或不建設損失成本升高,其對政府補貼力度的要求也會相應降低。
3)農(nóng)民采取用秸稈壓塊取暖策略的概率取決于政府滿足農(nóng)民自身補貼需求的程度。當政府出臺相關(guān)財政補貼政策完全滿足農(nóng)民補貼需求后,農(nóng)民選擇采用秸稈壓塊取暖的概率為1。同時研究表明,政府對農(nóng)民的補貼力度與農(nóng)民采用秸稈壓塊取暖需付出的燃料成本成正比關(guān)系,與農(nóng)民不采用秸稈壓塊取暖需付出的燃料成本成反比關(guān)系。隨著農(nóng)民采用秸稈壓塊取暖燃料成本的降低或農(nóng)民不采用秸稈壓塊取暖燃料成本的升高,其對政府補貼力度的要求也會相應降低。
4)除政府補貼力度會影響企業(yè)和農(nóng)民參與程度外,政府對企業(yè)和農(nóng)民的補貼比例也影響著雙方策略選擇。一個合理的補貼比例在企業(yè)和農(nóng)民均選擇參與該項目中發(fā)揮著至關(guān)重要的作用。企業(yè)和農(nóng)民作為項目實施的利益相關(guān)者,雙方策略的選擇會相互影響。政府補貼比例不合理會導致某一參與主體積極性降低,從而影響另一參與主體的策略選擇。研究結(jié)果表明,當政府對企業(yè)和農(nóng)民的補貼比例保持在40∶1時企業(yè)和農(nóng)民均傾向于參與該項目。
5)在秸稈壓塊服務站建設運行項目中,政府從中分配的利潤最少,其次是農(nóng)民,企業(yè)分配利潤最多。政府、企業(yè)、農(nóng)民的利潤分配占比分別為9.06%、69.17%、21.77%,該結(jié)論與實際相符。政府作為宏觀調(diào)控機構(gòu),本身的關(guān)注點不在盈利,其主要承擔的是社會責任。而企業(yè)恰恰相反,其作為營利機構(gòu)關(guān)注的焦點為利潤額。