和燕杰
(麗江師范高等??茖W(xué)校國際旅游與工商管理學(xué)院,云南 麗江 674199)
建設(shè)長江經(jīng)濟帶,不但能促進經(jīng)濟發(fā)展由東向西梯度推進,縮小區(qū)域發(fā)展差距,還能優(yōu)化全國經(jīng)濟結(jié)構(gòu),形成與絲綢之路經(jīng)濟帶的戰(zhàn)略互動,是新時期促進我國區(qū)域經(jīng)濟協(xié)調(diào)發(fā)展,直接惠及6億國民的重大戰(zhàn)略舉措(李克強,2014)[1]。在這樣的背景下,研究長江經(jīng)濟帶沿線各省市如何基于異質(zhì)性的比較優(yōu)勢強化彼此之間的經(jīng)濟合作,事關(guān)中國區(qū)域經(jīng)濟的協(xié)調(diào)發(fā)展,事關(guān)國家發(fā)展戰(zhàn)略的實現(xiàn),因而是一個十分重要的現(xiàn)實與理論問題。在建設(shè)長江經(jīng)濟帶的進程中,流域所特有的上下游之間的自然聯(lián)系使得生態(tài)保護等合作領(lǐng)域具備了公共物品的性質(zhì),從而導(dǎo)致市場失靈,合作效率不高,甚至使合作流于形式。這主要是由于經(jīng)濟運行機制在特定領(lǐng)域內(nèi)不能自發(fā)調(diào)節(jié)以及政府的制度安排不能校正市場失靈而產(chǎn)生的(Field,2008)[2],但從根本上講是由于區(qū)域利益的不一致所導(dǎo)致的。所以,需要通過必要的政策矯正來克服市場失靈,使得區(qū)域利益趨向一致,不斷提升公共物品供給合作的績效。因此,深入研究長江經(jīng)濟帶跨區(qū)域公共物品供給合作問題,對于深化長江經(jīng)濟帶經(jīng)濟合作,促進長江流域經(jīng)濟的協(xié)調(diào)發(fā)展,保證生態(tài)安全都有著重大的現(xiàn)實意義。
流域生態(tài)環(huán)境作為公共產(chǎn)品具有顯著的跨區(qū)域性,它不但具有全國屬性,還具有鮮明的地域?qū)傩?彭高旺,2009)[3],其供給不僅要由中央政府來承擔(dān),而且更重要的是要由區(qū)域內(nèi)所有受益者共同承擔(dān)(李寧等,2010)[4]。流域生態(tài)環(huán)境不但具有不可分割的自然屬性,還具有顯著的外部性特征且生態(tài)產(chǎn)權(quán)難以界定(梁麗娟等,2006)[5]。上游地區(qū)如果為了獲得最大的經(jīng)濟利益而過度使用環(huán)境資源,即使出現(xiàn)生態(tài)災(zāi)難,其成本也可以很方便的轉(zhuǎn)嫁給下游地區(qū),形成負的外部性,而上游地區(qū)如果有著保護生態(tài)環(huán)境的積極性,則下游地區(qū)可以獲得正的外部性,因此出于各自的經(jīng)濟利益,上游地區(qū)有著過度開發(fā)的偏好(王燕,2011)[6],而下游地區(qū)則有著免費搭便車的偏好(Sandler T,2009)[7]。這種區(qū)域利益的不一致導(dǎo)致了流域公共物品的供給合作存在很大困難,合作效率不高。那這些問題如何解決?從現(xiàn)有文獻看,代表性的觀點有:比較優(yōu)勢理論和分工理論并不能解決流域經(jīng)濟合作問題,其很大的原因是由于以GDP為導(dǎo)向的地方政府政治晉升機制進一步強化了這種區(qū)域利益的不一致從而增加了合作的難度(卓凱、殷存毅,2007)[3],因為這種利益不一致導(dǎo)致了地方保護主義的長期存在(周黎安,2004[8]),并且由于地方政府對局部利益的偏好,在沒有相應(yīng)“秩序”規(guī)范的條件下,“諸侯經(jīng)濟”這種不合作的現(xiàn)象勢必出現(xiàn)(殷存毅,2004)[9]。因此中國的改革最難的不是“體制摩擦”問題,而是其身后的“利益摩擦”問題,所以改革的關(guān)鍵是解決利益不一致所產(chǎn)生的各種利益矛盾問題(樊綱,2009)[10],而建立穩(wěn)定的合作制度需要滿足合作制度內(nèi)生性、參與各方利益平衡、參與方必須切實感受到合作的互利以及合作制度對參與方具備約束力等條件(青木昌彥,2000[11])。顯然,利益受益者對受損者進行利益補償以及由國家提供承諾將有助于解決流域公共物品供給合作中所產(chǎn)生的利益不一致的問題(盧周來,2008)[12]。沿著這樣的思路,本文將基于博弈分析的框架研究利益不一致與長江經(jīng)濟帶跨區(qū)域公共物品供給合作問題,以探索提升長江經(jīng)濟帶跨區(qū)域公共物品供給合作績效的道路。
長江經(jīng)濟帶生態(tài)保護問題是長江經(jīng)濟帶區(qū)域經(jīng)濟合作中重要的合作領(lǐng)域之一,同時還是長江經(jīng)濟帶區(qū)域經(jīng)濟合作的難點之一,很具有典型性。為了方便進一步分析問題,本研究假設(shè)如下:(1)長江經(jīng)濟帶有上游區(qū)域A和下游區(qū)域B兩個利益主體;(2)將A和B看作是具有完全理性的決策主體;(3)A和B的決策是兩種純策略即A是保護與不保護而B是補償與不補償;(4)A選擇保護策略時得到的長期收益LR;A選擇不保護策略時得到的短期收益SR;A選擇保護策略時所要支付的成本C1;B選擇補償策略時所要支付的成本C2;當(dāng)A選擇保護策略時,B得到的外部性收益E1;當(dāng)A選擇不保護策略時,B得到的外部性收益E2;LR、SL、E1、E2、C1和C2為正數(shù),LR、SL、E1和E2都與時間有關(guān)。
缺乏剛性的約束機制條件下的短期博弈均衡。所謂雙方的合作缺乏剛性的約束機制,就是指沒有對不保護和不補償?shù)牟呗赃x擇進行懲罰的制度安排。假設(shè)決策參與者A采取保護策略,參與者B采取補償策略,這樣A采取保護策略要付出保護成本但由于可以得到B的補償而可以獲得收益LR-C1+C2,B采取補償策略也要支付補償?shù)瑫r可以得到由于A的保護而產(chǎn)生的外部性收益而最終也可以獲得收益E1-C2;如果A選擇保護,而B選擇不補償,那么A不但要付出保護成本同時還得不到B的補償而只能得到收益LR-C1,而B則不但可以不支付成本C2并且還可以搭A(yù)保護生態(tài)的便車得到收益E1;如果A選擇不保護,B選擇補償,那么A由于可以獲得短期利益(如伐木收益等)同時還可以獲得B的補償而可以獲得收益SR+C2,B則一方面要提供補償另一方面要承受由于A破壞生態(tài)而帶來的外部性的利益損失而只能得到收益E2-C2;假如A選擇不保護,B選擇不補償,那么A可以得到收益SR,B則可以得到收益E2。最終,參與博弈的各方選擇怎樣的策略取決于各方自身的利益。
根據(jù)以上分析,構(gòu)建博弈模型,如圖1所示。
圖1 長江經(jīng)濟帶跨區(qū)域公共物品供給短期博弈模型
在短期內(nèi),上游區(qū)域A由于選擇保護策略所產(chǎn)生的效益不可能立即顯現(xiàn),而是需要相當(dāng)長的時間,因此在短期內(nèi)短期利益總是要大于長期利益,即LR
為了克服個體理性與集體理性之間的矛盾,引入剛性的行為約束機制對行為主體進行必要而有效的約束。對上述的假設(shè)進行必要的修正,其他假設(shè)不變,增加兩條假設(shè):(5)雙方建立了剛性的行為約束機制;(6)F1是在上游區(qū)域A選擇不保護策略的條件下,區(qū)域A所受到的懲罰;F2是在下游區(qū)域B選擇不補償策略的條件下,區(qū)域B所受到的懲罰。這樣,可以構(gòu)建博弈模型,如圖2所示。
圖2 引入剛性約束機制后的長江經(jīng)濟帶跨區(qū)域公共物品供給短期博弈模型
通過分析,無法確定這一過程是否存在純策略的納什均衡,因此只能從定義出發(fā)求混合策略的納什均衡。假設(shè)μ是A選擇保護策略的概率,γ是B選擇補償策略的概率。
在給定μ的條件下,B選擇補償策略(γ=1)和不補償策略(γ=0)的期望收益:
πB(1,μ)=(E1-C2)μ+(E2-C2)(1-μ)
πB(0,μ)=(E1-F2)μ+(E2-F2)(1-μ)
πB(1,μ)=πB(0,μ)
F2=C2
在給定γ的條件下,A選擇保護策略(μ=1)和不保護策略(μ=0)的期望收益:
πA=(1,γ)=(LR-C1+C2)γ+(LR-C1)(1-γ)
πA=(0,γ)=(SR+C2-F1)γ+(SR-F1)(1-γ)
πA=(1,γ)=πA(0,γ)
F1=LR-C1+SR
所以F2=C2和F1=LR-C1+SR是B和A選擇不同策略的臨界點,因此只要保證F2≥C2和F1≥LR-C1+SR,就有混合策略的納什均衡解(保護,補償),所以對于具有公共品性質(zhì)的合作領(lǐng)域,應(yīng)當(dāng)建立一種剛性的約束機制,這種機制應(yīng)當(dāng)充分發(fā)揮政府特別是中央政府的作用,通過減少政策的供給、減少稅收返還甚至調(diào)整地方政府人事等手段來對于非合作行為進行懲罰,實現(xiàn)A、B兩區(qū)域由利益不一致向利益一致、短期行為向長期行為轉(zhuǎn)化。
盡管在短期博弈中,為了分析問題的方便,假設(shè)長江經(jīng)濟帶存在兩個利益主體,分別為上游區(qū)域A和下游區(qū)域B,但實際的情況是上游區(qū)域有著很多利益主體,同樣下游區(qū)域也有著多個利益主體,哪怕同在上游或下游區(qū)域的各個博弈主體之間的利益也是不一致的,因此認為各博弈主體具備完全理性是不合理的,而較為合理的假設(shè)是博弈各方的理性是有限的。盡管建立了剛性的約束機制,并且還有社會輿論的強大壓力(因為社會各界不希望長江流域陷入生態(tài)災(zāi)難之中,而任何博弈方都不希望成為眾矢之的),但各博弈方不可能在任何情況下都遵循同一種保護或不保護以及補償或不補償?shù)募儾呗?,并且最?yōu)策略也不是一開始就有的,而是隨著時間的推移而不斷學(xué)習(xí)演化的過程。當(dāng)然,更為重要的是利益不一致這一根本問題依然還將長期存在。因此,博弈雙方的各個行為主體在長期內(nèi)通常會采用混合策略。那么,上游和下游區(qū)域雙方之間就形成了大群體成員的反復(fù)博弈的基本態(tài)勢?;谝陨戏治觯潘梢恍l件后,對原先的假設(shè)做進一步的修正:(1)長江經(jīng)濟帶有兩個利益群體,分別為上游區(qū)域和下游區(qū)域;(2)參與者決策是混合策略;(3)LR是上游區(qū)域選擇保護策略時得到的長期收益;SR是上游區(qū)域選擇不保護策略時得到的短期收益;C1是上游區(qū)域選擇保護策略時所要支付的成本;C2是下游區(qū)域選擇補償策略時所要支付的成本;E1是上游區(qū)域選擇保護策略的條件下下游區(qū)域得到的外部性收益;(4)E2是上游區(qū)域選擇不保護策略的條件下下游區(qū)域得到的外部性收益;(5)F1是在上游區(qū)域選擇不保護策略時受到的懲罰;(6)F2是在下游區(qū)域選擇不補償策略的條件下,其所受到的懲罰。LR、SL、E1、E2、C1、C2、F1和F2都為正數(shù)。
假設(shè)在初始狀態(tài)下,上游區(qū)域博弈主體中選擇保護策略的比例為α(0≤α≤1),而選擇不保護策略的比例為1-α;下游區(qū)域博弈主體中選擇補償策略的比例為β(0≤β≤1),而選擇不保護策略的比例為1-β。顯然,α和1-α以及β和1-β都是隨著時間的變化而不斷變化的,因此可以將其記成時間的函數(shù)α(t)、1-α(t)、β(t)和1-β(t),但是為了分析問題的方便可以仍然簡記成α、1-α、β和1-β?;诖耍瑯?gòu)建長期動態(tài)博弈模型,如圖3所示。
圖3 長江經(jīng)濟帶跨區(qū)域公共物品供給長期動態(tài)博弈模型
從圖3的支付矩陣中,可以發(fā)現(xiàn)這一長期動態(tài)博弈過程并不存在純策略均衡。下面,求長期動態(tài)博弈的混合策略均衡。
上游區(qū)域選擇保護或不保護策略的預(yù)期收益是:
π保護=β(LR-C1+C2)+(1-β)(LR-C1)
π不保護=β(SR+C2-F1)+(1-β)(SR-F1)
平均預(yù)期收益是:
由生物進化的“復(fù)制動態(tài)機制”可得上游區(qū)域選擇策略傾向的復(fù)制動態(tài)方程(謝識予,2007)[13]:
下游區(qū)域選擇補償或不補償策略的預(yù)期收益是:
π補償=α(E1+C2)+(1-α)(E2-C2)
π不補償=α(E1-F2)+(1-α)(E2-F2)
平均預(yù)期收益是:
同理,可得下游區(qū)域選擇策略傾向的復(fù)制動態(tài)方程:
令G(α)=0,G(β)=0,可得α*和β*的兩個穩(wěn)定狀態(tài)均為0和1。依據(jù)微分方程的穩(wěn)定性定理以及演化穩(wěn)定策略的性質(zhì)(謝識予,2007),可得:
基于以上分析,可以得到長江經(jīng)濟帶跨區(qū)域公共物品供給長期動態(tài)博弈的相位圖,如圖4所示。
圖4 長江經(jīng)濟帶跨區(qū)域公共物品供給長期動態(tài)博弈相位圖
在圖4中,不難看出,長江經(jīng)濟帶上游地區(qū)群體與下游地區(qū)群體之間經(jīng)過長期多次反復(fù)博弈的兩種進化穩(wěn)定策略結(jié)果為(α*,β*)=(1,1)=(保護,補償)或者(α*,β*)=(0,0)=(不保護,不補償)。顯然,初始狀態(tài)采用不同策略的比例決定著系統(tǒng)最終會收斂于哪種進化穩(wěn)定策略。假如初始狀態(tài)落在B區(qū)時,系統(tǒng)會收斂到屬于帕累托最優(yōu)均衡的進化穩(wěn)定策略(α*,β*)=(1,1)=(保護,補償);假如初始狀態(tài)落在C區(qū)時,系統(tǒng)會收斂到屬于帕累托劣均衡的進化穩(wěn)定策略(α*,β*)=(0,0)=(不保護,不補償);假如初始狀態(tài)落在A區(qū)或者D區(qū)時,既有可能進入B區(qū)并最終收斂到(保護,補償),也有可能進入C區(qū)并最終收斂到(不保護,不補償)。因此,為了使系統(tǒng)收斂于帕累托最優(yōu)均衡,即(α*,β*)=(1,1)=(保護,補償),除了使初始的博弈點出現(xiàn)在B區(qū)以外,更為重要的是要盡可能的擴大B區(qū)的面積,減少C區(qū)的面積。B區(qū)的面積為:
從長期來看,對于長江經(jīng)濟帶上游地區(qū)而言,由于生態(tài)保護的效益隨著時間的推移而日漸顯現(xiàn),帶來社會效益的同時,伴隨著旅游休閑等綠色產(chǎn)業(yè)的發(fā)展,將帶來更大的經(jīng)濟效益,長期收益不斷增大。更為重要的是,隨著合作的不斷深化以及流域經(jīng)濟一體化的實現(xiàn),不斷增強的經(jīng)濟實力使得上游地區(qū)完全具備了支付保護生態(tài)成本的能力和意愿。對于下游地區(qū)而言,隨著流域經(jīng)濟一體化的實現(xiàn),上游地區(qū)會因為保護生態(tài)的原因而大力發(fā)展綠色產(chǎn)業(yè),下游地區(qū)所具備的資金、技術(shù)等比較優(yōu)勢也能為上游地區(qū)發(fā)展綠色產(chǎn)業(yè)提供合作,并因此獲得利益。最終,這一切將使補償變成為市場機制下的價值交換,各方將形成長期的博弈均衡,補償也將成為歷史。
長江經(jīng)濟帶生態(tài)保護所具有的公共品的特性導(dǎo)致推進和深化長江經(jīng)濟帶生態(tài)領(lǐng)域的合作要比其他合作領(lǐng)域困難,是長江經(jīng)濟帶經(jīng)濟合作的難點之一。短期內(nèi),在缺乏剛性約束機制條件下,各個參與者都會選擇(不保護,不補償)這一嚴格優(yōu)勢策略。因此,對于具有公共品性質(zhì)的合作領(lǐng)域,應(yīng)當(dāng)引入剛性的行為約束機制對行為主體進行必要而有效的約束,充分發(fā)揮政府特別是中央政府的作用,通過減少政策的供給、轉(zhuǎn)移支付甚至是調(diào)整地方政府人事等手段來對于非合作行為進行懲罰,以保證產(chǎn)生混合策略的納什均衡解(保護,補償),實現(xiàn)由利益不一致向利益一致、短期行為向長期行為轉(zhuǎn)化。長期內(nèi),要產(chǎn)生帕累托最優(yōu)均衡的進化穩(wěn)定策略即上游地區(qū)選擇保護策略,下游地區(qū)選擇補償?shù)牟呗?,就必須滿足長期收益能補償生態(tài)保護的成本和短期收益的條件,但這種補償并不是一開始就能滿足的,尤其是在博弈演化剛開始的一段時期內(nèi),因此需要對不保護的行為進行必要的懲罰,其懲罰的力度應(yīng)以能補償上述的成本和短期收益為底線,越大越好。這樣,會使博弈結(jié)果朝著帕累托最優(yōu)的方向演進。這一演進的結(jié)果會使長江經(jīng)濟帶上游地區(qū)生態(tài)保護的效益隨著時間的推移而日漸顯現(xiàn),帶來社會效益的同時,將帶來更大的經(jīng)濟效益,使得長期收益不斷增大,對保護成本和短期收益的補償能力也不斷增強。更為重要的是,隨著合作的不斷深化以及流域經(jīng)濟一體化的實現(xiàn),不斷增強的經(jīng)濟實力使得上游地區(qū)完全具備了支付保護生態(tài)成本的能力和意愿,而下游地區(qū)也會因為參與推動上游地區(qū)綠色產(chǎn)業(yè)的發(fā)展而獲得巨大的經(jīng)濟利益。最終,這一切將使生態(tài)補償變成為市場機制下的價值交換,各方將形成長期的博弈均衡,補償也將成為歷史。