馬文斌 阮氏映 楊莉華
二十一世紀以來的中國,無論是經(jīng)濟較為發(fā)達的沿海地區(qū),還是尚具有巨大經(jīng)濟潛力的中西部地區(qū),政府公共服務(wù)支出相較二十世紀80年代均出現(xiàn)了大幅增長。但同時,需要認識的是,不同區(qū)域之間與不同時間段,政府主體在公共服務(wù)支出上不盡相同,其增長速度快慢也存在較大差異。從公共服務(wù)支出的內(nèi)部構(gòu)成上看,中國不同地區(qū)的教育類支出、醫(yī)療衛(wèi)生支出、社會保障支出和文化設(shè)施支出占總公共服務(wù)支出的比重也各不相同。然而,從相關(guān)統(tǒng)計數(shù)據(jù)的分析中可知,由于政府個體之間存在時間序列和空間序列的高度相關(guān)性,所以,需要從公共治理視角重新審視我國政府公共服務(wù)支出問題。
早在經(jīng)濟學創(chuàng)立之初,亞當·斯密、休謨等學者均討論過關(guān)于演化思想應(yīng)用的思維模式問題,繼而在德國歷史學派和馬克思主義經(jīng)濟學中又進行了更為深刻的探討[1]。如今,演化經(jīng)濟學的發(fā)展在達爾文主義思潮的推動下一度成為主流經(jīng)濟學的分析框架。
同樣的,演化機制具有其自身的優(yōu)劣評價依據(jù)——演化穩(wěn)定性。齊寶庫(2010)[2]認為,進化穩(wěn)定策略(evolutionarily stable strategy,ESS)表示一個種群抵抗變異策略侵入的一種穩(wěn)定策略。由于演化博弈論并沒有完全地應(yīng)用演化理念,因而,其自身存在一定的理論缺陷。本文為了與演化穩(wěn)定策略有所區(qū)別,提出了演化穩(wěn)定性評價概念。演化穩(wěn)定性評價是指在一定范式之下,演化所達到的穩(wěn)定狀態(tài)。同時,演化穩(wěn)定評價也是依托于現(xiàn)實范式之下的評價方法,其范式的遷移將會拓寬對穩(wěn)定狀態(tài)的要求。此外,演化穩(wěn)定性也可以表達為個體適應(yīng)度的最大化,同樣可以替代效用最大化的概念。與效用最大化概念相比,演化穩(wěn)定性具有更容易計算和觀察的屬性。二者的不同點主要體現(xiàn)在,演化穩(wěn)定性評價著力于對物種生存與否的認定,而效用最大化著力于物種愉悅與否的評價。根據(jù)馬斯洛需求層次理論,生存性問題應(yīng)當也必須是最優(yōu)先討論的問題。因此,演化穩(wěn)定性,即個體適應(yīng)度最大化也應(yīng)當優(yōu)先于效用最大化來討論。個體穩(wěn)定策略和集體穩(wěn)定策略同樣存在悖論,這一悖論形式與效用最大化理論的悖論形式是一致的,即個體適應(yīng)度的最大化無法推導(dǎo)出集體適應(yīng)度的最大化。因此,穩(wěn)定策略依舊是一種個體最優(yōu)與集體最優(yōu)間來回平衡的策略形式。
此前學者們對于政府行為的探究,尤其是公共財政支出狀況影響因素的研究多著眼于外因式的影響因素,例如:地區(qū)GDP、基尼系數(shù)、人口等外在因素,往往忽視了政府內(nèi)在的影響因素[3-7]。演化政府行為正是為了彌補這一容易被忽視的因素而導(dǎo)致的分析缺陷,所提出來的一個政府內(nèi)在影響因素。就公共治理角度而言,內(nèi)因才是導(dǎo)致事物發(fā)生變化的根本原因,并且外因會通過傳導(dǎo)機制作用到內(nèi)因上。因此,演化政府行為的研究是合理且富有價值的。對于不同地區(qū)、不同時間階段、不同政府個體之間學習能力的研究將會加強我們對政府行為的理解和預(yù)測。值得一提的是,演化政府行為的探究模式遠比單純地加入時間分析的動態(tài)分析更加符合現(xiàn)實狀況。
一、演化政府行為中學習行為的構(gòu)建與實現(xiàn)
在這一部分,首先構(gòu)建演化政府行為模式——學習行為的行為仿真模型,然后產(chǎn)生相對應(yīng)的正態(tài)分布隨機數(shù)組并進行仿真運行,隨后進行方檢驗和邏輯理論分析,以揭示演化政府行為模式——學習行為的客觀性和科學性,最后,進一步論證演化動力在現(xiàn)實政府行為中的存在性問題。
(一)行為仿真模型的邏輯
本文的邏輯基礎(chǔ)在于具備經(jīng)濟個體特性的政府同樣具備演化個體的特征。將公共財政支出作為這一研究的對象,判斷并檢驗政府行為中財政支出的演化動力是否真實存在。將外因(即地區(qū)GDP、人口因素、社會狀況等指標)的多種表現(xiàn)形式耦合成內(nèi)因(即演化動力)并進行系統(tǒng)表達。具體而言,就是通過行為仿真模擬設(shè)立演化與未演化的對照試驗組,并進一步計算和比較演化組和未演化組各自的相關(guān)性系數(shù),對本文所提出的理論進行檢驗?,F(xiàn)實世界中,不同地區(qū)的政府在時空秩序下的財政支出呈現(xiàn)出較強的相關(guān)性,因此,相關(guān)性系數(shù)的加強將在一定意義上驗證演化動力的存在性問題。
本文著重探討演化動力中的“學習行為”?!皩W習行為”是不同演化政府個體之間為制定最終政策所進行一種行為,該行為以示范個體(model individual)的政策作為范例并以一定學習比率對之前政策進行調(diào)整,也可稱之為后續(xù)調(diào)整行為。換言之,在已生成的未演化仿真組的基礎(chǔ)上,進行一定比率的調(diào)整,以生成新的最終政策。學習行為在整個行為仿真模型表現(xiàn)為兩個方向:一是縱向代與代之間的遺傳性學習;二是橫向區(qū)際之間的借鑒性學習。一般來說,廣義上的學習行為在具體行為依據(jù)上存在兩種不同的路徑:在代際政府之間,下一屆政府會趨向于模仿上一屆政府。一方面,這樣的學習借鑒有利于地區(qū)間政策的連貫性和穩(wěn)定性;另一方面,由于所在地區(qū)的時序上差異較小,下一代政府利用上一代政府決策所做的決策準備可以輔助自己做出相應(yīng)的決策。在不同區(qū)域之間,相鄰政府也會存在相互模仿的行為。一方面,地區(qū)間成功或者失敗的經(jīng)驗可以相互借鑒學習;另一方面,地區(qū)相鄰度越高,決策對象的同一性也就越強。由于學習是按一定的比率實現(xiàn)的,每一個政府個體的學習能力大不一樣,因此,政府個體的學習速率及效率的表現(xiàn)也是不盡相同的。
(二)行為仿真模型的構(gòu)建
假設(shè)在不同時間、空間上存在諸多異質(zhì)的政府個體,這些政府個體在決策上具有高度的獨立性,這就需要區(qū)分決策制定行為的高度獨立性和決策本身的高度獨立性之間是否存在差別。一般來說,決策制定行為的高度獨立性并不意味著決策本身的高度獨立性。決策制定行為的高度獨立性更多表現(xiàn)在學習比率的多元性,即學習比率是以隨機正態(tài)分布的形式分布在[0,1]之間的,換言之,高度獨立的決策行為可能會產(chǎn)生并非高度獨立的政策結(jié)果。演化政府個體Gij表示其第i代、第j地的政府演化個體,其中,i、j均為正整數(shù)。演化政府個體作為一個抽象個體,在此處不考慮具體層面上政府公務(wù)人員的新舊比例、行政區(qū)劃及其轄區(qū)的變動等微觀因素。演化個體及其之后的算法化行為依托于個體屬性,個體屬性所代表的是公共財政支出的各個部分,以體現(xiàn)決策調(diào)整的方向性。這樣,公共財政支出的組成部分就可以無限細分至n,即:
同樣地,為了防止放射變換和計算量過大的問題,x*是X*在總體財政支出的比重,則可以得到:
根據(jù)對實際政府個體的觀察可知,政府對于示范個體的學習在于其支出比重結(jié)構(gòu)上進行比對和模仿,進而以自身所認可的較為合理的學習比率進行結(jié)構(gòu)化趨同,而不是對單純支出數(shù)量進行比對和模仿,因此,結(jié)構(gòu)化趨同更符合現(xiàn)實生活中政府個體的學習行為。此外,還需要進一步認識的是,結(jié)構(gòu)化趨同在算法上的好處是可以消除仿射變換所帶來的弊端。
學習的觀察路徑Gij到Gi(j-1)可以表示為:
學習行為也可以理解為對現(xiàn)有的與模范個體之間的差異的縮減,即同方向上范數(shù)的減少,即:
橫向和縱向的學習強度是以學習比率(Kij)來體現(xiàn)的。學習比率Kij表示其第i代、第j代的政府演化個體的學習比率,i、j均為正整數(shù)。需要說明的是,在政府演化個體的學習上,存在時間序列上的縱向關(guān)系和空間序列上的橫向關(guān)系,這也可以作為遺傳和模仿的行為表征。因此,學習比率是具有一定向量形態(tài)的,即Kij(ki,kj) ,k1,k2隨機正態(tài)分布于[0,1]。此外,學習行為還是一種后續(xù)調(diào)整行為,所謂后續(xù)調(diào)整是由于政府所做學習行為必然以學習前的決策作為學習調(diào)整的對象,從而產(chǎn)生學習后的新決策。
因此,Gij在進行橫向?qū)W習,計算得到橫向?qū)W習路徑:
同樣地,Gij在進行縱向?qū)W習,計算得到縱向?qū)W習路徑:
政府所生成的最終的決策是由橫向?qū)W習和總想學習一起決定的,最終的學習路徑為:
(三)行為仿真模型的實現(xiàn)
本文利用matlab2014a對所構(gòu)建的演化算法及其識別判斷的行為仿真模型進行算法實現(xiàn),以1000*1000(Gij)仿真?zhèn)€體、3類別屬性值構(gòu)建完成非越級性單次學習模型。
Step 1:以隨機正態(tài)分布的形式生成Gij及其3類別屬性值:
其中,xij1以μ=50,σ=503的正態(tài)分布隨機產(chǎn)生;xij2受xij1影響,以μ=50-xij12,σ=503-xij16的正態(tài)分布隨機產(chǎn)生,則,
Step 2:計算得到Gij-Gi(j-1)及Gij-G(i-1)j,并隨機生成k1,k2。k1、k2分別以μ=12,σ=16的正態(tài)分布隨機產(chǎn)生。
計算得到橫向?qū)W習路徑:
同樣地,計算得到縱向?qū)W習路徑:
計算最終的學習路徑為:
得到經(jīng)過學習行為修正過的新的仿真?zhèn)€體:G′ij(x′ij1,x′ij2,x′ij3),i,j∈[1,1000]。
Step 3:檢驗與分析
對新的仿真?zhèn)€體進行相關(guān)性檢驗并計算相關(guān)性矩陣方差以得到相關(guān)性強弱趨勢的實驗結(jié)果。
其中,xij1的相關(guān)性矩陣方差為0.447,x′ij1的相關(guān)性矩陣方差為0.467。換言之,修正后的仿真?zhèn)€體相關(guān)性有增強的趨勢。
二、演化政府行為的拓展
(一)越級性學習
演化仿真模型的假定設(shè)立在仿真?zhèn)€體只針對相鄰的前值進行相應(yīng)的學習,也就是“非越級性學習”,然而,事實上仿真?zhèn)€體極有可能對前幾代仿真?zhèn)€體進行了學習。因此,在更廣泛的意義上,越級性學習更加符合現(xiàn)實社會的決策意圖和學習路徑。放寬非越級性學習假設(shè),即不再局限于僅僅向上一個仿真?zhèn)€體學習,還可以向多個仿真?zhèn)€體進行學習,這將使得模型更加具有客觀性和科學性。
(二)多次學習
如果演化仿真模型僅僅停留在單次學習行為的演化上,則與多次學習多次演化相背離。事實上,仿真?zhèn)€體是會根據(jù)最終決策所達成的效力而進行多次學習借鑒的,這會體現(xiàn)在多次模型運行中,進行多次的學習過程。
(三)學習比率的確定
對學習比率進行存儲、選擇更為精確的推斷和構(gòu)造,這將減少學習比率的隨機性和不確定性,是有助于模型算法的優(yōu)化的。
四、結(jié)論與啟示
對于政府而言,演化政府行為并不僅僅包括學習或者遺傳,還有其他演化行為模式。就公共治理角度而言,政府之間具備相互競爭的動機,也因此逐漸具備了相互抗爭的能力。競爭的目的是在增大自身適應(yīng)度的同時,減少競爭對手的適應(yīng)度。競爭將導(dǎo)致同一時間序列中稟賦資源的重新分配。合作是政府之間同樣為了自身發(fā)展,而采取的取之長處的一種行為,合作的前提是要具備合作的動機,合作的目的在于增加同一群體的集體適應(yīng)度,同樣地將會促成稟賦的重新分配。因此,在同一組的行為系統(tǒng)之中,同一個體針對不同個體、以及針對同一個體的不同時間都可能產(chǎn)生這兩種行為模式。
政府之間的變異是根據(jù)自身轄區(qū)的具體情況所進行的有意識的政策差異,變異是學習的相反作用力,表述為“逆學習”的過程。在更寬泛的演化框架下,政府同樣具備兩種較為極端的情況,一是適應(yīng)度由正值轉(zhuǎn)化為零的情況,即死亡;二是適應(yīng)度由零轉(zhuǎn)化為正值的情況,也就是新生。
本文的分析主要是集中與演化政府行為對個體群的分析,隨著研究的深入,這一分析模式將會遷移到更加一般的行為個體上,盡管需要更加全面的數(shù)據(jù)作為支撐,但這樣也會使政府行為的分析模式更加客觀與準確。
基金項目:重慶市技術(shù)預(yù)見與制度創(chuàng)新項目“重慶市全面深化改革成效評估模型研究”(項目編號:CSTC2019JSYJ-ZDXWTA0038)。
參考文獻:
[1]韋森.語言的經(jīng)濟學與經(jīng)濟學的語言[J].東岳論叢,2009(11):5-29.
[2]齊寶庫,蔚筱促,郭亮亮.基于演化博弈理論的綠色采購政府激勵模型構(gòu)建與應(yīng)用[J].沈陽建筑大學學報(自然科學版),2010(4):813-816.
[3]王煥祥.中國地方政府創(chuàng)新與競爭的行為制度及其演化研究[M].北京:光明日報出版社,2009.
[4]茆翠紅,錢鋼,胡偉偉.創(chuàng)新行為系統(tǒng)中政府與企業(yè)的演化博弈及穩(wěn)態(tài)分析[J].科技管理研究,2008,188(10):16-17,20.
[5]任碧云,羅安邦.金融集聚區(qū)建設(shè)中中央與地方政府行為的演化博弈研究[J].經(jīng)濟問題,2014(7):66-40.
[6]劉苗苗,杜建國.低碳經(jīng)濟背景下政府與企業(yè)行為演化分析[J].商業(yè)時代,2014(3):30-32.
[7]陸立軍,于斌斌.傳統(tǒng)產(chǎn)業(yè)與戰(zhàn)略性新興產(chǎn)業(yè)的融合演化及政府行為:理論與實證[J].中國軟科學,2012(5):28-39.
作者:馬文斌,重慶師范大學經(jīng)濟與管理學院教授,碩士生導(dǎo)師
阮氏映,重慶師范大學經(jīng)濟與管理學院碩士研究生
楊莉華,重慶師范大學國際交流與合作處助理研究員
責任編輯:張 波