摘 要:當(dāng)存在外部經(jīng)濟(jì)不確定性時(shí),“相機(jī)抉擇”的貨幣政策會導(dǎo)致中央銀行與公眾的博弈,形成“時(shí)間不一致性”。在K-P博弈模型的基礎(chǔ)上,針對中央銀行可能實(shí)施的通貨膨脹政策,分別對信任機(jī)制和非信任機(jī)制下的中央銀行與公眾博弈行為進(jìn)行分析,發(fā)現(xiàn)博弈的結(jié)果是形成子博弈精煉納什均衡,出現(xiàn)“零和”,最終貨幣政策失效。
關(guān)鍵詞:不確定性;K-P博弈模型;信任機(jī)制;子博弈精煉納什均衡
中圖分類號:F830 文獻(xiàn)標(biāo)志碼:A 文章編號:1673-291X(2013)10-0075-03
新古典主義經(jīng)濟(jì)學(xué)的“理性人”假設(shè)認(rèn)為公眾經(jīng)濟(jì)行為是理性的因而也是確定性的。Hall(1978)提出了消費(fèi)的隨機(jī)游走理論,指出了消費(fèi)的不確定性問題。不確定性條件下,凱恩斯所倡導(dǎo)的“相機(jī)抉擇”的貨幣政策會引起時(shí)間不一致性。最早提出時(shí)間不一致性問題的是Kydland and Prescott(1977),他們在運(yùn)用理性預(yù)期假說分析經(jīng)濟(jì)問題時(shí),發(fā)現(xiàn)政府在預(yù)承諾條件下,相機(jī)抉擇的策略會使公眾的行為對政策產(chǎn)生抵銷效應(yīng),由此他們提出了K-P博弈模型,成為貨幣政策有效性分析的一個(gè)重要工具,兩人也因此獲得了2004年的諾貝爾經(jīng)濟(jì)學(xué)獎。
Barro and Gordon(1983)構(gòu)造了一個(gè)無限期重復(fù)博弈的模型,認(rèn)為中央銀行在相機(jī)地采取“欺騙”或“守信”兩種策略時(shí),公眾在重復(fù)博弈中總能找到方法來“懲罰”中央銀行的“欺騙”行為,從而迫使中央銀行保持“守信”的策略,即保持貨幣政策的穩(wěn)定性。
Barro(1986)運(yùn)用KMRW聲譽(yù)模型研究了信息不完全條件下的中央銀行聲譽(yù)問題。研究表明,當(dāng)公眾不能確定中央銀行是堅(jiān)定反通貨膨脹的“強(qiáng)力決策者”還是放縱通貨膨脹的“疲弱決策者”時(shí),通過重復(fù)博弈可以迫使“疲弱決策者”不斷調(diào)整自己的策略并持續(xù)發(fā)布申明來維護(hù)自己的“聲譽(yù)”,而這種“聲譽(yù)”會對其相機(jī)抉擇傾向產(chǎn)生很大的制約。
彭璐(2008)闡述了KMRW聲譽(yù)模型在動態(tài)不一致性分析中的應(yīng)用,并指出要提高中國貨幣政策有效性,必須更加重視公眾理性預(yù)期的形成,由此應(yīng)該增強(qiáng)貨幣政策操作的透明度以建立起良好的聲譽(yù)。博弈論的引入為分析貨幣政策框架內(nèi)中央銀行與公眾之間關(guān)系提供了一個(gè)非??茖W(xué)的方法。
徐亞平(2009)在理性預(yù)期理論的框架下分析了公眾的自我學(xué)習(xí)機(jī)制。文章對比了公眾預(yù)期模型(Muth,1961)、適應(yīng)性預(yù)期模型(Bray,1982)和遺傳算法(Marimon,1990)幾種公眾預(yù)期形成的描述方法,發(fā)現(xiàn)公眾預(yù)期的形成很大程度是由于公眾之間口碑相傳式的信息傳遞。由此他提出了貨幣政策應(yīng)加強(qiáng)預(yù)期引導(dǎo),要保持貨幣政策的透明性、可靠性和權(quán)威性。
本文在前述研究的基礎(chǔ)上,分別對信任機(jī)制下和非信任機(jī)制下的公眾與中央銀行博弈過程進(jìn)行分析,以期建立不確定性條件下的貨幣政策規(guī)則。
一、信任機(jī)制下的非重復(fù)不完全信息動態(tài)博弈分析
建立一個(gè)簡單的兩期動態(tài)博弈模型。假設(shè)在t時(shí)期存在著較強(qiáng)的通貨膨脹預(yù)期。中央銀行對于t+1期可能發(fā)生的通貨膨脹有兩種態(tài)度:一是堅(jiān)定地防范通貨膨脹;二是依據(jù)菲利普斯曲線,有意無意地讓通貨膨脹發(fā)生,以獲得經(jīng)濟(jì)增長和擴(kuò)大就業(yè)的效應(yīng)。實(shí)際上中央銀行會傾向于后者,但出于維護(hù)民生的基本國策,不會公開宣示這種通貨膨脹政策,因此只會有兩種行為:一種是公開告示要防范治理通貨膨脹;二是不作任何表態(tài)。當(dāng)然這兩種策略都各有兩種結(jié)果:發(fā)生通貨膨脹或者不發(fā)生。
同時(shí)假設(shè)居民對于中央銀行完全信任,則其在中央銀行公開告示時(shí)不會做出防范舉動;如果中央銀行不公開告示,則采取防范措施。防范措施主要是調(diào)整個(gè)人資產(chǎn)負(fù)債結(jié)構(gòu)如增加實(shí)物資產(chǎn)、增加當(dāng)期消費(fèi)和增加個(gè)人負(fù)債等等,另外也會強(qiáng)烈要求漲工資。
記C為決策者中央銀行;Ca中央銀行告示;Cn為中央銀行未告示;R為對抗者居民;Ra為居民采取防范措施;Rn為居民不防范;F為發(fā)生通貨膨脹;F’為不發(fā)生通貨膨脹。由此可以形成中央銀行與居民的博弈樹(見圖1):
圖中X1、X2、X3、X4為不同的支付函數(shù),每個(gè)支付函數(shù)中前面的數(shù)值為中央銀行的報(bào)酬,后者為居民的報(bào)酬。
中央銀行在預(yù)承諾條件下發(fā)生了通貨膨脹,即發(fā)生了“欺騙”,取得了通貨膨脹效應(yīng)的最大化,將其報(bào)酬記為2;① 而居民在沒有防范時(shí)面對通貨膨脹,將蒙受最大損失,記為-2。因此X1=(2,-2)。
在預(yù)承諾機(jī)制和信任機(jī)制下,沒有發(fā)生通貨膨脹,中央銀行雖未獲得增長和就業(yè)效應(yīng),但增強(qiáng)了對抗者的信任程度,可賦值為1;居民因未作資產(chǎn)調(diào)整,報(bào)酬為0。因此X2=(1,0)。
沒有預(yù)承諾條件下發(fā)生通貨膨脹,中央銀行既未取得通貨膨脹效應(yīng),②又會因通貨膨脹而被迫采取應(yīng)急措施,還會進(jìn)一步失去對抗者的信任,實(shí)際上蒙受最大損失,記為-2;而居民雖未獲財(cái)務(wù)收益,但因提前進(jìn)行了有效的對抗,將獲最大報(bào)酬2。因此X3=(-2,2)。
沒有預(yù)承諾也沒有通貨膨脹,中央銀行的報(bào)酬可記為0;居民未承受通貨膨脹損失,但調(diào)整資產(chǎn)結(jié)構(gòu)的行為致其資產(chǎn)結(jié)構(gòu)不再最優(yōu),可賦值為-1。因此X4=(0,-1)。由此可以形成博弈支付函數(shù)矩陣(見表1):
表1 信任機(jī)制下動態(tài)博弈支付函數(shù)矩陣
從支付矩陣中可以看出,中央銀行的最大解是X1,即在承諾且受信時(shí)實(shí)施通貨膨脹政策可以獲得最大報(bào)酬,其他解都是次優(yōu)、次差和最差,因此中央銀行要獲得通貨膨脹的增長效應(yīng),最好的策略是“欺騙”;居民的最大解是X3,其他均為差、次差和最差,因此最好的策略是不管中央銀行有沒有預(yù)承諾,都應(yīng)該采取防范通貨膨脹的應(yīng)對措施。但是,不管是中央銀行的最大解還是居民的最大解,都不是博弈的最優(yōu)解,最優(yōu)解為X2,在此解下沒有一個(gè)博弈局中人受損失,實(shí)現(xiàn)了“刺猬效應(yīng)”即帕累托最優(yōu);而最差解為X4,是完全的零和。
需要強(qiáng)調(diào)的是,這個(gè)信任機(jī)制條件的博弈過程發(fā)生的概率很小,因?yàn)槿绻僭O(shè)居民是完全理性的,那么當(dāng)他了解到自己的得失分布后,會發(fā)現(xiàn)如果信任中央銀行只可能獲得次優(yōu)和最差解,即(0,-2)的支付組合,其均值為-1,而不信任時(shí)卻可以獲得(2,-1)的支付組合,均值為0.5。毫無疑問,后者更有吸引力。
因此居民極有可能放棄對中央銀行的“信任”,而不管中央銀行怎樣決策,都會采取防范以期獲得X3,這樣X1將不可能發(fā)生,即中央銀行不可能獲得最大解。形成這個(gè)結(jié)果的原因是居民作為對抗者,在這個(gè)非重復(fù)動態(tài)博弈中是占優(yōu)者,是在中央銀行決策之后才開始決策的;而中央銀行作為先決策者,不管是否有意“欺騙”,在居民作出利益最大化的決策后,都不可能獲得最大解。這樣就將中央銀行置于不利的境地。
因此,中央銀行又想要避免X3和X4,就只有一個(gè)選擇,即宣示其決心并堅(jiān)定地采取強(qiáng)有力的措施防范通貨膨脹的出現(xiàn),即使在本輪博弈中無法獲得X2的雙贏解,也可以增強(qiáng)居民對自身的信任,以期在其后的重復(fù)博弈中占優(yōu)。
當(dāng)然,如果居民確實(shí)事前存在著對中央銀行的絕對信任,不會在中央銀行告示的條件下進(jìn)行防范,那么中央銀行的“欺騙”行為雖然在本輪博弈中獲益,但受騙的居民同樣會放棄信任,由此下輪博弈就進(jìn)化為非信任機(jī)制的博弈。
二、非信任機(jī)制下的非重復(fù)不完全信息動態(tài)博弈分析
由于信任機(jī)制是一個(gè)非常嚴(yán)格的條件,它的成立必須建立在中央銀行是一個(gè)“強(qiáng)力決策者”的基礎(chǔ)上,所以可以通過建立一個(gè)非信任機(jī)制的博弈模型來進(jìn)一步分析中央銀行和居民的行為(見下頁圖2):
在下頁圖2中X1、X2、X3、X4均不發(fā)生變化;X5為中央銀行預(yù)承諾及居民防范時(shí)發(fā)生了通貨膨脹時(shí)的支付函數(shù),中央銀行蒙受最大損失,居民獲最大報(bào)酬,故X5=(-2,2),與X3相同;X6=(1,-1),為預(yù)承諾且防范時(shí)未發(fā)生通貨膨脹的支付函數(shù);X7=(1,-2),為未承諾且不防范時(shí)發(fā)生通貨膨脹的支付函數(shù);X8=(0,0),為未承諾、不防范且未通脹的支付函數(shù)。
在存在普遍的通貨膨脹預(yù)期時(shí),中央銀行沒有預(yù)承諾而居民不作任何防范的可能性比較小,因此X7和X8發(fā)生的概率較小。但考慮到不完全信息和居民行為能力的因素,部分居民可能沒有采取防范行動,故保留X7和X8的選項(xiàng)。對應(yīng)的支付函數(shù)矩陣(見表2):
從表2的支付矩陣看,居民選擇防范時(shí),其報(bào)酬的均值為1,不防范的報(bào)酬均值為-2,所以居民的最佳決策是不管中央銀行是否作出承諾都采取防范;而中央銀行因前述的原因無論如何都不可能獲得自身的最大解,只能尋求次優(yōu)解。如果中央銀行為尋求最大解而實(shí)施“欺騙”,可能恰好有部分居民因各種原因而未做防范,這樣就讓中央銀行短期實(shí)現(xiàn)了其通貨膨脹目標(biāo)。但居民在不斷的認(rèn)知總結(jié)與自我學(xué)習(xí)過程中,總會發(fā)現(xiàn)中央銀行的真實(shí)動機(jī),從而轉(zhuǎn)向自我防護(hù),這樣中央銀行的欺騙是不可能持續(xù)有效的。
對于居民,似乎可以在博弈中占優(yōu),但如前所述,博弈中居民并沒有獲得真實(shí)的財(cái)務(wù)收益,對其最大報(bào)酬的賦值僅僅是逃避了一次通貨膨脹的損失。而且博弈的結(jié)果肯定是發(fā)生通貨膨脹,毫無疑問,沒有任何人可以在持續(xù)的通貨膨脹中受益,反而蒙受最大損失。因此,博弈的結(jié)果一定是“零和”。
同樣如前,非信任機(jī)制的博弈過程的最優(yōu)解也是X2,即(1,0)的支付函數(shù)。這個(gè)解雖然都不是中央銀行和居民各自的最大解,但卻是整個(gè)博弈的帕累托最優(yōu)解,這個(gè)解不僅效用總量最大,邊際效用也是最大。但是,要獲得這個(gè)解,不僅要求中央銀行堅(jiān)定地履行治理通貨膨脹的承諾,還要求居民絕對信任中央銀行。那么,怎樣才能達(dá)到這種中央銀行與居民的合作呢?
三、建議
所幸中央銀行作為決策者,是有能力改變最差結(jié)果的。由圖2可知,博弈的最優(yōu)解為X2=(1,0),即中央銀行以“強(qiáng)力決策者”的形象堅(jiān)定不移地防范和治理通貨膨脹,居民認(rèn)識到自身的最大報(bào)酬是不可能出現(xiàn)的,因此調(diào)整報(bào)酬錨,逐漸恢復(fù)對中央銀行的信任,并使自己的行為不斷地向中央銀行靠攏。
經(jīng)過重復(fù)博弈后,當(dāng)中央銀行的“強(qiáng)力決策者”形象不改變時(shí),居民也不會改變其決策;反過來,當(dāng)居民保持對中央銀行的信任時(shí),中央銀行為防止失信導(dǎo)致最差結(jié)果,也必須長期維持其形象,這就形成了子博弈精煉納什均衡。當(dāng)子博弈納什均衡形成后,中央銀行與居民之間的長期合作關(guān)系也就建立起來了。雖然這種合作關(guān)系沒有明確的書面協(xié)議,但這種基于信任的合作關(guān)系是保持經(jīng)濟(jì)穩(wěn)定的基礎(chǔ)之一,也是提高貨幣政策有效性的必由之路。