房立波,鐘曉敏
(1.浙江財(cái)經(jīng)大學(xué)中國(guó)政府管制研究院,浙江 杭州 310018;2.杭州市發(fā)展和改革委員會(huì),浙江 杭州 310020;3.浙江財(cái)經(jīng)大學(xué)財(cái)政稅務(wù)學(xué)院,浙江 杭州 310018)
2016年《國(guó)務(wù)院辦公廳關(guān)于深化改革推進(jìn)出租汽車行業(yè)健康發(fā)展的指導(dǎo)意見(jiàn)》(國(guó)辦發(fā)〔2016〕58號(hào))發(fā)布后,客運(yùn)出租市場(chǎng)由此迎來(lái)重要的發(fā)展機(jī)遇期。隨著經(jīng)濟(jì)體制改革不斷深化和人民生活水平日益提高,不斷增長(zhǎng)的出行需求與服務(wù)供給不平衡不充分之間的矛盾逐漸凸顯出來(lái)。作為城市公共交通的重要補(bǔ)充,客運(yùn)出租成為滿足差異化出行需求的重要途徑。然而,從監(jiān)管實(shí)踐看,雖然2016年7月中央七部委聯(lián)合發(fā)布的《網(wǎng)絡(luò)預(yù)約出租汽車經(jīng)營(yíng)服務(wù)管理暫行辦法》結(jié)束了網(wǎng)約車市場(chǎng)混亂的局面,但網(wǎng)約車市場(chǎng)仍需進(jìn)一步完善監(jiān)管政策,優(yōu)化政府監(jiān)管機(jī)構(gòu)與網(wǎng)約車平臺(tái)之間的關(guān)系,調(diào)整網(wǎng)約車市場(chǎng)體制機(jī)制。從社會(huì)福利的視角出發(fā),完善監(jiān)管政策、理清市場(chǎng)內(nèi)部競(jìng)爭(zhēng)關(guān)系成為下一階段推動(dòng)網(wǎng)約車市場(chǎng)健康發(fā)展亟需解決的問(wèn)題。
研究網(wǎng)約車市場(chǎng)發(fā)展路徑問(wèn)題需重點(diǎn)關(guān)注政府監(jiān)管和內(nèi)部競(jìng)爭(zhēng)兩個(gè)方面。對(duì)此,不同專業(yè)研究的重點(diǎn)有所差異。本文認(rèn)為要想提升研究成果的理論水平,首先,遵循經(jīng)濟(jì)規(guī)律,把握正確的研究方向;其次,基于法理構(gòu)建嚴(yán)謹(jǐn)、合理的制度體系框架;最后,基于技術(shù)層面提出高效率的實(shí)施路徑。目前,運(yùn)用技術(shù)方法提高網(wǎng)約車運(yùn)營(yíng)效率和科學(xué)設(shè)計(jì)客運(yùn)出租政府監(jiān)管法制框架兩方面的研究比較充分,而依托管理學(xué)和經(jīng)濟(jì)學(xué)的研究大多集中在政策層面,缺乏對(duì)市場(chǎng)參與主體行為動(dòng)機(jī)的客觀分析,鮮見(jiàn)針對(duì)網(wǎng)約車市場(chǎng)參與主體相互作用的研究。本文運(yùn)用博弈理論分析網(wǎng)約車市場(chǎng)參與主體之間的行為選擇邏輯,重點(diǎn)探討政府監(jiān)管機(jī)構(gòu)與網(wǎng)約車平臺(tái)的監(jiān)管博弈和網(wǎng)約車平臺(tái)之間的競(jìng)爭(zhēng)博弈。一是利用“小偷守衛(wèi)”博弈模型,強(qiáng)調(diào)政府監(jiān)管是交替選擇策略的重復(fù)博弈,政府監(jiān)管需統(tǒng)籌考慮具體監(jiān)管措施的短期效果和長(zhǎng)期影響,并重視監(jiān)管對(duì)象針對(duì)具體監(jiān)管措施采取向前展望和向后推理的效果。二是利用伯特蘭德模型和古諾模型,分析網(wǎng)約車平臺(tái)在不同市場(chǎng)階段的帕累托最優(yōu)策略并解釋“價(jià)格戰(zhàn)”的原因,預(yù)測(cè)未來(lái)競(jìng)爭(zhēng)格局、指出提高經(jīng)濟(jì)效率的有效路徑。
網(wǎng)約車在促進(jìn)客運(yùn)出租行業(yè)發(fā)展的同時(shí)也對(duì)巡游出租車市場(chǎng)的穩(wěn)定造成一定的沖擊。為此,相關(guān)學(xué)者從不同的視角展開(kāi)研究并取得豐碩的文獻(xiàn)成果。(1)利用政府監(jiān)管理論研究網(wǎng)約車的政府監(jiān)管問(wèn)題。王俊豪(2021)認(rèn)為需根據(jù)監(jiān)管實(shí)踐需求構(gòu)建監(jiān)管有據(jù)、運(yùn)行高效、精準(zhǔn)有效、公開(kāi)透明、激勵(lì)約束的中國(guó)特色政府監(jiān)管理論體系[1]。唐要家(2021)認(rèn)為數(shù)字經(jīng)濟(jì)監(jiān)管體制創(chuàng)新應(yīng)堅(jiān)持審慎包容原則,以促進(jìn)開(kāi)放共享和鼓勵(lì)創(chuàng)新為目標(biāo),以維護(hù)市場(chǎng)競(jìng)爭(zhēng)為主要任務(wù)[2]。劉長(zhǎng)玉等(2019)基于政府、企業(yè)與消費(fèi)者三方協(xié)同監(jiān)管模式構(gòu)建博弈模型,研究影響三方策略選擇的相關(guān)因素,建議提高政府監(jiān)管效率、保障企業(yè)產(chǎn)品質(zhì)量、發(fā)揮消費(fèi)者監(jiān)督優(yōu)勢(shì)[3]。曲國(guó)華等(2020)利用三角模糊數(shù)構(gòu)建博弈模型,分析策略選擇的影響因素,強(qiáng)調(diào)政府引導(dǎo)消費(fèi)者和懲罰企業(yè)的影響[4]。(2)在此基礎(chǔ)上,學(xué)者從不同視角研究客運(yùn)出租的政府監(jiān)管問(wèn)題。有文獻(xiàn)對(duì)現(xiàn)行監(jiān)管政策進(jìn)行梳理和歸納總結(jié)。馬亮和李延偉(2018)依據(jù)監(jiān)管政策條款構(gòu)建監(jiān)管嚴(yán)格程度的評(píng)價(jià)指數(shù),并以此評(píng)價(jià)地方政府的監(jiān)管政策差異[5]。李金龍和喬建偉(2019)通過(guò)梳理規(guī)制政策,基于倡議聯(lián)盟框架建議增強(qiáng)市場(chǎng)主導(dǎo)聯(lián)盟競(jìng)爭(zhēng)力,構(gòu)建“前瞻性”的政府治理機(jī)制,以緩解聯(lián)盟沖突[6]。也有文獻(xiàn)重點(diǎn)研究監(jiān)管路徑和體系構(gòu)建。蔣巖波和黃娟(2020)認(rèn)為網(wǎng)約車行政規(guī)制存在信息不足、效率低下的問(wèn)題,建議通過(guò)明確產(chǎn)權(quán)邊界、完善規(guī)制體系等措施建立網(wǎng)約車司法規(guī)制框架[7]。此外,還有文獻(xiàn)研究網(wǎng)約車的屬性和特征。費(fèi)威(2018)從質(zhì)量問(wèn)題、公共資源、信息、信任、社會(huì)福利等方面闡釋網(wǎng)約車共享經(jīng)濟(jì)的兩面性[8]。郝麗華和曹永勝(2018)在肯定網(wǎng)約車共享經(jīng)濟(jì)屬性的積極作用的同時(shí),著重分析資源浪費(fèi)、成本增加、風(fēng)險(xiǎn)擴(kuò)大等問(wèn)題[9]。其中,運(yùn)用博弈理論研究網(wǎng)約車的政府監(jiān)管的文獻(xiàn)對(duì)本文具有較高的借鑒價(jià)值。付淑換和石巋然(2020)分析網(wǎng)約車平臺(tái)行為及監(jiān)管策略選擇的影響因素,建議引入第三方監(jiān)督制度,以打破政府無(wú)效監(jiān)管和平臺(tái)消極管理的均衡,促進(jìn)行業(yè)良性發(fā)展[10]。陳璟濤(2017)從博弈論視角分析百色市網(wǎng)絡(luò)預(yù)約出租汽車行業(yè)監(jiān)管問(wèn)題,利用收益矩陣建立完全靜態(tài)博弈模型,分析網(wǎng)約車平臺(tái)與監(jiān)管部門、監(jiān)管部門相互之間的行動(dòng)策略,提出制定實(shí)施細(xì)則、創(chuàng)新監(jiān)管思維、完善監(jiān)管機(jī)制等建議[11]。
網(wǎng)約車平臺(tái)之間相互關(guān)系的研究主要集中在定價(jià)策略方面??祫P等(2021)構(gòu)建兩個(gè)網(wǎng)約車平臺(tái)的Stackelberg博弈模型并分析平臺(tái)定價(jià)策略,建議劣勢(shì)平臺(tái)低競(jìng)爭(zhēng)強(qiáng)度時(shí)效仿占優(yōu)平臺(tái)采取中等定價(jià),競(jìng)爭(zhēng)強(qiáng)度適中時(shí)采取低價(jià)策略,高競(jìng)爭(zhēng)強(qiáng)度時(shí)應(yīng)著重提升服務(wù)質(zhì)量[12]。倪玲霖和王澤(2020)利用變分不等式構(gòu)建網(wǎng)約車市場(chǎng)競(jìng)爭(zhēng)網(wǎng)絡(luò)均衡模型,得出成本增加后價(jià)格提高且出行量下降、市場(chǎng)主體增加后競(jìng)爭(zhēng)加劇且價(jià)格下降及出行量提升、準(zhǔn)入管制導(dǎo)致司機(jī)減少且均衡價(jià)格增加的結(jié)論,驗(yàn)證了模型的有效性[13]。孫中苗和徐琪(2021)運(yùn)用最優(yōu)控制論方法構(gòu)建網(wǎng)約車平臺(tái)動(dòng)態(tài)定價(jià)模型,并利用哈密頓函數(shù)及模型推導(dǎo),得出最優(yōu)價(jià)格可有效調(diào)控平臺(tái)供應(yīng)能力、乘車需求市場(chǎng)的競(jìng)爭(zhēng)有助于拉低平臺(tái)最優(yōu)價(jià)格而乘運(yùn)市場(chǎng)的競(jìng)爭(zhēng)將推高價(jià)格等結(jié)論[14]。盧珂、周晶和林小圍(2019)基于雙邊市場(chǎng)理論,從交叉網(wǎng)絡(luò)外部性的視角研究網(wǎng)約車平臺(tái)的市場(chǎng)定價(jià)問(wèn)題,得出交叉網(wǎng)絡(luò)外部性降低平臺(tái)定價(jià)、時(shí)間敏感系數(shù)對(duì)平臺(tái)的影響因歸屬屬性不同而存在一定的差異等結(jié)論[15]。
學(xué)者們從不同角度分析網(wǎng)約車發(fā)展存在的問(wèn)題,但基于經(jīng)濟(jì)學(xué)和管理學(xué)的分析尚不多見(jiàn),對(duì)監(jiān)管策略、內(nèi)部競(jìng)爭(zhēng)行為動(dòng)機(jī)的分析也有待深化,缺少數(shù)量競(jìng)爭(zhēng)的研究成果。本文在已有理論研究的基礎(chǔ)上,以提高理論與實(shí)踐的耦合性為研究目標(biāo):從行業(yè)的政府監(jiān)管實(shí)踐出發(fā),利用博弈模型探討網(wǎng)約車平臺(tái)和政府監(jiān)管機(jī)構(gòu)的動(dòng)態(tài)策略選擇,討論政府監(jiān)管機(jī)構(gòu)對(duì)網(wǎng)約車行業(yè)實(shí)施監(jiān)管的制約因素,為網(wǎng)約車平臺(tái)的政府監(jiān)管實(shí)踐提供理論指導(dǎo);從行業(yè)發(fā)展的維度,梳理網(wǎng)約車市場(chǎng)競(jìng)爭(zhēng)格局演變規(guī)律,在揭示市場(chǎng)競(jìng)爭(zhēng)現(xiàn)象的同時(shí)分析影響網(wǎng)約車平臺(tái)收益的因素,從增進(jìn)社會(huì)福利的視角為政府干預(yù)市場(chǎng)競(jìng)爭(zhēng)明確方向。
1.建立“小偷守衛(wèi)”博弈模型,分析政府監(jiān)管機(jī)構(gòu)與網(wǎng)約車平臺(tái)之間的博弈策略[16]。設(shè)定政府監(jiān)管機(jī)構(gòu)的群體策略集為{G1(強(qiáng)監(jiān)管),G2(弱監(jiān)管)},網(wǎng)約車平臺(tái)的群體策略集為{W1(守法),W2(違法)}。政府監(jiān)管機(jī)構(gòu)選擇強(qiáng)監(jiān)管的概率為p、弱監(jiān)管的概率為(1-p),網(wǎng)約車平臺(tái)選擇守法的概率為q、違法的概率為(1-q)。其中,強(qiáng)監(jiān)管是指政府監(jiān)管機(jī)構(gòu)監(jiān)管成本較高、嚴(yán)格執(zhí)法等積極監(jiān)管,弱監(jiān)管包括玩忽職守、以犧牲公共利益獲取私利、大幅減少監(jiān)管投入等。
2.建立完全信息靜態(tài)博弈模型,分析網(wǎng)約車平臺(tái)內(nèi)部的博弈策略。設(shè)定在一個(gè)由兩個(gè)網(wǎng)約車平臺(tái)組成的市場(chǎng)中,服務(wù)價(jià)格P與供給量Q具有線性函數(shù)關(guān)系。在市場(chǎng)發(fā)展的第一階段,網(wǎng)約車平臺(tái)的價(jià)格策略集為A={0,Pmax},博弈策略為同時(shí)選擇價(jià)格水平;在第二階段,網(wǎng)約車平臺(tái)的產(chǎn)量策略集為B={0,Qmax},博弈策略為同時(shí)選擇產(chǎn)量水平。具體變量定義見(jiàn)表1。
表1 符號(hào)的意義及說(shuō)明
假設(shè)1:政府監(jiān)管機(jī)構(gòu)的目標(biāo)是監(jiān)督管理網(wǎng)約車平臺(tái)的行為,以確保價(jià)格、服務(wù)質(zhì)量和安全保障等符合規(guī)定要求[17]。網(wǎng)約車平臺(tái)的行為動(dòng)機(jī)是根據(jù)政府監(jiān)管策略權(quán)衡違法的成本和收益來(lái)選擇最優(yōu)策略,以實(shí)現(xiàn)收益最大化。不同網(wǎng)約車平臺(tái)的服務(wù)差異很小,高度相互替代,價(jià)格-數(shù)量函數(shù)的參數(shù)相同且具有連續(xù)函數(shù)特征。博弈雙方具有完全理性,均基于成本-收益和“以牙還牙”原則選擇最優(yōu)策略[18]。
假設(shè)2:網(wǎng)約車平臺(tái)的固定成本和邊際成本均為0,守法只能獲得正常利潤(rùn)且凈收益為0。違法行為如果不被查處,則能獲得風(fēng)險(xiǎn)溢價(jià)V;一旦被查處,則需承擔(dān)額外損失L。網(wǎng)約車市場(chǎng)屬于寡頭壟斷市場(chǎng),單個(gè)網(wǎng)約車平臺(tái)調(diào)整價(jià)格或服務(wù)供給規(guī)模都對(duì)競(jìng)爭(zhēng)對(duì)手的收益產(chǎn)生影響。
假設(shè)3:政府監(jiān)管機(jī)構(gòu)與網(wǎng)約車平臺(tái)之間存在信息不對(duì)稱,只能以一定的概率發(fā)現(xiàn)后者的違法行為。政府監(jiān)管機(jī)構(gòu)強(qiáng)監(jiān)管可提高發(fā)現(xiàn)網(wǎng)約車平臺(tái)違法行為的概率,保持較高水平的社會(huì)收益,承擔(dān)較高成本且凈收益為0;弱監(jiān)管且網(wǎng)約車平臺(tái)不違法,則可節(jié)約監(jiān)管成本S;弱監(jiān)管且網(wǎng)約車平臺(tái)違法,則承擔(dān)較大的損失D。
假設(shè)4:監(jiān)管技術(shù)水平相對(duì)穩(wěn)定,政府監(jiān)管機(jī)構(gòu)的監(jiān)管力度是影響網(wǎng)約車平臺(tái)成本的主要因素。隨著監(jiān)管投入不斷增加,未被懲處的違法行為數(shù)量減少且更隱蔽,發(fā)現(xiàn)并懲處的成本更高,且不管投入多少資源都不可能完全消除違法行為。因此,政府監(jiān)管機(jī)構(gòu)強(qiáng)監(jiān)管的概率p與監(jiān)管投入C呈正相關(guān),且增加C對(duì)提高p的邊際效應(yīng)遞減[19](1)這里,忽略效率因素。。
假設(shè)5:外部環(huán)境相對(duì)穩(wěn)定,增加違法的額外凈收益能誘導(dǎo)守法意識(shí)薄弱的網(wǎng)約車平臺(tái)違法。隨著違法的額外凈收益的增加,守法的網(wǎng)約車平臺(tái)的平均守法意識(shí)水平也在提高。增加違法額外凈收益對(duì)具有較強(qiáng)守法意識(shí)的網(wǎng)約車平臺(tái)的效用較小。即使違法的額外凈收益很高,強(qiáng)守法意識(shí)的網(wǎng)約車平臺(tái)也能抵擋住誘惑,因此守法的概率始終大于0。網(wǎng)約車平臺(tái)違法行為發(fā)生的概率與違法的額外凈收益V呈正相關(guān),則守法的概率q與V呈負(fù)相關(guān),且增加V對(duì)降低q的邊際效應(yīng)遞減[20]。
假設(shè)6:政府監(jiān)管機(jī)構(gòu)與網(wǎng)約車平臺(tái)的博弈初始處于混合策略納什均衡狀態(tài),V和S為外生變量,L和D為政府可調(diào)節(jié)和控制的自變量(2)V由違法行為的性質(zhì)決定,S由監(jiān)管行為的技術(shù)條件等外部環(huán)境決定,政府監(jiān)管機(jī)構(gòu)可調(diào)節(jié)L中的F1和D中的F2。。短期內(nèi),一方因自變量變化而偏離均衡水平,另一方的概率分布保持不變;長(zhǎng)期內(nèi),一方變化導(dǎo)致另一方的概率分布聯(lián)動(dòng)調(diào)整,并最終實(shí)現(xiàn)新的均衡。
假設(shè)7:網(wǎng)約車市場(chǎng)遵循由粗放向集約發(fā)展的客觀規(guī)律。在粗放競(jìng)爭(zhēng)階段,主要的競(jìng)爭(zhēng)方式是降低價(jià)格、擴(kuò)張規(guī)模,通過(guò)兼并減少市場(chǎng)主體數(shù)量;在集約競(jìng)爭(zhēng)階段,市場(chǎng)結(jié)構(gòu)相對(duì)穩(wěn)定,主要通過(guò)調(diào)整供給規(guī)模和降低生產(chǎn)成本來(lái)實(shí)現(xiàn)利潤(rùn)最大化。消費(fèi)者對(duì)價(jià)格變化反應(yīng)敏感,低價(jià)策略能使網(wǎng)約車平臺(tái)迅速、完全占領(lǐng)市場(chǎng)。
1.建立“小偷守衛(wèi)”博弈模型
基于以上假設(shè),我們構(gòu)建兩人的非對(duì)稱非零和博弈,其得益矩陣如圖1所示。令V=R1+C1、D=S+F2、L=C1+F1,簡(jiǎn)化后的得益矩陣如圖2所示。
政府監(jiān)管機(jī)構(gòu)弱監(jiān)管強(qiáng)監(jiān)管網(wǎng)約車平臺(tái)違法守法(R1+C1,S+F2)(C1+F1,0)(0,S)(0,0)圖1 完全信息靜態(tài)“小偷守衛(wèi)”博弈的得益矩陣
政府監(jiān)管機(jī)構(gòu)弱監(jiān)管強(qiáng)監(jiān)管網(wǎng)約車平臺(tái)違法守法(V,D)(L,0)(0,S)(0,0) 圖2 簡(jiǎn)化的完全信息靜態(tài)“小偷守衛(wèi)”博弈的得益矩陣
根據(jù)模型假設(shè),令政府監(jiān)管機(jī)構(gòu)的強(qiáng)監(jiān)管和弱監(jiān)管策略的期望得益及平均期望得益分別為E(G1)、E(G2)和E(G),網(wǎng)約車平臺(tái)守法和違法策略的期望得益及平均期望得益分別為E(W1)、E(W2)和E(W),其計(jì)算過(guò)程如下:
令E(G1)=E(G2),E(W1)=E(W2),我們得到混合策略納什均衡條件為式(7)、(8)。引入行為策略的影響因素,擴(kuò)展后的博弈模型為式(9)、(10)?;诩僭O(shè),C是影響p的主要因素,二者的關(guān)系如圖3所示;V是影響q的主要因素,二者的關(guān)系如圖4所示。
圖3 政府監(jiān)管機(jī)構(gòu)強(qiáng)監(jiān)管的概率與監(jiān)管成本的關(guān)系
圖4 網(wǎng)約車平臺(tái)守法的概率與違法額外凈收益的關(guān)系
將式(9)、(10)分別代入式(7)、(8),可得:
2.建立價(jià)格博弈模型
接下來(lái),我們構(gòu)建伯特蘭德雙主體完全信息靜態(tài)博弈模型,其價(jià)格-數(shù)量函數(shù)和博弈得益分別為:
對(duì)式(15)、(16)求偏導(dǎo)數(shù),得到反應(yīng)函數(shù)為式(17)、(18)(如圖5所示)。聯(lián)立反應(yīng)函數(shù),我們得到納什均衡解和雙方的得益分別為式(19)、(20)、(21):
圖5 伯特蘭德模型的反應(yīng)函數(shù)
甲合作不合作乙合作不合作(UH,UH)(0,UB)(UB,0)(UL,UL) 圖6 完全信息靜態(tài)削價(jià)競(jìng)爭(zhēng)博弈的得益矩陣
定義雙方采用“以牙還牙”策略,合作均衡為串謀均衡,不合作均衡為納什均衡。一方合作、另一方不合作時(shí),不合作方獨(dú)占市場(chǎng)獲得的利潤(rùn)略低于串謀的雙方利潤(rùn)之和(這里,以串謀的市場(chǎng)總利潤(rùn)簡(jiǎn)化表示,即UB=2UH)。因此,甲對(duì)乙觸發(fā)策略的最佳反應(yīng)策略的后半部分與觸發(fā)策略的后半部分一樣。問(wèn)題的關(guān)鍵在于確定甲在第一階段的最優(yōu)選擇。在第一階段,如果乙合作、甲不合作,根據(jù)模型設(shè)定,其后雙方均不合作,甲的得益現(xiàn)值為式(22);如果乙合作、甲合作,則第二階段將重復(fù)第一階段的選擇。假定W為甲在該博弈中每階段均采用最佳策略的總得益現(xiàn)值,重復(fù)博弈中總收益是否包含第一階段不影響結(jié)果。第二階段及以后的得益在第一階段看來(lái)現(xiàn)值均為Wδ,總收益現(xiàn)值為式(23)。由于對(duì)稱性,乙具有相同的收益。
(22)
(23)
3.建立產(chǎn)量博弈模型
根據(jù)假設(shè),我們構(gòu)建古諾雙主體完全信息靜態(tài)博弈模型,設(shè)定價(jià)格-數(shù)量函數(shù)為P=P(Q)=a-bQ(a為常數(shù),b為系數(shù),Q=Q1+Q2),博弈主體的得益為:
對(duì)式(24)、(25)求偏導(dǎo)數(shù),可得反應(yīng)函數(shù)為式(26)、(27)(如圖7所示)。聯(lián)立反應(yīng)函數(shù),我們得到博弈納什均衡解為式(28)、(29)、(30):
圖7 古諾模型的反應(yīng)函數(shù)
從甲偏離合作策略的下一階段開(kāi)始,雙方將保持古諾產(chǎn)量,不確定結(jié)束時(shí)點(diǎn)的有限次重復(fù)博弈的第一階段偏離的總得益現(xiàn)值為:
(33)
上述博弈矩陣的四個(gè)策略組合都不穩(wěn)定,該博弈沒(méi)有純策略納什均衡。任意一個(gè)策略組合,博弈的任一方都有單方面改變策略的動(dòng)機(jī)。當(dāng)一方改變策略后,對(duì)方繼而單方面改變策略,雙方的交替行動(dòng)導(dǎo)致博弈策略組合不斷變化而沒(méi)有穩(wěn)定最優(yōu)解。一方如果知道對(duì)方的策略或了解其策略選擇規(guī)律,則能相應(yīng)地調(diào)整自己的策略以增加收益(或減少損失)。因此,雙方均努力確定對(duì)方的策略或策略選擇規(guī)律,同時(shí)極力防止自己的策略或策略選擇規(guī)律被對(duì)方發(fā)現(xiàn)。這一結(jié)論揭示了在打擊犯罪、污染治理、防治腐敗等實(shí)踐中政府監(jiān)管力度和監(jiān)管效果此消彼長(zhǎng)的原因[21]。政府監(jiān)管機(jī)構(gòu)加大監(jiān)管投入導(dǎo)致網(wǎng)約車平臺(tái)因違法風(fēng)險(xiǎn)增加而減少違法行為,同時(shí)少數(shù)違法行為得到懲處,相關(guān)工作取得顯著成效。面對(duì)較好的工作成績(jī),政府監(jiān)管機(jī)構(gòu)傾向于逐漸減少監(jiān)管投入,繼而因違法風(fēng)險(xiǎn)降低誘導(dǎo)違法行為增多,行業(yè)發(fā)展再次陷入困境,直至政府監(jiān)管機(jī)構(gòu)重新增加監(jiān)管投入。因此,建議政府監(jiān)管機(jī)構(gòu)保持監(jiān)管投入力度的穩(wěn)定,以促進(jìn)市場(chǎng)的持續(xù)健康發(fā)展。
如果博弈雙方均以一定的概率隨機(jī)選擇策略,則四種策略組合均有可能出現(xiàn)。如果雙方的策略選擇概率分布均不給對(duì)方可乘之機(jī),那么在一方概率分布既定的前提下,對(duì)方以一定的概率選擇兩種策略的期望得益相同,從而沒(méi)有改變策略概率分布的動(dòng)機(jī)。也就是說(shuō),雙方均在對(duì)方概率分布已知的條件下,通過(guò)調(diào)整自己的概率分布實(shí)現(xiàn)不同策略的相同期望得益,從而實(shí)現(xiàn)得益最大化。此時(shí),博弈雙方均沒(méi)有動(dòng)機(jī)單方面調(diào)整策略概率分布。p*、q*滿足式(7)、(8)的條件時(shí),政府監(jiān)管機(jī)構(gòu)與網(wǎng)約車平臺(tái)的博弈實(shí)現(xiàn)混合策略納什均衡,且具有自動(dòng)向均衡水平回歸的特性。如果q 0,根據(jù)式(6),網(wǎng)約車平臺(tái)降低q能增加收益。如果網(wǎng)約車平臺(tái)降低q,則E(G2)<0,根據(jù)式(3),政府監(jiān)管機(jī)構(gòu)提高p能減少損失。網(wǎng)約車平臺(tái)守法的概率大于q*時(shí),理性的最優(yōu)策略是降低守法概率;小于q*時(shí),理性的最優(yōu)策略是提高守法概率;等于q*時(shí),此時(shí)實(shí)現(xiàn)均衡,期望收益達(dá)到最大值0,政府監(jiān)管機(jī)構(gòu)的策略概率分布不影響其收益。q偏離q*后將自動(dòng)向q*回歸,最終使E(G2)、E(W2)趨向于0。政府監(jiān)管機(jī)構(gòu)強(qiáng)監(jiān)管的概率大于p*時(shí),理性的最優(yōu)策略是降低強(qiáng)監(jiān)管概率;小于p*時(shí),理性的最優(yōu)策略是提高強(qiáng)監(jiān)管概率;等于p*時(shí),此時(shí)實(shí)現(xiàn)均衡,期望收益達(dá)到最大值0,網(wǎng)約車平臺(tái)的策略概率分布不影響其收益。p偏離p*后將自動(dòng)向p*回歸,最終使E(G2)、E(W2)趨向于0。該博弈的混合策略納什均衡如圖8所示。 圖8 混合策略納什均衡 政府監(jiān)管機(jī)構(gòu)以p*概率隨機(jī)選擇強(qiáng)監(jiān)管,網(wǎng)約車平臺(tái)以q*概率隨機(jī)選擇守法,雙方的期望得益均為最大值0,均沒(méi)有單方面調(diào)整策略概率分布的動(dòng)力。因此,以p*×q*概率實(shí)現(xiàn)得益(0,0),以p*×(1-q*)概率實(shí)現(xiàn)得益(L,0),以(1-p*)×q*概率實(shí)現(xiàn)得益(0,S),以(1-p*)×(1-q*)概率實(shí)現(xiàn)得益(V,D)。此時(shí),網(wǎng)約車市場(chǎng)實(shí)現(xiàn)整體均衡,違法未被懲處而獲得額外凈收益V,選擇守法的則沒(méi)有額外收益,違法被懲處時(shí)承擔(dān)成本L。始終存在一定比例的違法行為,但整體平均收益為0。從時(shí)間維度來(lái)說(shuō),具體的網(wǎng)約車平臺(tái)違法有時(shí)獲得收益V、有時(shí)承擔(dān)成本L,守法則沒(méi)有額外收益,長(zhǎng)期平均收益為0。政府監(jiān)管機(jī)構(gòu)從成本-收益角度綜合考慮增加監(jiān)管成本、提高監(jiān)管強(qiáng)度的投入-產(chǎn)出效率。此時(shí),政府監(jiān)管機(jī)構(gòu)實(shí)現(xiàn)整體均衡,低監(jiān)管投入而未被懲處的節(jié)約成本S,低監(jiān)管投入但被懲處的承擔(dān)凈損失D,恪盡職守的則沒(méi)有額外收益。始終存在一定比例的弱監(jiān)管,但整體平均收益為0。從時(shí)間維度來(lái)看,政府監(jiān)管機(jī)構(gòu)低監(jiān)管投入有時(shí)節(jié)約成本S、有時(shí)承擔(dān)凈損失D,高監(jiān)管投入則沒(méi)有額外收益,長(zhǎng)期平均收益為0。政府監(jiān)管機(jī)構(gòu)監(jiān)督管理網(wǎng)約車平臺(tái)的目的不是徹底消除違法行為,而是將違法水平控制在可承受的范圍內(nèi)。監(jiān)管行為存在成本,需根據(jù)邊際成本等于邊際收益的原則實(shí)現(xiàn)收益最大化。 根據(jù)假設(shè),政府調(diào)整處罰力度的長(zhǎng)期和短期效果截然不同,存在激勵(lì)悖論。根據(jù)假設(shè)6,提高F1可增加L,短期內(nèi)政府監(jiān)管機(jī)構(gòu)強(qiáng)監(jiān)管的概率仍為p*,根據(jù)式(5),E(W2)<0,根據(jù)式(6),網(wǎng)約車平臺(tái)提高q有助于減少損失。提高F2可增加D,短期內(nèi)網(wǎng)約車平臺(tái)違法的概率分布仍為q*,根據(jù)式(2),E(G2)<0,根據(jù)式(3),政府監(jiān)管機(jī)構(gòu)提高p有助于減少損失。根據(jù)式(7),p*與V呈正相關(guān)、與L的絕對(duì)量呈負(fù)相關(guān),與D無(wú)關(guān),通過(guò)提高F1后增加L將導(dǎo)致p*下降。根據(jù)式(8),q*與D的絕對(duì)量呈正相關(guān)、與S呈負(fù)相關(guān),與P無(wú)關(guān),通過(guò)提高F2后增加D將導(dǎo)致q*上升。因此,短期內(nèi)加大對(duì)違法行為的處罰有助于網(wǎng)約車平臺(tái)守法,加大對(duì)失職瀆職行為的處罰有助于政府監(jiān)管機(jī)構(gòu)加強(qiáng)監(jiān)管;長(zhǎng)期內(nèi)加大對(duì)網(wǎng)約車平臺(tái)違法行為的懲罰將誘導(dǎo)政府監(jiān)管機(jī)構(gòu)弱監(jiān)管而并不能抑制違法行為,加大對(duì)政府監(jiān)管機(jī)構(gòu)的懲罰有助于網(wǎng)約車平臺(tái)守法而并不能促使政府監(jiān)管機(jī)構(gòu)積極執(zhí)法。在新的均衡點(diǎn),雙方得益恢復(fù)為0并根據(jù)新的均衡概率分布選擇混合策略(如圖9所示)。 圖9 政府監(jiān)管機(jī)構(gòu)和網(wǎng)約車平臺(tái)的混合策略 納什均衡具有穩(wěn)定性,串謀則面臨“囚徒困境”。在兩人博弈的基礎(chǔ)上增加反應(yīng)函數(shù)的數(shù)量并聯(lián)立方程組求納什均衡解,可將研究結(jié)論擴(kuò)展到多主體博弈。由于UB>UH>UL,雙方均清楚串謀是帕累托最優(yōu)結(jié)果,但都無(wú)法信任對(duì)方,難以抵制利用對(duì)方信任單獨(dú)降價(jià)而獨(dú)占市場(chǎng)的誘惑。雙方在價(jià)格博弈中面臨“囚徒困境”,不管對(duì)方的具體策略如何,降價(jià)總是占優(yōu)策略,最終博弈將穩(wěn)定在(UL,UL)的策略組合。 進(jìn)一步地,我們擺脫“囚徒困境”的嚴(yán)苛條件。如果W>U,則甲的最優(yōu)策略為合作,反之則不合作。實(shí)現(xiàn)合作策略需滿足的條件為: (34) 因?yàn)闊o(wú)限次重復(fù)博弈是否從第一階段開(kāi)始并不影響結(jié)果,剔除已發(fā)生的,則需做出選擇的階段均可視為第一階段,所以δ滿足式(34)能保障博弈維持合作均衡。由于博弈的對(duì)稱性,保證乙維持合作的δ需滿足相同的條件。 δ的實(shí)際值與市場(chǎng)利率、通貨膨脹預(yù)期、博弈時(shí)長(zhǎng)等因素呈負(fù)相關(guān)。當(dāng)δ的實(shí)際值大于δ的閾值時(shí),隨機(jī)結(jié)束的有限次重復(fù)博弈有望走出“囚徒困境”,反之則深陷其中。δ的閾值越大,δ的實(shí)際值高于閾值的概率越小,走出“囚徒困境”越困難,反之則相對(duì)容易。δ的實(shí)際值越大,高于既定閾值的概率越大,合作的未來(lái)收益現(xiàn)值越大,現(xiàn)階段自己合作而對(duì)方不合作給自己造成的損失與雙方均保持合作而獲得未來(lái)收益的現(xiàn)值相比越無(wú)足輕重,走出“囚徒困境”越容易,反之則相對(duì)困難。自己選擇不合作雖能獲得一次性收益UB,但與合作保留持續(xù)獲得UH收益的潛在可能相比,δ越大,合作的吸引力越大。因此,走出“囚徒困境”的概率與δ的閾值呈負(fù)相關(guān)、與δ的實(shí)際值呈正相關(guān)。根據(jù)無(wú)限次重復(fù)博弈的民間定理,在雙寡頭削價(jià)競(jìng)爭(zhēng)的重復(fù)博弈中,由(0,UB)、(UH,UH)、(UB,0)、(UL,UL)四點(diǎn)合圍區(qū)域內(nèi)的點(diǎn)表示所有可實(shí)現(xiàn)得益,其中斜線部分點(diǎn)的坐標(biāo)對(duì)應(yīng)的得益組合均可通過(guò)子博弈完美納什均衡實(shí)現(xiàn)(如圖10所示)。 圖10 雙寡頭削價(jià)競(jìng)爭(zhēng)無(wú)限次重復(fù)博弈的民意定理 此外,如果動(dòng)搖博弈雙方完全理性的基礎(chǔ)條件(即博弈的信息不完美甚至不完全,至少博弈一方不再擁有追求個(gè)體利益最大化的“個(gè)體理性”或完美分析判斷選擇能力的“完全理性”),則“極大化極小策略”將影響納什均衡的結(jié)果。當(dāng)雙方均意識(shí)到行動(dòng)的風(fēng)險(xiǎn)并懷疑對(duì)方的理性時(shí),為降低風(fēng)險(xiǎn)傾向于根據(jù)風(fēng)險(xiǎn)上策均衡做出選擇,從而實(shí)現(xiàn)與帕累托上策均衡結(jié)果差異明顯的其他均衡結(jié)果。由于風(fēng)險(xiǎn)上策均衡具有自我強(qiáng)化的反饋機(jī)制,最初只是懷疑對(duì)方可能采取風(fēng)險(xiǎn)上策均衡策略,最終將推動(dòng)相對(duì)低效率的風(fēng)險(xiǎn)上策均衡成為現(xiàn)實(shí)。如果博弈為多主體博弈,隨著博弈主體的數(shù)量增加,基于風(fēng)險(xiǎn)上策均衡達(dá)成合作的概率將以幾何級(jí)速度降低。 與上述的價(jià)格博弈一樣,在兩人博弈的基礎(chǔ)上增加反應(yīng)函數(shù)的數(shù)量并聯(lián)立方程組求納什均衡解,也可將研究結(jié)論擴(kuò)展到多主體博弈。同價(jià)格博弈類似,數(shù)量博弈也面臨“囚徒困境”。雙方均清楚串謀是帕累托最優(yōu)結(jié)果,但都無(wú)法信任對(duì)方,難以抵制利用對(duì)方信任單獨(dú)增產(chǎn)搶占市場(chǎng)份額而增加利潤(rùn)的誘惑。對(duì)雙方而言,不管對(duì)方的具體策略如何,增產(chǎn)總是占優(yōu)策略,最終博弈將穩(wěn)定在古諾均衡水平。 同樣地,我們擺脫“囚徒困境”的嚴(yán)苛條件。如果W>U,則甲的最優(yōu)策略為合作,反之則不合作。聯(lián)立式(32)、(33),可得ε>9/17。由于博弈的對(duì)稱性,保證乙維持合作的ε亦需滿足上式。當(dāng)ε的實(shí)際值大于9/17時(shí),博弈雙方的串謀是最優(yōu)策略;反之,古諾產(chǎn)量是最優(yōu)策略。ε越大,合作的未來(lái)收益現(xiàn)值越大,現(xiàn)階段自己合作而對(duì)方不合作造成的損失與雙方均合作時(shí)獲得未來(lái)收益的現(xiàn)值相比越無(wú)足輕重,合作的概率越大。自己選擇不合作雖能獲得一次性收益9a2/64b,但與合作保留持續(xù)獲得a2/8b收益的潛在可能相比,ε越大,合作的吸引力越大。ε的閾值為常數(shù),ε的實(shí)際值與市場(chǎng)利率、通貨膨脹預(yù)期、博弈時(shí)長(zhǎng)等因素呈負(fù)相關(guān),因此合作的可能性與上述因素呈負(fù)相關(guān)。 與伯特蘭德模型一樣,雙方雖然都清楚合作對(duì)雙方最有利,但均有增加產(chǎn)量以獲得額外利潤(rùn)的沖動(dòng),最終串謀限產(chǎn)協(xié)議因相互猜忌而破產(chǎn)。雖然理論上無(wú)法明確結(jié)束時(shí)點(diǎn)的有限次重復(fù)博弈有望在ε滿足一定條件時(shí)可通過(guò)“以牙還牙”策略保持合作均衡,但實(shí)踐中很難具備完全理性的條件。在信息不完美甚至不完全的條件下,質(zhì)疑博弈雙方的“個(gè)體理性”或“完全理性”,風(fēng)險(xiǎn)上策均衡策略有可能取代帕累托上策均衡策略。由于風(fēng)險(xiǎn)上策均衡具有自我強(qiáng)化的反饋機(jī)制,增加網(wǎng)約車平臺(tái)數(shù)量將可大幅降低成功串謀的概率。 本文運(yùn)用“小偷守衛(wèi)”博弈模型研究政府監(jiān)管機(jī)構(gòu)與網(wǎng)約車平臺(tái)的博弈過(guò)程,考察博弈雙方策略選擇的路徑,分析博弈混合策略納什均衡的穩(wěn)定性及博弈策略長(zhǎng)短期的效果差異。在此基礎(chǔ)上,通過(guò)引入監(jiān)管資源投入和違法凈收益等變量擴(kuò)展“小偷守衛(wèi)”博弈模型,為政府根據(jù)實(shí)際監(jiān)管需要通過(guò)調(diào)整相應(yīng)變量來(lái)提高監(jiān)管效果指明了路徑?;谑袌?chǎng)發(fā)展規(guī)律建立兩階段博弈模型,利用伯特蘭德模型分析市場(chǎng)擴(kuò)展階段的價(jià)格競(jìng)爭(zhēng)、古諾模型分析市場(chǎng)穩(wěn)定階段的產(chǎn)量調(diào)整,并將兩個(gè)完全信息靜態(tài)博弈擴(kuò)展為不確定結(jié)束時(shí)點(diǎn)的重復(fù)博弈,闡述網(wǎng)約車平臺(tái)價(jià)格戰(zhàn)難以避免的原因及相應(yīng)措施存在的局限性。 第一,與政府監(jiān)管機(jī)構(gòu)博弈的網(wǎng)約車平臺(tái)不是具體企業(yè),而是整個(gè)行業(yè)。網(wǎng)約車平臺(tái)與政府監(jiān)管機(jī)構(gòu)的博弈是一個(gè)交替采取行動(dòng)的過(guò)程。從發(fā)現(xiàn)對(duì)方的策略選擇到調(diào)整己方的策略選擇的時(shí)間周期較長(zhǎng),特別是政府監(jiān)管機(jī)構(gòu)調(diào)整監(jiān)管強(qiáng)度需經(jīng)過(guò)前期調(diào)研、內(nèi)部研究、逐級(jí)上報(bào)、決策審批、資源籌集、組織實(shí)施、效果評(píng)估等階段。但從短周期看,雙方依然表現(xiàn)為純策略博弈。 第二,存在混合策略納什均衡的研究結(jié)論要求政府監(jiān)管具有前瞻性,注意區(qū)分長(zhǎng)短期效果,重視博弈參與主體對(duì)具體博弈策略向前展望和向后推理產(chǎn)生的持續(xù)影響。短期內(nèi)具有較強(qiáng)針對(duì)性的政策措施在長(zhǎng)期將因監(jiān)管對(duì)象的適應(yīng)性調(diào)整而失效。 第三,引入影響變量,從而明晰監(jiān)管策略調(diào)整路徑。雖然混合策略納什均衡在實(shí)踐中很難實(shí)現(xiàn),但根據(jù)均衡概率分布可確定政府監(jiān)管機(jī)構(gòu)最優(yōu)資源的投入規(guī)模。即使不知道均衡概率分布,但從可觀測(cè)、可調(diào)整的監(jiān)管資源投入入手,確定對(duì)網(wǎng)約車平臺(tái)的懲罰力度。實(shí)際上,圖3中強(qiáng)監(jiān)管的概率與監(jiān)管成本曲線上的任意點(diǎn)都可作為均衡概率分布,只是對(duì)應(yīng)的監(jiān)管成本和對(duì)網(wǎng)約車平臺(tái)違法行為的懲罰力度存在差異。網(wǎng)約車平臺(tái)的均衡守法概率因違法行為的額外凈收益不同而存在差異,因而需根據(jù)違法性質(zhì)實(shí)施分類監(jiān)管。由違法凈收益的大小確定守法概率,進(jìn)而調(diào)整對(duì)政府監(jiān)管機(jī)構(gòu)的懲罰力度。將二者綜合起來(lái)考慮,網(wǎng)約車平臺(tái)高違法凈收益的違法行為的守法概率較低,長(zhǎng)期內(nèi)需對(duì)政府監(jiān)管機(jī)構(gòu)配套實(shí)施較大力度的懲罰。因?yàn)檫`法凈收益較大,如果受監(jiān)管資源限制能達(dá)到的政府強(qiáng)監(jiān)管均衡概率較小,則需大幅提高對(duì)網(wǎng)約車平臺(tái)的懲罰力度才能保持平衡;如果能實(shí)現(xiàn)較高水平的強(qiáng)監(jiān)管概率,則對(duì)網(wǎng)約車平臺(tái)的懲罰力度可相應(yīng)降低。反之亦然。 第五,在網(wǎng)約車市場(chǎng)發(fā)展初期,網(wǎng)約車平臺(tái)存在為搶占市場(chǎng)展開(kāi)補(bǔ)貼大戰(zhàn)的行為動(dòng)機(jī)。在滴滴與優(yōu)步合并前的價(jià)格戰(zhàn)中,政府干預(yù)這一不正當(dāng)競(jìng)爭(zhēng)后,競(jìng)爭(zhēng)主體采取差異化競(jìng)爭(zhēng)策略而暫時(shí)告一段落,意味著競(jìng)爭(zhēng)格局趨于穩(wěn)定,競(jìng)爭(zhēng)將由價(jià)格轉(zhuǎn)向數(shù)量和質(zhì)量。為增進(jìn)社會(huì)福利,政府仍需努力鞏固數(shù)量博弈“囚徒困境”的穩(wěn)定性:一是根據(jù)貼現(xiàn)系數(shù)的影響因素,通過(guò)延長(zhǎng)博弈時(shí)長(zhǎng)、增加未來(lái)的不確定性等方式降低貼現(xiàn)率:二是建立由政府主導(dǎo)的網(wǎng)約車平臺(tái)并發(fā)揮其“鯰魚(yú)效應(yīng)”,促進(jìn)市場(chǎng)主體之間的競(jìng)爭(zhēng):三是干擾市場(chǎng)信號(hào)的傳遞,塑造市場(chǎng)主體不具有“個(gè)體理性”和“完全理性”的形象,發(fā)揮“極大化極小策略”在數(shù)量決策中的作用。q*,則E(G2)>0,根據(jù)式(3),政府監(jiān)管機(jī)構(gòu)降低p能增加收益。如果政府監(jiān)管機(jī)構(gòu)降低p,則E(W2)>0,根據(jù)式(6),網(wǎng)約車平臺(tái)降低q能增加收益。如果p>p*,則E(W2)<0,根據(jù)式(6),網(wǎng)約車平臺(tái)提高q能減少損失。如果網(wǎng)約車平臺(tái)提高q,則E(G2)>0,根據(jù)式(3),政府監(jiān)管機(jī)構(gòu)降低p能增加收益。如果p
(二)網(wǎng)約車平臺(tái)之間的價(jià)格博弈
(三)網(wǎng)約車平臺(tái)之間的數(shù)量博弈
五、結(jié) 語(yǔ)