靳開元
(南京財(cái)經(jīng)大學(xué) 經(jīng)濟(jì)學(xué)院,江蘇 南京 210023)
自2018年美國(guó)單方面宣布對(duì)華貿(mào)易制裁措施以來,美國(guó)徹底撕開偽裝,以美國(guó)優(yōu)先為口號(hào),憑借美元與石油霸權(quán),在世界范圍內(nèi)頻頻采取長(zhǎng)臂管轄和單邊制裁的措施,使世界多邊貿(mào)易架構(gòu)遭到巨大破壞,多邊主義遭遇空前威脅。為應(yīng)對(duì)美國(guó)對(duì)中國(guó)的經(jīng)濟(jì)貿(mào)易圍堵,通過中國(guó)的不懈努力,《區(qū)域全面經(jīng)濟(jì)伙伴關(guān)系協(xié)定(RCEP)》于2020年11月正式簽訂,世界范圍內(nèi)人口含量最多、經(jīng)濟(jì)規(guī)模最大的自由貿(mào)易協(xié)定(free trade agreement,F(xiàn)TA)正式成型,這是區(qū)域性FTA在當(dāng)今世界的又一次成功的應(yīng)用。
自20世紀(jì)90年代以來,區(qū)域性FTA就以靈活、高效的特點(diǎn),在世界范圍內(nèi)廣泛應(yīng)用。而在RECP簽成后,區(qū)域經(jīng)濟(jì)一體化特征越發(fā)清晰,代表美洲的北美自由貿(mào)易區(qū)(NAFTA)、代表歐洲的歐盟(EU)以及代表亞洲的《區(qū)域全面經(jīng)濟(jì)伙伴關(guān)系協(xié)定(RCEP)》標(biāo)志著各個(gè)大洲都進(jìn)行了不同程度的經(jīng)濟(jì)一體化整合。在這樣的背景下,RCEP的簽訂無疑會(huì)對(duì)中國(guó)的經(jīng)濟(jì)、政治等多層面產(chǎn)生重大影響。本文通過對(duì)區(qū)域性FTA對(duì)雙邊貿(mào)易流量影響的量化分析,不僅有利于為現(xiàn)有FTA戰(zhàn)略的持續(xù)推進(jìn)提供政策性建議,同時(shí)可以在當(dāng)前的不利環(huán)境中,尋找中國(guó)特色的破局方案,具有重要的實(shí)踐意義。
盡管有大量的文獻(xiàn)對(duì)FTA與GDP、貿(mào)易流量等宏觀經(jīng)濟(jì)指標(biāo)之間的關(guān)系進(jìn)行了考察。但是在大多數(shù)文獻(xiàn)中,在將FTA作為解釋變量考察貿(mào)易效應(yīng)時(shí),通常是簡(jiǎn)單作為二元虛擬變量來進(jìn)行分析,這暗含著FTA完全同質(zhì)的假設(shè),與現(xiàn)實(shí)世界完全不符。本文放棄了對(duì)FTA同質(zhì)性的假設(shè),重點(diǎn)關(guān)注FTA的異質(zhì)性對(duì)雙邊貿(mào)易成本的影響。而在研究FTA異質(zhì)性的貿(mào)易效應(yīng)文獻(xiàn)中,絕大多數(shù)研究將衡量FTA深度的高維稀疏特征分為WTO+和WTO-X兩類。通過分類求和計(jì)算總分的方式將高維數(shù)據(jù)壓縮為低維數(shù)據(jù),并將該數(shù)據(jù)應(yīng)用于引力模型中。這樣的研究方法使得FTA深度數(shù)據(jù)所包含的信息并沒有被充分挖掘,同時(shí)引力模型將數(shù)據(jù)之間的關(guān)系固定為線性關(guān)系。本文選擇被廣泛應(yīng)用于高維數(shù)據(jù)處理的機(jī)器學(xué)習(xí)模型,挖掘FTA深度指標(biāo)數(shù)據(jù)的內(nèi)在信息,豐富了該領(lǐng)域的模型應(yīng)用方法。
在FTA異質(zhì)性指標(biāo)確定上,本文采用Hofmann(2017)的深度一體化測(cè)算方法,將協(xié)定文本所包含的條款劃分為52個(gè)政策領(lǐng)域,在這些條款分類基礎(chǔ)上,根據(jù)協(xié)定文本內(nèi)容進(jìn)行深度衡量。同時(shí),將各條款分類為18項(xiàng)核心條款(core)和6項(xiàng)關(guān)稅減讓條款(traffic)。其中核心條款是在貿(mào)易協(xié)定中出現(xiàn)頻率較高的條款,屬于貿(mào)易談判的基本議題;關(guān)稅減讓條款為與關(guān)稅減讓相關(guān)的條款。
自由貿(mào)易協(xié)定的貿(mào)易效應(yīng)一直是備受關(guān)注的研究領(lǐng)域。早期研究關(guān)注FTA對(duì)雙邊貿(mào)易流量的影響多是將FTA做同質(zhì)化處理。對(duì)自由貿(mào)易協(xié)定異質(zhì)性的研究最早在1996年,Lawrence首次提出了深度一體化(也稱“邊界一體化”)的概念,本質(zhì)上是為確保國(guó)際分工的順利進(jìn)行①。東艷等指出,“深度”是通過深層次的貿(mào)易政策來協(xié)調(diào)整合各區(qū)域市場(chǎng)②。
在對(duì)FTA異質(zhì)性衡量指標(biāo)的設(shè)定上,Horn等對(duì)美國(guó)和歐盟的FTA文本進(jìn)行分析,對(duì)FTA條款進(jìn)行分類賦值,并進(jìn)行了描述性統(tǒng)計(jì)分析③。Hofmann等則使用該方法對(duì)WTO的RTA條款數(shù)據(jù)庫(kù)進(jìn)行了更新,對(duì)2015年截止的279份區(qū)域貿(mào)易協(xié)定進(jìn)行了分析,同時(shí)提供了可供公開下載的RTA條款數(shù)據(jù)庫(kù)④。在FTA異質(zhì)性的貿(mào)易效應(yīng)研究中,高疆和盛斌發(fā)現(xiàn),短期內(nèi)具備法律執(zhí)行率的“約束力”指標(biāo)的促進(jìn)作用強(qiáng)于僅僅提及條款的“覆蓋力”指標(biāo),隨著生效時(shí)間的延長(zhǎng),二者的影響差異逐漸縮小⑤。鐵瑛等發(fā)現(xiàn),相較于“北-北”國(guó)家對(duì),國(guó)家對(duì)保有深度FTA數(shù)量差異的負(fù)面影響在“南-北”國(guó)家對(duì)中會(huì)受到明顯削弱⑥。
在貿(mào)易流量的影響因素方面,蘇劍發(fā)現(xiàn)語(yǔ)言距離可以在多個(gè)層面影響貿(mào)易流量⑦。張曉欽等的研究表明,經(jīng)濟(jì)制度與貿(mào)易流量顯著正相關(guān),是國(guó)際貿(mào)易的重要影響因素⑧。呂延方等發(fā)現(xiàn)經(jīng)濟(jì)規(guī)模對(duì)貿(mào)易流量有顯著正向影響,地理距離則產(chǎn)生顯著負(fù)向影響⑨。本文通過運(yùn)用Hofmann衡量FTA條款異質(zhì)化的度量方法及數(shù)據(jù)庫(kù),將貿(mào)易雙方的地理距離、GDP、官方語(yǔ)言等作為影響因素,運(yùn)用機(jī)器學(xué)習(xí)模型對(duì)FTA生效后的雙邊貿(mào)易流量進(jìn)行建模,分析結(jié)果揭示了FTA條款的異質(zhì)性對(duì)協(xié)定簽署國(guó)之間貿(mào)易的重要影響和機(jī)器學(xué)習(xí)模型在該領(lǐng)域的可用性。
本文選取變量對(duì)各國(guó)簽訂自由貿(mào)易協(xié)定后的雙邊貿(mào)易流量進(jìn)行建模與預(yù)測(cè),模型的自變量與因變量設(shè)定如表1所示。
表1 自變量與因變量設(shè)定表1表中變量可能對(duì)應(yīng)于單邊特征或雙邊特征。對(duì)于單邊變量,存在于貿(mào)易國(guó)雙方,其中-o代表貿(mào)易起源國(guó),-d代表貿(mào)易目的國(guó)。此處為簡(jiǎn)潔,只顯示一方數(shù)據(jù)。
表中,貿(mào)易流量相關(guān)數(shù)據(jù)trade flow來源于UN Comtrade Database數(shù)據(jù)庫(kù)。貿(mào)易流量trade flow_o代表o國(guó)出口貿(mào)易流量,trade flow_d代表d國(guó)進(jìn)口貿(mào)易流量,這兩項(xiàng)數(shù)值可能因?yàn)閲?guó)家間的統(tǒng)計(jì)方法不同而出現(xiàn)偏差。Trade flow comtrade rate代表過去三年的平均貿(mào)易增長(zhǎng)率,具體計(jì)算公式如下:
Trade flow_comtrade_rate
其中:(1)地理因素?cái)?shù)據(jù)distw、contig,人口數(shù)據(jù)pop來源于CEPII數(shù)據(jù)庫(kù)。distw代表大多數(shù)人口密集的城市之間的人口加權(quán)距離。(2)貿(mào)易協(xié)定類型數(shù)據(jù)type來源于World Bank數(shù)據(jù)庫(kù)。type數(shù)據(jù)具體可分為:A Free Trade Agreement(FTA):自由貿(mào)易協(xié)定;A Customs Union(CU):為關(guān)稅同盟;An Economic Integration Agreement(EIA):經(jīng)濟(jì)一體化協(xié)定。(3)FTA深度一體化數(shù)據(jù)fta_depth來源于2017年的Hofmann “深層協(xié)定”數(shù)據(jù)庫(kù),并在此基礎(chǔ)上進(jìn)行了處理。本項(xiàng)數(shù)據(jù)均可分為“覆蓋力”數(shù)據(jù)和“約束力”數(shù)據(jù)。其中“覆蓋力”數(shù)據(jù)56項(xiàng),“約束力”數(shù)據(jù)56項(xiàng)。核心條款數(shù)據(jù)、關(guān)稅減讓數(shù)據(jù)、WTO+數(shù)據(jù)、WTO-X數(shù)據(jù)是各自所包含的貿(mào)易政策議題得分的加總。
本文選擇1990—2015年世界范圍內(nèi)簽訂并生效的區(qū)域性自由貿(mào)易協(xié)定、區(qū)域貿(mào)易協(xié)定的增補(bǔ)條約作為研究對(duì)象,即本文假定增補(bǔ)條約與新訂條約的效果相同。具體包括美洲的北美自由貿(mào)易協(xié)定(NAFTA),東盟自由貿(mào)易區(qū)協(xié)定(ASEAN free trade area),新型自由貿(mào)易區(qū)協(xié)定(SAFTA)以及歐盟增補(bǔ)條約(EU Enlargement)。為使得多國(guó)之間的貿(mào)易協(xié)定數(shù)據(jù)可以具體分析,本文通過將區(qū)域貿(mào)易協(xié)定中的多國(guó)數(shù)據(jù)兩兩拆分,將數(shù)據(jù)從多國(guó)層面處理為“國(guó)-國(guó)”層面,分別作為一條數(shù)據(jù)加入數(shù)據(jù)集之中。
此外,本文還對(duì)數(shù)據(jù)進(jìn)行了如下的細(xì)節(jié)處理:(1)對(duì)于兩國(guó)間同一時(shí)間生效的多個(gè)自由貿(mào)易協(xié)定,本文通過采取并集的方式處理所包含的FTA深度特征。(2)對(duì)于兩國(guó)間生效時(shí)間間隔小于三年的多個(gè)自由貿(mào)易協(xié)定,由于本文研究對(duì)象是協(xié)定生效三年內(nèi)的貿(mào)易流量,因此本文將之拆分為兩組數(shù)據(jù):分別為單一協(xié)定生效時(shí)間數(shù)據(jù)和協(xié)定同時(shí)生效時(shí)間數(shù)據(jù)。對(duì)于單一生效時(shí)間數(shù)據(jù),刪除多個(gè)協(xié)定同時(shí)生效后的貿(mào)易流量特征;對(duì)于協(xié)定同時(shí)生效時(shí)間數(shù)據(jù),只保留多個(gè)協(xié)定同時(shí)生效后的貿(mào)易流量特征,同時(shí)通過取并集的方式處理所包含的FTA深度特征。
區(qū)別于計(jì)量模型,機(jī)器學(xué)習(xí)模型的側(cè)重點(diǎn)不在于分析各個(gè)自變量對(duì)因變量的影響,而是將關(guān)注的重點(diǎn)放在模型預(yù)測(cè)的精確程度上。為了達(dá)到更高的預(yù)測(cè)精度,機(jī)器學(xué)習(xí)模型中各個(gè)自變量與因變量之間的關(guān)系是根據(jù)模型邏輯,由數(shù)據(jù)本身選擇,而不是事先人為設(shè)定的,因此機(jī)器學(xué)習(xí)模型多為黑箱模型。為研究貿(mào)易協(xié)定內(nèi)容對(duì)雙邊貿(mào)易流量影響的關(guān)系,本文分別采用了樹模型-極限梯度提升樹(XGBOOST)和線性模型-嶺回歸模型(Ridge)進(jìn)行訓(xùn)練與預(yù)測(cè)。在模型訓(xùn)練過程中,將原始數(shù)據(jù)分割為三部分,分別是訓(xùn)練集、驗(yàn)證集和測(cè)試集。將訓(xùn)練集輸入模型進(jìn)行訓(xùn)練,得到訓(xùn)練后的模型。使用驗(yàn)證集的數(shù)據(jù)對(duì)訓(xùn)練的模型效果進(jìn)行評(píng)估,調(diào)整模型參數(shù)。用測(cè)試集中的數(shù)據(jù)比較、衡量模型的泛化效果。
XGBOOST是傳統(tǒng)的梯度提升算法的改進(jìn)算法,被認(rèn)為是在分類和回歸上都擁有超高性能的先進(jìn)評(píng)估器。在此基礎(chǔ)上建立回歸樹,對(duì)回歸樹每個(gè)樣本的預(yù)測(cè)結(jié)果是所有弱分類器上的葉子權(quán)重的直接求和:
嶺回歸是在普通OLS模型的代價(jià)函數(shù)上增加了L2正則項(xiàng),具體代價(jià)函數(shù)公式如下:
其中,Xi為第i個(gè)自變量的名稱,λ為正則項(xiàng)系數(shù)。
本文數(shù)據(jù)樣本共1982條,特征共138個(gè)。在將所有包含缺失值的樣本進(jìn)行刪除后,剩余樣本共1783條。其中貿(mào)易流量在一億美元以上的數(shù)據(jù)有1385條,貿(mào)易流量在十億美元以上的數(shù)據(jù)由555條。對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,減少特征的數(shù)量大小對(duì)模型的影響,提高運(yùn)算速度。
在建立模型前還需要對(duì)特征進(jìn)行篩選,以消除模型的過擬合傾向,提高模型的泛化能力。本文首先使用皮爾遜相關(guān)系數(shù)以及最大互信息對(duì)變量之間的線性關(guān)系以及非線性關(guān)系進(jìn)行篩選,分別找出這兩項(xiàng)排名前50的特征并將這些特征進(jìn)行合并,得到61項(xiàng)備選特征。其次,對(duì)被篩選出的61項(xiàng)特征使用正則項(xiàng)系數(shù)為1的Lasso模型進(jìn)行嵌入式特征選擇,進(jìn)行二次特征篩選后,最終得到55項(xiàng)特征。
本文按照進(jìn)出口貿(mào)易流量的情況將數(shù)據(jù)劃分為無限制數(shù)據(jù)、貿(mào)易流量一億美元以上的數(shù)據(jù)以及貿(mào)易流量十億美元以上的數(shù)據(jù)。為比較線性模型與樹模型在該問題上的預(yù)測(cè)效果,本文分別采用了樹模型-極限梯度提升樹(XGBOOST)、線性模型-嶺回歸模型(Ridge)進(jìn)行訓(xùn)練與預(yù)測(cè)。表2報(bào)告了在各個(gè)期限上的模型在測(cè)試集上的實(shí)證效果。為平衡不同數(shù)量大小的數(shù)據(jù)的貢獻(xiàn),本文選擇的模型評(píng)價(jià)指標(biāo)為平均絕對(duì)百分比誤差MAPE,計(jì)算公式如下:
從表2的結(jié)果來看,XGBOOST模型在預(yù)測(cè)效果上明顯優(yōu)于Ridge模型。在貿(mào)易流量不同的數(shù)據(jù)集上模型的表現(xiàn)有顯著性差異:對(duì)于貿(mào)易流量在10億美元以上的數(shù)據(jù),無論是XGBOOST模型還是Ridge模型都得到了較好的結(jié)果;對(duì)于貿(mào)易流量在1億美元以上的數(shù)據(jù),XGBOOST模型的預(yù)測(cè)效果一般。而Ridge模型預(yù)測(cè)效果較差,兩種模型的效果都有所下降。對(duì)于貿(mào)易流量無限制的數(shù)據(jù),XGBOOST模型的效果很差,而Ridge模型變得不可信。
總的來說,模型對(duì)越靠近貿(mào)易協(xié)定生效年的數(shù)據(jù)預(yù)測(cè)效果越準(zhǔn)確,這是自然的。同時(shí),模型對(duì)貿(mào)易量越大的數(shù)據(jù)集預(yù)測(cè)表現(xiàn)越好。這是因?yàn)樵绞钱a(chǎn)生大宗貿(mào)易的國(guó)家之間,貿(mào)易需求越穩(wěn)定,而小宗貿(mào)易存在很大的不確定性。
接下來,為體現(xiàn)FTA異質(zhì)性對(duì)雙邊貿(mào)易流量的影響,本文選用模型預(yù)測(cè)效果較好的XGBOOXT模型,在10億貿(mào)易流量以上的數(shù)據(jù)集上,對(duì)不含F(xiàn)TA深度特征的數(shù)據(jù)進(jìn)行了訓(xùn)練和預(yù)測(cè),并與包含F(xiàn)TA深度特征的數(shù)據(jù)的預(yù)測(cè)效果進(jìn)行了比較,表3報(bào)告了測(cè)試集比較的結(jié)果。
表3 是否包含F(xiàn)TA深度特征的模型MAPE性能對(duì)比表
我們觀察表3可以發(fā)現(xiàn),在各年期的貿(mào)易流量預(yù)測(cè)效果上,包含F(xiàn)TA深度特征的模型都普遍高于不包含F(xiàn)TA深度特征的模型,且差異明顯。因此可以得出結(jié)論,在模型訓(xùn)練中加入FTA深度特征可以明顯提高模型預(yù)測(cè)效果,F(xiàn)TA條款的異質(zhì)性對(duì)協(xié)定簽署國(guó)之間的貿(mào)易產(chǎn)生了重要影響。
本文研究了自由貿(mào)易協(xié)定(FTA)簽訂后,簽約國(guó)的貿(mào)易流量預(yù)測(cè)問題。分別采用樹模型XGBOOST與線性模型Ridge,選擇FTA文本條款的深度作為區(qū)別不同協(xié)議的核心特征,建立對(duì)于協(xié)議生效3年內(nèi)的雙邊貿(mào)易流量預(yù)測(cè)模型。實(shí)證結(jié)果顯示,樹模型XGBOOST在貿(mào)易流量預(yù)測(cè)上取得了較好結(jié)果,且FTA條款的異質(zhì)性對(duì)協(xié)定簽署國(guó)之間貿(mào)易產(chǎn)生了重要影響。在模型的預(yù)測(cè)效果上看,貿(mào)易流量越大,預(yù)測(cè)結(jié)果越精準(zhǔn)。對(duì)流量在十億美元以上貿(mào)易在協(xié)定生效第一年的預(yù)測(cè),平均絕對(duì)百分比誤差約為0.077。
注釋:
①Lawrence R.5 1996,“Regionalism,Multilateralism and Deeper interation”,Washington DC:Brookings Institutuon,No.16426.
②東艷,馮雅江,邱薇.深度一體化:中國(guó)自由貿(mào)易區(qū)戰(zhàn)略的新趨勢(shì)[J].當(dāng)代亞太,2009(4):111-136.
③Horn H.and Mavroidis P.,“Sapir A.Beyond the WTO?An anatomy of EU and US preferrntial trade agreements”[J].The World Economy,2010,Vol.98(11),PP1565-1588.
④Hofmann C,Osnago A,Rute M..Horizontal Depth-A New Database on Content of Preferential Trade Agreements,World Bank Policy Research Working Paper,No,7981,2017.
⑤高疆,盛斌.貿(mào)易協(xié)定質(zhì)量會(huì)影響全球生產(chǎn)網(wǎng)絡(luò)嗎?[J].世界經(jīng)濟(jì)研究,2018(08):3-16+135.
⑥鐵瑛,黃建忠,徐美娜.第三方效應(yīng)、區(qū)域貿(mào)易協(xié)定深化與中國(guó)策略:基于協(xié)定條款異質(zhì)性的量化研究[J].經(jīng)濟(jì)研究,2021,56(01):155-171.
⑦蘇劍.語(yǔ)言距離影響國(guó)際貿(mào)易的理論機(jī)理與政策推演[J].學(xué)術(shù)月刊,2015(12).
⑧張曉欽,韓傳峰.中國(guó)-東盟自由貿(mào)易區(qū)基礎(chǔ)設(shè)施、經(jīng)濟(jì)制度與貿(mào)易流量的實(shí)證分析[J].系統(tǒng)工程,2016(01).
⑨呂延方,王冬.“一帶一路”有效實(shí)施:經(jīng)濟(jì)規(guī)模、地理與文化距離[J].經(jīng)濟(jì)學(xué)動(dòng)態(tài),2017(04).