任燕燕,李東霖,王文悅
(山東大學(xué) 經(jīng)濟(jì)學(xué)院,濟(jì)南 250100)
在現(xiàn)代經(jīng)濟(jì)問題實證研究中應(yīng)用的樣本數(shù)據(jù)逐漸呈現(xiàn)大數(shù)據(jù)特征,由于數(shù)據(jù)來源具有多樣性、復(fù)雜性,經(jīng)濟(jì)大數(shù)據(jù)集表現(xiàn)出顯著的異質(zhì)性特點,原有基于同質(zhì)性假設(shè)的單一化等傳統(tǒng)建模方法無法全面揭示經(jīng)濟(jì)運(yùn)行的客觀規(guī)律。因此,異質(zhì)性分析是計量經(jīng)濟(jì)學(xué)和統(tǒng)計學(xué)中的一個研究熱點,如何處理經(jīng)濟(jì)大數(shù)據(jù)中的異質(zhì)性并分析經(jīng)濟(jì)變量之間的結(jié)構(gòu)關(guān)系或變化是該研究的關(guān)鍵所在。利用面板數(shù)據(jù)模型進(jìn)行異質(zhì)性分析的研究大多基于均值回歸假設(shè)進(jìn)行,回歸結(jié)果只能刻畫均值水平上的異質(zhì)性結(jié)構(gòu),未能全面考慮數(shù)據(jù)所蘊(yùn)含的信息。而基于面板分位數(shù)模型的異質(zhì)性分析方法能夠從被解釋變量條件分布的角度,更加全面地反映不同分位點處變量之間的回歸關(guān)系,并識別其異質(zhì)性結(jié)構(gòu)。其中,一部分學(xué)者基于個體維度的異質(zhì)性,研究組群結(jié)構(gòu)的識別方法。Zhang 等(2019)[1]考慮個體維度上的組群結(jié)構(gòu),提出了面板分位數(shù)模型的聚類方法,并借鑒機(jī)器學(xué)習(xí)中的K-means 算法開發(fā)了用于識別某一分位點處或不同分位點間組群結(jié)構(gòu)的迭代算法;Zhang 等(2023)[2]提出了一種關(guān)于面板分位數(shù)模型組群結(jié)構(gòu)的非參數(shù)估計方法,使用兩兩融合的懲罰項估計了組群結(jié)構(gòu)的數(shù)量,通過ADMM 迭代算法提高了運(yùn)算效率。另外一部分學(xué)者關(guān)注時間維度上的異質(zhì)性,試圖尋找未知的結(jié)構(gòu)變點。Wang 等(2009)[3]基于回歸系數(shù)是關(guān)于時間的平滑非參數(shù)函數(shù)的假設(shè),構(gòu)建了變系數(shù)分位數(shù)回歸模型,并且使用基函數(shù)近似法進(jìn)行參數(shù)估計;部分學(xué)者提出了具有結(jié)構(gòu)變點的分位數(shù)自回歸模型,根據(jù)非對稱Laplace 分布構(gòu)建似然函數(shù),實現(xiàn)了對結(jié)構(gòu)變點的估計;Lee等(2018)[4]構(gòu)建了具有結(jié)構(gòu)變點的分位數(shù)回歸模型,利用L1懲罰項結(jié)合加權(quán)絕對偏差項構(gòu)建目標(biāo)函數(shù),估計了該模型的回歸系數(shù)和結(jié)構(gòu)變點,同時證明了估計量具有Oracle屬性。上述針對異質(zhì)性面板分位數(shù)模型的研究,普遍基于個體或時間的單一維度進(jìn)行分析,然而隨著異質(zhì)性分析方法的不斷發(fā)展,一些實證研究結(jié)果表明,變量之間的關(guān)系可能同時存在個體和時間兩個維度上的異質(zhì)性,因此有必要假設(shè)模型存在兩維的異質(zhì)性結(jié)構(gòu)。
兩維異質(zhì)性面板分位數(shù)模型存在嚴(yán)重的冗余參數(shù)問題,因此減少待估參數(shù)的數(shù)量成為相關(guān)研究的關(guān)鍵。一種方法是將兩維異質(zhì)性系數(shù)分解為個體維度的異質(zhì)性系數(shù)、時間維度的異質(zhì)性系數(shù)和共同系數(shù)三項之和,稱為維數(shù)縮減法[5]。此類方法存在模型識別問題,系數(shù)分解需要滿足個體和時間維度的異質(zhì)性系數(shù)均值為零的假設(shè),重點考察通過系數(shù)分解得到的共同系數(shù)。另一種方法假設(shè)系數(shù)在個體和時間兩個維度上存在異質(zhì)性結(jié)構(gòu),根據(jù)不同問題的研究背景,設(shè)定兩維異質(zhì)性系數(shù)具有不同的稀疏結(jié)構(gòu),基于某一維度的異質(zhì)性結(jié)構(gòu)關(guān)注另一個維度上是否存在組群結(jié)構(gòu)或結(jié)構(gòu)變點。Okui 和Wang(2021)[6]在基于個體維度識別出組群結(jié)構(gòu)的基礎(chǔ)上,考察不同組群時間維度上的結(jié)構(gòu)變點,提出利用Adaptive Lasso進(jìn)行組群融合的方法;Lumsdaine 等(2020)[7]關(guān)注面板數(shù)據(jù)模型在時間維度上的某一結(jié)構(gòu)變點,基于K-means算法識別該結(jié)構(gòu)變點附近個體維度上的組群結(jié)構(gòu)是否發(fā)生變化。此外,部分研究假設(shè)模型系數(shù)在個體或時間中某一個維度上存在稀疏結(jié)構(gòu),而在另一個維度上存在完全異質(zhì)性。Baltagi等(2016)[8]允許不同個體的斜率系數(shù)存在差異,但斜率系數(shù)具有相同的結(jié)構(gòu)變點;Su 等(2017)[9]假定不同個體之間存在組群結(jié)構(gòu),并且具有時間維度上的時變非參數(shù)形式的異質(zhì)性系數(shù),利用篩法或B-樣條將個體維度和時間維度進(jìn)行分離,考慮分離出的個體維度并識別其組群結(jié)構(gòu)。迄今為止,尚未有文獻(xiàn)研究面板分位數(shù)模型的兩維異質(zhì)性問題。本文考慮系數(shù)具有兩維異質(zhì)性結(jié)構(gòu)的面板分位數(shù)模型,基于SCAD懲罰函數(shù)和MCP懲罰函數(shù)提出一種能夠同時進(jìn)行參數(shù)估計和兩維異質(zhì)性結(jié)構(gòu)識別的雙懲罰回歸方法。
本文考慮如下的兩維異質(zhì)性面板數(shù)據(jù)模型:
其中,yit表示一維被解釋變量,μit表示隨個體和時間同時變化的固定效應(yīng)項,zit=(zit,1,zit,2,…,zit,P-1)Τ表示P-1 維 解 釋 變 量 向 量,δit=(δit,1,δit,2,…,δit,P-1)Τ表 示P-1 維異質(zhì)性解釋變量系數(shù),εit表示一維隨機(jī)誤差項。定義和。在分位點τ處,可構(gòu)建如下的條件分位數(shù)函數(shù):
模型存在冗余參數(shù)問題,為了減少待估參數(shù),本文假設(shè)斜率系數(shù)βit(τ)具有如下的兩維異質(zhì)性結(jié)構(gòu):
其中,B(τ)={B1(τ),B2(τ),…,BL(τ)(τ)}表示兩維異質(zhì)性結(jié)構(gòu),L(τ)表示其數(shù)量。
其中:ρτ(u)=u?(τ-I(u<0))表示分段線性分位數(shù)損失函數(shù);I(?)表示示性函數(shù),當(dāng)括號內(nèi)不等式成立時取值為1,否則取值為0。因此ρτ(u)的分段函數(shù)為:
pλ(τ)(?)和pγ(τ)(?)表示成對融合懲罰函數(shù),分別基于個體維度和時間維度對兩維異質(zhì)性結(jié)構(gòu)進(jìn)行融合,λ(τ)和γ(τ)表示控制懲罰力度的調(diào)節(jié)參數(shù)。常用的Lasso懲罰函數(shù)pλ(t)=λt對所有的或使用相同的閾值,因此過度收縮了較大的模型參數(shù),導(dǎo)致估計量存在偏差并且可能無法正確識別模型的異質(zhì)性結(jié)構(gòu)。因此,本文使用能夠產(chǎn)生無偏估計的懲罰函數(shù),包括Fan和Li(2001)[10]提出的SCAD懲罰函數(shù):
Zhang(2010)[11]提出的MCP懲罰函數(shù):
其中:(?)+=max(0,?);a表示控制懲罰函數(shù)凹性的參數(shù),在本文中視作一個固定常數(shù);t表示基于個體維度或時間維度模型參數(shù)的差異,即‖βit(τ)-βjt(τ) ‖或‖βit(τ)-βit′(τ) ‖。SCAD 懲罰函數(shù)和MCP 懲罰函數(shù)均為漸進(jìn)無偏的,能夠更加精確地識別模型參數(shù)的異質(zhì)性結(jié)構(gòu)。特別地,當(dāng)a→+∞時,SCAD懲罰函數(shù)和MCP懲罰函數(shù)收斂到Lasso懲罰函數(shù)。
對于給定的λ(τ)和γ(τ),參數(shù)估計量可通過最小化目標(biāo)函數(shù)給出:
考慮到最小化目標(biāo)函數(shù)S(β(τ);γ(τ),λ(τ))這一無約束優(yōu)化問題的顯式解不存在,本文擬使用求解優(yōu)化問題的交替方向乘子法(Alternating Direction Method of Multipliers,ADMM)估計分位點τ處的斜率系數(shù)β(τ)?;谀繕?biāo)函數(shù)S(β(τ);γ(τ),λ(τ)),考慮如下約束條件:
其中,ηij,t(τ)表示在分位點τ處和相同的時間點t不同個體i和j之間斜率系數(shù)的差異,θi,tt′(τ)表示在分位點τ處同一個體i在不同時間點t和t′之間斜率系數(shù)的差異。因此,可以將原有的無約束優(yōu)化問題轉(zhuǎn)化成有約束的優(yōu)化問題:
其中,η(τ)=(t(τ),i 本文使用ADMM 算法,從給定的初始值開始逐步更新β(τ)、η(τ)、θ(τ)、v(τ)和w(τ)的迭代值。假設(shè)第s步的迭代值β(s)(τ)、v(s)(τ)和w(s)(τ)是已知的,第s+1 步使用ADMM 算 法 獲 得 迭 代 值β(s+1)(τ) 、η(s+1)(τ) 、θ(s+1)(τ) 、v(s+1)(τ)和w(s+1)(τ)的具體步驟為:(1)根據(jù)β(s)(τ)、v(s)(τ)和w(s)(τ),更新迭代值η(s+1)(τ)和θ(s+1)(τ);(2)根據(jù)v(s)(τ)和w(s)(τ)以及第一步迭代得到的η(s+1)(τ)和θ(s+1)(τ),更新斜率系數(shù)的迭代值β(s+1)(τ);(3)根據(jù)相關(guān)參數(shù),更新迭代值v(s+1)(τ)和w(s+1)(τ)?;谝陨喜襟E,更新迭代值的詳細(xì)過程為: 首先,更新迭代值η(s+1)(τ)和θ(s+1)(τ)的子優(yōu)化問題為: 使用不同的懲罰函數(shù),即使在目標(biāo)函數(shù)不可導(dǎo)的情況下,依然能使用凸分析中的次微分得到和的迭代公式。 如果參數(shù)滿足a>max(1/φ+1,1/?+1)并且使用SCAD懲罰函數(shù),那么迭代公式為: 其中,ST(z,t)=(1-t/‖ω‖ )+ω表示軟閾值算子(Soft Thresholding Operator),并且(?)+=max(0,?)。 如果參數(shù)滿足a>max(1/φ,1/?)并且使用MCP懲罰函數(shù),那么迭代公式為: 其次,模型斜率系數(shù)的迭代值β(s+1)(τ)可以通過如下無約束最優(yōu)化問題計算: 其中,η(s+1)(τ)、θ(s+1)(τ)、v(s)(τ)和w(s)(τ)均已知。目標(biāo)函數(shù)等價于: 最后,使用對偶上升法(Dual Ascent)計算對偶變量v(τ)和w(τ)的迭代值,迭代方向取增廣拉格朗日目標(biāo)函數(shù)L對對偶變量的次微分,迭代步長選擇固定的懲罰參數(shù)φ和?。因此,(τ)和(τ)的計算公式為: 本文使用蒙特卡洛模擬驗證提出的基于雙懲罰最小加權(quán)絕對偏差目標(biāo)函數(shù)系數(shù)估計量的有限樣本性質(zhì)。每輪蒙特卡洛模擬使用的數(shù)據(jù){yit,xit}(i=1,…,N;t=1,…,T)基于如式(26)所示的數(shù)據(jù)生成過程得到。不失一般性,考慮二變量面板數(shù)據(jù)模型: 其中,N=10,20,T=10,20,固定效應(yīng)項μit和解釋變量系數(shù)ηit具有相同的兩維異質(zhì)性結(jié)構(gòu)。假設(shè)兩維異質(zhì)性結(jié)構(gòu)的數(shù)量為L=2,并且每一個兩維異質(zhì)性結(jié)構(gòu)系數(shù)的真實值為α1=(-2,3)和α2=(3,5)。具體兩維異質(zhì)性結(jié)構(gòu) 可 任 意 設(shè) 定,例 如N=20 和T=20 ,當(dāng)6 ≤i≤8 且8 ≤t≤12,以及9 ≤i≤13 且6 ≤t≤15 時,(i,t)屬于兩維異質(zhì)性結(jié)構(gòu)B2;否則,(i,t)屬于兩維異質(zhì)性結(jié)構(gòu)B1。B1和B2元素數(shù)量的比例 |B1|:|B2|≈5:1。假設(shè)xit的生成過程滿足: 本文在蒙特卡洛模擬的過程中選擇重復(fù)次數(shù)n=200 。調(diào)節(jié)參數(shù)λ和γ的網(wǎng)格搜索篩選范圍為[0.1,1.9],搜索步長為0.2。為了驗證估計量的有限樣本性質(zhì),本文將基于SCAD 懲罰函數(shù)和MCP 懲罰函數(shù)的估計結(jié)果與Post 估計量(見式(28))和Oracle 估計量(見式(29))進(jìn)行比較。 其中,B?表示兩維異質(zhì)性結(jié)構(gòu)的估計值,L?表示兩維異質(zhì)性結(jié)構(gòu)數(shù)量的估計值,B0表示兩維異質(zhì)性結(jié)構(gòu)的真實值,L0表示兩維異質(zhì)性結(jié)構(gòu)數(shù)量的真實值。根據(jù)參數(shù)α的估計量和相應(yīng)的兩維異質(zhì)性結(jié)構(gòu),能夠得到參數(shù)β的Post估計量和Oracle估計量。 為了評估模型參數(shù)估計結(jié)果的精確度,下頁表1和表2分別匯報了基于同方差假設(shè)和異方差假設(shè)的中位點處、0.25 分位點處和0.75 分位點處系數(shù)估計值的均方誤差和平均偏差。結(jié)果顯示,在各分位點處,本文提出的應(yīng)用SCAD 懲罰函數(shù)和MCP 懲罰函數(shù)的參數(shù)估計方法的估計結(jié)果相似,并且Post 估計量的RMSE 與Bias 和Oracle 估計量差別不大。 表1 同方差假設(shè)下參數(shù)估計的RMSE和Bias 表2 異方差假設(shè)下參數(shù)估計的RMSE和Bias 為了檢驗本文提出的兩維異質(zhì)性結(jié)構(gòu)識別方法的準(zhǔn)確性,下頁表3和表4分別匯報了同方差假設(shè)下和異方差假設(shè)下不同分位點處兩維異質(zhì)性結(jié)構(gòu)估計的準(zhǔn)確率和Rand 指數(shù)。結(jié)果表明,本文提出的方法在所有情況下都能準(zhǔn)確地識別各分位點處的兩維異質(zhì)性結(jié)構(gòu),而且基于SCAD 懲罰函數(shù)和MCP 懲罰函數(shù)的估計方法在兩維異質(zhì)性結(jié)構(gòu)識別方面的表現(xiàn)相近。 表3 同方差假設(shè)下兩維異質(zhì)性結(jié)構(gòu)估計的Acc和RI 表4 異方差假設(shè)下兩維異質(zhì)性結(jié)構(gòu)估計的Acc和RI 本文將提出的雙懲罰最小加權(quán)絕對偏差估計方法應(yīng)用于2009—2019 年我國31 個省份(不含港澳臺)的GDP數(shù)據(jù),以識別不同省份和不同年份經(jīng)濟(jì)發(fā)展的兩維異質(zhì)性結(jié)構(gòu)并進(jìn)行參數(shù)估計,研究使用的數(shù)據(jù)來源于國家統(tǒng)計局官網(wǎng)。考慮如下兩維異質(zhì)性面板分位數(shù)模型: 其中,l n(GDPit)表示省份i第t年人均GDP的自然對數(shù)值,t=0 對應(yīng)于2009 年,βit(τ)=(βit,0(τ),βit,1(τ),βit,2(τ))Τ表示具有未知兩維異質(zhì)性結(jié)構(gòu)的異質(zhì)性斜率系數(shù),(i,t)?Bl,{B1,B2,…,BL}表示未知的兩維異質(zhì)性結(jié)構(gòu),εit(τ)表示隨機(jī)誤差項。調(diào)節(jié)參數(shù)λ(τ)和γ(τ)的選擇范圍為[0.1,1.9],步長為0.2,考慮τ=0.25,τ=0.5 和τ=0.75 三個分位點。應(yīng)用本文方法估計上述模型,估計結(jié)果表明,各分位點處的兩維異質(zhì)性結(jié)構(gòu)數(shù)量L?(τ)均為2。 表5列出了模型的參數(shù)估計結(jié)果,發(fā)現(xiàn)各分位點處識別出不同兩維異質(zhì)性結(jié)構(gòu)的參數(shù)存在顯著差異。首先,不同兩維異質(zhì)性結(jié)構(gòu)的截距項在各分位點處均存在顯著差異;其次,GDP 一階滯后項的系數(shù)即自回歸系數(shù)在不同兩維異質(zhì)性結(jié)構(gòu)下和不同分位點處均顯著但差距較?。蛔詈?,各分位點處不同兩維異質(zhì)性結(jié)構(gòu)之間時間斜率系數(shù)的差異主要體現(xiàn)在其顯著性上,其中一個兩維異質(zhì)性結(jié)構(gòu)時間的斜率系數(shù)顯著,而另一個兩維異質(zhì)性結(jié)構(gòu)的系數(shù)不顯著。上述結(jié)果表明,我國各省份在研究期間的經(jīng)濟(jì)發(fā)展?fàn)顩r存在兩維異質(zhì)性,本文提出的方法實現(xiàn)了對兩維異質(zhì)性結(jié)構(gòu)的估計。 表5 各分位點處不同兩維異質(zhì)性結(jié)構(gòu)的參數(shù)估計結(jié)果 本文研究了具有兩維異質(zhì)性結(jié)構(gòu)的面板分位數(shù)模型及其參數(shù)估計問題。利用SCAD 懲罰函數(shù)和MCP 懲罰函數(shù)在個體維度和時間維度上對異質(zhì)性參數(shù)進(jìn)行融合,構(gòu)建了雙懲罰最小加權(quán)絕對偏差目標(biāo)函數(shù),并通過設(shè)計ADMM迭代算法求解該目標(biāo)函數(shù),實現(xiàn)了參數(shù)估計和兩維異質(zhì)性結(jié)構(gòu)識別。根據(jù)蒙特卡洛模擬驗證了雙懲罰估計量的有限樣本性質(zhì),無論基于同方差假設(shè)還是異方差假設(shè),本文提出的方法均能準(zhǔn)確地識別各分位點處的兩維異質(zhì)性結(jié)構(gòu),并且Post估計量的RMSE和Bias接近于假設(shè)真實兩維異質(zhì)性結(jié)構(gòu)已知的Oracle估計量。進(jìn)一步地,將本文方法應(yīng)用于中國省級GDP回歸的估計,估計結(jié)果表明,我國各省份在研究期間的經(jīng)濟(jì)增長存在兩維異質(zhì)性,本文提出的方法能夠識別這種兩維異質(zhì)性結(jié)構(gòu)。2 蒙特卡洛模擬
2.1 數(shù)據(jù)生成過程
2.2 蒙特卡洛模擬結(jié)果
3 應(yīng)用
4 結(jié)論