陳 芳,胡二琴
(湖北工業(yè)大學 理學院,武漢 430068)
面板數據綜合了時間序列和截面數據的特征,成為了統(tǒng)計學和計量經濟學分析的熱點領域。近二十年來,面板數據的參數(通常是線性)模型分析得到了統(tǒng)計學者熱切的關注,并被廣泛地應用在實證研究中。參數模型可以簡單地描述和分析響應變量與協(xié)變量之間的關系,然而它們往往受到模型錯誤規(guī)范的影響,從而導致建模偏差。為了克服這一缺點,非參數和半參數面板數據回歸模型近年來引起了計量經濟學領域許多研究者的注意。Henderson等[1]和Li 等[2]研究了非參數模型的估計。Baltagi 和Li[3]、Su和Ullah[4]與Zhang等[5]提出了具有固定效應的部分線性面板數據模型。Rodriguez-Poo和Soberon[6]提出了一種基于一階差分和局部線性回歸的變化系數函數估計新技術。趙明濤[7]基于變系數縱向數據模型研究了漸進懲罰估計問題。其中部分線性變系數模型受到了廣泛的關注,Seong 和Byeong[8]研究了部分線性變系數模型在系數函數有不同平滑變量時的有效估計。Fan和Huang[9]提出了采用輪廓最小二乘估計法估計部分線性變系數模型,證明了估計量的漸進性質,得出了對于半參數面板數據模型的估計,輪廓最小二乘估計法估計良好的結論。
在前人研究基礎上,本文將固定效應引入到部分線性變系數面板數據模型中,通過引入虛擬變量和采用輪廓最小二乘估計法估計模型,最后采用Monte Carlo隨機模擬法驗證模型的估計效果。
本文考慮如下具有固定效應的部分線性變系數面板數據模型
若記
其中In是n維單位矩陣,1T是元素均為1的T維列向量,D 為In與1T的克羅內克積,則模型(1)的矩陣形式為
因為模型(1)中αi作為個體固定效應,具有不可觀測性,與Xit,Zit具有某種未知的相關結構,在對模型進行估計的過程中要去除αi對Xit,Zit的影響。為了消除αi的影響,在模型(2)兩邊同乘矩陣W=InT-D(DTD)-1DT,由于WD=D-D(DTD)-1DTD=0,則模型(2)可轉化為
本文采用輪廓最小二乘估計法估計模型(3)中的未知參數與未知函數[10]。具體步驟如下。
第一步:假設未知函數β(·)=(β1(·),…,βp(·))T已知,估計未知參數θ。
若β(·)=(β1(·),…,βp(·))T已知,則模型(3)可改寫成線性模型
利用最小二乘法可得θ 的估計值為
第二步:估計未知函數β(·)=(β1(·),…,βp(·))T。
將模型(6)整理可得非參數模型
其中Q=W-WZT(ZWZT)-1ZW 為冪等矩陣。
為了估計模型(7)的未知函數β(·)=(β1(·),…,βp(·))T,最小化目標函數
非參數模型中未知函數的估計有多種方法[11],本文采用B樣條基函數近似方法來估計未知函數。
將式(9)代入式(8),令其對γ 的導數為0可得γ 的估計值為
其中,Sit=Ip?B(Uit)·Xit,i=1,2,..,n t=1,2,...,T
因此,未知函數β(·)的估計值為
將Dα=D0α0代入模型(2)可得
其中
對于α0的估計,將模型(11)改寫成線性模型
通過最小二乘法得出α0的估計值
上文利用B樣條基函數來擬合未知函數,并采用輪廓最小二乘估計法估計固定效應部分線性變系數面板數據模型,本節(jié)利用Monte Carlo 模擬評估所得估計量的估計效果和模型擬合效果。為了評估參數θ 和未知函數β(·)的估計效果,對于參數θ 的估計量θ^ 計算均方誤差(MSE),對于未知函數β(·)的估計量β^(·)計算均方根誤差(RMSE)。為了評估模型的擬合效果,對于模型擬合效果的評估計算平均絕對誤差(MAE)。本文中計算均方誤差(MSE)、均方根誤差(RMSE)和平均絕對誤差(MAE)的方法如下:
模擬1 考慮如下模型:
(1)Xit,1,Xit,2,Xit,3,Xit,4均為來自于均勻分布U(-0.8,0.8)的樣本。
(2)Uit為來自于均勻分布U(-0.8,0.8)的樣本,函數β(u)的形式如下:
(3)Zit,1為來自于均勻分布U(-1,1)的樣本,Zit,2為來自于均勻分布U(-2,2)的樣本,
(4)參數θ1=2,θ2=3。
(5)固定效應αi為來自于正態(tài)分布N(0,1)的樣本,隨機誤差項εit服從正態(tài)分布N(0,0.04)。
(6){Zit} 、{ Xit} 均和{εit} 相互獨立。
模擬2考慮如下模型:
(1)Xit,1,Xit,2為來自于服從正態(tài)分布N(0,0.16)的樣本。
(2)Uit為來自于均勻分布U(-0.8,0.8)的樣本,函數β(u)的形式如下:
(3)Zit,1為來自于正態(tài)分布N(1,2.25)的樣本,Zit,2為來自于正態(tài)分布N(0,1.69)的樣本。
(4)參數θ1=2,θ2=3。
(5)固定效應αi為來自于正態(tài)分布N(0,1)的樣本,隨機誤差項εit服從正態(tài)分布N(0,0.04)。
(6){Zit} 、{ Xit} 均和{εit} 相互獨立。
針對模擬1和模擬2,本文選取3次B樣條基函數來擬合未知函數βk(Uit),節(jié)點為均勻節(jié)點,取時間長度分別為T=4和T=6,樣本量分別為n=50,n=100,n=150。
模擬1的數據生成及參數與未知函數估計過程如下:
(1)首先生成解釋變量Xit=(Xit,1,Xit,2,Xit,3,Xit,4)和Z=(Zit,1,Zit,2),Uit、固定效應αi與隨機誤差項εit的觀測值,然后根據模型(14)計算出yit;
模擬2與模擬1的數據生成參數、未知函數和被解釋變量擬合值的過程一致。
使用MATLAB軟件對每一個數據的生成過程進行模擬,模擬次數為1000次,記錄每一次的模擬結果,并計算評價指標MSE、RMSE和MAE。
根據表1可以看出,兩個模擬下參數θ 的估計值和真實值,在樣本量n和時間長度T不斷變化的情況下均較為接近。說明了參數估計量在解釋變量取自于不同分布的情況下均具有較好的估計準確性,表明了估計方法的優(yōu)良性。
表1 參數θ 的模擬效果
首先,固定時間長度為T=4或T=6,隨著樣本量n的不斷增加,均方誤差(MSE)在逐漸減小。固定樣本量n=50、n=100或n=150,隨著時間長度T的增加,均方誤差(MSE)在逐漸減小。當同時增加n和T時,均方誤差(MSE)在逐漸減小。
根據表2可以看出,兩個模擬下未知函數β(·)的估計值和真實值,在樣本量n和時間長度T不斷變化的情況下均較為接近。說明了未知函數估計量在解釋變量取自不同分布的情況下均具有較好的估計準確性,表明了估計方法的優(yōu)良性。
表2 未知函數β(·)的模擬效果
首先,固定時間長T=4或T=6,隨著樣本量n的不斷增加,均方根誤差(RMSE)在逐漸減小。固定樣本量為n=50、n=100或n=150,隨著時間長度T的增加,均方根誤差(RMSE)在逐漸減小。當同時增加n和T時,均方根誤差(RMSE)在逐漸減小。
圖1 和圖2 分別繪制了當樣本量n=50,時間長度T=4 和樣本量n=150,時間長度T=6 時,模擬1 中函數β1(Uit)、β2(Uit)、β3(Uit)和β4(Uit)的估計效果。
圖3 和圖4 分別繪制了當樣本量n=50,時間長度T=4 和樣本量n=150,時間長度T=6 時,模擬2 中函數β1(Uit)和β2(Uit)的估計效果。
圖3 n=50,T=4 模擬2中β1(Uit)、β2(Uit)的估計結果
同樣,從圖1至圖4可以看出,模擬1和模擬2中未知函數的估計值和真實值在各種情況下均較為接近。同時,從圖1和圖2中可以觀察到估計在峰值處存在“高峰低估,低峰高估”的趨勢。
圖1 n=50,T=4模擬1中β1(Uit)、β2(Uit)、β3(Uit)和β4(Uit)的估計結果
圖2 n=150,T=6 模擬1中β1(Uit)、β2(Uit)、β3(Uit)和β4(Uit)的估計結果
圖4 n=150,T=6 模擬2中β1(Uit)、β2(Uit)的估計結果
圖5和圖6分別繪制了當樣本量n=50,時間長度T=4和樣本量n=150,時間長度T=6時,yit在模擬1和模擬2中的估計結果。
根據圖5和圖6,可以看出在模擬1和模擬2中yit的估計值和真實值在各種情況下均較為接近,表明了模型的擬合效果良好。
圖5 模擬1中yit的估計結果
圖6 模擬2中yit的估計結果
根據表3可以看出,兩個模擬下被解釋變量的估計值和真實值,在樣本量n和時間長度T不斷變化的情況下均較為接近。說明了被解釋變量在解釋變量取自不同分布的情況下均具有較好的估計準確性,表明了模型的擬合效果良好。
表3 被解釋變量的擬合效果
首先,固定時間長度T=4或T=6,隨著樣本量n的不斷增加,平均絕對誤差(MAE)在逐漸減小。固定樣本量為n=50、n=100或n=150,隨著時間長度T的增加,平均絕對誤差(MAE)在逐漸減小。當同時增加n和T時,平均絕對誤差(MAE)逐漸減小。
本文研究面板數據模型,將參數模型的特點和非參數模型的特點融合在一起,相較于一般的模型,本文的模型引入了不可觀測的個體固定效應,可以在很大程度上減輕內生性問題。
本文在采用輪廓最小二乘法估計模型的未知參數和未知函數的過程中,采用B樣條基函數法近似未知函數。同時,還利用Monte Carlo模擬,結合模擬1和模擬2的結果,考察了當解釋變量為取自于均勻分布和正態(tài)分布的樣本時,估計量的估計效果和模型擬合效果,最終說明了估計方法在有限樣本下具有良好的估計效果,模型的擬合效果良好。