姜 磊
(浙江財經大學 經濟學院, 浙江 杭州 310018)
?
【統(tǒng)計理論與方法】
空間回歸模型選擇的反思
姜磊
(浙江財經大學 經濟學院, 浙江 杭州 310018)
空間計量經濟學存在兩種最基本的模型:空間滯后模型和空間誤差模型,這里旨在重新思考和探討這兩種空間回歸模型的選擇,結論為:Moran’sI指數(shù)可以用來判斷回歸模型后的殘差是否存在空間依賴性;在實證分析中,采用拉格朗日乘子檢驗判斷兩種模型優(yōu)劣是最常見的做法。然而,該檢驗僅僅是基于統(tǒng)計推斷而忽略了理論基礎,因此,可能導致選擇錯誤的模型;在實證分析中,空間誤差模型經常被選擇性遺忘,而該模型的適用性較空間滯后模型更為廣泛;實證分析大多缺乏空間回歸模型設定的探討,Anselin提出三個統(tǒng)計量,并且,如果模型設定正確,應該遵從Wald統(tǒng)計量>Log likelihood統(tǒng)計量>LM統(tǒng)計量的排列順序。
空間計量經濟學模型;空間滯后模型;空間誤差模型;拉格朗日乘子檢驗
空間計量經濟學(Spatial Econometrics)是近年來學術界較為關注的一門學科??臻g計量經濟學這一術語最早是由Paelinck和Klaassen提出[1]。Cliff和Ord在這個領域進行了開拓性的工作[2]。由此,引出了空間計量經濟學模型的開端。Anselin在1988年出版的《空間計量經濟學:方法與模型》一書是這個領域中的一座里程碑[3]。該書對空間計量經濟學理論做了系統(tǒng)地整理和深入地探索。隨后,很多學者被吸引到該領域進行更為深入地研究,這其中包括Cressie、Kelejian、Anselin、 Florex、LeSage、Elhorst等[4-8]。
空間計量經濟學模型在國內外的各個學科應用非常廣泛,已經得到了學術界的認可。在空間計量經濟學發(fā)展的近40年中,出現(xiàn)了多種空間計量經濟學模型。其中,應用最為廣泛的有兩個模型:空間滯后模型和空間誤差模型。近年來,這兩個基本的空間計量模型在實證分析中應用十分廣泛,尤其是空間滯后模型及其衍生模型,是大多數(shù)實證分析文章所經常采用的模型,空間誤差模型則通常被選擇性忽視。那么,空間滯后模型是否存在適用范圍?Anselin提出的拉格朗日乘子檢驗是否是判斷空間計量模型選擇的唯一依據(jù)呢?空間誤差模型為什么被忽略?該模型有什么樣的優(yōu)點?這些將是本文探討的主要問題。
(一)數(shù)據(jù)來源
本文實證分析數(shù)據(jù)集采用的是Anselin用到的著名案例:Columbus犯罪數(shù)據(jù)。該數(shù)據(jù)集包含49個觀察值,本文主要涉及到3個變量,即因變量CRIME和兩個自變量INC和HOVAL。其中,CRIME表示每千戶中的入室搶劫和盜竊車輛的案件數(shù)量;INC表示家庭收入,單位為1 000美元;HOVAL表示房屋價格,單位為1 000美元。
表1 變量定義、單位以及描述性統(tǒng)計
(二)空間滯后模型與空間誤差模型
通常來說,在進行空間計量經濟學模型分析時,需要一個基準模型用以對比參考。普通最小二乘模型是最常見的基準模型,如公式(1)所示:
CRIME=α+β1INC+β2HOVAL+ε
(1)
式(1)中,α表示常數(shù)項,β為待估計的參數(shù),ε表示隨機誤差項。
相應地,空間滯后模型如式(2)所示:
CRIME=α+ρWCRIME+β1INC+β2HOVAL+ε
(2)
式(2)中,ρ表示因變量空間滯后項的待估計參數(shù),也被稱為空間自回歸系數(shù)。W表示空間權重矩陣。其他同公式(1)。
空間誤差模型如式(3)所示:
CRIME=α+β1INC+β2HOVAL+ε
(3)
ε=λWε+μ其中,λ為空間自相關誤差項的待估計系數(shù),也被稱為空間自相關系數(shù)。μ為誤差項。其他同式(1)。
(三)空間計量經濟學建模一般流程
Anselin針對空間計量經濟學建模給出了實證分析的流程圖(圖1)。
圖1 空間計量模型決策流程圖
由圖1可知,空間計量經濟學建模首先要從OLS模型開始,用OLS回歸后的殘差進行拉格朗日乘子檢驗(LagrangeMultiplierTest,LM)。該檢驗包含兩個統(tǒng)計量:即LM-Error和LM-Lag。如果這兩個統(tǒng)計量均不顯著,則選擇OLS模型作為最終模型;若只有一個統(tǒng)計量顯著,那么LM-Error統(tǒng)計量顯著則指向空間誤差模型,而LM-Lag統(tǒng)計量顯著則指向空間滯后模型。如果兩個統(tǒng)計量均顯著,Anselin提出了穩(wěn)健性(Robust)的拉格朗日乘子檢驗(RobustLMtest),相應地該檢驗也包含兩個統(tǒng)計量,即RobustLM-Error和RobustLM-Lag。其中,若RobustLM-Error統(tǒng)計量顯著則指向空間誤差模型,而RobustLM-Lag統(tǒng)計量顯著則指向空間滯后模型。
(一)空間滯后模型和空間誤差模型結果
在空間計量模型回歸之前,很多實證分析的論文通常做法是對因變量進行全域空間自相關分析,用來描述空間單元的某個要素的觀察值與相鄰空間單元元素的觀察值是否相近。全域空間自相關分析一般采用的測度指標是Moran’sI指數(shù)。其公式如下所示[9]:
I=
(4)
在對本例數(shù)據(jù)進行空間計量經濟學模型回歸之前,先對CRIME變量進行全域空間自相關進行分析。計算結果顯示:CRIME變量的Moran’sI指數(shù)為0.500 2,其概率值為0.001,也就是說,CRIME變量存在顯著的正向空間自相關現(xiàn)象。
在空間計量建模之前對因變量進行空間自相關檢驗是很多中文文獻的通常做法。需要指出的是:因變量是否存在空間自相關現(xiàn)象與是否在模型右邊添加因變量的空間滯后項并非必要條件,盡管有時候因變量存在顯著的空間自相關現(xiàn)象。
在拉格朗日乘子檢驗發(fā)表之前,空間自相關檢驗應用在檢驗模型回歸后的殘差是否存在空間自相關現(xiàn)象[11]。如果殘差存在空間自相關現(xiàn)象,那么應該通過添加因變量的空間滯后項(即建立空間滯后模型)或者添加空間自相關誤差項(即建立空間誤差模型)來消除殘差中的空間自相關現(xiàn)象。
接下來,對模型進行回歸分析。首先對模型(1)采用OLS進行回歸,然后計算OLS模型殘差的Moran’sI指數(shù)。結果顯示,殘差的Moran’sI指數(shù)為0.222 1,其概率值為0.006 0(見表2),表明了在1%的顯著性水平下拒絕了“無空間自相關”的原假設,即殘差存在顯著的空間自相關現(xiàn)象。換言之,空間單元的殘差值與相鄰空間單元的殘差值相近。因此,需要處理OLS模型殘差存在的空間自相關問題。
表2 6種模型回歸后的殘差Moran’s I指數(shù)
盡管Moran’sI檢驗顯示殘差存在顯著的空間自相關,但是該檢驗并不能判斷是否應該選擇空間滯后模型還是空間誤差模型。因此,需要通過拉格朗日乘子檢驗來進行判斷,檢驗結果見表3。
表3 拉格朗日乘子檢驗結果
首先,分析OLS回歸的結果。由表3可知,兩個自變量INC和HOVAL均顯著為負,說明提高家庭收入和房屋價格有助于降低入室搶劫和盜竊車輛案件發(fā)生的數(shù)量。再來分析拉格朗日乘子檢驗的結果。LM-Lag和LM-Error兩個統(tǒng)計量均在1%水平下顯著,根據(jù)圖1來看,需要通過穩(wěn)健性的拉格朗日乘子檢驗來進一步判斷:即RobustLM-Lag和RobustLM-Error統(tǒng)計量來進行判斷。由表3可知,RobustLM-Lag統(tǒng)計量在5%的水平下拒絕了原假設,因此,應該選擇空間滯后模型。
接下來對模型(2)也就是空間滯后模型進行極大似然估計,回歸結果如表4所示。
表4 空間滯后模型和空間滯后模型估計結果
先來分析空間滯后模型回歸結果。由表4可知,兩個自變量INC和HOVAL均顯著為負,說明提高家庭收入和房屋價格有助于降低入室搶劫和盜竊車輛案件發(fā)生的數(shù)量。因變量空間滯后項W*CRIME顯著為正,說明周圍鄰居地區(qū)入室搶劫和盜竊車輛案件發(fā)生的數(shù)量越多,那么核心地區(qū)入室搶劫和盜竊車輛案件發(fā)生的數(shù)量也會增多。
再來比較OLS模型和空間滯后模型。由于空間滯后模型的擬合優(yōu)度R2與OLS擬合優(yōu)度R2不同,因此二者之間不可通過大小來進行比較[3]。Anselin給出了3個統(tǒng)計量來進行模型的比較,分別是Log Likelihood(對數(shù)似然值),Akaike Info Criterion(赤池信息準則)和Schwarz Criterion(施瓦茨信息準則)[3]。其中,Log Likelihood統(tǒng)計量越大說明模型越好,而Akaike Info Criterion和Schwarz Criterion統(tǒng)計量越小說明模型越好。通過比較表3和表4可知,空間滯后模型的Log Likelihood(-182.674)大于OLS模型的Log Likelihood(-187.38),而Akaike Info Criterion(373.348)和Schwarz Criterion(380.915)均分別小于OLS模型的Akaike Info Criterion(380.75)和Schwarz Criterion(386.43)。通過這3個統(tǒng)計量可知,空間滯后模型的確優(yōu)于OLS模型。
那么,空間滯后模型是否消除了殘差中的空間自相關呢?可以通過Moran’sI檢驗來進行判斷。結果顯示(見表2),空間滯后模型殘差的Moran’sI指數(shù)為0.033 1,其概率值為0.264 0,表明了空間滯后模型的殘差不存在空間自相關。
實際上,Moran’sI檢驗只是一種簡單的判別殘差是否存在空間自相關的方法,與因變量的空間滯后項(W*CRIME)和空間滯后誤差項(Wε)在模型中是否顯著并無關系。Anselin給出了3種統(tǒng)計量檢驗空間滯后項是否顯著[3],即Wald統(tǒng)計量、Likelihood Ratio統(tǒng)計量(LR)和拉格朗日乘子統(tǒng)計量(LM),這三個統(tǒng)計量大小排列應遵從Wald>LR>LM。在有限樣本情況下,若這3個統(tǒng)計量排列不遵從這個順序,則模型設定可能有誤。從空間滯后模型結果來看,完全遵從這種排序,即Wald(12.546 9)>LR(9.406 5)>LM(8.898 0),并且,這3個統(tǒng)計量均在1%顯著性水平下強烈地拒絕了原假設,說明空間滯后模型是合適的。
盡管拉格朗日乘子檢驗結果指向了空間滯后模型,表4也給出了空間誤差模型的回歸結果。2個自變量INC和HOVAL同樣顯著為負,而空間自相關系數(shù)λ也顯著為正,說明殘差存在空間依賴性。
那么,空間誤差模型是否也能消除殘差中的空間依賴性呢?可以通過Moran’sI指數(shù)來進行判斷,檢驗結果顯示(見表2):空間誤差模型回歸后殘差(式(3)中的μ)的Moran’sI指數(shù)為0.012 2,其概率值為0.352 0,表明了空間誤差模型的殘差也不存在空間依賴性。而空間誤差模型中的空間自相關誤差項的顯著性檢驗結果顯示:3個統(tǒng)計量也遵從Anselin提出的排列順序,即Wald(15.685 7)>LR(7.255 6)>LM(5.206 2)。說明空間誤差模型至少從統(tǒng)計檢驗上來說也是合適的。
(二)空間回歸模型的討論
首先,空間滯后模型和空間誤差模型各自的空間滯后項在統(tǒng)計上非常顯著,并且Wald、LR和LM這3個統(tǒng)計量排列順序也顯示出這2個空間回歸模型分別也都是合適的。接下來,通過前述介紹的Log Likelihood、Akaike Info Criterion和Schwarz Criterion這3個統(tǒng)計量來橫向比較這2個空間回歸模型。由表4可知,兩個空間回歸模型的3個統(tǒng)計量在大小上都極為接近,盡管空間滯后模型中這3個統(tǒng)計量每一個都略微優(yōu)于空間誤差模型的,即Log likelihood-Lag(-182.674)>Log likelihood-Error(-183.750);Akaike Info Criterion-Lag(373.348)
接下來,通過理論基礎來進一步判斷空間滯后模型是否合適。
本例實證分析采用空間滯后模型是合適的,這不僅僅是因為統(tǒng)計檢驗的結果支持這一結論,更重要的是從理論基礎上也支持空間滯后模型的設定。因變量空間滯后項W*CRIME顯著為正,表明了周圍鄰近地區(qū)的入室搶劫和盜竊輛案件會嚴重影響中心地區(qū)的相同犯罪現(xiàn)象的發(fā)生。這不僅可以從犯罪學上很容易得知,而且從常識的角度也容易理解。當一個地區(qū)發(fā)生犯罪事件后,犯罪嫌疑人往往可能會流竄到其他鄰近地區(qū)作案,存在非常明顯的空間溢出效應。這種地理空間之間的交互效應通過空間滯后項表達出來。
由此可見,空間效應的合理性應該是空間計量經濟學建模的理論基礎,而不僅僅是通過拉格朗日乘子檢驗來進行判斷,兩者的結合才是有效的空間計量模型設定的基礎。實際上,空間滯后模型的應用是非常受限的,在使用上不如空間誤差模型廣泛[3]。這是因為,若要在回歸方程中添加因變量的空間滯后項,即估計空間滯后模型,不僅僅需要拉格朗日乘子檢驗結果的支持,更重要的是需要合理的理論基礎來支持模型。而空間誤差模型則不同,不需要任何的前提假設,并且在數(shù)據(jù)收集過程中,誤差極有可能存在空間依賴性。
(三)空間誤差模型案例的討論
因變量的空間滯后項并非在所有的模型中都是有意義的。例如,Jiang等檢驗中國省域能源強度是否存在二次曲線,其研究的因變量為能源強度,盡管拉格朗日乘子檢驗結果支持空間滯后模型,但是Jiang等仍然選擇空間誤差模型[12]。
這是由于沒有任何理論可以證明鄰近地區(qū)的能源強度可以“直接”作用或者影響中心地區(qū)的能源強度。盡管有文獻支持技術擴散這一說法,也就是說某一地區(qū)的技術可以擴散到其他地區(qū)。然而,這種簡單地闡述能源強度存在技術溢出絕對不是添加因變量空間滯后項的理由。若技術溢出效應存在,那么也應該是通過外生技術變量的空間滯后項表示出來。
另外,技術溢出也不是唯一能決定能源強度的外生因素。實際上,能源強度強烈地受到能源稟賦等強外生因素影響。具體舉例來說,山西是著名的煤炭富集大省。因此,山西省的工業(yè)體系跟煤炭的生產與加工緊密聯(lián)系,工業(yè)用能基本完全來自于低效的煤炭。在山西省的能源消費結構中,煤炭占據(jù)了絕對的主導地位?;诿禾繛橹鞯哪茉促Y源稟賦決定了在山西省這種以重工業(yè)為主的工業(yè)體系,因此山西省的能源強度極高。山西省直接鄰近省份有內蒙古、河北、河南和陜西,這些相鄰省份的技術水平很難說就一定比山西水平高。
假若能源強度指標能夠反映出一定的技術水平,那么河南和陜西的能源強度也處于全國的中間水平,而內蒙古和河北的能源強度也僅僅比山西省略好(根據(jù)2014年統(tǒng)計數(shù)據(jù),作者自己整理)??梢猿姓J省域之間存在技術差異,那么這種并非十分明顯的技術差異是否能通過空間技術溢出決定山西省的能源強度改善,也未可知。盡管有可能較遠并且技術先進的地區(qū)可以進行技術溢出,但是很難在較短的時間內從整體上較快改善山西省的能源強度。這還是由于山西省的工業(yè)體系很難更改以煤炭為主的基本事實。另一個典型的煤炭大省貴州也是如此。
再回到空間計量經濟學模型本身。盡管忽略因變量的空間滯后項,會得到有偏的估計;而忽略誤差的空間滯后項,會得到無偏但是缺乏效率的估計[3,6]。但是,忽略殘差中的空間自相關的風險有時候是相當高的[13]。并且,在很多實證分析情況下,盡管因變量的空間自相關可能顯著,但是缺乏基本的理論基礎,所以在這種情況下,應該轉而考慮由非系統(tǒng)性聯(lián)系所產生的空間依賴性,也就是考慮誤差中的空間依賴性。這是由于在誤差項中有極大的可能性包含著空間依賴性[3]。
(四)空間計量模型的擴展
盡管在某些情況下,添加因變量空間滯后項可能缺乏理論基礎,但是因變量的部分空間依賴性可以通過某些外生變量的空間效應來彌補。例如,在上例中介紹的能源強度變量。技術溢出和擴散也是技術進步的重要來源之一,換言之,從地區(qū)外部獲取先進的技術是本地區(qū)技術進步的重要來源之一。而技術進步又是促使能源強度降低的有效方法之一,所以外界先進的技術通過技術溢出和擴散有助于降低能源強度,而并非鄰近地區(qū)的能源強度可以“直接”影響本地區(qū)的能源強度,因為這個解釋缺乏理論基礎。
因此,添加外生變量的空間滯后項可以產生另一種空間計量經濟學模型,即自變量空間滯后模型(Spatial Lag of X model, SLX)[7],如式(5)所示:
CRIME=α+β1INC+β2W*INC+β3HOVAL+
β4W*HOVAL+ε
(5)
其中W*INC和W*HOVAL分別表示自變量INC和HOVAL的空間滯后項。其他同式(1)。
對模型(5)進行OLS回歸估計,并進行拉格朗日乘子檢驗,結果見表5。
表5 自變量空間滯后模型拉格朗日乘子檢驗結果
由表5可知,自變量INC和HOVAL顯著為負。INC的空間滯后項W*INC也顯著為負,說明鄰近地區(qū)收入提高也可以降低中心地區(qū)犯罪數(shù)量的發(fā)生。但是HOVAL的空間滯后項W*HOVAL估計后的系數(shù)為正,但是并不顯著。
再看表5下方的拉格朗日乘子檢驗結果,LM-Lag和LM-Error兩個統(tǒng)計量均十分顯著,但是Robust LM-Lag和Robust LM-Error兩個統(tǒng)計量均不顯著,在這種情況下,圖1中的分析流程圖不再適用。但是可以看到,統(tǒng)計量LM-Lag大于LM-Error,說明拉格朗日乘子檢驗結果傾向建議在模型中添加因變量的空間滯后項。
由此,又產生了另一種空間計量經濟學模型,即空間杜賓模型(Spatial Durbin Model, SDM)。這種模型是LeSage和Pace極力推薦的,如式(6)所示:
CRIME=α+ρW*CRIME+β1INC+β2W*INC+β3HOVAL+β4W*HOVAL+ε
(6)
同理,可以在空間誤差模型中添加自變量的空間滯后項,則產生了另外一種空間計量經濟學模型,即空間杜賓誤差模型(Spatial Durbin Error Model, SDEM),如式(7)所示:
CRIME=α+β1INC+β2W*INC+β3HOVAL+β4W*HOVAL+ε
(7)
ε=λWε+μ
對空間杜賓模型(6)和空間杜賓誤差模型(7)進行極大似然估計,結果見表6。
表6 空間杜賓模型和空間杜賓誤差模型估計結果
先分析空間杜賓模型的估計結果。自變量INC和HOVAL與空間滯后模型的系數(shù)一樣顯著為負,但是這兩個自變量的空間滯后項W*INC和W*HOVAL均不顯著。因變量空間滯后項W*CRIME顯著為正。剔除這2個不顯著的自變量空間滯后項則退回到了空間滯后模型。再來看空間杜賓誤差模型。自變量INC和HOVAL同空間誤差模型的系數(shù)一樣顯著為負,但是W*HOVAL不顯著,而W*INC則顯著為負??臻g自回歸系數(shù)λ在統(tǒng)計上也非常顯著。
接下來對比空間杜賓模型和空間杜賓誤差模型的Log Likelihood,Akaike Info Criterion和Schwarz Criterion這3個統(tǒng)計量,由表6可知,這2個空間回歸模型相對應的3個統(tǒng)計量也都極為接近。
最后來看Wald統(tǒng)計量,Likelihood Ratio統(tǒng)計量(LR)和LM統(tǒng)計量。其中,空間杜賓模型這3個統(tǒng)計量并沒有遵從Wald(6.254 0)> LR(4.662 7)> LM(4.827 3)的順序。同理,空間杜賓誤差模型這3個統(tǒng)計量也沒有遵從Wald(6.091 4) > LR (4.383 2)> LM (4.455 1)。說明這2個空間回歸模型設定有誤,導致了極大似然估計和檢驗的統(tǒng)計量的漸進性不再有效。解決的方法是考慮更改模型,例如引入新的自變量或者采用不同的空間權重矩陣[10]。換言之,這并不意味著空間杜賓誤差模型沒有意義,通過引入新的自變量或者采用不同的空間權重矩陣,空間杜賓誤差模型完全有可能成為合適的模型。
LeSage和Pace極力推薦空間杜賓模型,這是由于不僅僅因變量的空間滯后項和外生變量會影響因變量,同樣,外生變量的空間溢出效應也是影響因變量的重要因素。因此,綜合考慮,若實證分析采用了空間滯后模型,則最好擴展為空間杜賓模型。但是,空間杜賓模型也并非沒有缺點。經驗表明:通常需要大量的樣本才能得到顯著的自變量空間滯后項,以及相應的間接效用(有關空間杜賓模型的直接效應和間接效應,可以參考LeSage和Pace出版的著作[7]。這也是實證分析中阻礙空間杜賓模型應用的重要障礙之一。
在實證分析中,空間杜賓誤差模型極少得到應用[14]。但是,這并非意味著該模型沒有應用價值。實際上,空間誤差模型應用范圍比空間滯后模型要廣泛[3]。同理,空間杜賓誤差模型在實證分析上也極為有應用價值。這是因為,空間杜賓誤差模型不僅可以囊括想要檢驗感興趣的外生變量的空間效應的顯著性,同時也考慮到了誤差中的空間依賴性。
另外,空間杜賓誤差模型在應用上較空間杜賓模型有一個明顯的優(yōu)點,那就是空間杜賓誤差模型的系數(shù)可以像OLS回歸后的系數(shù)一樣直接解釋,而空間杜賓模型的系數(shù)不可以直接解釋。這是由于空間杜賓模型包含因變量的空間滯后項,因此外生變量的系數(shù)和其空間滯后項的系數(shù)不能直接解釋,而是需要計算直接效用和間接效應。然而,空間杜賓誤差模型的回歸系數(shù)則可以直接解釋。以表6最右側的空間杜賓誤差模型回歸結果為例,自變量INC系數(shù)為-1.052 3,該系數(shù)為直接效應,而空間滯后項W*INC系數(shù)為-1.204 9,該系數(shù)為間接效應(也叫做累積鄰近效應)。
由上述例子可知,在分析某因變量的解釋因素及其相應的空間效應時,空間杜賓誤差模型有著天然的優(yōu)勢,尤其在因變量的空間滯后項缺乏理論基礎的時候尤甚。綜上所述,在實證分析研究時,需要反復斟酌因變量的空間滯后項是否有理論依據(jù),盡管Moran’sI檢驗結果顯示因變量存在空間自相關。若沒有強有力的理論基礎,則需要考慮空間杜賓誤差模型。
通過上文分析,本文主要有以下四點結論。
第一,Moran’sI指數(shù)可以用來判斷回歸模型后的殘差是否存在空間自相關現(xiàn)象,若存在,則需要剔除殘差中的空間自相關。
第二,在實證分析中,拉格朗日乘子檢驗結果是判斷兩種模型優(yōu)劣的標準檢驗。但是,該檢驗僅僅是基于統(tǒng)計推斷,而忽略了經濟學的基本理論基礎,也就是說該檢驗并不負責因變量空間滯后項是否有理論基礎。因此,僅僅依據(jù)拉格朗日乘子檢驗結果可能導致錯誤的模型設定。在判斷空間計量經濟學模型時,不應該僅僅依據(jù)拉格朗日乘子檢驗結果,而是結合實際的經濟學意義進行建模。
第三,在實證分析中,有關空間回歸模型設定的探討,Anselin提出三個統(tǒng)計量,并且若模型設定正確,應該遵從Wald統(tǒng)計量 > Log likelihood統(tǒng)計量 > LM統(tǒng)計量。因此,在空間回歸模型的結果中,應該報告出這3個統(tǒng)計量的數(shù)值大小。
最后,在實證分析中,空間誤差模型作為一種空間回歸模型經常被選擇性的遺忘,而該模型的適用性較空間滯后模型要廣泛。在因變量的空間溢出效應缺乏理論基礎時,應當首先考慮誤差可能存在的空間依賴性。而在選擇空間誤差模型時,也應該要考慮到外生變量的空間交互效應,即考慮空間杜賓誤差模型。
[1]Paelinck J, Klaassen L. Spatial Econometrics[M]. Farnborough: Saxon House, 1979.
[2]Cliff A D,Ord J K. Spatial Autocorrelation[M]. London: Pion, 1973.
[3]Anselin L. Spatial Econometrics: Methods and Models[M]. Dordrecht: Kluwer Academic, 1988.
[4]Cressie N. Statistics for Spatial Data[M]. Toronto: Wiley, 1993.
[5]Kelejian H H, Robinson D P. A Suggested Method of Estimation for Spatial Interdependent Models with Autocorrelated Errors and An Application to A County Expenditure Model[J]. Papers in Regional Science, 1993, 72(3).
[6]Anselin L, Florax R, Rey S J. Advances in Spatial Econometrics[M]. Berlin: Springer, 2004.
[7]LeSage J, Pace R K. Introduction to Spatial Econometrics[M]. Boca Raton: CRC Press, 2009.
[8]Elhorst J P. Spatial Econometrics: From Cross-sectional Data to Spatial Panels[M]. Berlin: Springer, 2014.
[9]Anselin L, Bera A K, Florax R, et al. Simple Diagnostic Tests for Spatial Dependence[J]. Regional Science & Urban Economics, 1996, 26(1).
[10]Moran P A P. Notes on Continuous StochasticPhenomena[J]. Biometrika, 1950, 37(1/2).
[11]Cliff A D,Ord J K. Spatial Processes: Models and Applications[M]. London: Pion, 1981.
[12]Jiang L,Folmer H, Ji M. The Drivers of Energy Intensity in China: A Spatial Panel Data Approach[J]. China Economic Review, 2014, 31.
[13]Oberst C, Oelgem?ller J. Economic Growth and Regional Labor Market Development in German Regions[R]. Institute for Future Energy Consumer Needs and Behavior (FCN), RWTH Aachen University,Working Paper, 2014.
[14]Elhorst J P. Applied Spatial Econometrics: Raising the Bar[J]. Spatial Economic Analysis, 2010, 5(1).
(責任編輯:張治國)
The Choice of Spatial Econometric Models Reconsidered in Empirical Studies
JIANG Lei
(School of Economics, Zhejiang University of Finance & Economics, Hangzhou 310018, China)
There are two kinds of basic spatial econometric models: spatial lag model and spatial error model. The aim of this paper is to reconsider the choice of spatial regression models. Four conclusions are drawn:firstly, Moran's I is used to test spatial dependence among residuals in the OLS model. Secondly, in empirical studies Lagrange Multiplier (LM) test is performed to point out which model is in favor of. However, LM test is designed to test for spatial dependence for residuals of regression models, but ignored the vary basic economic theory or theoretical grounds, which may lead to a wrong specification. Hence, the choice of spatial econometric models should be based first on the basic theoretical grounds and then on LM test results. Thirdly, spatial error model ignored in empirical studies is better than spatial lag model to some extent. Finally, empirical studies usually ignore to test model specifications. Anselin proposed three statistics. If specification is appropriate, it follows that Wald >Log likelihood>LM.
spatial econometric models; spatial lag model; spatial error model; Lagrange multiplier test
2016-03-25;修復日期:2016-07-19
姜磊,男,山東煙臺人,經濟地理博士,助理教授,研究方向:應用空間計量經濟學,區(qū)域經濟學。
F224.0∶O212.1
A
1007-3116(2016)10-0010-07