趙 靜,蒲 越
(新疆財經(jīng)大學(xué) 應(yīng)用數(shù)學(xué)學(xué)院,烏魯木齊 830012)
在空間數(shù)據(jù)分析中,雖然普通的線性回歸模型作為一種最普通最常用的方法,可以用來分析自變量與應(yīng)變量之間的關(guān)系,但普通的線性回歸模型未能描述空間位置的特殊性——空間非平穩(wěn)性或空間異質(zhì)性,因而不能全面有效地反映出空間數(shù)據(jù)的真實屬性。[1]近年來,多名學(xué)者對混合地理加權(quán)回歸模型進(jìn)行了研究,混合地理加權(quán)回歸模型作為一種有效的探測空間數(shù)據(jù)分析法已經(jīng)廣泛應(yīng)用在各個領(lǐng)域。例如,Pecci等研究15個歐盟國家的農(nóng)業(yè)生產(chǎn)力,通過MCMC檢驗,以人口密度、GDP為全局變量,以失業(yè)率和林業(yè)面積為局部變量,通過MGWR基礎(chǔ)建立模型,得出區(qū)域農(nóng)業(yè)生產(chǎn)力的空間分異;[2]Helbich通過考察建筑和住宅對周圍環(huán)境的影響建立MGWR模型,對奧地利的房價進(jìn)行研究,認(rèn)為局部變量對房價的影響較大,房價會隨空間局部變量的變化而變化[3];覃文忠等通過迭代算法,深入分析了混合地理加權(quán)回歸模型的參數(shù),將模型的參數(shù)進(jìn)行了分類,并以上海市住宅小區(qū)樓盤銷售平均價格為例進(jìn)行驗證,最終得出混合地理加權(quán)回歸模型大于地理加權(quán)回歸模型,且擬合度更好,局部參數(shù)更穩(wěn)健。[4]本文主要通過兩步估計法對混合地理加權(quán)回歸模型的參數(shù)進(jìn)行有效的分類,得到混合地理加權(quán)回歸模型的常參數(shù)和變參數(shù)的表達(dá)式,選取國內(nèi)31個省(市、自治區(qū))的SO2排放量為例進(jìn)行研究分析。
混合地理加權(quán)回歸模型是對地理加權(quán)回歸模型的進(jìn)一步擴(kuò)展。在混合地理加權(quán)回歸模型中,將部分因子在整體范圍中保持不變的量稱為全局變量,而另一部分因子會隨著空間地理的變化發(fā)生改變,稱為局部變量。模型表達(dá)式為
(1)
式中:i=1,2,…,n;βj(j=0,1,…,q)為未知常數(shù),而βj(ui,vi)(j=q+1,q+2,…,p)為第i個觀測點(ui,vi)處的未知參數(shù)(ui,vi)的任意函數(shù)。
也可以寫成矩陣形式
(2)
其中:i=1,2,…,n;
滿足
地理加權(quán)回歸模型是對回歸模型中局部參數(shù)進(jìn)行研究,而混合地理加權(quán)回歸模型是針對回歸模型中參數(shù)進(jìn)行全局研究。因此,實際應(yīng)用中對于參數(shù)的估計問題,地理加權(quán)回歸模型參數(shù)估計并不適用于混合地理加權(quán)回歸模型中的參數(shù)估計。對于混合地理加權(quán)回歸模型的參數(shù)估計問題,通常選取兩步估計法和Back-Fitting估計法。[5]本文采用后一種估計方法。
混合地理加權(quán)回歸模型(MGWR)由兩部分構(gòu)成:常系數(shù)部分和變系數(shù)部分。若用地理加權(quán)回歸模型估計這兩個部分,將會產(chǎn)生兩個新的因變量的估計值Yc和Yg,[6]表達(dá)式為
Yc=Yc(Y-Yg),
(3)
式中Yc和Yg分別為
假定βc=(β0,β1,…,βq)T是對常參數(shù)的估計值,將Yc=Xcβc代入,得出
從而得到
最終解出
(4)
可知因變量的估計值為
(5)
其中
(6)
由于式(6)為已知,通過地理加權(quán)回歸模型可計算變參數(shù)的部分,常參數(shù)部分通過用最小二乘法估計,分別獲取參數(shù)的估計值及因變量的擬合值??蓪⒒旌系乩砑訖?quán)回歸模型寫為
(7)
式中:i=1,2,…,n。
矩陣形式表示
(8)
變參數(shù)在地理位置(ui,vi)的估計值為
(9)
將式(7)轉(zhuǎn)化為
得出
(10)
可得出常系數(shù)的估計值為
(11)
因而得出
(12)
其中
選取國內(nèi)31個省(市、自治區(qū)),對經(jīng)濟(jì)指標(biāo)和空氣環(huán)境指標(biāo)進(jìn)行分析,其中樣本選取的變量有:人均第一產(chǎn)業(yè)額SO2排放量、就業(yè)率、人口密度以及人均電力消費(fèi)。具體設(shè)計如表1所示,數(shù)據(jù)來源于《中國統(tǒng)計年鑒》和《中國環(huán)境統(tǒng)計年鑒》。
表1 模型指標(biāo)設(shè)計
首先,在建立模型之前進(jìn)行自相關(guān)檢驗。空間自相關(guān)分析出空間異質(zhì)性和依賴性,通過Moran′sI指數(shù)反映出空間鄰近區(qū)域之間的相似程度,取值介于-1和1之間,大于零表示正相關(guān),小于零表示負(fù)相關(guān),等于零表示不存在空間相關(guān)性或各個要素之間差異性較小。計算式為
(13)
對于Moran′sI指數(shù)的計算結(jié)果,有漸進(jìn)分布和隨機(jī)分布兩種檢驗方法。對Moran′sI進(jìn)行標(biāo)準(zhǔn)化通常采用標(biāo)準(zhǔn)化的Z統(tǒng)計量
(14)
通常統(tǒng)計量Z值服從標(biāo)準(zhǔn)正態(tài)分布,同時顯著性也由正態(tài)分布判斷。根據(jù)空間單元的數(shù)量和分布的特征可以計算標(biāo)準(zhǔn)化Moran′sI期望值
(15)
對2015年國內(nèi)31個省(市、自治區(qū))SO2排放量在空間上的自相關(guān)、空間依賴性及集聚性方面進(jìn)行檢驗,基于對距離的空間權(quán)重矩陣,利用全局Moran′sI指數(shù)計算SO2排放量的集聚情況,結(jié)果見表2。
表2 全局Moran′sI指數(shù)
國內(nèi)31個省(市、自治區(qū))SO2排放量的Moran′sI指數(shù)為0.338,Z值大于正態(tài)分布函,即在1%水平下的臨界值(1.96),表明各省之間SO2的排放量在地理位置上具有一定的正自相關(guān)(即空間依賴性),說明SO2在空間的分布并不是隨機(jī)的,而是呈現(xiàn)出一種較強(qiáng)的集聚現(xiàn)象。此外,均值和方差數(shù)值較小,表明結(jié)論可靠。
表3 Moran′sI值及P值
由表3可知,變量人口密度和人均第一產(chǎn)業(yè)額的P值均小于0.05,說明具有明顯的空間異質(zhì)性和空間集聚性,因而可作為局部變量;人均電力消費(fèi)和就業(yè)率的P值均大于0.05,但并不顯著,空間異質(zhì)和集聚性表現(xiàn)不夠明顯。
通過上述檢驗,可將混合地理加權(quán)回歸模型參數(shù)進(jìn)行分類,見表4。
表4 混合地理加權(quán)回歸模型參數(shù)分類
建立混合地理加權(quán)回歸模型,用兩步法估計出模型各個參數(shù)的P值及擬合值,計算式為
lnyi=β0+β1lnx1i+β2lnx2i+
α(u1i,v1i)lnZ1i+α(u2i,v2i)lnZ2i
(16)
表5 兩步法參數(shù)估計的檢驗P值
由表5可以看出,兩步法估計得到的參數(shù)P值均小于0.05,擬合優(yōu)度R2為94.2%,說明兩步法對混合地理加權(quán)回歸模型的估計更加精確,且擬合度很好。
通過GWR軟件進(jìn)一步有效描述出變量對SO2排放量的影響,對比圖見圖1。從圖1中可以看出,(b)與(a)基本吻合,只是有部分地區(qū)不一樣。新疆、黑龍江等地殘差較低,說明測量值與真實值較為接近;對于少部分地區(qū),如天津、青海等地,原始的SO2排放量屬于輕度污染,而在回歸擬合圖中屬于中度污染,這與事實基本符合。說明兩步估計法能夠更好地驗證變量對SO2排放量的影響。[7-9]
圖1 SO2排放量對比圖
混合地理加權(quán)回歸模型中既有局部參數(shù)(變參數(shù)),也有全局參數(shù)(常參數(shù)),本文主要用兩步估計法分別對這兩部分進(jìn)行計算。為了能夠較好地應(yīng)用混合地理加權(quán)回歸模型參數(shù)估計問題,本文以國內(nèi)31個省(市、自治區(qū))為研究對象,通過對選取的變量進(jìn)行空間自相關(guān)的檢驗和驗證,將選取的變量進(jìn)行分類,有效地驗證了兩步法對模型的顯著性和擬合值。根據(jù)所選擇的變量,可以看出空氣污染主要是由于電力消費(fèi)和第一產(chǎn)業(yè)所引起的。為保護(hù)環(huán)境,在綠色種植的過程中,要增加防火意識,防止發(fā)生火災(zāi),減少因火災(zāi)帶來大量的廢氣污染,同時,在使用電能過程中也需要提高防火意識。另外,要鼓勵發(fā)展高新技術(shù)產(chǎn)業(yè),通過不斷發(fā)展高新技術(shù)產(chǎn)業(yè),從而有效降低大氣污染,改善環(huán)境。
參考文獻(xiàn):
[1]魏傳華,梅長林.半?yún)?shù)空間變系數(shù)回歸模型的兩步估計方法及數(shù)值模型[J].統(tǒng)計與信息論壇,2005(1):16-19.
[2]PESSI F,SASSI M.A mix geographically weighted approach to decoupling and rural development in the EU-15[C].107th Seminar European Association of Agricultural Economists in its series,21308,Sevilla,Spain with number,6625.
[3]HELBICH M.Mixed geographically weighted regression for hedonic house price modelling in austria[D].Heidelberg:University of Heidelberg,2010.
[4]覃文忠,王建梅,劉妙龍.混合地理加權(quán)回歸模型算法研究[J].武漢大學(xué)學(xué)報(信息科學(xué)版),2007(2):115-119.
[5]玄海燕,劉樹群,羅雙華.混合地理加權(quán)回歸模型的兩種估計[J].蘭州理工大學(xué)學(xué)報,2007(3):142-144.
[6]魏傳華,吳喜之.空間變系數(shù)模型的統(tǒng)計診斷[J].數(shù)理統(tǒng)計與管理,2007(6):1027-1033.
[7]康國棟.中國經(jīng)濟(jì)發(fā)展的電力需求及對環(huán)境的影響分析[D].西安:陜西師范大學(xué),2009.
[8]齊飛.混合地理加權(quán)回歸模型的統(tǒng)計推斷[D].北京:中央民族大學(xué),2010.
[9]韋米佳.中國宏觀經(jīng)濟(jì)內(nèi)生增長因素分析:基于混合地理加權(quán)回歸(GWR)模型的實證分析[J].中國經(jīng)濟(jì)問題,2009(3):24-30.