程鵬鵬
(東北林業(yè)大學(xué))
變系數(shù)模型是經(jīng)典線性模型的一個(gè)有用推廣,它在諸如地理學(xué)、經(jīng)濟(jì)學(xué)、環(huán)境學(xué)、生態(tài)學(xué)、氣流學(xué)及流行病學(xué)等眾多領(lǐng)域中有廣泛的應(yīng)用,由于其靈活性以及易于解釋性,過去幾十年來(lái),變系數(shù)模型無(wú)論在理論體系還是在應(yīng)用方面都得到長(zhǎng)足發(fā)展[1].1996年Brunsdon等首次通過假定線性回歸模型中的回歸系數(shù)是觀測(cè)點(diǎn)空間位置的函數(shù),將數(shù)據(jù)的空間位置信息納入到模型之中,給出了空間變系數(shù)模型的概念.并提出以觀測(cè)點(diǎn)之間的距離的函數(shù)為權(quán)值的非參數(shù)光滑估計(jì)方法,稱之為地理加權(quán)回歸方法,簡(jiǎn)稱GWR. Wang等(2008)將變系數(shù)模型的局部線性擬合方法推廣到空間變系數(shù)模型,給出局部線性GWR擬合方法,并通過數(shù)值模擬說明改進(jìn)的擬合方法可以顯著的降低系數(shù)估計(jì)的偏和邊界效應(yīng)[7].
空間變系數(shù)模型在短短的十多年中很快得到研究工作者,尤其是實(shí)際領(lǐng)域的數(shù)據(jù)分析工作者的重視.魏傳華和梅長(zhǎng)林[2]以及魏傳華和吳喜之[3]都對(duì)這一模型理論部分有進(jìn)一步的研究.王晨亮和岳天祥等[4]在中國(guó)氣候的模擬研究中利用了空間變系數(shù)模型.LüShiqin and Lu Zhunwei[5]給出了半變系數(shù)模型在線性約束條件下的估計(jì)以及Zhang Yu[6]在變系數(shù)模型的相關(guān)理論基礎(chǔ)上提出了兩種估計(jì)方法.
基于空間變系數(shù)模型的局部線性GWR擬合方法的基礎(chǔ)上,給出了空間變系數(shù)模型的局部非線性GWR擬合方法,并進(jìn)一步得到了模型參數(shù)的估計(jì)值和偏導(dǎo)數(shù),明確了曲面參數(shù)的意義.
空間變系數(shù)回歸模型為:
其中βi(u,v)(j=0,1,2,…,p)為空間地理位置(u,v)的未知函數(shù);εi(i=1,2,…,n)為獨(dú)立同分布的誤差項(xiàng),且E(εi)=0,Var(εi)=σ2[7].
為簡(jiǎn)化表示,將空間變系數(shù)模型(1)改寫為如下形式:
設(shè)其中的每個(gè)系數(shù)函數(shù)βj(u,v)(j=1,2,…,p)關(guān)于空間位置坐標(biāo)u和v均有連續(xù)的二階偏導(dǎo)數(shù),這里(u,v)為在某直角坐標(biāo)系下的空間位置坐標(biāo).給定所研究區(qū)域內(nèi)的任一點(diǎn)(u0,v0),對(duì)于每個(gè)j=1,2,…,p應(yīng)用Taylor公式對(duì)βj(u,v)在(u0,v0)的鄰域內(nèi)進(jìn)行二階泰勒展開,并用二次函數(shù)逼近,有
達(dá)到最小,便得到各空間變系數(shù)模型系數(shù)函數(shù)βj(u,v)(j=1,2,…,p)在(u0,v0)點(diǎn)的局部估計(jì)值.其中(Yi;Xi1,Xi2,…,Xip)為因變量Y和自變量X1,X2,…,Xp在地理位置(ui,vi)處的觀測(cè)值,d0i為(u0,v0)到(ui,vi)的距離,這里
其中K(·)為核函數(shù),核函數(shù)選取方法通常為Gauss核或Epanechnikov核,h是光滑參數(shù).
若令
則上述最小二乘問題的解可用矩陣表示為
其中(u0,v0)點(diǎn)的權(quán)矩陣和因變量Y在n個(gè)觀測(cè)位置處的觀測(cè)值所成的列向量.記
分別為各回歸系數(shù)函數(shù)在(u0,v0)處的估計(jì)值所構(gòu)成的列向量以及關(guān)于u和v的偏導(dǎo)數(shù)的估計(jì)值所成的列向量,則由(3)式可得
其中Ip和0p分別表示p階單位陣和p階零矩陣,令(u0,v0)=(ui,vi),i=1,2,…,n),則由(4)得到模型參數(shù)在各觀測(cè)位置處的估計(jì)值為
為表示簡(jiǎn)潔,將五個(gè)p階零矩陣合并為一個(gè)p× 5p階的零矩陣,并用0p×5p表示.由此可得因變量Y在各觀測(cè)位置(ui,vi)處的擬合值為
其中 Xi=(Xi1,Xi2,…,Xip)T為自變量 X1,X2,…,Xp的第i組觀測(cè)值所成的列向量.從而因變量Y在n個(gè)觀測(cè)位置處的擬合向量為
其中
進(jìn)一步可得局部非線性GWR估計(jì)的殘差向量為
殘差平方和為
由此可得模型(2)的誤差方差Var(εi)=σ2的估計(jì)為
這里光滑參數(shù)h的確定方法,可使用CV,GCV或AICc準(zhǔn)則確定.
稱上述方法為空間變系數(shù)模型的局部非線性GWR估計(jì)方法,此方法不僅可以得到各空間變系數(shù)模型系數(shù)函數(shù)在區(qū)域內(nèi)任一點(diǎn)(u0,v0)處的估計(jì)值,同時(shí)也能得到系數(shù)函數(shù)曲面關(guān)于空間坐標(biāo)u和v的一階和二階偏導(dǎo)數(shù)在該處的估計(jì)值.一階偏導(dǎo)數(shù)在(u0,v0)點(diǎn)的估計(jì)值分別反映了系數(shù)曲面在該點(diǎn)處沿地理空間坐標(biāo)u和v方向的瞬間變化率,二階偏導(dǎo)數(shù)能反映變化率的增減性以及曲面的凹凸程度.
對(duì)空間變系數(shù)模型進(jìn)行探討,是經(jīng)典線性模型的一種擴(kuò)展.為了使空間地理位置更明確,更形象,將從非線性二次函數(shù)擬合以及GWR方法入手,在局部線性擬合基礎(chǔ)上推廣到局部非線性二次函數(shù)擬和,更加深入闡述地理空間位置對(duì)變系數(shù)的影響.
[1] 許健,劉萬(wàn)榮.廣義空間變系數(shù)模型[D].湖南師范大學(xué),2009.
[2] 魏傳華,梅長(zhǎng)林.半?yún)?shù)空間變系數(shù)回歸模型的Back-Fitting估計(jì)[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2006(3):177-184.
[3] 魏傳華,吳喜之.空間變系數(shù)模型的統(tǒng)計(jì)診斷[J].數(shù)理統(tǒng)計(jì)與管理,2007(11):1027-1033.
[4] 王晨亮,岳天祥,范澤孟,等.高精度曲面建模的中國(guó)氣候降尺度模型[J].地球信息科學(xué)學(xué)報(bào),2012,10:599-610.
[5] LüShiqin,Lu Zhunwei.The Asymptotic Normality Of Constrained Profile Least-Squares Estimation On Semivarying Coefficient Models[J].Mathematica Applicata,2008,21 (1):149-155.
[6] Zhang Yu.B-spline Estimation For Varying-Coefficient Single-Index Model[J].Chinese Journal of Applied Probability and Statistics,2013(8):433-442.
[7] 梅長(zhǎng)林,王寧.近代回歸分析方法[M].北京:科學(xué)出版社,2012.