曹連英,張 博
(東北林業(yè)大學(xué) 理學(xué)院,哈爾濱 150040)
非線性半?yún)?shù)空間變系數(shù)模型的兩步估計(jì)
曹連英,張博
(東北林業(yè)大學(xué) 理學(xué)院,哈爾濱 150040)
文章對(duì)非線性函數(shù)與空間變系數(shù)模型組合的半?yún)?shù)模型進(jìn)行研究,提出該類模型的兩步估計(jì),給出半?yún)?shù)模型中非線性函數(shù)和空間變系數(shù)參數(shù)估計(jì)的精確表達(dá)式。并進(jìn)行了數(shù)值模擬,結(jié)果表明,估計(jì)值與真實(shí)值擬合程度較好,方法的精確度較高。
半?yún)?shù)模型;地理加權(quán)回歸;兩步估計(jì)法
半?yún)?shù)模型自1986年提出以來(lái),由于此模型兼具參數(shù)模型和非參數(shù)模型的優(yōu)點(diǎn),在過(guò)去的三十年里受到統(tǒng)計(jì)學(xué)家和計(jì)量學(xué)家們的廣泛研究,并應(yīng)用于生物、農(nóng)業(yè)、GPS定位等許多實(shí)際問(wèn)題中。近年,趙坷[1]提出一種新型加權(quán)半?yún)?shù)模型,通過(guò)比較參數(shù)和半?yún)?shù)部分所占的比重,對(duì)其進(jìn)行加權(quán),驗(yàn)證了加權(quán)半?yún)?shù)模型的優(yōu)越性;朱晉偉等人[2]根據(jù)半?yún)?shù)模型能減小誤差,也能減少“維數(shù)災(zāi)難”的特點(diǎn),將其應(yīng)用到企業(yè)間創(chuàng)新績(jī)效的影響因素的分析中。
目前學(xué)者研究的半?yún)?shù)模型主要以線性模型和變系數(shù)模型的組合為研究熱點(diǎn)。Zeger等人[3]曾用迭代法對(duì)非參數(shù)部分進(jìn)行估計(jì),用后移算法估計(jì)線性部分,并將該半?yún)?shù)模型應(yīng)用到實(shí)際醫(yī)學(xué)領(lǐng)域;Caroll和Lin[4]等人利用廣義估計(jì)方程研究了以線性模型為分量的半?yún)?shù)模型。He等人[5]在估計(jì)半?yún)?shù)模型時(shí),對(duì)線性部分采用M-估計(jì)法,對(duì)非參數(shù)部分采用回歸樣條方法;封維波等人[6]在均方誤差準(zhǔn)則下對(duì)此類半?yún)?shù)模型中的參數(shù)的兩步估計(jì)和最小二乘估計(jì)進(jìn)行了比較,給出了參數(shù)的兩步估計(jì)優(yōu)于最小二乘估計(jì)的充分條件。
然而,在一些實(shí)際問(wèn)題中會(huì)遇到這樣的問(wèn)題,部分變量對(duì)因變量的影響具有空間差異性,而其他變量對(duì)因變量的影響無(wú)空間差異性,但是是非線性的。本文將對(duì)以往研究的半?yún)?shù)模型中線性部分推廣為非線性函數(shù),對(duì)由一個(gè)自變量的非線性函數(shù)與空間變系數(shù)模型組合的半?yún)?shù)模型其估計(jì)方法進(jìn)行探討。
設(shè)非線性半?yún)⒆兿禂?shù)模型為:
其中,Y為因變量,X1,X2,…,Xk為自變量,V為空間變量V=(u,v)。 m(X1)為未知的非線性函數(shù),βl(V)為空間變系數(shù)模型部分的系數(shù)參數(shù)函數(shù)。ε為誤差項(xiàng),滿足且m(X1)為足夠光滑的函數(shù),有任意階導(dǎo)數(shù)。
由Taylor公式,m(x)在x=x0點(diǎn)處泰勒展開式為:
若記:
此時(shí)式(1)為:
非線性半?yún)⒆兿禂?shù)模型的估計(jì)問(wèn)題轉(zhuǎn)化成M1,M2(V)的估計(jì)。這里為第i個(gè)單位坐標(biāo)向量。
首先假設(shè)m(x)已知,即M1已知,則模型(2)可以表示為:
利用空間地理加權(quán)回歸方法得空間變系數(shù)模型部分變系數(shù)M2(V)在點(diǎn)Vi=(ui,vi)的估計(jì)表達(dá)式為:
再將上式代入到式(2):
式(4)可整理為只含有未知參數(shù)系數(shù)M1的線性回歸問(wèn)題如下:
利用最小二乘估計(jì)可得上式中M1的估計(jì)為:
其中:
下面將通過(guò)一系列的模擬試驗(yàn)來(lái)考察上文提出的非線性半?yún)?shù)變系數(shù)模型中的線性函數(shù)和空間變系數(shù)參數(shù)估計(jì)的精確性。
模擬實(shí)驗(yàn)的空間區(qū)域邊長(zhǎng)為m-1個(gè)單位的正方形,以此區(qū)域的左下角為坐標(biāo)原點(diǎn),將正方形的邊長(zhǎng)m-1等分,等分后得到m×m個(gè)格子點(diǎn)。這樣的格子點(diǎn)分隔方法有著廣泛的應(yīng)用背景,例如在地理分析中遙感數(shù)據(jù)的空間位置常用述格子點(diǎn)形式。若分別以u(píng),v表示格子點(diǎn)的橫縱坐標(biāo),則Vi=() ui,vi為第i個(gè)自變量與因變量的地理位置,其中表示i-1除以m的余數(shù),表示商的整數(shù)部分,i=1,2,…,n,n=m2。模型中其他自變量的取值是獨(dú)立產(chǎn)生的服從區(qū)間[0,1]上均勻分布的隨即數(shù)。如若不然可將實(shí)際問(wèn)題變量數(shù)值標(biāo)準(zhǔn)化。取x0=0.5。
就三組非線性半?yún)?shù)空間變系數(shù)模型進(jìn)行數(shù)值試驗(yàn):
誤差項(xiàng)ε服從正態(tài)分布N(0,σ2),分別取標(biāo)準(zhǔn)差為σ=1,0.6,0.2,m=10,9,8進(jìn)行模擬試驗(yàn)。對(duì)于每個(gè)σ,m只改變隨機(jī)誤差ε重復(fù)運(yùn)算300次,獲取試驗(yàn)結(jié)果。記非線性函數(shù)m(x)的均方誤差為MSE1,變系數(shù)部分的均方誤差MSE2和因變量估值的均方誤差MSE3:
三組模型300次實(shí)驗(yàn)結(jié)果如表1所示,非線性函數(shù)的估值曲線與真實(shí)曲線見(jiàn)下頁(yè)圖1至圖3。
數(shù)值結(jié)果表明,在不同的σ、m下,半?yún)?shù)模型的估計(jì)值與真實(shí)值非常接近,擬合效果較好。隨著σ變小,即噪聲方差變小,對(duì)模型的干擾減弱,估計(jì)的精度明顯提高。m越大,即隨著觀測(cè)點(diǎn)的增多,對(duì)于以上模型來(lái)說(shuō)估計(jì)值逼近精確值的程度影響不大。
表1 三組模型300次實(shí)驗(yàn)下的均方誤差
圖1 回歸模型(i)中非線性部分sin2x1圖像和在方差分別為0.2, 1方差下的擬合圖(*為真值,△為擬合值)
圖2 回歸模型(ii)中非線性部分6x1·cos(6 πx1)圖像和在方差分別為0.2,1方差下的擬合圖(*為真值,△為擬合值)
圖3 回歸模型(iii)中非線性部分sin(6 πx1)圖像和在方差分別為0.2,1方差下的擬合圖(*為真值,△為擬合值)
本文用兩步估計(jì)法對(duì)非線性半?yún)?shù)空間變系數(shù)模型進(jìn)行估計(jì),并給出估計(jì)表達(dá)式,模擬試驗(yàn)表明,估計(jì)值與真實(shí)值擬合程度較好,方法的精確度較高。在本文估計(jì)中使用了泰勒展開式,為提高計(jì)算的精度,建議解決實(shí)際問(wèn)題時(shí)對(duì)變量先進(jìn)性數(shù)據(jù)標(biāo)準(zhǔn)化。
[1]趙坷,付政慶,劉國(guó)林.加權(quán)半?yún)?shù)模型及其應(yīng)用效果分析[J].大地測(cè)量與地球動(dòng)力學(xué),2014,34(2).
[2]朱晉偉,梅靜嫻.不同規(guī)模企業(yè)間創(chuàng)新績(jī)效影響因素比較研究[J].科學(xué)與科學(xué)技術(shù)管理,2015,36(2).
[3]Zeger S L.Semiparametric Models for Longitudinal Data With Appli?cation to CD4 Cell Numbers in HIV Seroconverters[J].Biometrics, 1994,50(3).
[4]Lin X,Carroll R.J.Semiparametric Regression for Clustered Data Using Generalized Estimating Equations[J],Journal of the American statistical Association,2001,96(9).
[5]He X,Zhu Z,Fang W.Estimation in a Semiparametric Model for LongitudinalDataWithUnspecifiedDependenceStructure[J]. Biometrika, 2002,89(3).
[6]封維波,劉瓊蓀.半?yún)?shù)模型中兩步估計(jì)與最小二乘估計(jì)的比較[J].統(tǒng)計(jì)與決策,2008,(4).
(責(zé)任編輯/易永生)
O212.7
A
1002-6487(2016)22-0012-03
國(guó)家自然科學(xué)基金資助項(xiàng)目(31270596)
曹連英(1976—),女,黑龍江人,博士,副教授,研究方向:參數(shù)統(tǒng)計(jì)及數(shù)學(xué)模型。