陸曉恒, 石賢匯, 凌能祥
(1.合肥工業(yè)大學(xué) 數(shù)學(xué)學(xué)院,安徽 合肥 230009;2.銅陵學(xué)院 數(shù)學(xué)與計算機(jī)科學(xué)系,安徽 銅陵 244000)
回歸函數(shù)估計是數(shù)據(jù)分析中一個非常重要的問題,由于其在通信、控制系統(tǒng)、模式識別等很多領(lǐng)域都有非常廣泛的應(yīng)用,一直以來備受關(guān)注。在有限維場合,很多學(xué)者無論在獨立同分布(i.i.d.)還是某種相依情形下,都對其進(jìn)行了研究并且獲得了卓有成效的結(jié)果,如文獻(xiàn)[1-4]等。
最近幾年,隨著函數(shù)型數(shù)據(jù)在包括醫(yī)學(xué)、經(jīng)濟(jì)度量學(xué)、環(huán)境度量學(xué)、化學(xué)度量學(xué)等各個領(lǐng)域的廣泛應(yīng)用,函數(shù)型數(shù)據(jù)的回歸函數(shù)估計越來越受到人們的關(guān)注。文獻(xiàn)[5]采用經(jīng)典的 Nadaraya-Watson(N-W)核,對相依數(shù)據(jù)的函數(shù)型非參數(shù)回歸模型進(jìn)行了研究;文獻(xiàn)[6]建立了相依函數(shù)型數(shù)據(jù)N-W核估計的漸近正態(tài)性的性質(zhì)。關(guān)于函數(shù)型數(shù)據(jù)的分析可參考文獻(xiàn)[7-8];關(guān)于函數(shù)型數(shù)據(jù)非參數(shù)統(tǒng)計回歸函數(shù)、條件分位數(shù)、條件眾數(shù)核估計的詳細(xì)分析可參考文獻(xiàn)[9]。
設(shè){(Xi,Yi),1≤i≤n}是同分布于(X,Y)的函數(shù)型數(shù)據(jù),其中X在某個抽象的半度量空間E中取值,而Y取值于實值空間R。文獻(xiàn)[5]和文獻(xiàn)[10]引入的N-W核回歸函數(shù)的估計定義為:
其中,K(·)為一實值的核函數(shù);h=hn為滿足的窗寬參數(shù);d(·,·)為空間E中的一個半度量。本文所研究的改良的核回歸估計為:
其中,Ι(A)是集合A上的一個示性函數(shù);bn滿足當(dāng)n→∞時,bn→∞。這個估計在文獻(xiàn)[11]中進(jìn)行了研究,并得到了一些相合性的結(jié)果。
定義1 若過程{(Xi,Yi),i≥1}的混合系數(shù)α(n)滿足:
則稱過程{(Xi,Yi),i≥1}為α-混合或強(qiáng)混合過程。
其中,Akj為隨機(jī)變量{(Xi,Yi),j≤i≤k}產(chǎn)生的σ-代數(shù)。進(jìn)而,若?a>0,C>0使得:
則稱{(Xi,Yi),i≥1}為階a的算術(shù)α-混合;若?t∈(0,1),C>0使得:
則稱{(Xi,Yi),i≥1}為幾何α-混合。
本文的主要目的是就α-混合函數(shù)型數(shù)據(jù)在某些合適的條件下,獲得改良的核回歸估計^r(nóng)(x)的漸近正態(tài)性的性質(zhì)。假設(shè)C是一個正的常數(shù),在文中每次出現(xiàn)時,都可以取不同的值;c1、c2為2個正的常數(shù)。
設(shè)Ki(x)=K(h-1d(x,Xi)),i=1,2,…,n;B(x,h)是中心為x,半徑為h>0的小球。為了方便,先引入下列一些記號:
(1)(i)?h>0,P{X∈B(x,h)}=φx(h),其中且φx(h)在原點的某個領(lǐng)域內(nèi)關(guān)于h絕對連續(xù)。
其中,Cjx,j=1,2為2個正的關(guān)于x的函數(shù)。
(3)對v≥1,都有E|Y|v≤C<∞。
(4)(i)?β>0,使得對?μ,ν∈E,有|r(μ)-r(ν)|≤Cd(μ,ν)β。
(ii)設(shè)g2(u)=Var[Yi|Xi=u],u∈E,在x的某個領(lǐng)域內(nèi)連續(xù)且滿足當(dāng)h→0時,
(2)K(·)是滿足0<c1≤K(·)≤c2<∞的支撐集為[0,1]的實值核函數(shù),且滿足:
設(shè)對某個m>2有:
在x的某個領(lǐng)域內(nèi)連續(xù)。
(iii)設(shè)g(u,v;x)=E[(Yi-r(x))(Yjr(x))|Xi=u,Xj=v],i≠j,u,v∈E在(x,x)的某個領(lǐng)域內(nèi)連續(xù)。
(5)對某個m>2,p>1-2/m有:
(6)設(shè)當(dāng)n→∞時有nφx(h)→∞。同時存在正整數(shù)序列{vn}滿足
條件(1)和文獻(xiàn)[6]中的condition 3′不同,這里小球概率和聯(lián)合密度函數(shù)都沒有寫成2個函數(shù)乘積的形式,更具一般性。條件(2)關(guān)于核函數(shù)的假設(shè)是很經(jīng)典的,關(guān)于極限值的假設(shè)在文獻(xiàn)[6]和文獻(xiàn)[11]中都作了類似的假設(shè)。條件(3)~(6)都可以在文獻(xiàn)[6]中找到類似的假設(shè)。
為了更方便地敘述和得到相關(guān)結(jié)論,先給出一些引理,并對其進(jìn)行證明。
證明 由文獻(xiàn)[11]中Theorem 2的證明過程可知:于是根據(jù)un(x)的表達(dá)式可得:
首先對T1進(jìn)行處理:
同時有:
由條件(4)的(i)可知:
于是,由條件(2)可得:
又由控制收斂定理知,當(dāng)n→∞有:
因此,由(3)式、(5)式、(6)式有:
對T2進(jìn)行處理:
其中,an=o(n),下面將給出其具體形式。
對于T21:
由控制收斂定理知,當(dāng)n→∞有:
又由條件(1)的(ii)、條件(2)和條件(4)的(iii),當(dāng)n足夠大的時候,可得:
從而當(dāng)n足夠大的時候有:
對于T22,利用文獻(xiàn)[12]中Davydov’s lemma可得:
由控制收斂定理知,當(dāng)n→∞有:
又由條件(2)和條件(4)的(ii),當(dāng)n足夠大的時候,可得:
綜上(2)式、(7)式、(8)式、(11)式和(12)式,于是有:
引理2 假設(shè)條件(1)~(6)滿足,則當(dāng)n→∞時有:
證明 此引理的證明利用Bernstein大塊小塊過程,可參考文獻(xiàn)[6]中Theorem 4的證明。
引理3 假設(shè)條件(1)、(2)和(5)滿足且有,則
證明 此引理的證明參見文獻(xiàn)[6]中Theorem 1的證明,需要注意的是小球概率和聯(lián)合密度函數(shù)的表達(dá)形式不同。
引理4 假設(shè)條件(1)~(6)滿足,則當(dāng)n→∞時有:
于是由引理2和引理3可知結(jié)論成立。
下面給出本文的一個重要結(jié)論。
[1]Devroye L.On the almost everywhere convergence of nonparametric regression function estimate[J].The Annals of Statistics,1981,9:1310-1319.
[2]Roussas G G.Nonparametric regression estimation under mixing conditions[J].Stochastic Process Appl,1990,36:107-116.
[3]Roussas G G,Tran L T,Ioannides D A.Fixed design regression for time series:asymptotic normality[J].Journal of Multivariate Analysis,1992,40:262-291.
[4]Tran L T.Nonparametric function estimation for time series by local average estimators[J].The Annals of Statistics,1993,21:1040-1057.
[5]Ferraty F,Vieu P.Nonparametric model for functional data with application in regression,time series prediction and cure discrimination[J].Journal of Nonparametric Statistics,2004,16(1/2):111-125.
[6]Masry E.Nonparametric regression estimation for dependent functional data:asymptotic normality[J].Stochastic Process Appl,2005,115:155-177.
[7]Ramasy J,Silverman B.Functional data analysis[M].New York:Springer,1997:68-90.
[8]Ramasy J,Silverman B.Applied functional data analysis:methods and case studies[M].New York:Springer,2002:42-78.
[9]Ferraty F,Vieu P.Nonparametric functional data analysis:theory and practice[M].New York:Springer,2006:36-174.
[10]Ferraty F,Vieu P.The functional nonparametric model and application to spectrometric data[J].Comput Stat,2002,17:545-564.
[11]Ling N,Wu Y.Consistency of modified kernel regression estimation for functional data[J].Statistics,2010.doi:10.1080/02331888.2010.500077.
[12]Hall P,Heyde C C.Martingale limit theory and its applications[M].New York:Academic Press,1980:23-52.