(天津財經(jīng)大學(xué)理工學(xué)院,天津300222)
當(dāng)數(shù)據(jù)存在趨勢時,回歸分析可能將無關(guān)變量擬合出顯著的關(guān)聯(lián)關(guān)系.這樣的分析會得出錯誤的結(jié)論、做出無效的預(yù)測,即發(fā)生所謂的虛假回歸,給實證研究和預(yù)測工作帶來風(fēng)險[1].這就要求學(xué)者對模型是否存在偽回歸的問題進行診斷,以識別和降低這種風(fēng)險.在研究當(dāng)中,參數(shù)模型的偽回歸診斷已經(jīng)得到了廣泛的重視[2],而非參數(shù)模型的偽回歸診斷卻常常會被人忽視.主要原因在于,非參數(shù)模型沒有在形式上做主觀預(yù)設(shè),它們常常被當(dāng)作最接近真實、決不會犯錯的模型.但事實并非如此.在趨勢的影響下,參數(shù)模型尚且容易錯把無關(guān)變量擬合出關(guān)聯(lián)關(guān)系,作為擬合能力更強的非參數(shù)模型,就可能面臨更大的偽回歸風(fēng)險.但考慮到非參數(shù)模型并沒有描述關(guān)聯(lián)關(guān)系的表達(dá)式,即便模型存在風(fēng)險,又該診斷什么,如何診斷呢?本文研究了非參數(shù)模型的偽回歸診斷問題,試圖為相關(guān)檢驗方法給出嚴(yán)格的理論論證和較全面的應(yīng)用參考.
關(guān)于偽回歸診斷的問題,有些重要的文獻做出了有價值的研究.Granger等[3]基于模擬實驗,率先研究了單位根過程帶給參數(shù)模型的偽回歸問題,并提出基于DW統(tǒng)計量的回歸診斷方法.方法的基本思想是用殘差的全局特征來診斷參數(shù)模型的表達(dá)式是否可靠.在此基礎(chǔ)上,Phillips[4,5]研究了單位根過程回歸殘差的漸進分布特征,推導(dǎo)和完善了方法的理論基礎(chǔ).但該方法并不適合診斷非參數(shù)模型.非參數(shù)回歸是一種關(guān)注局部的逐點估計,殘差關(guān)聯(lián)機制與參數(shù)模型不同,局部之間缺乏相關(guān)性.Phillips[6]分析了這個問題,并創(chuàng)造性地提出了局部診斷的思想,研究了數(shù)據(jù)隨機趨勢帶給局部殘差特征的影響.Kasparis等[7]沿用了局部視角的檢驗設(shè)計思想,研究了在多元動態(tài)時間序列的分析當(dāng)中,選錯解釋變量滯后期時非參數(shù)回歸的殘差異常性質(zhì).這些診斷方法的共同思路是,設(shè)計統(tǒng)計量考察數(shù)據(jù)趨勢屬性帶給非參數(shù)回歸殘差的影響,用非參數(shù)回歸殘差的局部特征來診斷原始數(shù)據(jù)的趨勢屬性.偽回歸診斷的初衷是辨別有風(fēng)險的回歸,但現(xiàn)有的研究并沒有把非參數(shù)模型中“殘差局部特征”和“估計失真風(fēng)險”的關(guān)聯(lián)關(guān)系說清楚,可見局部DW診斷方法的理論基礎(chǔ)有待進一步論證.診斷在不同窗寬、不同樣本容量的回歸當(dāng)中可能遇到的問題,也有待進一步研究.
本文回顧了隨機趨勢給非參數(shù)模型帶來的偽回歸風(fēng)險,并針對現(xiàn)有文獻的不足,在Phillips局部診斷思想的基礎(chǔ)上,研究了非參數(shù)回歸中殘差局部性質(zhì)和模型估計風(fēng)險的關(guān)聯(lián)關(guān)系.用數(shù)學(xué)語言描述回歸風(fēng)險,并通過數(shù)學(xué)變換,創(chuàng)造性地將回歸的診斷問題轉(zhuǎn)化成了級數(shù)收斂的檢驗問題,解釋了數(shù)據(jù)局部特征與局部回歸風(fēng)險之間的聯(lián)系.還通過模擬實驗,考察了不同類型非參估計的偽回歸診斷,給出了診斷的一般步驟且驗證了診斷的功效.發(fā)現(xiàn),局部殘差性質(zhì)異常是非參數(shù)模型估計失真的充分條件,而局部DW檢驗可以很好地識別這種情況,進而診斷非參數(shù)模型的偽回歸.文章完善了使用局部特征診斷回歸風(fēng)險的理論基礎(chǔ),具有較強的理論意義;歸納了檢驗方法在模擬實驗中表現(xiàn)出的若干性質(zhì),為非參數(shù)模型的實際應(yīng)用提供參考.
誤設(shè)模型的擬合優(yōu)度通常很低,因此研究常用擬合優(yōu)度指標(biāo)來評價模型的可靠性.但當(dāng)數(shù)據(jù)存在趨勢時,擬合優(yōu)度指標(biāo)可能會出現(xiàn)虛高,容易讓人把誤設(shè)的模型當(dāng)作正確的模型.這就是虛假回歸或偽回歸.這種“虛假”是由趨勢造成的.
在實際經(jīng)濟當(dāng)中,時間序列的數(shù)據(jù)生成過程普遍受到多方面因素的影響.其中可能存在一部分影響幾乎不隨時間推移而有所衰減,這部分影響不斷累積,形成了數(shù)據(jù)的趨勢.時間序列的趨勢可以分成如下幾類,即線性趨勢、非線性趨勢、變結(jié)構(gòu)現(xiàn)象和隨機性趨勢[8].趨勢有時會給數(shù)據(jù)分析帶來干擾,進而導(dǎo)致模型的誤設(shè).
趨勢是識別和描述數(shù)據(jù)生成過程的重要工具.可以運用發(fā)現(xiàn)趨勢、擬合趨勢(通常用虛擬變量、傅立葉展開或非參數(shù)形式擬合)和去勢等技術(shù),逐步將包含確定性趨勢的數(shù)據(jù)轉(zhuǎn)換成無趨勢數(shù)據(jù)[9].確定性趨勢在很大程度上是可預(yù)測、可處理的.但如果序列存在隨機趨勢,情況則變得復(fù)雜.隨機性趨勢表現(xiàn)為數(shù)據(jù)的長記憶性(常見的有單位根過程和分?jǐn)?shù)單整過程),這種性質(zhì)打斷了時間序列不同位置間數(shù)據(jù)屬性的遞推機制,給數(shù)據(jù)分析工作帶來了嚴(yán)重的誤導(dǎo).對于確定存在關(guān)聯(lián)關(guān)系的變量,可用誤差修正模型建模,探索變量間的影響機制[10].在不確定關(guān)聯(lián)關(guān)系時,使用回歸方法研究變量關(guān)系就可能將無關(guān)變量擬合出某種關(guān)聯(lián)關(guān)系,研究就是要識別這種回歸.
為了直觀地展示非參數(shù)回歸中偽回歸的問題,下面用模擬實驗舉例,使用非參數(shù)模型對單位根過程做回歸分析.設(shè)三個隨機序列ut,vt,ξt服從標(biāo)準(zhǔn)正態(tài)分布,用它們定義三個非平穩(wěn)過程xt,yt,zt.首先生成單位根過程x序列;然后借助x序列生成y序列,此處不失一般性地設(shè)定二者存在正相關(guān)的線性函數(shù)關(guān)系;最后生成了一個與前兩個序列無關(guān)的單位根過程z序列.
數(shù)據(jù)生成過程的數(shù)學(xué)表達(dá)式如下
其中k取正整數(shù),用來控制y序列的波動幅度,令k=1,序列設(shè)為100期.
對生成的數(shù)據(jù)多次重復(fù)下面的回歸,即式(4)~式(6).
當(dāng)變量間相關(guān)系數(shù)較高時,回歸容易產(chǎn)生較高的擬合優(yōu)度.在考察回歸擬合優(yōu)度之前,不妨先查看自變量和因變量間的皮爾遜相關(guān)系數(shù),實驗重復(fù)1 000次,結(jié)果見圖1.
圖1 相關(guān)系數(shù)直方圖Fig.1 Histogram of the correlation-coefficients
根據(jù)式(1)~式(3)可以看出,y序列與x序列存在函數(shù)關(guān)系,而y與z和v與u均不存在關(guān)聯(lián)關(guān)系.由圖1可以看出,當(dāng)數(shù)據(jù)不存在隨機趨勢,無關(guān)序列不會呈現(xiàn)出顯著的相關(guān)特征,v與u的相關(guān)系數(shù)集中在(-0.2,0.2);當(dāng)數(shù)據(jù)存在隨機趨勢時,無關(guān)序列相關(guān)系數(shù)盡管期望為0,但有時表現(xiàn)出顯著的正相關(guān),有時表現(xiàn)出顯著的負(fù)相關(guān),實驗產(chǎn)生的相關(guān)系數(shù)幾乎是均勻分布在(-1,1)的區(qū)間里;如果數(shù)據(jù)本身存在關(guān)聯(lián)關(guān)系,y與x表現(xiàn)出顯著的相關(guān)關(guān)系,與實驗的設(shè)定相符,相關(guān)系數(shù)集中在(0.97,1.00)的區(qū)間里.
比較三個回歸的擬合優(yōu)度.回歸1中的變量不存在趨勢,擬合優(yōu)度集中在0附近.用非參數(shù)回歸分析非平穩(wěn)數(shù)據(jù)(即回歸2和回歸3)是下面研究的重點.采用不同窗寬實施模擬實驗研究這兩組回歸的擬合優(yōu)度,研究結(jié)果見圖2,圖(a),圖(b)和圖(c)采用的窗寬依次為h=n-1/2.5,h=n-1/3和h=n-1/4.
不妨將回歸2稱為虛假回歸,回歸3稱為真實回歸.圖2顯示,虛假回歸的擬合優(yōu)度幾乎均勻分布在(0,1)的區(qū)間里,而真實回歸的擬合優(yōu)度集中在1附近.在隨機趨勢的影響下,雖然z與y之間不存在關(guān)聯(lián)關(guān)系,但有時會得到不錯的擬合優(yōu)度.擬合優(yōu)度指標(biāo)是失效的.窗寬的不同沒有造成顯著的差異.
研究還做了另一組實驗.令k=10,即放大被解釋變量的波動幅度,比較真實回歸與虛假回歸的擬合優(yōu)度,結(jié)果見表1.
根據(jù)實驗設(shè)定可知,用z來預(yù)測y既沒有經(jīng)濟意義,又沒有實用價值.但當(dāng)因變量有較大波動幅度時,有超過5%的概率,偽回歸的模型看上去更有效.如果單純依據(jù)擬合優(yōu)度選擇模型,有5%以上的概率誤選偽回歸的模型做分析和預(yù)測.
圖2 回歸2和回歸3的擬合優(yōu)度經(jīng)驗分布圖Fig.2 Empirical distribution of goodness of fit for regression 2 and regression 3
表1 憑擬合優(yōu)度選解釋變量時犯錯的概率(k=10)Table 1 The probability of choosing wrong when explanatory variables are selected by goodness of fit(k=10)
可以得到一個初步的結(jié)論,對非平穩(wěn)數(shù)據(jù)做非參數(shù)回歸時,擬合優(yōu)度指標(biāo)無效.模型需要新的診斷工具來識別虛假的回歸.
當(dāng)數(shù)據(jù)生成過程存在隨機趨勢時,擬合優(yōu)度指標(biāo)不再可靠,DW統(tǒng)計量變得重要.無論是參數(shù)模型還是非參數(shù)模型,都對殘差序列做了“相互獨立”的假設(shè).如果估計出的殘差違背了獨立性的假設(shè),對模型的估計可能存在失真.反過來看,若模型設(shè)定有誤,所估計出的殘差通常存在序列相關(guān).利用DW指標(biāo)對殘差做檢驗,可以幫助識別這類模型.
存在偽回歸問題的參數(shù)模型,具有三個特征,分別是異常的關(guān)聯(lián)關(guān)系、較高的擬合優(yōu)度和極低的DW統(tǒng)計量.對參數(shù)模型的偽回歸診斷,主要是借助DW統(tǒng)計量對殘差做序列相關(guān)檢驗.若DW統(tǒng)計量存在異常,可以推斷模型存在虛假回歸.
非參數(shù)殘差的形成機制有所不同.非參數(shù)回歸是一種逐點估計,局部與局部之間缺乏關(guān)聯(lián).但對點估計和局部估計而言,仍可以用殘差的函數(shù)來描述估計面臨的風(fēng)險.不同位置的殘差應(yīng)當(dāng)具有不同的影響權(quán)重.為了評價估計所面臨的風(fēng)險以實現(xiàn)對非參數(shù)模型的診斷,需要基于DW統(tǒng)計量的思想,設(shè)計新的統(tǒng)計量.下面基于非參數(shù)核回歸模型,研究殘差特征與估計風(fēng)險的關(guān)系,給出偽回歸檢驗的設(shè)計思路和理論依據(jù).
非參數(shù)回歸的一般形式為[11]
其中x為解釋變量,y為被解釋變量,t為誤差項的估計值,是對被解釋變量的核回歸估計,其形式為
其中K(·)是核函數(shù),h為窗寬.
在非參數(shù)模型當(dāng)中,窗寬的選擇對模型的估計有顯著的影響.當(dāng)窗寬取無窮大時,非參數(shù)模型退化成線性參數(shù)模型;當(dāng)窗寬無窮小時,非參數(shù)模型研究的是極小區(qū)間內(nèi)的關(guān)系,甚至可能會濃縮到一個點.對偽回歸的診斷,就有逐點視角、局部視角和全局視角等三個角度.全局視角的分析與參數(shù)模型一致,下面主要討論“逐點視角”和“局部視角”.
非參核回歸所做的點估計,本質(zhì)上是用多個觀測值的加權(quán)平均來估計被解釋變量,可將該估算方法的表達(dá)式改寫成
其中wt,i表示估計yi時yt所占的權(quán)重,其表達(dá)式為
在x與y間函數(shù)關(guān)系連續(xù)的假設(shè)下,如果觀測點的x取值相鄰,其y的取值也應(yīng)該相鄰;若xi與xj的差在約定的范圍內(nèi),對任何i?j,都可以用yj作為估計yi的參考;若xi與xj的觀測值足夠臨近,yj與yi也該接近,所以yj將被賦予較高的權(quán)重.當(dāng)數(shù)據(jù)存在異常值時,加權(quán)平均的方法不再適用.舉一個極端的例子,設(shè)yi是一個顯著的離群值,以至于它與其它y觀測值的差別很大,而其它y觀測值之間的差別小到可以忽略,就不應(yīng)該用y的加權(quán)平均值當(dāng)作yi的估計值.以yj來估計yi是存在風(fēng)險的,不同位置帶給估計的風(fēng)險具有不同的權(quán)重.
非參數(shù)模型的點估計風(fēng)險可以用級數(shù)來描述,其表達(dá)形式為
在這個級數(shù)中,如果相鄰數(shù)項相關(guān)系數(shù)為1,點估計值不會隨著樣本容量的增加而收斂,估計風(fēng)險將失控.在wt,i(yi-yt)序列存在高度關(guān)聯(lián)的特征時,模型的估計是不可靠的.前人的研究主要關(guān)注隨機趨勢給殘差特征帶來的影響.本文特別關(guān)注殘差數(shù)據(jù)特征和回歸可靠性之間的關(guān)系,并將回歸風(fēng)險的診斷問題轉(zhuǎn)化成級數(shù)收斂的檢驗問題.
對點估計風(fēng)險的檢驗,需要檢驗wt,i(yi-yt)序列的相關(guān)特征,這要求yi為已知量.然而在實際預(yù)測工作中,待預(yù)測的觀測值通常是未知量.診斷對某個待預(yù)測點的非參估計,需要引入“局部視角”,也就是以該點為觀察點,考察對估計該點產(chǎn)生影響的整個局部,診斷非參數(shù)回歸在這個局部的表現(xiàn).在這個局部里,各位置的i都需要考慮進來.
定義一個待預(yù)測點(xobs,E[y|xobs]),因變量的非參估計值為
根據(jù)定義,待預(yù)測點的y為E[y|xobs],可以將估計風(fēng)險定義成估計值的偏差,并可表達(dá)為
判斷一個局部的回歸質(zhì)量,要考察回歸在局部范圍內(nèi)每一處的估計風(fēng)險.從觀測點的角度出發(fā),不同位置的風(fēng)險應(yīng)該被賦予不同的權(quán)重.用加權(quán)的思想設(shè)計局部DW檢驗,可以識別這種風(fēng)險.從另一個角度來看,檢驗wt,obst的序列相關(guān)特征,可以看成檢驗t序列是否滿足獨立性假設(shè)的一種非線性方法.
經(jīng)過上面的研究,已經(jīng)把回歸風(fēng)險的診斷問題轉(zhuǎn)化成了殘差性質(zhì)的診斷問題.在研究非參數(shù)回歸殘差診斷之前,首先回顧參數(shù)模型的情況.
DW統(tǒng)計量是檢驗參數(shù)模型殘差性質(zhì)的重要工具,其表達(dá)式為
其中T為樣本容量.
使用參數(shù)模型研究問題,最終會給出確定的模型形式及內(nèi)部參數(shù)的估計值,以表述在全部定義域內(nèi)解釋變量如何影響被解釋變量.模型每一處的殘差都有平等的地位,在構(gòu)造統(tǒng)計量時擁有相同的權(quán)重.對非參數(shù)回歸模型的診斷,則有所不同.非參數(shù)模型中沒有一個代表全局的表達(dá)式可供診斷,不同局部間的關(guān)聯(lián)性隨間隔變大而變?nèi)?診斷特定局部的回歸時,其它位置的殘差不再具有平等的地位.Phillips[6]基于相似的思想,率先定義了局部擬合優(yōu)度和局部DW,其表達(dá)式分別為
對一組無關(guān)非平穩(wěn)序列做非參數(shù)回歸時,局部DW統(tǒng)計量在h→0且Th→∞的假設(shè)下有穩(wěn)定的漸進分布(參見文獻[6]中的定理3),可以很好地描述變量趨勢帶給模型的殘差特征.模型如果具有這種殘差特征,其估計的過程就會存在風(fēng)險,因此局部DW檢驗可以用來診斷模型的虛假回歸.
當(dāng)數(shù)據(jù)存在隨機趨勢,擬合優(yōu)度指標(biāo)不再可靠時,局部DW統(tǒng)計量直接用殘差擬合值構(gòu)造函數(shù),相當(dāng)程度上減弱了觀測值非平穩(wěn)帶給檢驗統(tǒng)計量的干擾.其背后的原理在于,加權(quán)后的殘差可以更恰當(dāng)?shù)孛枋龇菂?shù)模型所面臨的回歸風(fēng)險.局部DW統(tǒng)計量所發(fā)現(xiàn)的殘差相關(guān)性,已經(jīng)不再是簡單線性相關(guān)關(guān)系,而是非參數(shù)意義上的相關(guān)關(guān)系.
綜上所述,可以依據(jù)殘差存在的這種非線性序列相關(guān)性來推斷非參數(shù)模型估計存在的風(fēng)險;局部DW統(tǒng)計量可以識別這種序列相關(guān),進而幫助識別模型的誤設(shè);統(tǒng)計量在漸進意義上是可靠的.實際的數(shù)據(jù)分析工作中,討論統(tǒng)計量在漸進意義上是否有效固然重要,其漸進速度同樣對檢驗的實際應(yīng)用產(chǎn)生重大影響.下面通過模擬實驗,研究實際應(yīng)用當(dāng)中,局部DW統(tǒng)計量能否有效地診斷出非參數(shù)模型中的偽回歸問題.
通過模擬實驗評估局部DW檢驗在非參數(shù)模型中的表現(xiàn).實驗的目的在于,一方面評估局部DW檢驗在非平穩(wěn)數(shù)據(jù)非參數(shù)回歸中識別偽回歸的功效,為理論提供支持;另一方面估算恰當(dāng)?shù)慕y(tǒng)計量拒絕域,為實際研究提供參考.考慮到非參數(shù)回歸有樣本容量T和窗寬h兩個重要的參數(shù),實驗對不同樣本容量和不同窗寬分別做了考察,試圖發(fā)現(xiàn)局部DW統(tǒng)計量如何隨模型參數(shù)變化而變化.
生成隨機序列xt、yt和zt,序列生成方式與前文中的x、y和z相對應(yīng).yt與xt存在穩(wěn)定的關(guān)聯(lián)關(guān)系,而與zt無關(guān).序列均存在隨機趨勢,波動幅度參數(shù)k=1.用前文中的回歸2和回歸3對yt做回歸分析,用局部DW檢驗對回歸做診斷,在實驗中觀察檢驗的表現(xiàn).在實驗之前,需要對核函數(shù)的形式做預(yù)設(shè).在非參數(shù)回歸當(dāng)中,通常要根據(jù)數(shù)據(jù)關(guān)聯(lián)關(guān)系來選擇核函數(shù),實驗選用了常見的正態(tài)核函數(shù).在檢驗當(dāng)中,需要借助核函數(shù)來排除局部間的干擾,因此在計算局部DW統(tǒng)計量時,原則上不可以使用正態(tài)核,實驗選擇了較簡單的均勻核.如何更恰當(dāng)?shù)剡x擇核函數(shù),有待進一步的研究.
原假設(shè)為H0:模型的解釋變量與被解釋變量存在關(guān)聯(lián)關(guān)系.備擇假設(shè)為H1:模型錯誤地選擇了無關(guān)的解釋變量.
回歸3使用x做自變量,原假設(shè)H0成立.對這類回歸做檢驗,應(yīng)該以極小的概率拒絕H0(犯棄真錯誤的概率較小),同時以較大的概率拒絕H1(犯取偽錯誤的概率也較小).回歸2使用z做自變量時,備擇假設(shè)H1成立.對這類回歸做檢驗,應(yīng)該以較大的概率拒絕H0,以較小的概率拒絕H1.運用模擬數(shù)據(jù),分別計算兩組回歸中的局部DW指標(biāo),結(jié)果見圖3,
圖3 回歸2和回歸3在中位點附近的局部DW統(tǒng)計量經(jīng)驗分布圖Fig.3 Empirical distribution of local-DW-statistics near the median site of regression 2 and regression 3
圖3中從左到右的三條曲線分別對應(yīng)三組不同的實驗,圖(a),圖(b)和圖(c)采用的窗寬依次為h=n-1/2.5,h=n-1/3和h=n-1/4,每組實驗重復(fù)1 000次.觀察圖3可知,回歸2的局部DW統(tǒng)計量取值集中在0附近,而回歸3的局部DW統(tǒng)計量取值集中在2附近.數(shù)據(jù)的隨機趨勢并沒有給局部DW統(tǒng)計量的表現(xiàn)帶來干擾.
繼續(xù)借助實驗研究局部DW統(tǒng)計量的檢驗臨界值.采用n-1/2.5、n-1/3和n-1/4三個窗寬,選擇1/4分位點、中位點和3/4分位點為回歸檢驗的觀測點,劃定三個“待觀測局部”,選擇T=100,500,1 000,三個樣本容量.首先考察中位點附近,局部DW檢驗的表現(xiàn),實驗結(jié)果見表2.
表2 中位點附近做局部DW檢驗時回歸落入拒絕域的概率表Table 2 Probability table of falling into the rejection domain when local DW test is performed near the midpoint
在中位點診斷非參數(shù)模型,局部DW檢驗的功效較好.尤其是在局部數(shù)據(jù)足夠多時(即窗寬大、樣本多時),局部DW統(tǒng)計量可以顯著地區(qū)分真實回歸和虛假回歸.下面觀察1/4分位點和3/4分位點的情況,實驗結(jié)果見表3.
表3 分位點附近做局部DW檢驗時回歸落入拒絕域的概率表Table 3 Probability table of falling into the rejection domain when local DW test is performed near the locus
診斷1/4和3/4分位點的非參數(shù)估計,局部DW檢驗的功效有所下降.尤其是在小樣本、小窗寬的情況下,統(tǒng)計量分布不穩(wěn)定.將棄真概率設(shè)置到0.01附近時,取偽概率普遍接近或超過0.1;當(dāng)棄真概率設(shè)置到0.05附近,取偽概率的表現(xiàn)才有所改觀.當(dāng)樣本容量超過500后,局部DW統(tǒng)計量分布趨于穩(wěn)定,檢驗功效有所提高.
以上研究表明,局部DW檢驗可以較好地識別非平穩(wěn)數(shù)據(jù)非參數(shù)回歸中的偽回歸.實驗發(fā)現(xiàn),局部DW檢驗的功效呈現(xiàn)出一條基本規(guī)律,即有效樣本越多,檢驗功效越好.當(dāng)樣本容量較小時(如T<100),統(tǒng)計量波動尺度較大,檢驗的功效也較差;在大樣本下,檢驗功效普遍較好.窗寬越小(所容納的觀測值也就越少),檢驗的功效越差;當(dāng)窗寬變大,檢驗功效將得到顯著提升.當(dāng)樣本數(shù)據(jù)來自總體的邊緣,檢驗功效較差;而對中位點附近的非參估計做診斷,檢驗功效較好
本文對非參數(shù)模型中的偽回歸診斷問題進行了研究.與參數(shù)模型相似,非參數(shù)模型同樣可能發(fā)生偽回歸.通過研究非參數(shù)核回歸的估計風(fēng)險與殘差特征發(fā)現(xiàn),模型的估計風(fēng)險可以表述成級數(shù)部分和的形式,而殘差序列中特定的相關(guān)特征會造成級數(shù)的發(fā)散即模型估計風(fēng)險的失控;用加權(quán)后殘差構(gòu)造的局部DW統(tǒng)計量,可以檢驗這種序列相關(guān).這些論證為使用局部DW檢驗方法來預(yù)警回歸風(fēng)險和診斷虛假回歸提供了堅實的理論依據(jù).模擬實驗發(fā)現(xiàn),局部DW檢驗具有良好的功效.在原假設(shè)成立和備擇假設(shè)成立兩種情況下,局部DW統(tǒng)計量都可以較快地趨近于對應(yīng)的穩(wěn)定分布.應(yīng)用局部DW檢驗時,可根據(jù)實際的樣本容量和窗寬設(shè)定來參考本文中相應(yīng)的統(tǒng)計量臨界值.