張學新
(湖北工程學院 數(shù)學與統(tǒng)計學院,湖北孝感 432000)
失擬檢驗在社會物流總額函數(shù)的應用
張學新
(湖北工程學院 數(shù)學與統(tǒng)計學院,湖北孝感 432000)
文章討論了多元線性回歸模型異方差情形的失擬檢驗問題,實例模擬研究了失擬檢驗的效率,給出了失擬檢驗在社會物流總額關于GDP一次函數(shù)的應用。
失擬檢驗;勢分析;蒙特卡洛模擬;異方差;社會物流總額函數(shù)
回歸方程常用于研究變量之間的聯(lián)系,常假設它能對所有可能的因變量、自變量及不可觀測的誤差項成立,它可能會包含不必要的或無關的變量,或忽視某些變量。如果設定的函數(shù)形式真實地反映了那些感興趣變量的關系,相應的估計或推斷過程將是可靠并有效的;如果回歸模型的設定是錯誤的,那么統(tǒng)計推斷可能是誤導的、甚至是災難性的。因此,評估回歸函數(shù)參數(shù)形式的充分性將是回歸建模不可缺少的部分。雖然拉格朗日乘子檢驗、各種殘差圖等幾何工具經常用來檢驗設定的回歸函數(shù)的適當性,但是沒有利用組內變異的信息,而失擬檢驗具有一定的優(yōu)勢,因為它是利用重復觀測數(shù)據(jù)。對失擬檢驗的研究逐步得到重視[1,2],主要在試驗性學科領域,國內研究也只見工業(yè)實際應用及試驗設計方面[3~7],在經濟學領域似乎不多見[8],本文對此作了有益嘗試。本文首先研究多元線性回歸模型中的失擬檢驗,通過一個真實的羊肉需求模型分析失擬檢驗的勢。然后利用199l—2014年樣本數(shù)據(jù)檢驗GDP是社會物流總額的單向Granger原因,通過一元線性回歸方程,以GDP的歷史值預測社會物流總額本期值,并使用失擬檢驗佐證了社會物流總額關于GDP的線性模型。本文方法為失擬檢驗在宏觀經濟中的應用提供了參考。
在研究線性回歸函數(shù)變量之間的關系時,利用重復試驗或觀察的數(shù)據(jù),檢驗回歸模型是否可以接受,稱為失擬檢驗。失擬檢驗很直觀,將模型殘差視為隨機誤差加上失擬誤差。隨機誤差與模型無關,但失擬誤差卻與模型相關,如果模型合適,失擬誤差的值就小,否則失擬誤差的值就會很大。因此,可以把殘差平方和分解為純誤差平方和與失擬平方和,以失擬誤差對純誤差的相對大小來做判斷。如果失擬誤差會顯著地大于純誤差,應該放棄模型。
通常,失擬檢驗用于比較一個分類模型是否比一個線型模型更顯著性的擬合了數(shù)據(jù)?,F(xiàn)在考慮p-1元線性回歸模型Y=Xβ+ε,其中Y=(y1,y2,···,yn)T,X=(x1,···xi,···xn)T,xTi=(1,
xi,1···xi,p-1),β=(β0,β1,···,βp-1)T,ε=(ε1,ε2,···,εn)T~N(0,σ2In),i=1,···n。在重復觀測情形下,假設每個自變量重復水平數(shù)均為m,把因變量y在第i個水平組合處的第j個觀測表示為是總觀測值數(shù)。需要檢驗:
整個檢驗過程結果用一張方差分析表給出,見表1所示。
表1 多元回歸情形失擬檢驗方差分析
在一元多項式回歸情形,最常見的失擬檢驗是H0:E(y|x)=(1,x,···xp-1)β對 H1:E(y|x)≠(1,x,···xk-1)β(k),β(k)=(β0,β1,···βk-1)T,1≤p<k≤c,其中c是變量x的水平數(shù)。設總觀測值個數(shù)n,則檢驗統(tǒng)計量:
特別的,失擬檢驗 H0:E(y|x)=(1,x)β(2)對 H1:E(y|x)≠(1,x)β(2)的統(tǒng)計量:
假設檢驗的勢(Power)是指當零假設H0錯誤時,正確拒絕它的概率,也叫統(tǒng)計檢驗的靈敏性。當存在一個真實的效應需要檢測時,檢驗的勢反映了某個研究將證實這個統(tǒng)計效應的可能性。勢越高,認可效應的可信度越大。檢驗的勢受顯著性水平α,樣本容量n及效應ES大小的影響,對給定顯著性水平α,檢驗的勢越大越好。
劉銳,王莉[9]提出羊肉需求模型:
其中,MPC為羊肉人均消費量,pdi為城鄉(xiāng)居民可支配收入,pb為牛肉價格,pm為羊肉價格。模型估計結果是:
現(xiàn)有意在H0:lnMPC=-0.7652+0.1484lnpdi-0.1434 lnpm+0.1484lnMPCt-1中忽視牛肉價格 pb,即讓H1:lnMPC=-0.7652+0.1484lnpdi-0.1434lnpm+clnpb +0.1484lnMPCt-1正確,本文分析失擬檢驗的勢。
設計如下模擬方案:對各個解釋變量,按照由樣本獲得的各自最小值與最大值等間距劃分水平,在每種水平組合上均重復測量4次,取因變量每次對應的誤差項εt~N(0,1)。分別取參數(shù)c=0,0.08,0.15,0.5,1,2,水平數(shù)l=5,10,20,30,50,80。在每種(c,l)組合上均模擬1000次,取顯著性水平α=0.05,研究失擬檢驗勢隨c,樣本容量n=4l變化情況,見表2及圖1所示。
表2 羊肉需求模型失擬檢驗勢
這個模擬研究表明,隨著備擇假設越來越偏離零假設的模型,失擬檢驗的效率越來越大,樣本容量越大,檢驗效率越高,對于備擇假設的模型很接近于零假設的時候(c= 0,0.08,0.15),可能會做出錯誤的決策,但是隨著備擇假設偏離零假設模型很大時(c=0.5,1,2),失擬檢驗有較好的效率,能夠做出較好的模型。
圖1 擬檢驗勢隨參數(shù)c,樣本容量變化趨勢
玉米的價格pma與MPC有無關系呢?玉米可以飼養(yǎng)豬或雞,有理由認為pma對羊肉消費有負影響,在H0中加入-clnpma項,仿照上述模擬方案,得到圖2。
圖2擬檢驗勢隨樣本容量變小
圖2顯示,失擬檢驗的勢在小樣本情形急劇下降,而對大樣本情形則一致平穩(wěn),低于10%,故不能認為玉米的價格是個無關變量。當玉米的價格劇烈增長時,它對羊肉消費有影響,可能體現(xiàn)在它與豬肉(雞肉)產量的關系上,豬肉(雞肉)產量的增長間接降低了羊肉消費。可見該羊肉需求模型還有改進的余地。
這里wi是某個回歸因子或其他變量,而α和δ都是待估未知參數(shù)。由,得其中可以認為[10]對做普通最小二乘法就得到α和δ的一致的漸進有效估計。
作為失擬檢驗在宏觀經濟中的一個應用,現(xiàn)在研究楊琳,劉忠波[11]提出的全社會物流總額與GDP之間一元二次模型與一元一次模型設定問題。
本文選取1991—2014年中國國內生產總值GDP與全社會物流總額TVSL的數(shù)據(jù)(單位:萬億元):
GDP=[2.16,2.66,3.46,4.68,5.85,6.79,7.45,7.83,8.19,9.00, 9.73,10.52,11.69,13.65,18.23,20.94,24.66,31.40,33.50,39.80, 47.16,51.93,56.80,63.65];
TLV=[3.02,3.91,5.43,7.92,10.20,11.03,12.37,12.87,13.89, 17.06,19.45,23.26,29.55,38.38,48.01,59.60,75.23,89.89,96.65, 125.40,158.40,177.30,197.80,213.50];(來源:1991—2014年《中國第三產業(yè)統(tǒng)計年鑒》、全國物流運行情況通報(中華人民共和國國家發(fā)展和改革委員會)、《中國統(tǒng)計年鑒》及中國物流采購與聯(lián)合會網站等。)
首先擬合全社會物流總額TVSL與國內生產總值GDP間的簡單回歸方程,得:
模型估計結果見表5所示,表明方程擬合較好。
其次進行異方差檢驗,同時采用Breusch-Pagan檢驗、White檢驗、及White與Wooldridge特別情形檢驗。
在White檢驗的輔助回歸方程中最小二乘估計的殘差平方需在所有原始自變量及它們的平方項、交叉乘積項上回歸;Breusch-Pagan檢驗是White檢驗的特殊情形,殘差平方只在原始自變量上回歸;而White與Wooldridge特別情形檢驗是殘差平方在因變量的擬合值及擬合值平方項上回歸。
三種檢驗的p-值是,White檢驗的pValW=0.4002,Breusch-Pagan檢驗的pVal BPK=0.2162,Breusch-Pagan檢驗的pValWs=0.4002,說明沒有異方差。
最后模型適定性檢驗:
為了獲得自變量上的重復觀測值,把GDP數(shù)據(jù)每連續(xù)三年求平均,并以該平均值代替原值,得到點(GDP, TLV)18個重復觀測值:(4.12,2.16),(4.12,2.66),(4.12,3.46),(9.72,4.68),(9.72,5.85),(9.72,6.79),(13.04,7.45),(13.04, 7.83),(13.04,8.19),(19.92,9.00),(19.92,9.73),(19.92, 10.52),(38.65,11.69),(38.65,13.65),(38.65,18.23),(74.91, 20.94),(74.91,24.66),(74.91,31.4)。據(jù)此做失擬檢驗,結果見表3所示。
表3 自變量重復觀測的回歸模型失擬檢驗
表3表明,在0.01,0.05顯著性水平下,均接受H0:E(TLV|GDP)=-12.281+3.548GDP的假設,說明社會物流總額作為GDP一次函數(shù)是合適的。
如果選擇把GDP數(shù)據(jù)每連續(xù)五年求平均,失擬檢驗的結果仍是接受原假設。把變量觀測值調整為重復觀測值,原則上要求它們相差不顯著,也不應定要求每個重復觀測值是等重復的。
賈國強[12]利用199l—2010年樣本數(shù)據(jù)證實社會物流總額與GDP互為Granger因果關系,本文把樣本數(shù)據(jù)擴展為199l—2014年后發(fā)現(xiàn),無論是滯后1期,還是滯后2期,在5%顯著性水平下,結果都是:GDP是TLV的Granger原因,但TLV不是GDP的Granger原因。GDP2期對TLV的預測能力似乎比其1期的強(0.0079<0.0282),參見表4。
表4 成對Granger因果檢驗
這個結果是可以接受、可以解釋的。從TLV的構成及GDP的定義看,TLV只是GDP的小部分,從我國社會物流發(fā)展歷程看,是國內生產總值發(fā)展到一定程度后,才有物流發(fā)展,這與方程(9)的常數(shù)項為負值是吻合的。通常GDP數(shù)據(jù)發(fā)布滯后1~2年,實際上不可能用當年GDP預測同年的TLV。因而,預測本年TLV應該是利用GDP的前年值或上前年值,在實際應用時可靈活選擇。使用不同滯后期GDP預測TLV的模型信息見表5,其中模型的調整-R2=都很高,模型顯著性檢驗的p-值及回歸系數(shù)顯著性檢驗的p-值均接近0,表明各個方程擬合也好。
表5 TLV對不同滯后期GDP的回歸結果
失擬檢驗本質上是利用來自于組內變異的額外信息,因變量在至少自變量的一個水平上有重復觀測值,純誤差源于這些重復。失擬檢驗可以給出獨立于模型之外的參數(shù)σ2的估計,是一種數(shù)據(jù)驅動檢驗方法。由于失擬檢驗要求有重復試驗的數(shù)據(jù),不及某些模型設定準則及模型選擇準則應用普遍。但是,本文對失擬檢驗的勢函數(shù)模擬分析表明失擬檢驗能有效優(yōu)化模型,只要對經濟數(shù)據(jù)適當歸為重復觀測的情形,失擬檢驗就能更多地應用于經濟數(shù)據(jù)擬合研究中。
[1]Aerts M,Claeskens G,Hart J.Testing Lack of Fit in Multiple Regres?sion[J].Biometrika.2000,87.
[2]Baraud Y,Huet S,Laurent B.Adaptive Tests of Linear Model Hypoth?eses by Model Selection[J].Annals of Statistics,2003,31.
[3]郭東星,何大衛(wèi).失擬分析在曲線擬合中的應用[J].中國衛(wèi)生統(tǒng)計, 1999,16(6).
[4]張宣昊,岳榮先.均勻設計在多響應線性模型失擬檢驗中的最優(yōu)性[J].上海師范大學學報(自然科學版),2007,36(2).
[5]劉德成.小型船舶摩擦模型的研究[J].造船技術,2009,(5).
[6]王明亮,李希菲.非線性樹高曲線模型的研究[J].林業(yè)科學研究, 2000,13(1).
[7]胡國兵,劉渝.BPSK信號盲處理結果的可靠性檢驗算法[J].數(shù)據(jù)采集與處理,2011,26(6).
[8]Doran H E,Kmenta J.A Lack-of-Fit Test for Econometric Applica?tions to Cross-Section Data[J].Review of Economics and Statis?tics.1992,74(2).
[9]劉銳,王莉.中國牛羊肉消費情況及展望[J].農業(yè)展望,2014,(10).
[10]Bartlett M S,Kendall D G.The Statistical Analysis of Variance Het?erogeneity and the Logarithmic Transformation[J].Journal of the Roy?al Statistical Society,SeriesB,1946,(8).
[11]楊琳,劉忠波.一元線性回歸模型在預測物流需求的應用[J].商業(yè)文化(學術探討),2007,(10).
[12]賈國強.物流業(yè)發(fā)展與經濟增長關系研究——基于中國的實證分析[D].北京:北京交通大學,2011.
(責任編輯/浩天)
F224.7
A
1002-6487(2016)22-0073-03
張學新(1966—),男,湖北宜城人,博士,副教授,研究方向:概率論與數(shù)理統(tǒng)計方法應用。