劉 洋,范永輝
(天津師范大學數(shù)學科學學院,天津 300387)
半相依回歸模型中回歸系數(shù)的廣義p值檢驗
劉 洋,范永輝
(天津師范大學數(shù)學科學學院,天津 300387)
研究半相依回歸模型中回歸系數(shù)的精確檢驗問題.針對含有2個相依線性方程的回歸系統(tǒng)中回歸系數(shù)的假設檢驗問題,利用廣義p值的方法建立了精確的檢驗.對檢驗的功效進行了模擬,模擬結果表明,本研究的檢驗方法能有效控制第一類錯誤出現(xiàn)的概率,具有較好的檢驗效果.
半相依回歸模型;回歸系數(shù);廣義p值;廣義檢驗變量
由m個相依線性回歸方程組成的線性回歸系統(tǒng)形式如下
其中:yi為n×1觀測向量;Xi為n×pi列滿秩設計陣;βi為pi×1未知回歸系數(shù);εi為隨機誤差向量.若隨機誤差向量ε1,ε2,…,εm具有相關性,即滿足
這里,“?”表示矩陣的Kronecker乘積,In為n階單位陣,Σ=(σij)m×m為非對角正定矩陣,則這樣的系統(tǒng)稱為半相依回歸系統(tǒng)[1].
半相依回歸系統(tǒng)模型在國民經濟、計量經濟、生物、工業(yè)及計量地理學等相關領域有著廣泛的應用,同時也適用于銷售預測[2]、經濟預測、通貨膨脹研究等有關領域[3].自該類模型參數(shù)的一類兩步估計被提出以來[4],關于此類模型的研究一直受到很多學者的關注.
與一般的線性模型類似,對于半相依模型(1),常常要檢驗如下假設:
其中:β′=(β1′,β2′,…,βm′)為k×(p1+p2+…+pm)的行滿秩矩陣,H為q×k矩陣.由于多余參數(shù)(Σ中的元素)的影響,假設(2)不存在精確檢驗.
假設檢驗是統(tǒng)計推斷中的一個重要內容,進行檢驗決策的重要依據(jù)之一就是p值.在半相依模型中,由于協(xié)方差矩陣中多余參數(shù)的影響,導致無法獲取傳統(tǒng)意義上的精確的p值檢驗.為了克服檢驗中多余參數(shù)帶來的困難,文獻[5]提出了廣義p值檢驗.文獻[6]分別對單向分類模型方差分量的單邊假設和多向分類模型中方差分量的單邊假設問題給出了基于廣義p值的精確檢驗,文獻[7]將這種方法應用到混合效應模
型中,分別對單個方差分量的顯著性和2個獨立平衡模型方差分量的比較建立了精確檢驗,并將部分結果推廣到非平衡的情況.文獻[8-9]利用廣義p值對協(xié)方差具有組內相關結構的簡單生長曲線模型中的回歸系數(shù)建立了精確檢驗,文獻[10]將其結果推廣到具有相關結構的簡單生長曲線模型.文獻[11-12]利用廣義p值和廣義置信區(qū)間對Panel數(shù)據(jù)模型中回歸系數(shù)的假設檢驗問題建立了精確檢驗,并構造了回歸系數(shù)的幾個廣義置信區(qū)間.文獻[13]利用一個有用的矩陣不等式,構造了一般的含2個方差分量混合模型中方差分量復雜假設下的廣義p值檢驗,并拓展到某些含多個方差分量模型中的方差分量檢驗.
本研究對于含有2個相依線性方程的回歸系統(tǒng)中回歸系數(shù)的假設檢驗,利用廣義p值的方法建立了精確的檢驗,并對檢驗的功效進行了模擬.
令X是一個可觀測的隨機變量,具有分布函數(shù)F(x|θ,η).需要考慮的是檢驗假設H0:θ<θ0,θ0是已知量,而η是由多余參數(shù)組成的參數(shù)向量.為了引入廣義p值,首先引入廣義檢驗變量.廣義檢驗變量是指滿足以下條件的隨機變量T(X,x,θ,η)(x是隨機變量X的觀測值):
(1)T是θ的隨機單調函數(shù);
(2)T的觀測值T(x,x,θ,η)與未知參數(shù)無關;
(3)當θ=θ0時,T的分布與未知參數(shù)無關.
廣義p值定義為P(T>t|θ=θ0).對于給定的顯著性水平α,如果廣義p值小于α,則拒絕H0.關于廣義p值的詳細內容見文獻[5].
為方便,記rank(A)、R(A)、tr(A)分別為矩陣A的秩、A的列向量張成的線性子空間和A的跡.
含2個相依線性回歸方程的線性回歸系統(tǒng)為:
其中:yi為n×1觀測向量;Xi為n×pi列滿秩設計陣;βi為pi×1未知回歸系數(shù);εi為隨機誤差向量.假定(ε1,ε2)的行獨立同分布,每行服從二維正態(tài)分布N2(0,Σ),其中Σ=(σij)為2階未知正定陣,并且σ12≠0.
記y′=(y1′,y2′),X′=diag(X1′,X2′),β′=(β1′,β2′),ε′=(ε1′,ε2′).由模型(3)的假設可知ε服從2n維正態(tài)分布N(0,Σ?In).
對矩陣(X1,X2)作QR分解
將(Q1,Q2)補全成正交陣Q=(Q1,Q2,Q3),則由QR分解的性質可知,R(Q1,Q2)=R(X2,X1)=R(X1,X2),R(Q3)=R(X2,X1).
用Q′對半相依模型作變換
將zi適當分塊,記作zi′=(zi1′,zi2′),i=1、2,其中zi1、zi2分別是r×1、(n-r)×1的向量,在模型(7)中適當交換zi1、zi2,i=1、2在向量z中的位置,得到如下等價模型
由該模型可知β=(β1′,β2′)′的最佳線性無偏估計[14]為
在實際應用中,Σ往往是未知的,因此需尋求一種兼顧誤差向量間相關性和可行性的估計.
由于 (z12,z22)′~N(0,Σ?In-r),隨機矩陣 (z12,z22)行獨立,且每一行服從分布N(0,Σ),故可看作從二維正態(tài)總體N(0,Σ)中抽取的一個容量為n-r的樣本,令
由于S只是z12、z22的函數(shù),故S與z11、z21獨立,也與相互獨立.在式(8)中將Σ用它的估計代替,得到的兩步估計為
其中:z′=(z11′,z21′),z~N(Rβ,Σ?Ir),且由S與z的獨立性可知
那么有(HVH′)-1/2H((S)-β)|S~N(0,I),這個條件分布與S無關,故(HVH′)-1/2H((S)-β)的無條件分布也是N(0,I),并且與S獨立.
記TS為S的Cholesky因子,即S=TSTS′,TS=(Tij)是下三角矩陣,并且對角線元素都為正數(shù).令θ為Σ的Cholesky因子,設M=θ-1TS,則有顯然M也是下三角矩陣.根據(jù)文獻[15]的定理3.2.14, M的元素mij,i≥j都是獨立的,并且,i= 1、2,mij~N(0,1),i>j.令s是S的觀測值,tS是TS的觀測值,則tStS′=s.
由以上討論可構造廣義檢驗變量
其中:s是S的觀測值;tS是TS的觀測值;
且MM′~W(n-r,I).令t是廣義檢驗變量T的觀測值,則t=(H(S)-d)′(H(S)-d)與未知參數(shù)無關.當H0成立時,T的分布與位置參數(shù)無關,故廣義p值可定義為
如果廣義p值p1小于給定的顯著性水平α,則拒絕原假設,認為Hβ和d有顯著性差異.
由于廣義檢驗變量T中包含的變量的分布已知,但分布函數(shù)難以計算,故廣義p值p1很難計算,可以利用文獻[16]使用的Monte-Carlo模擬方法來給出p1的值,模擬過程如下:
計算出t的值,令p1=0;
For i=1 to m
從ξ、η的分布隨機抽取它們的觀測值;
計算廣義檢驗變量T的值t1;
如果t1>t,則p1=p1+1;
end(i);
計算廣義p值p1=p1/m.
針對假設問題H0:Hβ=d?H1:Hβ≠d,本節(jié)給出基于T的廣義p值檢驗功效的模擬.模擬過程中取
表1 檢驗功效的模擬結果Tab.1 Results of simulation for effects of test
由表1的模擬結果可以看出,當(Hβ-d)′(Hβd)=0時,原假設H0:Hβ=d成立.模擬結果顯示,所有檢驗功效都是(Hβ-d)′(Hβ-d)的增函數(shù),即Hβ與d的距離越遠,否定H0的概率就越大.模擬結果同時顯示,當H0成立時,T的功效(犯第一類錯誤的概率或真實的檢驗水平)和給定的檢驗水平α= 0.05相差不大.由這些數(shù)據(jù)可以看出,廣義p值檢驗要比似然比檢驗具有優(yōu)越性.
對于含有2個相依線性方程的回歸模型,本研究給出了關于回歸系數(shù)假設檢驗問題的一種廣義p值方法,構造了廣義檢驗變量,進一步通過隨機模擬的方法,考察了檢驗的功效.模擬結果表明,本研究的檢驗方法能有效控制第一類錯誤出現(xiàn)的概率,具有較好的檢驗效果.
[1]馬鐵豐.線性混合模型與多元分布中的統(tǒng)計推斷問題[D].北京:北京工業(yè)大學,2008. MA T F.Problems of statistic inference in linear mixture models and multivariate distributions[D].Beijing:Beijing University of Technology,2008(in Chinese).
[2] 高榮興.半相依線性回歸模型在耐用消費品銷售預測中的應用[J].系統(tǒng)工程學報,1992,7(2):71-78. GAO R X.The application of seemingly unrelated linear regression models in forecasting sales of durable consumer goods[J].Journal of Systems Engineering,1992,7(2):71-78(in Chinese).
[3]黃克明,胡瑞平,張國忠.我國通貨膨脹與對外經濟的半相依自回歸模型的研究[J].系統(tǒng)工程理論與實踐,2003(4):56-58. HUANG K M,HU R P,ZHANG G Z.The seemingly unrelated autoregression model of Chinese inflation and foreign economy[J].Systems Engineering-Theory and Practice,2003(4):56-58(in Chinese).
[4]王松桂.線性回歸系統(tǒng)回歸系數(shù)的一種新估計[J].中國科學:A輯,1988(10):1033-1040. WANG S G.A new estimation of regression coefficients in linear regression system[J].Science China:Ser A,1988(10):1033-1040(in Chinese).
[5] TUSI K W,WEERAHANDI S.Generalized p-values in significance testing of hypotheses in the presence of nuisance parameter[J].Journal of the American Statistical Association,1989,84:602-607.
[6] WEERAHANDI S.Testing variance components in mixed models with generalized p-values[J].Journal of the American Statistical Association,1991,86:151-153.
[7] ZHOU L P,MATHEW T.Some tests for variance components using generalized p-values models[J].Technometrics,1994,36:394-402.
[8] WEERAHANDI S,BERGER V W.Exact inference for growth curves with intraclass correlation structure[J].Biometrics,1999,55:921-924.
[9]CHI E M,WEERAHANDI S.Comparing treatments under growth curve models:Exact tests using generlized p-values[J].Journal Statistical Planning and Inference,1998,71:179-189.
[10]LIN S H,LEE J C.Exact tests in simple growth curve models and oneway ANOVA with equicorrelation error structure[J].Journal of Multi-variate Analysis,2003,84:351-368.
[11]范永輝,王松桂.廣義p-值與Panel數(shù)據(jù)模型的精確檢驗[J].應用數(shù)學學報,2008,31(2):367-373. FAN Y H,WANG S G.Generalized p-value and exact test in Panel data model[J].Acta Mathematicae Applicatae Sinica,2008,31(2):367-373(in Chinese).
[12]程靖,王松桂,岳容先.Panel數(shù)據(jù)模型中回歸系數(shù)的廣義p值檢驗[J].工程數(shù)學學報,2009,26(5):836-844. CHENG J,WANG S G,YUE R X.Generalized p-value test for regression coefficients in Panel data model[J].Chinese Journal of Engineering Mathematics,2009,26(5):836-844(in Chinese).
[13]郭紅霞.混合效應模型的廣義p值檢驗[D].北京:北方工業(yè)大學,2014. GUO H X.Generalized p-value tests for mixed effect models[D].Beijing:North China University of Technology,2014(in Chinese).
[14]王松桂,史建紅,伊素菊,等.線性模型引論[M].北京:科學出版社,2004. WANG S G,SHI J H,YIN S J,et al.Introduction of Linear Model[M]. Beijing:Science Press,2004(in Chinese).
[15]MUIRHEAD R J.Aspects of Multivariate Statistical Theory[M].New York:John Wiley and Sons,2005.
[16]KRISHNAMOORTHY K,MATHEW T.Inferences on the means of lognormal distributions using generalized p-values and generalized confidence intervals[J].Journal Statistical Planning and Inference,2003,115:103-121.
(責任編校 馬新光)
Generalized p-value test for regression coefficients in seemingly unrelated regressions
LIU Yang,F(xiàn)AN Yonghui
(College of Mathematical Science,Tianjin Normal University,Tianjin 300387,China)
The problem of exactly testing regression coefficients in seemingly unrelated regression equations is studied.By using the method of generalized p-value,the exact tests of regression coefficients in the seemingly unrelated regressions equations with two linear equations are established.The effects of the tests are simulated,and the simulation results show that the tests can control the probability of typeⅠerror and have good effects.
seemingly unrelated regressions;regression coefficients;generalized p-value;generalized test variables
O212.7
A
1671-1114(2016)06-0001-04
2016-06-20
劉 洋(1992—),女,碩士研究生.
范永輝(1972—),男,教授,主要從事概率統(tǒng)計方面的研究.