陳顯彬,林 松,尹長(zhǎng)明
(廣西大學(xué) 數(shù)學(xué)與信息科學(xué)學(xué)院, 南寧 530004)
廣義估計(jì)方程是對(duì)縱向數(shù)據(jù)進(jìn)行回歸分析的一類(lèi)重要方法,由Liang等[1]于1986年對(duì)廣義線(xiàn)性模型推廣而得到。1983年,McCullagh等[2]出版了專(zhuān)著來(lái)系統(tǒng)地論述廣義線(xiàn)性模型。對(duì)于自然聯(lián)系函數(shù)的情況,極大似然估計(jì)的弱相合性和漸近正態(tài)性的條件在文獻(xiàn)[3-5]中都有列出。特別關(guān)于Logit模型的條件,文獻(xiàn)[6-8]也給出了論述。對(duì)于非自然聯(lián)系函數(shù),文獻(xiàn)[9]給出了相應(yīng)的漸近結(jié)果,但沒(méi)有嚴(yán)格的假設(shè)和條件,而文獻(xiàn)[10]則需要非常強(qiáng)的條件。由于之前研究存在一定的局限性,1985年L.Fahrmeir和H.Kaufmann發(fā)表了文獻(xiàn)[11],論述了極大似然估計(jì)的漸近性質(zhì);1986年,兩人在文獻(xiàn)[12]中具體分析了離散相應(yīng)變量的漸近推斷,又豐富了廣義線(xiàn)性模型的相關(guān)理論。
本文設(shè)在試驗(yàn)中對(duì)第i個(gè)個(gè)體的第j次觀(guān)測(cè)得到q×1維響應(yīng)變量Yij,pn×q維協(xié)變量Xij,i=1,…,n,j=1,…,m。設(shè)來(lái)自不同個(gè)體的觀(guān)測(cè)值相互獨(dú)立,來(lái)自相同個(gè)體觀(guān)測(cè)值則是相關(guān)的,但相關(guān)系數(shù)未知。令Yij=(Yij1,…,Yijq)T的期望為
(1)
(2)
方差記為
(3)
(4)
若Yij服從三項(xiàng)分布(觀(guān)測(cè)次數(shù)是1),即q=2,期望
(5)
(6)
就得到兩步Logit模型[13-14]。
Wang[15]在一定條件下證明了經(jīng)典Logit廣義估計(jì)方程
(7)
對(duì)兩階段Logit模型,假設(shè)以下條件成立:
(8)
為了證明定理1,需要以下引理:
下面4個(gè)引理的證明分別與文獻(xiàn)[4]引理3.1、3.3、3.4、3.5類(lèi)似,故在此省略。
引理2 若假設(shè)條件①~⑤成立,則
引理3 若假設(shè)條件①~⑤成立,則?Δ>0,an,bn∈Rpn,有
引理4 若假設(shè)條件①~⑤成立,則?Δ>0,an,bn∈Rpn,有
引理5 若假設(shè)條件①~⑤成立,則?Δ>0,an,bn∈Rpn,有
定理1的證明
根據(jù)引理1,證明方程Sn(βn)=0根的存在性且式(8)成立,只需證明?ε>0,存在一個(gè)Δ>0,對(duì)足夠大的n有如下式子成立:
(9)
由微分中值定理,
(10)
(11)
(12)
其中εi(βn)=Yi-hi(βn)。所以
(13)
由引理2和假設(shè)⑤得
(14)
(15)
由引理3和假設(shè)⑤得:
(16)
(17)
由引理4和引理5及假設(shè)⑤得:
(18)
由假設(shè)②~④可得
(19)
由式(16)~(19)知In2≤-CΔ2pn,再由式(13)和(14)知|In1|=ΔOp(pn),可見(jiàn)當(dāng)Δ足夠大時(shí)式(8)(9)成立。
[1] LIANG K Y,ZEGER S L.Longitudinal data analysis using generalized linear models[J].Biometrika,1986,73:12-22.
[2] MCCULLAGH P,NELDER J A.Generalized Linear Moders[M].New York:Chapman&Hall,1989.
[3] HABERMAN S J.Maximum likelihood estimates in exponential response models[J].The Annals of Statistics,1977,66:815-841.
[4] ANDERSEN E B.Discrete Statistical Models with Social Science Applications[J].North Holland,Amsterdam,1980(3).
[5] NORDBERG L.Asymptotic normality of maximum likelihood estimators base on independent,unequally distributed observations in exponential family models[J].Scandinavian Journal of Statistics,1980:27-32.
[6] HABERMAN S J.The Analysis of Frequency Data Univ[M].Chicago:Chicago Press,1974.
[7] MCFADDEN D.Conditional logit analysis of qualitative choice behavior[M].Academic,New York:[s.n.],1974.
[8] GOURIEROUX C,MONFORT A.Asymptotic properties of the maximum likelihood estimator in dichotomous logit models[J].Econometrics,1981(2):83-97.
[9] MATHIEU J R.Tests ofχ2in the generalized linear model[J].Statistics:A Journal of Theoretical and Applied Statistics,1981(3):509-527.
[10] FAHRMEIR L,KAUFMANN H.Consistency and asymptotic normality of the maximum likelihood estimator in generalized linear models[J].The Annals of Statistics,1985(3):342-368.
[11] FAHRMEIR L,KAUFMANN H.Asymptotic inference in discrete response models[J].Statistische Hefte,1986(4):179-205.
[12] FAHRMEIR L,TUTZ G.Multivariate statistical modelling based on generalized linear models[M].New York:Springer-Verlag,1994.
[13] MORAWITZ B,TUTZ G.Alternative parametrizations in business tendency surveys[J].Zeitschrift Operations Research,1990,34:143-156.
[14] WANG L.GEE analysis of clustered binary data with diverging number of covariates[J].Annals of Statistics,2011,39(1):389-417.
[15] ORTEGA J M,RHEINBOLDT W C.Iterative solution of nonlinear equations in several variables[M].San diego:Academic press,1970.