蔡定教,易景平
(1.北京師范大學(xué) 數(shù)學(xué)科學(xué)學(xué)院,北京 100875;2.安陽師范學(xué)院 數(shù)學(xué)與統(tǒng)計學(xué)院,河南 安陽 455000)
?
部分區(qū)間刪失數(shù)據(jù)下指數(shù)分布中MLE的相合性
蔡定教1,2,易景平2
(1.北京師范大學(xué) 數(shù)學(xué)科學(xué)學(xué)院,北京 100875;2.安陽師范學(xué)院 數(shù)學(xué)與統(tǒng)計學(xué)院,河南 安陽 455000)
[摘要]部分區(qū)間刪失數(shù)據(jù)包括精確數(shù)據(jù)以及區(qū)間刪失數(shù)據(jù), 在慢性病研究中有廣泛的應(yīng)用.本文主要考慮在具有1類部分刪失數(shù)據(jù)下指數(shù)分布中最大似然估計的相合性,在一定的正則條件下證明了最大似然估計的強相合性.
[關(guān)鍵詞]區(qū)間刪失;相合性;最大似然估計;緊集;生存函數(shù)
部分區(qū)間刪失數(shù)據(jù)在實際生活中有廣泛的應(yīng)用. 如在慢性病的研究中,有些病人開始患病的年齡是已知的;而另一些人只知道現(xiàn)在已患病,因而只知道患病時刻在當(dāng)前時刻之前;還有一類未患病的可疑個體,則只知患病時刻在當(dāng)前時刻之后. 更一般的情形發(fā)生在跟蹤研究中,如亞類心絞病和冠心病的研究中. 對于一類病人,心絞病或冠心病的發(fā)病時刻是清楚的,但是對另一些病人則只在某兩個時刻進(jìn)行臨床檢測. 此外在丹麥的糖尿病研究中的數(shù)據(jù)也是既有精確值也包含區(qū)間刪失數(shù)據(jù).
我們知道在僅有精確值的情形,指數(shù)模型中未知參數(shù)的最大似然估計具有強相合性. 本文中我們考慮在具有1類部分區(qū)間刪失數(shù)據(jù)情形下最大似然估計的強相合性. 1類部分刪失數(shù)據(jù)具體描述如下:對于一些研究對象,我們能觀察到它們生存時間的精確值T1,…Tn1,然而對其他的對象卻只能知道它們的現(xiàn)狀. 也就是說對于這些組中的第j個對象,只知道它在檢測時刻Uj時是否已失效;因而觀測數(shù)據(jù)為:(δj,Uj),j=1,…,n2. 當(dāng)未知失效時刻Tj≥Uj時δj=1;否則δj=0.
1生存分析模型
設(shè)生存分析模型服從參數(shù)為λ的指數(shù)分布. 則生存函數(shù)為S(x)=exp{-λx},x>0, 相應(yīng)的密度函數(shù)為f(x)=λexp{-λx},x>0.
-exp{-λUj})(1-δj).
對數(shù)似然函數(shù)為:
+(1-δj)ln(1-exp{-λUj})].
假設(shè)1真值λ0為Λ的內(nèi)點且Λ為緊集.
2Jessen不等式和Hoeffding不等式
Jessen不等式:設(shè)X為m維隨機向量,f為定義在Rm上的凸函數(shù),EX存在有限,則
Ef(X)≥f(EX).
當(dāng)f為嚴(yán)凸時,上式中等號當(dāng)且僅當(dāng)P(X=EX)=1時才成立.
Hoeffding不等式:設(shè)X1,…,Xn是個獨立隨機變量且P(Xi∈[a,b])=1,1≤i≤n,Sn=X1+…+Xn,則對任意t≥0,有
3相合性
定義1:對指數(shù)型分布族,最大似然估計MLE的定義如下:
這里p(x;λ)=(exp{-λUj})δ(1-exp{-λUj})(1-δ).令E為真實參數(shù)為λ0時的期望, 則對任意λ≠λ0,0<α<1,由Jessen不等式得
由p(x;λ)關(guān)于λ的可識別性知不等號嚴(yán)格成立, 即
(1)
對λ的任一領(lǐng)域N, 定義
則對一列λ的半徑為ε的開領(lǐng)域Nε,當(dāng)ε→0時, 有Nε收縮到λ, 從而有
由(1)式知當(dāng)n1充分大而ε充分小時,存在ηε>0使得
(2)
通過簡單的計算可得
再根據(jù)對數(shù)函數(shù)的凹性得
(3)
右邊和事件中每一項的概率為一致有界獨立隨機變量的平均值非負(fù)的概率. 而由(2)知這些隨機變量具有負(fù)的期望. 利用Hoeffding不等式,每一項的概率具有階e-εn2,這里ε取為2ρ2/(M-log(1-α))2, 其中M=max(ηλk,1≤K≤m),ρ為某一負(fù)數(shù)且(2)中的期望n1>N在時小于ρ. 進(jìn)一步有
利用Borel-Cantelli引理及假設(shè)2知以概率1
由N0的任意性即得證.
[參考文獻(xiàn)]
[1]Jong S. Kim. Maximum Likelihood estimation for the proportional hazards model with partly interval censored data [J].J.R.Statist.Soc.B,2003,65(2):489-502.
[2]Van der Vaart, A. W. and Wellner, J.A. Existence and consistency of maximum likelihood in upgraded mixture models[J].Multivariate Analysis,1992,43:133-146.
[3]Huang J. Efficient estimation for the proportional hazard model with interval censoring[J].The Annals of Statistics,1996,24(2):540-568.
[4]Huang J. and Wellner, J.A. Asymptotic Normal of the NPMLE of Linear Functionals for Interval Censored Data, Case 1[J]. Statistica Neerlandica,1995,49:153-163.
[5]Van der Vaart, A. W. and Wellner, J.A. Weak convergence and empirical processes[M]. New York:Springer Verlag, 1996.
[6]陳希孺.高等數(shù)理統(tǒng)計學(xué)[M].合肥:中國科學(xué)技術(shù)大學(xué)出版社,1999:192.
[責(zé)任編輯:Z]
[中圖分類號]O213.9
[文獻(xiàn)標(biāo)識碼]A
[文章編號]1671-5330(2015)02-0006-02
[作者簡介]蔡定教(1979—),男,浙江溫州人,北京師范大學(xué)博士生,講師,主要從事生物統(tǒng)計的研究。
[收稿日期]2015-02-02