邱雷顰
(閩江師范高等??茖W(xué)校計(jì)算機(jī)系,福州 350002)
EM算法在基于區(qū)間數(shù)據(jù)的加速壽命試驗(yàn)統(tǒng)計(jì)分析中的應(yīng)用
邱雷顰
(閩江師范高等專科學(xué)校計(jì)算機(jī)系,福州 350002)
在步進(jìn)加速壽命試驗(yàn)中,當(dāng)壽命服從廣義指數(shù)分布且獲得的數(shù)據(jù)是區(qū)間數(shù)據(jù)時(shí),給出試驗(yàn)安排,并通過“各應(yīng)力下產(chǎn)品失效機(jī)理保持不變”等幾個(gè)基本模型假定,得出各應(yīng)力水平下形狀參數(shù)相等的結(jié)論以及不同應(yīng)力水平下的試驗(yàn)時(shí)間t1-t0,t2-t1,…,ti-1-ti-2折算到某一應(yīng)力水平下的時(shí)間τi-1的折算公式,進(jìn)而得出求相關(guān)參數(shù)的極大似然估計(jì)的隱性表達(dá)式。進(jìn)一步討論利用EM算法求解,先由E步求出期望,再由M步求出使得期望極大化的點(diǎn),給出具體的迭代過程。最后采用Monte Carlo數(shù)據(jù)模擬方法分別在大樣本和小樣本場(chǎng)合下給出了參數(shù)真值的估計(jì)值,結(jié)果表明,該方法在大樣本場(chǎng)合下更具有效性。
區(qū)間數(shù)據(jù);廣義指數(shù)分布;EM算法
加速壽命試驗(yàn),是指將樣品置于超過正常應(yīng)力水平下,通過觀察樣品的失效時(shí)間(即壽命),從而利用統(tǒng)計(jì)方法推斷在正常應(yīng)力條件下產(chǎn)品的各項(xiàng)可靠性指標(biāo)的一種壽命試驗(yàn)。目前常見的類型有恒定應(yīng)力加速壽命試驗(yàn),步進(jìn)應(yīng)力加速壽命試驗(yàn),序進(jìn)應(yīng)力加速壽命試驗(yàn)。文獻(xiàn)[1]中討論了加速壽命試驗(yàn)的類型和理論基礎(chǔ)。本文討論步進(jìn)應(yīng)力加速壽命試驗(yàn),簡(jiǎn)稱步加試驗(yàn),是先選定一組加速應(yīng)力水平S1<… 然而,針對(duì)Gupta和Kundu提出的廣義指數(shù)分布[11],利用EM算法對(duì)區(qū)間數(shù)據(jù)的統(tǒng)計(jì)分析的研究并不多見。文獻(xiàn)[12]指出,在分析很多壽命數(shù)據(jù)時(shí),廣義指數(shù)分布往往比其它分布更能有效利用。近年來,雙參數(shù)廣義指數(shù)分布已經(jīng)很廣泛的運(yùn)用到分析壽命數(shù)據(jù)。文獻(xiàn)[13]研究了廣義指數(shù)分布的尺度參數(shù)的極大似然估計(jì)基于隨機(jī)截尾模型。文獻(xiàn)[14]介紹了形狀參數(shù)的增加,使得這一分布族產(chǎn)生了更多的靈活性,使它可以被用來分析刪失數(shù)據(jù),如區(qū)間數(shù)據(jù)。 本文將主要討論當(dāng)獲得的壽命數(shù)據(jù)為區(qū)間數(shù)據(jù),而壽命分布服從廣義指數(shù)分布時(shí)相關(guān)參數(shù)的統(tǒng)計(jì)分析。 1.1 試驗(yàn)安排 1.2 基本假定 假定1 在應(yīng)力水平Si(i=1,2,…,m)下,產(chǎn)品的壽命分布為廣義指數(shù)分布,分布函數(shù)為Fi(t)=(1-e-λit)αi,密度函數(shù)為fi(t)=αiλi(1-e-λit)αi-1·e-λit,其中λi和αi分別是尺度參數(shù)的倒數(shù)和形狀參數(shù),和應(yīng)力水平Si有關(guān)。 假定2 在應(yīng)力水平Si(i=1,2,…,m)下,產(chǎn)品的失效機(jī)理保持不變[1]。 假定3 產(chǎn)品在應(yīng)力水平S下,滿足線性加速模型lnλi=a+bφ(Si),其中φ(Si)是與應(yīng)力水平Si有關(guān)的已知函數(shù),下記φi,i=1,2,…,m。 假定4 產(chǎn)品的剩余壽命僅依賴于當(dāng)時(shí)已累積失效的部分和當(dāng)時(shí)的應(yīng)力水平,而與累積的方式無關(guān)[15]。 引理1 在應(yīng)力水平Si(i=1,2,…,m)下,產(chǎn)品的壽命分布為Fi(t)=(1-e-λit)αi,則αi≡α(i=1,2,…,m)。 由基本假定2,在應(yīng)力水平Si(i=1,2,…,m)下,產(chǎn)品的失效機(jī)理保持不變,即加速系數(shù)是與R無關(guān)的常數(shù),因此要求αi≡α(i=1,2,…,m)。 引理2 若記τi-1為產(chǎn)品經(jīng)歷了水平S1,S2,…,Si-1的步加試驗(yàn)后,各段試驗(yàn)延續(xù)時(shí)間t1-t0,t2-t1,…,ti-1-ti-2折算到Si應(yīng)力水平下總的折算時(shí)間,則 證明 由基本假定4知τi-1滿足 又由假定1和假定2得: (1-e-λiτi-1)α=(1-e-λi-1(ti-1-ti-2+τi-2))α 得到, e-λiτi-1=e-λi-1(ti-1-ti-2+τi-2) 由此得到遞推公式 又由τ0=0得 其中,i=2,3,…,m。由基本假定知, 所以,τi-1為b的函數(shù),下記τi-1(b), i=1,2,…,m。 估計(jì)a,b,α三個(gè)參數(shù)。記n個(gè)樣品的失效時(shí)間為Xk,k=1,2,…,n,它們是獨(dú)立同分布的隨機(jī)變量,密度函數(shù)為f(x)=αλ(1-e-λx)α-1·e-λx, x>0,λ>0,α>0。只能觀測(cè)到落在區(qū)間[ti,ti+1)中的樣本數(shù)ni,其中i=0,1,2,…,m,0=t0 x落在區(qū)間[ti,ti+1)中的概率為 P(x∈[ti,ti+1))=Fi+1(ti+1)-Fi(ti)= [1-e-λi+1(ti+1-ti+τi(b))]α-[1-e-λi(ti-ti-1+τi-1(b))]α 其中記t-1=τ-1(b)=0,λ0=λm+1=0。 定理1 參數(shù)a,b,α的極大似然估計(jì)可以由隱性表達(dá)式求解。 (1) (2) (3) 其中, 證明 容易得到似然函數(shù)為 對(duì)數(shù)似然函數(shù)為 式(1)、式(2)和式(3)無法得出a,b,α的顯性表達(dá)式,于是考慮用EM算法實(shí)現(xiàn)。 為了便于表述,n個(gè)樣品的失效時(shí)間Xk,k=1,2,…,n的全體記為X,觀測(cè)結(jié)果即落在區(qū)間[ti,ti+1)中的樣本數(shù)目ni, i=0,1,2,…,m, 0=t0 于是 [1-exp[-ea(k)+b(k)φi(t-ti-1+τi-1(b(k)))]]α(k)-1· exp[-ea(k)+b(k)φi(t-ti-1+τi-1(b(k)))] 其中, [1-exp[-ea(k)+b(k)φi(ti-ti-1+τi-1(b(k)))]]α(k)- [1-exp[-ea(k)+b(k)φiτi-1(b(k))]]α(k) 所以 其中, AiAi(a,b,t)1-exp[-ea+bφi(t-ti-1+ τi-1(b))] (4) a= (5) (6) 迭代過程: (1)當(dāng)k=0時(shí),給定參數(shù)初始值a(0),b(0),α(0),及任意小的正數(shù)ε。 (2)當(dāng)k≥1時(shí),現(xiàn)有的參數(shù)估計(jì)為a(k),b(k),α(k)。 ①取式(4)右邊的,b=b(k),即可找到α(k+1), ②取式(5)右邊的b=b(k),a=a(k),α=α(k),即可找到a(k+1), ③令式(6)為零,即可解出b的顯示表達(dá)式,令表達(dá)式中a=a(k),b=b(k),α=α(k)找到b(k+1), 其中, (t-ti-1+τi-1(b(k)))] 滿足迭代終止的條件后繼續(xù)進(jìn)行20次迭代,取所得到的20個(gè)參數(shù)迭代值的平均值作為對(duì)真實(shí)參數(shù)的估計(jì) 考慮步進(jìn)加速壽命試驗(yàn)過程中的應(yīng)力為溫度,其中T1=240,T2=350,T3=470,φi=φ(Ti)=1/Ti,t0=0,t1=1.20×104,t2=1.55×104,t3=1.66×104,參數(shù)真值為a=-20,b=104,α=2,取迭代初始值a(0)=-18,b(0)=12000,α(0)=2.5。 在小樣本場(chǎng)合下,取n0=n1=n2=5,ε=10-3,在大樣本的場(chǎng)合下,取n0=n1=n2=100,ε=10-3運(yùn)用以上迭代過程得到參數(shù)真值的估計(jì),見表1。 表1 模擬結(jié)果 由數(shù)據(jù)模擬結(jié)果表1可知,在大樣本場(chǎng)合下,估計(jì)值與參數(shù)真值的相對(duì)誤差有所減小。因此,在產(chǎn)品壽命服從廣義指數(shù)分布的情況下,基于獲得的數(shù)據(jù)為區(qū)間數(shù)據(jù)的步進(jìn)加速壽命試驗(yàn),在大樣本場(chǎng)合下利用EM算法給出參數(shù)的最大似然估計(jì)顯得更為有效。 [1] YANG Y H,ZHOU Y Q.Theoretical foundation of accelerated life testing[J].Journal of Propulsion and Technology,2001,22(5):353-356. [2] ZHAO W,ELSAYED E A.A general accelerated life model for step-stress testing[J].IIE Trans,2005,37:1059-1069. [3] MOHAMED T.Step-Stress Accelerated Life Tests[C]//Miodrag Lovric.International Encyclopedia of Statistical Science,Springer,America:2011:1547-1517. [4] DEMPSTER A P,LAIRD N M,RUBIN D B.Maximum likelihood from incomplete data via the EM algorithm[J].Math SciNet Google Scholar.JR Stat Soc Ser B,1977,39:1-22. [5] WU C F.On the convergence properties of the EM algorithm[J].The Annals of Statistics,1983,11(1):95-103. [6] AMBROISE C.The EM Algorithm and Extensions[J].Journal of classification,1988,15(1):154-156. [7] CHARLES B,PAUL P B.Handbook of Mathematical Methods in Imaging[M].New York:Springer-Verlag,2015. [8] HUANG W H,CHEN Y G.The multiset EM algorithm[J].Statistics & Probability Letters,2017,126:41-48. [9] SUVRA P,BALAKRISHNAN N.Destructive negative binomial cure rate model and EM-based likelihood inference under Weibull lifetime[J].Statistics & Probability Letters,2016,116:9-20. [10] JEAN-PATRICK B,GILLES C.EM for mixtures[J].Statistics and Computing,2015,25(4):713-726. [11] GUPTA R D,KUNDU D.Generalized exponential distributions[J].Australian & New Zealand Journal of Statistics,1999,41:173-188. [12] CHIANG-SHENG L,HSINE-JEN T.A note on the generalized linear exponential distribution[J].Statistics & Probability Letters,2017,124(5):49-54. [13] NAMHYUN K.Approximate MLE for the scale parameter of the generalized exponential distribution under random censoring[J].Journal of the Korean Statistical Society,2014,43(1):119-131. [14] DEBASIS K,RAMESHWAR D G.An extension of the generalized exponential distribution[J].Statistical Methodology,2011,8(6):485-496. [15] NELSON W B.Accelerated life testing-step-stress models and data analysis[J].IEEE Transaction on Reliability,1980,29(2):103-108. Statistical Analysis Based on EM Algorithm for Accelerated Life Testing Under Interval Censored Samples QIULeipin (Department of Computer Science, Minjiang Teachers College, Fuzhou 350002, China) An accelerated life test carried out by step stress is considered when the the life time follows a generalized exponential distribution and the failure data obtained is interval censored. The test procedure is presented and the exchange formula of time is given by some assumptions. With the help of the expectation-maximization (EM) algorithm which is widely used when the observations can be viewed as incomplete data, the maximum likelihood estimates are computed. Moreover, an example by Mote Carlo data simulation is given to illustrate the procedure and show that this method is available, especially in large sample case. interval censored; generalized exponential distribution; EM algorithm 2017-06-06 福建省教育廳中青年課題(JAT160827) 邱雷顰(1980-),女,福建石獅人,講師,碩士,主要從事概率與數(shù)理統(tǒng)計(jì)方面的研究,(E-mail)qiuleipin@163.com 1673-1549(2017)04-0081-06 10.11863/j.suse.2017.04.15 0212.7 A1 試驗(yàn)安排及基本模型假定
2 參數(shù)估計(jì)
3 EM算法求極大似然估計(jì)
4 數(shù)據(jù)模擬