龍沁怡, 徐麗平*, 龍 兵
(1.長江大學信息與數(shù)學學院, 湖北 荊州 434023; 2.荊楚理工學院數(shù)理學院, 湖北 荊門 448000)
Pareto分布作為一種統(tǒng)計模型,在工資收入、保險精算、城市規(guī)劃以及可靠性工程等領(lǐng)域有著極為廣泛的應(yīng)用. 因此,對 Pareto產(chǎn)品進行可靠性試驗具有實際意義. 在本文中假定Pareto分布有如下的累積分布函數(shù)和概率密度函數(shù):
(1)
(2)
其中,α(>0),θ(>0)分別被稱為尺度參數(shù)和形狀參數(shù).為書寫簡便,將F(x;α,θ)和f(x;α,θ)分別簡記為F(x)和f(x).
對于截尾樣本來說,根據(jù)觀測數(shù)據(jù)預測未失效產(chǎn)品的信息是一個至關(guān)重要的問題.在試驗的早期階段可以告訴我們測試的成本有多高,以及是否需要重新設(shè)計試驗方案.目前關(guān)于預測方面的研究成果較多[13-17].本文假設(shè)受試產(chǎn)品的失效時刻服從Pareto分布,在雙定時混合截尾樣本下對產(chǎn)品的失效時刻進行了預測.
在這里將對文獻[12]中提出的雙定時混合截尾方案進行再次描述,該試驗方案如下.
假設(shè)在0時刻把n個獨立同分布的樣品投入試驗,它們的失效時刻分別為X1,X2,…,Xn,正整數(shù)m 記 即在時刻t1之前的失效樣品數(shù)為m1個,而在時刻t2之前的失效樣品數(shù)為m2個,m1,m2為隨機變量.如果m1≥m,則在時刻t1停止試驗,沒有失效的n-m1個樣品退出試驗,其中0 記 基于上述試驗數(shù)據(jù),省略正則化常數(shù)后似然函數(shù)為 (3) 其中,I(·)為示性函數(shù). 根據(jù)(3)式,利用極大似然法可得參數(shù)θ和α的極大似然估計分別為 (4) (5) [1-F(y)]n-k-s[1-F(t)]-(n-k), (6) 其中,y≥t. 對于Pareto分布(1)式,可以把(6)式變形為 (7) 在似然預測方法中,將運用極大似然法得到未知參數(shù)的估計和未來失效時刻的預測.基于觀測數(shù)據(jù)可以得到Y(jié)和(α,θ)的預測似然函數(shù)為 根據(jù)(3)和(7)式,則Y和(α,θ)的預測似然函數(shù)為 (8) 顯然α的極大似然估計為 (9) 取α=x1:n,去掉常數(shù)項后,對數(shù)預測似然函數(shù)為 nθlnx1:n-θ(s-1)lnt-[θ(n-k)+ (10) 根據(jù)(10)式,分別求對數(shù)預測似然函數(shù)關(guān)于θ和y的偏導數(shù),則θ,Y的預測似然方程為 (11) (12) 由方程(11)和(12)可以得到Y(jié)=X(s+k):n的極大似然預測為 下面求出Y的條件分布的中位數(shù),以此作為對Y的預測,并被稱為條件中位數(shù)預測. 根據(jù)(7)式,利用二項式展開 因此Y=X(s+k):n的條件概率密度函數(shù)可以變形為 (13) dj=n-k-s+j+1. 即 由條件概率密度函數(shù)(13),可以得到 (14) 由條件概率密度函數(shù)(13)不難得到Y(jié)=X(s+k):n的100(1-γ)%等尾預測區(qū)間為(L1,U1),其中L1和U1分別滿足下面的2個方程, (15) (16) 在Bayes統(tǒng)計分析中,未知參數(shù)先驗分布的選取是非常重要的,很多文獻中選擇Gamma分布作為先驗分布.在這里也選取θ的先驗分布為Gamma分布,其概率密度函數(shù)為 (17) 這里,超參數(shù)a>0,b>0,Γ(·)表示Gamma函數(shù). 由(3)和(17)式,利用Bayes公式可得θ的后驗概率密度函數(shù)為 (18) 由(13)和(18)式可得Y=X(s+k):n的Bayes預測密度函數(shù)為 b]-(k+a+1). (19) 根據(jù)(19)式可以得到Bayes預測生存函數(shù)為 (20) 因此Y=X(s+k):n的100(1-γ)%的Bayes等尾預測區(qū)間的下限L2和上限U2分別滿足 (21) (22) 可以用數(shù)值方法求出方程(21)和(22)的解,從而得到Bayes預測區(qū)間(L2,U2).事實上,利用Bayes預測密度函數(shù)(19)式也可以求出Y=X(s+k):n的Bayes預測值. 采用Bayes方法可以借助先驗信息來提高統(tǒng)計推斷的精度,如果沒有先驗信息可以利用,也可以取無信息先驗分布,在這里取θ的無信息先驗分布為 (23) 由(3)和(23)式,可得θ的后驗密度函數(shù)為 (24) 實際上在(18)式中取a=0,b=0就得到后驗概率密度函數(shù)(24)式,因此Y=X(s+k):n的Bayes預測概率密度函數(shù)為 (25) 由(25)式可得到Bayes預測生存函數(shù)為 因此Y=X(s+k):n的100(1-γ)%的Bayes等尾預測區(qū)間為(L3,U3),其中下限L3和上限U3分別滿足 根據(jù)Z的概率密度函數(shù)(2)式,可得生存函數(shù)為 當α已知時,θ的極大似然估計為 根據(jù)后驗概率密度函數(shù)(18)式,可以得到第n+1個失效數(shù)據(jù)Z=Xn+1的后驗預測密度函數(shù)為 (k+a)(A+b)k+az-1× (lnz-lnα+A+b)-(k+a+1),z≥α. (26) 根據(jù)(26)式得到的Bayes預測生存函數(shù)為 (27) 由(27)式可得Z=Xn+1的Bayes中位數(shù)預測值為 zU=exp[(A+b)(γ-1/(k+a)-1)+lnα]. 下面將對文獻[18]中的數(shù)據(jù)集進行分析,把這些數(shù)據(jù)按照從小到大的順序排列如下:0.500 9、0.504 0、0.514 2、0.522 1、0.526 1、0.541 8、0.547 3、0.583 4、0.609 1、0.625 2、0.640 4、0.649 8、0.675 0、0.703 1、0.709 9、0.716 8、0.791 8、0.846 5、0.903 5、1.114 3. 借助上面的完全數(shù)據(jù)可以得到不同的雙定時混合截尾數(shù)據(jù).已知α=0.5,利用文中的結(jié)論能夠計算出被截尾樣品未來次序失效時刻的預測值和預測區(qū)間(γ=0.05),相關(guān)結(jié)果列于表1中. 表1 Y=X(s+k):n的預測值和預測區(qū)間(a=0.5,b=0.2) 根據(jù)不同的雙定時混合截尾數(shù)據(jù)也可以得到Z=Xn+1的預測值和預測區(qū)間(γ=0.05),相關(guān)結(jié)果列于表2中. 表2 Z=Xn+1的預測值和預測區(qū)間 從表1可以看到,Y=X(s+k):n的3種預測區(qū)間的下限比較接近,當t1,t2,m和s固定時Y=X(s+k):n極大似然預測小于條件中位數(shù)預測,經(jīng)典預測區(qū)間的長度最小,兩種Bayes預測區(qū)間的長度比較接近,真正的觀測值都落在3個預測區(qū)間的內(nèi)部.在表2中對于超參數(shù)a,b的2種不同的取值及不同的雙定時混合截尾試驗數(shù)據(jù),Xn+1的預測值和預測區(qū)間都比較接近,當t1,t2和m固定時,中位數(shù)預測值小于Bayes中位數(shù)預測值.從這個例子中也可以看到利用文中的結(jié)論所得到的失效時刻的預測值和真實的失效時刻還是比較接近的. 本文根據(jù)觀測到的雙定時混合截尾試驗數(shù)據(jù),討論了未來失效數(shù)據(jù)的預測問題.當試驗樣品的失效時刻服從Pareto分布時,利用經(jīng)典方法得到了被截尾樣品未來失效時刻的預測值.在取兩種不同的先驗分布時計算了未來失效時刻的預測區(qū)間.對于獨立同分布的任一產(chǎn)品,對它的失效時刻進行了預測.通過數(shù)值例子的計算,所得到的結(jié)果也是符合實際情況的.利用本文中的方法可以隨時根據(jù)觀測到的失效數(shù)據(jù)對未來的失效時刻進行預測,以便于估算試驗的費用,進而考慮是否需要重新確定試驗的終止時刻,在控制費用的情況下盡可能提高統(tǒng)計推斷的精度.另外在雙定時混合截尾試驗數(shù)據(jù)下,也可以討論其它壽命分布模型產(chǎn)品失效時刻的預測問題.2 極大似然估計及條件分布
3 未來觀測值的經(jīng)典預測
3.1 似然預測方法
3.2 條件預測方法
3.3 經(jīng)典預測區(qū)間
4 未來觀測值的Bayes預測
4.1 Gamma先驗分布
4.2 無信息先驗分布
5 任一觀測值的預測
6 數(shù)據(jù)分析
7 結(jié)論