溫艷清, 崔利榮, 劉寶亮, 師海燕
(1. 西北工業(yè)大學(xué)機電學(xué)院, 陜西 西安 710072; 2. 北京理工大學(xué)管理與經(jīng)濟學(xué)院, 北京 100081; 3. 山西大同大學(xué)數(shù)學(xué)與計算機科學(xué)學(xué)院, 山西 大同 037009)
貯備系統(tǒng)的可靠性一直是可靠性領(lǐng)域研究的熱點問題之一,對于一些高可靠性要求的產(chǎn)品,通過貯備部件,可以大大地提高系統(tǒng)的可靠性,例如航空設(shè)備、汽車零部件等[1]。研究者們在以往的可靠性研究中,常用指數(shù)分布作為故障時間的分布。指數(shù)分布具有無記憶性且解析式易于處理,但其只適應(yīng)于壽命具備無記憶的設(shè)備場合,對于壽命是退化型的設(shè)備(部件),再用指數(shù)分布去刻畫效果就不太理想。為了克服以上困難,假設(shè)所涉及的分布是一般分布時,通過運用補充變量法可以處理相對比較簡單的可用度模型,對于比較復(fù)雜的模型,這些方法顯得舉步維艱。位相型(phase-type, PH)分布可以把任一個非負連續(xù)隨機變量逼近到任意的精度,且任何取值為正整數(shù)的離散概率分布是一個離散PH分布[2]。由于PH分布具有指數(shù)分布易處理的特點,所以其在排隊論、交通系統(tǒng)、統(tǒng)計信號處理、可靠性理論[3-7]等方面取得了廣泛應(yīng)用。以上參考文獻都是針對連續(xù)時間情形下系統(tǒng)模型的,然而實際工程領(lǐng)域中,并不是所有的系統(tǒng)都能被連續(xù)地檢測,正如國際著名可靠性專家Ruiz-Castro[8]所說:“或許因為不可能進行連續(xù)的檢測,或許因為系統(tǒng)自身內(nèi)部結(jié)構(gòu)的原因,工程上一些系統(tǒng)僅僅能在某些離散時間點被檢測,例如土木和航空工程領(lǐng)域的設(shè)備?!苯陙?離散時間情形下系統(tǒng)可靠性的研究越來越得到學(xué)者們的重視。文獻[8-11]在假設(shè)系統(tǒng)模型中所涉及的時間分布均為離散PH分布的情形下,研究了各種離散時間系統(tǒng)模型的可靠性。修理工多重休假策略在連續(xù)時間系統(tǒng)可靠性建模[12-15]中被研究者們廣泛使用,因為這樣使修理工這個人力資源得到更有效的利用。在連續(xù)時間情形下,文獻[5]假設(shè)所涉及的隨機時間分布為連續(xù)PH分布,研究了修理工具有多重休假的兩部件可修系統(tǒng)的可靠性;文獻[7]假設(shè)所涉及的隨機時間分布為連續(xù)PH分布,考慮了修理工帶多重休假的n部件冷貯備系統(tǒng)的可靠性。修理工多重休假是指當(dāng)系統(tǒng)中的部件都完好時,修理工離開系統(tǒng)去休假,休假結(jié)束返回系統(tǒng)中,如果發(fā)現(xiàn)系統(tǒng)中有故障部件等待修理,那么他開始修理故障部件,直到系統(tǒng)中沒有故障部件,他再離開系統(tǒng)去休假。這兒的“休假”指的是修理工兼職去做一些其他的事情,使得修理工這個人力資源得到充分的利用。例如:鐵路維修工對火車、地鐵等的維修檢查,不同工作的時間分配,船舶修理工的救助待命就屬于多重休假,有緊急救助時工作,沒有救助就做別的維修檢測。到目前為止,所了解的文獻中,尚沒有學(xué)者在所涉及到的隨機分布為離散PH分布的假設(shè)下研究有多重休假的貯備系統(tǒng),因此本文研究離散時間下修理工可多重休假的冷貯備系統(tǒng)的可靠性,系統(tǒng)中有2個部件,一個部件正常工作,另一個部件冷貯備,工作部件出現(xiàn)故障,冷貯備部件立即替換變?yōu)楣ぷ鞑考?。部件正常工作時間、修理時間、修理工的休假時間都服從離散時間的PH分布。本文所建的模型在工程實踐中有廣泛的應(yīng)用,例如醫(yī)生在進行大型手術(shù)的時候,有兩個供電系統(tǒng):正常電力供應(yīng)系統(tǒng)(可以看作部件1)和應(yīng)急發(fā)電系統(tǒng)(可以看作部件2,作冷貯備),電力系統(tǒng)維護工(修理工)可以進行多重休假。又如可以把飛機上的兩個同樣的發(fā)動機看作兩個部件,當(dāng)其中一個發(fā)動機正常運轉(zhuǎn)的時候,飛機將正常工作,供電系統(tǒng)扮演修理工的作用,其將給飛機的每個子系統(tǒng)進行正常電力供應(yīng),即進行休假。當(dāng)正運轉(zhuǎn)的這個發(fā)動機故障停止運轉(zhuǎn)時,另一個發(fā)動機立即啟動,同時這個“修理工”也將給檢測和維護系統(tǒng)供電來檢測和維護出現(xiàn)故障的這個發(fā)動機。本文所建立的模型是文獻[5]中模型在離散情形下的推廣,在工程實踐中,系統(tǒng)只在離散時間檢測普遍存在,例如火車、飛機、船舶上的一些關(guān)鍵零部件的檢測。由于任何取值為正整數(shù)的離散概率分布是一個離散PH分布,且離散時間情形并不是連續(xù)時間情形的一個特殊情況,當(dāng)系統(tǒng)在離散時間情形下運行,在線部件的故障、修理的完成以及休假的完成能夠同時發(fā)生,這是與連續(xù)時間情形下完全不同的,所以本文所得結(jié)果更具有一般性,有重要的理論和實際應(yīng)用價值,可以為管理人員的管理決策提供依據(jù)。
下面介紹Kronecker積與Kronecker和的定義,其在隨后論文的研究中被大量使用。
定義1[16]Kronecker積
如果A和B分別為m1×m2和n1×n2的矩陣,則其Kronecker積A?B是階數(shù)為m1n1×m2n2的矩陣,且
定義2[16]Kronecker和
如果A和B分別為m和n階方陣,則Kronecker和定義為
A⊕B=A?In+Im?B
式中,In和Im分別為m和n階單位矩陣。
考慮修理工具有多重休假的冷貯備離散時間可修系統(tǒng),系統(tǒng)由2個部件和1個修理工組成,系統(tǒng)模型的假設(shè)如下:
(1)κ=0時刻,部件都是新的。系統(tǒng)一旦啟動,其中一個部件開始工作,另一個部件冷貯備,修理工立即進入休假,在休假結(jié)束后,兩個部件仍沒有出現(xiàn)故障,重新開始另一次休假,稱為多重休假;若工作部件發(fā)生故障需要維修,冷貯備部件(如果系統(tǒng)中有貯備部件)立即替換這個故障部件開始工作。
(2) 修理工的多重休假策略參考文獻[6]中系統(tǒng)模型建立中的(2)。
(3) 部件正常工作時間X, 修理時間Y, 修理工的休假時間Z相互獨立,都服從離散的PH分布,且X~PH(α,T),位相的階數(shù)為m,Y~PH(β,S),位相的階數(shù)為k,Z~PH(γ,L)。假設(shè)隨機變量X,Y,Z相互獨立。
基于以上的假設(shè),系統(tǒng)可以用一個離散時間Markov鏈{Xn,n=0,1,2,…}來描述,其狀態(tài)空間是S={S1,S2,S3,S4,S5},其中,S1,S2,S3,S4,S5是宏狀態(tài),下面給出這些宏狀態(tài)表示的具體意義。
S1={(0,i,l),1≤i≤m,1≤l≤k}表示一個部件正常工作,工作時間在位相i,另一個部件冷貯備,修理工處于休假狀態(tài),且修理工休假在位相l(xiāng)。
S2={(1,i,l),1≤i≤m,1≤l≤k}表示一個部件正常工作,工作時間在位相i,另一個部件出現(xiàn)故障,修理工處于休假狀態(tài),休假時間在位相l(xiāng)。
S3={(1,i,j),1≤i≤m,1≤j≤n}表示一個部件正常工作,工作時間在位相i,另一個部件出現(xiàn)故障,修理工正在修理故障部件,修理時間在位相j。
S4={(2,l),1≤l≤k}表示兩個部件都發(fā)生故障,修理工在休假,休假時間在位相l(xiāng)。
S5={(2,j),1≤j≤n}表示系統(tǒng)中兩個部件都發(fā)生故障,修理工在修理第一個故障的部件,修理時間在位相j,另一個部件等待修理。
在上述假設(shè)下,系統(tǒng)的狀態(tài)空間為S=W∪F={S1,S2,S3}∪{S4,S5},其中,W表示系統(tǒng)的工作狀態(tài)集;F表示系統(tǒng)的故障狀態(tài)集。系統(tǒng)的轉(zhuǎn)移概率矩陣表示為P,其是一個分塊矩陣,每一塊相應(yīng)于S={S1,S2,S3,S4,S5}中狀態(tài)之間的轉(zhuǎn)移,即
S1S2S3S4S5
(1)
下面說明轉(zhuǎn)移概率矩陣矩陣P中的這些分塊元素如何得到。
轉(zhuǎn)移S1→S1相應(yīng)于T?L+T?L0γ。這是兩項的和,因為系統(tǒng)中沒有發(fā)生部件故障修理工休假也沒有結(jié)束,表示為T?L;或者修理工休假結(jié)束了但發(fā)現(xiàn)系統(tǒng)中沒有故障部件,所以其進行第二次休假,表示為T?L0γ。
轉(zhuǎn)移S1→S2相應(yīng)于T0α?L。這是因為正常工作的部件出現(xiàn)故障,冷貯備部件立刻取代其開始工作,表示為T0α,而修理工仍然在休假L。
轉(zhuǎn)移S1→S3相應(yīng)于T0α?L0?β。這是由于正常工作的部件出現(xiàn)故障,冷貯備部件取代其工作,表示為T0α,修理工休假結(jié)束后發(fā)現(xiàn)有故障部件,立即開始修理,表示為β。
轉(zhuǎn)移S2→S2相應(yīng)于T?L。這是因為系統(tǒng)中在線工作的部件沒有發(fā)生故障T,修理工的休假也沒有結(jié)束L,所以先前故障的部件也沒有得到修理。
轉(zhuǎn)移S2→S3相應(yīng)于T?L0?β。這是因為在線工作的部件沒有發(fā)生故障T,修理工從休假返回,發(fā)現(xiàn)系統(tǒng)中有一個故障部件等候修理L0,所以其立即以初始向量β開始修理這個故障部件。
轉(zhuǎn)移S2→S4相應(yīng)于T0?L。這是因為系統(tǒng)中在線工作的部件發(fā)生了故障T0,而修理工仍然在休假L,先前故障的部件也沒有得到修理。
轉(zhuǎn)移S2→S5相應(yīng)于T0?L0?β。這是因為系統(tǒng)中在線工作的部件發(fā)生了故障T0,修理工從休假返回L0,立即開始修理第一個故障部件β。
轉(zhuǎn)移S3→S1相應(yīng)于T?S0?γ。這是因為修理工正在修理的故障部件修理完好了S0,而在線工作的部件沒有發(fā)生故障T,所以其以初始向量γ開始休假。
轉(zhuǎn)移S3→S3相應(yīng)于T?S+T0α?S0β。這是兩項的和,因為系統(tǒng)中在線工作的部件沒有發(fā)生故障且正在修理的故障部件也沒有修理完成,表示為T?S;或者正在修理的故障部件修理完好了且在線工作的部件發(fā)生了故障,所以這個剛修理完好的部件代替其開始工作,修理工繼續(xù)修理這個剛發(fā)生故障的部件,表示為T0α?S0β。
轉(zhuǎn)移S3→S5相應(yīng)于T0?S。這是因為在線工作的部件發(fā)生了故障T0,而正在修理的故障沒有修理完成S,所以其只能排隊等待修理。
轉(zhuǎn)移S4→S4相應(yīng)于L。這是因為修理工仍然在休假L,所以兩個故障的部件繼續(xù)等待修理。
轉(zhuǎn)移S4→S5相應(yīng)于L0?β。這是因為修理工從休假返回L0,所以其立即以初始向量β修理先發(fā)生故障的部件,另一個部件等待修理。
轉(zhuǎn)移S5→S3相應(yīng)于α?S0β。這是因為正在修理的部件修理完成了S0,所以這個部件立即以初始向量α在線開始工作,修理工繼續(xù)以初始向量β開始修理另一個故障部件。
轉(zhuǎn)移S5→S5相應(yīng)于S。這是因為正在修理的部件沒有修理完成。
用向量π=(π1,π2,π3,π4,π5)表示相應(yīng)于轉(zhuǎn)移概率矩陣P的穩(wěn)態(tài)概率向量,則這個穩(wěn)態(tài)向量滿足矩陣方程πP=π且πe=1,即
(2)
通過運用計算程序可以得到這個方程組的解,以下假定穩(wěn)態(tài)概率向量π1,π2,π3,π4,π5是已知的。
系統(tǒng)的可用度定義為:在時刻κ,系統(tǒng)正常工作的概率,也就是說兩個部件中少有一個部件是正常工作的。令系統(tǒng)在宏狀態(tài){S1,S2,S3,S4,S5}之間的轉(zhuǎn)移概率矩陣記為P,所以在時刻κ,系統(tǒng)的可用度為
(3)
?γ,0)Pκ]1∶mk,
(α?γ,0)表示系統(tǒng)的初始狀態(tài)概率,即初始時刻系統(tǒng)中兩個部件都是完好的,處于宏狀態(tài)S1。
在式(3)中讓κ→∞取極限,可得系統(tǒng)的穩(wěn)態(tài)可用度為
A=π1e+π2e+π3e=1-π4e-π5e
(4)
故障的條件概率包括在線部件故障的條件概率和系統(tǒng)故障的條件概率。當(dāng)系統(tǒng)處于宏狀態(tài)S1,S2或者S3時,在線部件或許發(fā)生故障;系統(tǒng)中兩個部件都不能正常工作了,系統(tǒng)就發(fā)生了故障,所以只有當(dāng)系統(tǒng)處于宏狀態(tài)S2或者S3時,系統(tǒng)才可能發(fā)生故障,因此在時刻κ,在線部件故障的條件概率為
(5)
穩(wěn)態(tài)時在線部件故障的條件概率為
v=π1(T0?e)+π2(T0?e)+π3(T0?e)
(6)
時刻κ系統(tǒng)故障的條件概率為
(7)
穩(wěn)態(tài)時系統(tǒng)故障的條件概率為
vs=π2(T0?e)+π3(T0?e)
(8)
可見,在線部件故障的條件概率大于系統(tǒng)故障的條件概率。
S1S2S3S*
(9)
式中,S*是吸收狀態(tài)。令矩陣U是矩陣P*去掉最后一行和最后一列所得到的矩陣,則系統(tǒng)的可靠度為
R(κ)=(α?γ,0)Uκe
(10)
系統(tǒng)首次故障前的平均時間為
MTTFF=(α?γ,0)(I-U)-1e
(11)
以某供電系統(tǒng)為例,該供電系統(tǒng)由正常電力供應(yīng)系統(tǒng)、應(yīng)急發(fā)電系統(tǒng)和電力系統(tǒng)維護工(修理工)組成。下面對其進一步假設(shè)與描述。
正常電力供應(yīng)系統(tǒng)的工作時間X~PH(α,T),且
X的均值為220。
故障供電系統(tǒng)的修理時間Y~PH(β,S):
Y的均值為10。
電力系統(tǒng)維護工的休假時間Z~PH(γ,L):
Z的均值為20。
運用Matlab軟件,可以求得供電系統(tǒng)的穩(wěn)態(tài)概率向量為
π1=(0.421 1,0.369 4,0.044 8,0.039 4)
π2=(0.037 7,0.035 4,0.001 8,0.001 7)
π3=(0.020 1,0.019 6,0.001 2,0.001 3)
π4=(0.001 7,0.001 6)
π5=(0.001 3,0.001 6)
圖1是供電系統(tǒng)的可用度曲線,可以看出,在時刻κ=170之后,供電系統(tǒng)達到穩(wěn)定狀態(tài),且供電系統(tǒng)達到穩(wěn)態(tài)時,在工作狀態(tài)集W中逗留的概率為0.993 8,即供電系統(tǒng)大約有99.38%的時間是可用的。圖2是供電系統(tǒng)的可靠度曲線,可以求得供電系統(tǒng)首次故障前的平均時間為MTTFF=3 449.6。圖3和圖4分別是在線運行供電設(shè)備和供電系統(tǒng)的故障條件概率曲線,可以看出,兩條曲線在剛開始的一段時間內(nèi)快速上升,在時刻κ=80之后,系統(tǒng)在線部件故障的條件概率達到穩(wěn)定值,且為0.004 5;而在時刻κ=210之后,系統(tǒng)故障的條件概率達到穩(wěn)定值,為3.043 2×10-4。在相同的時刻點,在線部件故障的條件概率值要遠遠大于系統(tǒng)故障的條件概率值,這與直覺是相吻合的。
圖1 系統(tǒng)的可用度曲線Fig.1 Curve of the system availability
圖2 系統(tǒng)的可靠度曲線Fig.2 Curve of the system reliability
圖3 在線部件故障的條件概率曲線Fig.3 Conditional probability of failure for the online component
圖4 系統(tǒng)故障的條件概率曲線Fig.4 Conditional probability of failure for the system
(1) 把修理工的多重休假策略加入到離散時間可靠性模型的建模中,建立了修理工具有多重休假的兩部件冷貯備離散時間系統(tǒng)模型。
(2) 假設(shè)所涉及的隨機分布均為離散PH分布,且任何取值為正整數(shù)的離散概率分布是一個離散PH分布,所以建立的離散時間可靠性模型更具有一般性。
(3) 推導(dǎo)出離散時間可靠性系統(tǒng)所特有的可靠性指標(biāo):故障的條件概率以及可靠性系統(tǒng)模型一些常見的可靠性指標(biāo)(可用度和可靠度)。
(4) 本文僅研究了離散時間情形下一種只有2個部件的特殊的系統(tǒng)模型,如果將其推廣到更一般的系統(tǒng)模型,如部件數(shù)增加、部件故障機理復(fù)雜化(遭受沖擊)、維修策略多樣化等,系統(tǒng)在離散時間情形下運行,在線部件的故障、修理的完成以及休假的完成能夠同時發(fā)生,系統(tǒng)狀態(tài)和維數(shù)將急劇增加,推導(dǎo)系統(tǒng)的轉(zhuǎn)移率矩陣考慮的情形將非常復(fù)雜,這是后續(xù)將要研究的一些問題。