李貴杰, 詹 揚(yáng), 李大偉, 夏廣慶
(1. 大連理工大學(xué)航空航天學(xué)院, 遼寧 大連 116024; 2. 大連理工大學(xué)工業(yè)裝備結(jié)構(gòu)分析國家重點(diǎn)實(shí)驗(yàn)室, 遼寧 大連 116024; 3. 海軍大連艦艇學(xué)院, 遼寧 大連 116018)
故障樹分析(fault tree analysis,FTA)是一種圖形演繹方法,采用邏輯符號(hào)描述事件和系統(tǒng)之間的因果關(guān)系[1-2],用于分析造成系統(tǒng)失效的潛在因素,以確定不同因素的組合而導(dǎo)致的系統(tǒng)故障以及發(fā)生的概率,從而找出系統(tǒng)全部的可能失效狀態(tài)。基于FTA結(jié)果,設(shè)計(jì)人員可以直觀地對(duì)系統(tǒng)制定相應(yīng)的改進(jìn)措施,并進(jìn)行優(yōu)化設(shè)計(jì),以提高系統(tǒng)的安全性和可靠性。1961年,美國貝爾實(shí)驗(yàn)室在導(dǎo)彈的發(fā)射控制系統(tǒng)可靠性研究中首先采用了FTA技術(shù)[3]。1966年,美國波音公司將該技術(shù)應(yīng)用于飛機(jī)領(lǐng)域[4]。1990年,國際電工委員會(huì)制定了第一個(gè)針對(duì)FTA的標(biāo)準(zhǔn)[5],系統(tǒng)地介紹了開展FTA的具體方法。目前,FTA已廣泛應(yīng)用于核工業(yè)[6]、航空航天及船舶等裝備領(lǐng)域[7-10]的安全評(píng)估、故障分析和系統(tǒng)可靠性分析。在傳統(tǒng)FTA中,往往將底事件發(fā)生的概率處理為確定性的、單一估計(jì)值。然而,在實(shí)際工程中,很難獲得充足的數(shù)據(jù)來計(jì)算底事件出現(xiàn)概率的精確值[1]。特別是在設(shè)計(jì)初期,元件的具體設(shè)計(jì)細(xì)節(jié)還沒有被確定,幾乎不可能獲得失效概率的精確值,也就是說底事件的失效概率值存在著不確定性[11-12]。本文采用概率分布的形式對(duì)這種不確定性進(jìn)行描述。為了有效度量底事件發(fā)生概率的不確定性對(duì)頂事件的影響,本文在建立故障樹頂事件發(fā)生概率數(shù)學(xué)表達(dá)式的基礎(chǔ)上,根據(jù)不確定性重要性測(cè)度分析(uncertainty importance measure analysis, UIMA)方法,建立了考慮不確定性的故障樹重要度分析方法,用以量化底事件不確定性對(duì)頂事件發(fā)生概率的影響程度。
UIMA也稱為逆向不確定性分析,主要研究系統(tǒng)輸出不確定性的來源和輸入不確定性對(duì)輸出不確定性的影響程度[13]。UIMA不僅能夠定量分析系統(tǒng)輸入不確定性變量對(duì)響應(yīng)輸出的影響程度,還能給出影響大小的排序。根據(jù)排序結(jié)果設(shè)計(jì)人員可以有針對(duì)性地開展設(shè)計(jì)與分析,以提高分析效率,降低設(shè)計(jì)的復(fù)雜程度。20世紀(jì)90年代中期,基于方差的重要性測(cè)度(variance-based importance measure, VBIM)被提出[14-15],該方法能夠反映輸入不確定性變量在其整個(gè)取值區(qū)域內(nèi)變化時(shí)對(duì)響應(yīng)輸出方差的影響,方法簡單,易于理解,得到了廣泛的應(yīng)用。但由于VBIM方法使用輸出方差來表征響應(yīng)輸出的不確定性并不夠充分,在某些情況下會(huì)造成信息的損失。為此,學(xué)者們提出了矩獨(dú)立重要性測(cè)度(moment independent importance measure, MIIM),用以反映輸入變量對(duì)輸出整個(gè)概率分布的影響[16-19],其中Borgonovo[17]提出的MIIM能夠較好地反映各輸入變量對(duì)輸出性能概率密度函數(shù)的影響程度,被廣泛應(yīng)用于工程實(shí)際中。鑒于MIIM方法的優(yōu)越性,基于此方法,本文構(gòu)建了考慮故障樹底事件發(fā)生概率不確定性對(duì)頂事件影響的重要度分析方法。
另外,本文以某飛機(jī)結(jié)冰探測(cè)系統(tǒng)為例,闡述了所提出的故障樹重要度分析方法的具體流程及分析步驟,推導(dǎo)出了該系統(tǒng)頂事件發(fā)生概率數(shù)學(xué)表示式,計(jì)算得到了各底事件的重要度指標(biāo),同時(shí)分析給出了設(shè)計(jì)改進(jìn)措施,證明了所提出重要度方法的合理性和工程適用性。
FTA的目的是運(yùn)用演繹法逐級(jí)分析,尋找導(dǎo)致某種故障事件(頂事件)的各種可能原因,直至最基本的原因,通過邏輯關(guān)系的分析確定潛在的設(shè)計(jì)缺陷,以便采取改進(jìn)措施。故障樹采用標(biāo)準(zhǔn)化的符號(hào)構(gòu)建邏輯關(guān)系圖,以將所有的故障和原因聯(lián)系起來。
FTA分為定性分析和定量分析。定性分析在于尋找導(dǎo)致頂事件發(fā)生的原因事件及原因事件組合,即識(shí)別導(dǎo)致頂事件發(fā)生的所有故障模式集合,幫助分析人員發(fā)現(xiàn)潛在的故障;而定量分析則是在底事件互相獨(dú)立和已知其發(fā)生概率的條件下,計(jì)算頂事件發(fā)生的概率和底事件重要度等定量指標(biāo)[20]。
對(duì)于由n個(gè)獨(dú)立的底事件組成的連續(xù)系統(tǒng),故障樹的頂事件用T表示,底事件用Xi(i=1,2,…,n)表示。設(shè)底事件Xi出現(xiàn)的概率為pi,頂事件出現(xiàn)的概率為PT,則有
(1)
對(duì)于一個(gè)與門故障樹,當(dāng)所有底事件都發(fā)生時(shí),頂事件才會(huì)發(fā)生,其概率組成函數(shù)可以表示為
(2)
對(duì)于一個(gè)或門故障樹,當(dāng)有一個(gè)底事件發(fā)生時(shí),頂事件就會(huì)發(fā)生,其概率組成函數(shù)可以表示為
(3)
一般的情況下,故障樹頂事件發(fā)生概率的計(jì)算方法有兩種:最小割集方法和不交和展開方法。
(1) 最小割集方法。設(shè)某故障樹的全部N個(gè)最小割集為K1,K2,…,KN,當(dāng)各最小割集中沒有重復(fù)出現(xiàn)的底事件,即假定最小割集之間是不相交時(shí),頂事件發(fā)生的概率組成函數(shù)為
(4)
(2) 不交和展開方法。在大多數(shù)情況下,底事件可能在不同的最小割集中重復(fù)出現(xiàn),也就是說最小割集之間是相交的,此時(shí)頂事件發(fā)生的概率需要采用相容事件的概率公式[21]進(jìn)行計(jì)算:
(-1)N-1P(KiKj…KN)
(5)
式中:P(·)為事件發(fā)生的概率;Ki,Kj和Kk分別為第i,j和k個(gè)最小割集;N為最小割集數(shù)。
從式(5)中可以看出,共有2N-1項(xiàng),對(duì)于復(fù)雜系統(tǒng),最小割集數(shù)N往往很大時(shí),將會(huì)出現(xiàn)“組合爆炸”的問題,導(dǎo)致計(jì)算量十分巨大。為此,需要先將最小割集中的相交和轉(zhuǎn)化為不交和,即為不交和展開法,具體方法為如下。
假設(shè)某故障樹有3個(gè)最小割集,分別為K1,K2和K3,根據(jù)集合運(yùn)算的性質(zhì),集合K1,K2和K3的并集可以由三項(xiàng)不交和表示:
(6)
將其推廣到一般通用的情況,不交和展開如下:
(7)
將式(7)代入到相容事件的概率式(5)中,便可計(jì)算得到頂事件發(fā)生的概率。
上述方法為計(jì)算頂事件發(fā)生概率的精確求解方法,但當(dāng)故障樹中最小割集數(shù)較多時(shí)會(huì)發(fā)生“組合爆炸”的情況。即使采用不交和展開方法時(shí),計(jì)算成本也非常大。在某些實(shí)際工程中,精確解往往不是必須的,這是因?yàn)閷?duì)于高價(jià)值裝備,產(chǎn)品具有較高的可靠性,也就是說產(chǎn)品的失效概率很小。故障樹頂事件發(fā)生的概率(系統(tǒng)失效概率)計(jì)算收斂得非???式(5)中的2N-1項(xiàng)代數(shù)和中起主要作用的是第一項(xiàng)或前兩項(xiàng)。因此,在實(shí)際工程中,可根據(jù)具有情況進(jìn)行近似如下:
(8)
或
(9)
FTA重要度分析是研究部件(底事件)發(fā)生故障時(shí)對(duì)頂事件發(fā)生概率的貢獻(xiàn)程度,設(shè)計(jì)人員可以根據(jù)底事件重要度的大小來制訂維修策略,改進(jìn)系統(tǒng)設(shè)計(jì)??梢?重要度對(duì)于系統(tǒng)可靠性分析及優(yōu)化設(shè)計(jì)十分重要。較為常用的重要度分析有概率重要度、結(jié)構(gòu)重要度以及關(guān)鍵性重要度等[22]。上述重要度分析方法,雖然能從不同的角度反映底事件對(duì)頂事件發(fā)生的影響大小,但并沒有充分考慮各底事件發(fā)生概率存在不確定性時(shí)對(duì)頂事件的影響。為此,本文基于不確定性重要性測(cè)度分析技術(shù),建立了考慮底事件發(fā)生概率不確定性的故障樹重要度分析方法。
鑒于MIIM的優(yōu)越性[17],本文基于該重要性測(cè)度構(gòu)建故障樹底事件UIMA方法。
(10)
S(pi)的幾何意義如圖1的陰影區(qū)域面積所示。
圖1 S(pi)幾何意義示意圖Fig.1 Schematic diagram of geometric significance of S(pi)
用S(pi)的平均值來度量pi對(duì)頂事件發(fā)生概率PT分布上的平均影響,可用S(pi)的數(shù)學(xué)期望Epi[S(pi)]進(jìn)行表示[9],其計(jì)算公式如下:
(11)
為了方便分析,將底事件對(duì)頂事件發(fā)生概率的重要性測(cè)度做[0,1]處理,其可以表達(dá)為
(12)
類似地,定義一組底事件對(duì)頂事件發(fā)生概率重要度如下:
(13)
式中:fpi1,pi2,…,pir(pi1,pi2,…,pir)為pi1,pi2,…,pir的聯(lián)合PDF,fPT|pi1,pi2,…,pir(pT)為當(dāng)pi1,pi2,…,pir為給定實(shí)現(xiàn)值時(shí),頂事件出現(xiàn)的條件概率密度函數(shù)。
通過上述分析可知,故障樹概率組合函數(shù)為顯式的形式,因此可采用蒙特卡羅模擬(Monte Carlo simulation, MCS)方法進(jìn)行求解,該方法適用范圍廣泛,而且易于編程實(shí)現(xiàn)。當(dāng)隨機(jī)抽取的樣本量足夠大時(shí),就能保證計(jì)算結(jié)果估計(jì)的高精度。針對(duì)MIIM求解,學(xué)者們提出了雙層蒙特卡羅方法[24-25],其基本思想是通過等價(jià)轉(zhuǎn)換,將重要度指標(biāo)式(12)轉(zhuǎn)換為雙重期望的形式,進(jìn)而采用雙層MCS方法進(jìn)行求解。重要度指標(biāo)式(12)等價(jià)轉(zhuǎn)換如下:
(14)
式中:EPT|pi(·)為頂事件條件概率密度函數(shù)fPT|pi(pT)的數(shù)學(xué)期望。
值得指出的是,對(duì)于復(fù)雜系統(tǒng)來說,由于概率組成函數(shù)的復(fù)雜性,在調(diào)用其進(jìn)行重要度分析時(shí),雙層MCS方法較為耗時(shí)。因此,可采用目前較為常用的Kriging代理模型方法[28-29],建立頂事件概率組成函數(shù)的代理模型,之后再采用雙層MCS方法調(diào)用已建立的代理模型計(jì)算底事件的重要度,這樣將大大提高計(jì)算效率。
根據(jù)故障樹不確定性重要度的定義以及求解算法,總結(jié)重要度分析流程如圖2所示。
圖2 考慮底事件存在不確定性情況的故障樹重要度分析流程Fig.2 Fault tree importance analysis process considering uncertainty of base events
為驗(yàn)證本文所建立的考慮底事件不確定性的故障樹重要度分析方法的合理性以及工程適用性,以文獻(xiàn)[30]中的某飛機(jī)結(jié)冰探測(cè)系統(tǒng)為例,進(jìn)行故障樹UIMA。
機(jī)翼結(jié)冰將導(dǎo)致飛機(jī)的空氣動(dòng)力學(xué)性能惡化,影響飛機(jī)的穩(wěn)定性和操縱性,致使飛機(jī)的飛行安全性降低,甚至造成機(jī)毀人亡的事故[30]。為此,飛機(jī)結(jié)冰探測(cè)系統(tǒng)在防除冰系統(tǒng)中扮演著重要的角色,該系統(tǒng)能給出飛機(jī)飛行中結(jié)冰的信息,配合機(jī)載除冰裝置,可使飛機(jī)在結(jié)冰氣象條件下減小失事的概率。因此,研究飛機(jī)結(jié)冰探測(cè)系統(tǒng)可靠性對(duì)飛機(jī)飛行安全具有重要意義。
文獻(xiàn)[30]給出的某飛機(jī)結(jié)冰探測(cè)系統(tǒng)示意圖如圖3所示。其工作原理為當(dāng)飛機(jī)遇到結(jié)冰環(huán)境時(shí),結(jié)冰探測(cè)器通過總線(圖3中實(shí)線)和硬線(圖3中虛線)向系統(tǒng)數(shù)據(jù)采集計(jì)算機(jī)發(fā)送結(jié)冰告警信號(hào),之后由數(shù)據(jù)采集計(jì)算機(jī)進(jìn)行處理,再通過總線傳輸給兩臺(tái)獨(dú)立的飛行告警計(jì)算機(jī)。同時(shí),結(jié)冰探測(cè)器還將通過硬線方式直接將結(jié)冰信息傳輸給飛行告警計(jì)算機(jī)。飛行告警計(jì)算機(jī)將結(jié)冰告警信息以文字、燈光及語音等方式傳遞給飛行機(jī)組人員。兩個(gè)結(jié)冰探測(cè)器相互獨(dú)立,互不影響。
圖3 某飛機(jī)結(jié)冰探測(cè)系統(tǒng)示意圖Fig.3 Schematic diagram of an aircraft icing detection system
當(dāng)結(jié)冰探測(cè)系統(tǒng)無法完成結(jié)冰告警及指示時(shí),則表明探測(cè)系統(tǒng)發(fā)生失效。根據(jù)系統(tǒng)的功能及失效模式,構(gòu)建結(jié)冰探測(cè)系統(tǒng)故障樹如圖4所示[30]。圖4中,Ei(i=1,2,…,7)表示中間事件。各事件的詳細(xì)信息如表1所示。
圖4 某飛機(jī)結(jié)冰探測(cè)系統(tǒng)故障樹Fig.4 Fault tree of an aircraft icing detection system
表1 飛機(jī)結(jié)冰探測(cè)系統(tǒng)故障樹各事件Table 1 Events for the aircraft icing detection system of fault tree
在實(shí)際工程中,很難獲得該飛機(jī)結(jié)冰探測(cè)系統(tǒng)各底事件發(fā)生概率的準(zhǔn)確值,因此需考慮各底事件的不確定性。為驗(yàn)證本文所提方法,假設(shè)飛機(jī)結(jié)冰探測(cè)系統(tǒng)各底事件發(fā)生概率的分布類型及分布參數(shù)如表2所示。
表2 底事件發(fā)生概率的分布形式及分布參數(shù)Table 2 Distribution form and distribution parameters of the bottom event probability
根據(jù)故障樹定性分析方法,分析得到該結(jié)冰探測(cè)系統(tǒng)共有9個(gè)最小割集[30],分別為:K1={X1,X4,X5},K2={X2,X4,X5},K3={X3,X4,X5},K4={X1,X6,X7,X8,X9},K5={X2,X6,X7,X8,X9},K6={X3,X6,X7,X8,X9},K7={X1,X6,X7,X10,X11},K8={X2,X6,X7,X10,X11}和K9={X3,X6,X7,X10,X11}。
上述最小割集之間具有交和的情況,根據(jù)第2節(jié)中所介紹的不交和展開法,可以得到飛機(jī)結(jié)冰探測(cè)系統(tǒng)概率組成函數(shù)的表達(dá)式為
PT=[p1+(1-p1)p2+(1-p1)(1-p2)p3]·
[p4p5+(1-p4p5)p6p7p8p9+(1-p4p5)·
p6p7(1-p8p9)p10p11]
(15)
式(15)為顯式函數(shù),采用第4節(jié)給出的雙層MCS方法計(jì)算得到各底事件重要度指標(biāo)如表3所示。{X4,X5},{X6,X7},{X8,X9}及{X10,X11}這4組底事件中每一組兩兩功能相同互為備份,考慮到共因失效[31],即相同的原因造成一組底事件同時(shí)失效。根據(jù)一組底事件不確定性重要度式(13),分別計(jì)算得到各種底事件重要度指標(biāo)如表4所示。為了更直觀地反映不同底事件發(fā)生概率不確定性對(duì)頂事件發(fā)生概率的影響程度,各底事件重要度對(duì)比圖如圖5所示。
表3 考慮不確定性情況的底事件重要度計(jì)算結(jié)果Table 3 Calculation results of bottom event improtance considering uncertainty
表4 各組底事件重要度計(jì)算結(jié)果Table 4 Calculation results of bottom events importance in each group
圖5 考慮不確定性下的底事件重要度指標(biāo)分析對(duì)比圖Fig.5 Comparison chart of bottom events importance index analysis considering uncertainty
由表3和圖5可以看出,底事件X3對(duì)系統(tǒng)頂事件發(fā)生概率的影響最為顯著,底事件X2對(duì)系統(tǒng)頂事件發(fā)生概率的影響次之,接下來分別為底事件{X4,X5},X1,{X6,X7}及{X10,X11},底事件{X8,X9}對(duì)系統(tǒng)頂事件發(fā)生概率的影響最小。由于{X4,X5},{X6,X7},{X8,X9}及{X10,X11}這4組底事件兩兩互為備份,不確定性分布類型和分布參數(shù)相同,因此計(jì)算得到的重要度是一致的(數(shù)值上差異是由計(jì)算誤差所造成)。從表4中可以看出,{X4,X5}這組底事件對(duì)頂事件發(fā)生概率的影響最大,其次為{X6,X7}和{X10,X11},{X8,X9}這組底事件對(duì)頂事件發(fā)生概率的影響最小。
基于上述分析可知,在文中所給定的狀態(tài)下,若要降低飛機(jī)結(jié)冰探測(cè)系統(tǒng)發(fā)生失效的概率,應(yīng)重點(diǎn)關(guān)注探測(cè)棒燈發(fā)生的故障,其次應(yīng)關(guān)注控制開關(guān)發(fā)生的故障,再次應(yīng)該關(guān)注飛行告警計(jì)算機(jī)1和飛行告警計(jì)算機(jī)2的故障。另外,供電引起的故障,左右ID硬線信號(hào)輸出喪失及左右ID總線信號(hào)輸出喪失的故障也應(yīng)給予適當(dāng)?shù)年P(guān)注。而系統(tǒng)數(shù)據(jù)采集計(jì)算機(jī)1和2的故障對(duì)頂事件發(fā)生的影響較小,可以少關(guān)注甚至不關(guān)注。根據(jù)上述分析,設(shè)計(jì)人員可以有針對(duì)性地采取措施,通過改進(jìn)設(shè)計(jì)、收集信息等方式減小底事件不確定性對(duì)頂事件的影響,以提高系統(tǒng)的可靠性。
隨著裝備日趨復(fù)雜和精密化,工程實(shí)際中所涉及的不確定性越來越受到關(guān)注。本文在傳統(tǒng)故障樹分析的基礎(chǔ)上,充分考慮工程實(shí)際中的不確定性,將MIIM方法引入到故障樹重要度分析中,建立了考慮底事件不確定性的重要度分析方法,給出了基于MCS方法的求解算法。根據(jù)重要度分析結(jié)果,不僅能夠定量地辨識(shí)底事件出現(xiàn)概率不確定性對(duì)系統(tǒng)失效概率的影響程度,而且可以獲得影響程度大小的排序。UIMA結(jié)果可以有效地指導(dǎo)設(shè)計(jì)人員及工程師們進(jìn)行系統(tǒng)可靠性設(shè)計(jì)及概率安全評(píng)估。文中以某飛機(jī)結(jié)冰探測(cè)系統(tǒng)為例,驗(yàn)證了所提出的考慮不確定性故障樹重要度分析方法的合理性及可行性,為工程應(yīng)用奠定了基礎(chǔ)。