王春暉,李曉鋼,陳晧暉,閆凱
(1.海裝重大專項裝備項目管理中心,北京 100071; *.北京航空航天大學,北京 100083;2.中國人民解放軍32382部隊,河南 471000; 3.北京遙感設備研究所,北京 100854)
隨著高科技的發(fā)展,國防事業(yè)朝著高精尖技術突飛猛進。無人機產品作為當前在高空領域不可替代的攻守兼?zhèn)涞能娦璁a品,為滿足戰(zhàn)備需求,在交付客戶后有很長時間處于貯存狀態(tài)。無人機貯存環(huán)境監(jiān)測系統可以對無人機貯存環(huán)境進行實時監(jiān)測和遠程調控,確保無人機貯存環(huán)境始終處于健康狀態(tài),對于無人機貯存可靠性的提升具有重要的作用。無人機貯存環(huán)境監(jiān)測系統安全、可靠、穩(wěn)定的運行是關鍵,因此對于無人機貯存環(huán)境監(jiān)測系統的可靠性進行分析至關重要。
對無人機貯存環(huán)境監(jiān)測系統而言,可靠性分析方法層出不窮,代表性的有RBD法[1]、FMECA法[2]、FTA法[3]、蒙特卡洛方法[4]、Markov方法[5]及GO法[6]。Markov分析法將系統看做由多種狀態(tài)構成,具有無后效性。Markov過程的基本假設是系統從一種狀態(tài)到另一種狀態(tài)的轉移概率僅與當前的系統狀態(tài)相關,無需考慮歷史狀態(tài),即概率與實時狀態(tài)相關,從而可以得到系統的狀態(tài)概率和轉移概率,適用于無人機貯存環(huán)境監(jiān)測系統的可靠性分析。GO法是美國軍方專門研究的一種有效可靠性分析方法,最初是用于復雜系統的可靠性分析[7]。隨著GO法持續(xù)改進完善,避免了像FTA法在實際應用中復雜建模等問題。傳統的GO法計算基于概率公式法,對于多信號多狀態(tài)的系統計算非常困難,很大程度上限制了GO法在工程上的應用[8]。貝葉斯網絡(Bayesian Networks,BN)作為一種解決復雜概率的實用手段,可以與GO模型進映射互換與計算,通過把GO操作符轉換為BN節(jié)點,結合GO運算邏輯給出BN節(jié)點的條件概率,運用Bayesian軟件對GO法進行計算[9],能夠快速的得到結果,為GO法在工程上的應用提供了便利。
無人機貯存環(huán)境監(jiān)測系統可靠性分析流程如下:首先對無人機貯存環(huán)境監(jiān)測系統結構進行分析,利用Markov空間狀態(tài)模型對系統的狀態(tài)進行劃分和假設,統計各單元的狀態(tài)參數,代入Markov模型到各單元的狀態(tài)概率分布,之后根據無人機環(huán)境監(jiān)測系統結構圖,建立無人機環(huán)境監(jiān)測系統GO圖,將GO模型的操作符轉換為貝葉斯網絡模型,將各單元的狀態(tài)概率代入貝葉斯網絡中進行運算,即可得到無人機貯存環(huán)境監(jiān)測系統的狀態(tài)概率分布。
無人機貯存環(huán)境監(jiān)測系統,是為了監(jiān)測軍用無人機在戰(zhàn)備階段,能夠保證無人機產品在貯存期間,實時監(jiān)測無人機貯存環(huán)境的溫濕度,使無人機產品始終處于適宜的溫濕度范圍內,對于無人機產品長周期貯存的可靠性提升具有重要的現實意義。作為無人機產品貯存期間的核心環(huán)境監(jiān)測系統,環(huán)境監(jiān)測系統必須滿足可靠性需求,目前針對系統的可靠性分析研究工作,國內外很多學者已經有了一定的研究[10]。無人機貯存環(huán)境監(jiān)測系統分為軟硬件件兩部分,其中硬件是無人機貯存環(huán)境監(jiān)測系統可靠性的重要保障,因此,本文假設系統運行過程中軟件始終處于正常狀態(tài),主要研究無人機貯存環(huán)境監(jiān)測系統硬件可靠性。
無人機貯存環(huán)境監(jiān)測系統的主要功能包括溫濕度信號采集和溫濕度信號無線傳輸,劃分到各個單元主要分為溫濕度信號采集、低壓供電、信號處理、通風控制、報警、無線傳輸單元,各個模塊以合理的邏輯關系串接在一起,形成一個穩(wěn)定的環(huán)境監(jiān)測系統,本文設計的完整無人機貯存環(huán)境監(jiān)測系統的結構示意圖如圖 1所示。
圖1 無人機貯存環(huán)境監(jiān)測系統結構示意圖
本監(jiān)測系統是一個可以維修的監(jiān)測系統,監(jiān)測系統在運行過程中,硬件故障會偶然出現,比如溫濕度傳感器、電源和風扇等會出現故障,導致監(jiān)測系統不能完成所需功能,此時,需要維修人員對系統進行維修,通過更換器件等手段修復系統,經過修復可使系統恢復到正常的工作狀態(tài)。
監(jiān)測系統硬件失效的主要原因是硬件的元器件損壞所致,硬件失效的機理主要表現在元器件受到各種環(huán)境應力的作用下而發(fā)生失效。當元器件受到的環(huán)境應力大于器件本身可承受的極限耐力值時,元器件將發(fā)生故障,引起整個系統失效。
硬件發(fā)生故障時,根據不同的故障時間,可分為永久性故障和暫時性故障[11]。永久故障模式是由于元器件性能退化至器件失效,不在能完成規(guī)定的功能,只能進行維修或更換器件才能繼續(xù)工作。永久性故障按范圍又可分為全局故障和局部故障,全局故障會導致系統或子系統功能失效,而局部故障若得到及時修復,則硬件可以繼續(xù)正常工作,若未得到修復,則硬件可能會失效,系統降級工作。暫時性故障是指由于突然性內外部環(huán)境因素干擾引發(fā)的,如電磁干擾、噪聲干擾等,這種故障很短時間可自我恢復,不需要維修。
對可維修的監(jiān)測系統進行Markov模型分析之前,首先對無人機環(huán)境監(jiān)測系統各單元的狀態(tài)進行劃分,之后運用Markov狀態(tài)空間模型,將統計好的各單元的狀態(tài)參數代入Markov模型中,得到每一單元的狀態(tài)概率分布。
無人機貯存環(huán)境監(jiān)測系統是一種可修復系統,利用Markov過程能更好的反映監(jiān)測系統各單元的運行狀態(tài),通過對無人機貯存環(huán)境監(jiān)測系統各單元的運行狀態(tài)進行分析,我們將其劃分為三個狀態(tài):
1)單元可以正常運行,記為狀態(tài)3,既監(jiān)測系統單元處于正常運行狀態(tài)。
2)單元中某個器件失效或不能按要求完成所設功能,記為狀態(tài)2。此狀態(tài)下,系統的單元降級工作(為簡化模型,假設僅有一種降級狀態(tài)),此狀態(tài)下,器件若是及時維修,則可以回到狀態(tài)3,若未得到及時維修,則單元可能會轉移為失效模式。
3)無人機貯存環(huán)境監(jiān)測系統單元處于失效狀態(tài),記為狀態(tài)1。此時,監(jiān)測系統的單元不能正常工作。
4)設無人機貯存環(huán)境監(jiān)測系統單元發(fā)生故障的概率為31λ,,即系統由狀態(tài)3進入狀態(tài)1的狀態(tài)轉移率為λ3,1;設系統單元發(fā)生故障后的修復率為μ1,3,即系統由狀態(tài)3回到狀態(tài)1的狀態(tài)轉移率為13μ,。
5)設系統的單元由正常狀態(tài)轉為降級工作的概率為λ3,2,即單元由狀態(tài)3進入狀態(tài)2的狀態(tài)轉移率為λ3,2時。如被定期檢修發(fā)現,可被修復回到狀態(tài)3,設由狀態(tài)2轉移到狀態(tài)3的轉移率為 23μ,。若檢修未發(fā)現,則單元狀態(tài)進入狀態(tài)1,設狀態(tài)2轉移到狀態(tài)1的轉移率分別為21λ,。
6)假設單元維修時,每次維修均可恢復至正常狀態(tài),不考慮從狀態(tài)1維修至狀態(tài)2的情況。
7)假設監(jiān)測系統運行過程中軟件不發(fā)生失效,只有硬件發(fā)生失效。
8)假設系統各單元的失效率和修復率是已知常數,對應的可靠度和維修度服從指數分布。
9)假設各個單元之間相互串聯,各單元之間不會相互影響。
從假設條件知,各單元在一定的條件下,雖然存在著一定形式的故障,但依然能繼續(xù)工作。此時各單元雖然能繼續(xù)完善基本功能,但其運作水平有所下降,各單元降級工作。無人機貯存環(huán)境監(jiān)測系統共分為六個不同的單元,因此我們對不同單元降級工作的條件進行劃分。
1)溫濕度采集單元:當收集的溫濕度數據與實際環(huán)境的數據值偏差溫度為1~2 ℃,濕度為5~8 %,兩種數據有一種處于以上范圍區(qū)間,則認為溫濕度采集單元降級工作,低于以上范圍為正常狀態(tài),超出以上范圍為失效狀態(tài)。
2)低壓供電單元:當額定輸出電壓超出正常額定電壓的10~20 %的情況,則認為低壓供電系統降級工作。低于10 %為正常狀態(tài),超出20 %為失效狀態(tài)。
3)信號處理單元:信號處理單元主要功能是溫濕度數據信號從ZigBee終端向協調器發(fā)送數據,通常以丟包率來直觀的描述傳輸過程的可靠性。當數據丟包率處于5~8 %范圍之內時,認為無線傳輸單元降級工作,低于5 %為正常狀態(tài),超出8 %為失效狀態(tài)。
4)報警單元:報警單元仍然以溫濕度范圍來進行劃分,正常的報警閾值為:溫度15~25 ℃,濕度為40~70 %。當溫度在14~26 ℃,濕度為35~75 %范圍內報警時認為報警單元正常工作;當溫濕度在13~14 ℃或27~28 ℃、濕度在30~35 %或75~80 %范圍內才進行報警時,認為報警單元降級工作;其它情況報警為失效狀態(tài)。
5)通風控制單元:當溫濕度超出閾值,給到溫濕度控制設備信號后,若報警單元在1 min內啟動,則認為通風控制單元正常工作,若報警單元在1~5 min內啟動,則認為該單元降級工作,超出5 min視為失效。
6)無線傳輸單元:本單元同樣以數據丟包率來描述傳輸過程的可靠性,當數據丟包率處于5~8 %范圍之內時,認為無線傳輸單元降級工作,低于5 %為正常狀態(tài),超出8 %為失效狀態(tài)。
Markov過程于1907年由俄國科學家和數學家A.A.Markov提出[12],數學定義為:設 {X(t),t∈T}為隨機過程,若對任意正整數n及t1<t2<···<tn有:
則稱 {X(t),t∈T}為馬爾科夫過程。該公式表明X(t1) ,...,X(tn-1)的條件概率相等,Markov具有“無記憶性”,即tn時刻的隨機變量的概率值與tn-1時刻的取值有關,與tn-1前的歷史狀態(tài)無關。
實際監(jiān)測系統過程分析中,通常關注具有離散狀態(tài)空間及連續(xù)時間參數的齊次Markov過程。所謂齊次是指轉移概率pij( Δt)僅與 Δt有關,與t無關,即:
當tΔ無限小時,轉移概率為:
對于n個空間狀態(tài)的系統,轉移概率ijp可以寫成一下空間矩陣:
P為轉移概率矩陣,其數據表達式如下所示:
設T=P-I,則狀態(tài)轉移矩陣改寫為:
式中:
I—單位矩陣;
T—中矩陣每行元素相加等于0,即
Markov以狀態(tài)空間圖為基礎,又稱狀態(tài)空間法。由上述狀態(tài)劃分和假設條件的參數設定,可以建立無人機貯存環(huán)境監(jiān)測系統單元的Markov狀態(tài)空間模型,如圖2所示。
圖2 無人機貯存環(huán)境監(jiān)測系統Markov狀態(tài)空間模型
根據無人機貯存環(huán)境監(jiān)測系統單元的Markov模型及其特點,建立Markov狀態(tài)空間方程,如下所示:
式中:
Pi—無人機貯存環(huán)境監(jiān)測系統的單元處于it時刻的狀態(tài)分布;
T—狀態(tài)轉移矩陣。
其表達式為:
駐留矩陣可以描述為:
Pi為無人機貯存環(huán)境監(jiān)測系統單元在it時刻的狀態(tài)分布,本文僅對Pi的穩(wěn)態(tài)解進行分析,此情況下,Markov過程收斂于穩(wěn)態(tài)值:
式中:
p1—狀態(tài)1的概率;
p2—狀態(tài)2的概率;
p3—狀態(tài)3的概率。
式(9)中,q11,q22,q33為與無人機貯存環(huán)境監(jiān)測系統單元有關的指數分布,也是T矩陣的對角線元素,分別為:
同理狀態(tài)轉移矩陣可改寫為:
在通過Markov模型分析得出無人機貯存環(huán)境監(jiān)測系統不同單元的各個狀態(tài)概率后,運用GO法來分析無人機貯存監(jiān)測系統的可靠性。GO法于20世紀60年代由美國Kaman科學公司首先提出,近幾十年迅速發(fā)展,廣泛應用于各個領域[13]。GO法可以準確地對系統概率進行分析,將系統原理圖、流程圖直接翻譯成GO圖,GO法通過GO圖模型進行GO運算來得到系統的可靠性分析結果。建立GO圖模型和進行GO運算是GO法的核心,其中GO圖模型包括操作符和信號流,GO運算采用GO算法進信號流屬性的狀態(tài)概率計算。
無人機貯存環(huán)境監(jiān)測系統中的元器件、部件或子系統可統稱為單元,GO法用操作符來代表單元功能和單元輸入、輸出之間的邏輯關系。目前GO法有17中類型的操作符,分為邏輯和功能操作符兩大類。信號流是指系統單元輸入與輸出以及單元之間的關聯,信號流連接GO操作符,按屬性可分為狀態(tài)值和狀態(tài)概率。
由于六個單元分為三種狀態(tài),假設各單元相互串聯,因此需要對監(jiān)測系統的狀態(tài)進行重新定義。若六個單元均處于狀態(tài)3,即正常狀態(tài),則系統處于正常工作狀態(tài),記為狀態(tài)3;若六個單元中至少有一個單元處于狀態(tài)2,且各單元均未處于狀態(tài)1,則系統處于降級工作狀態(tài);記為狀態(tài)2;若六個單元中至少有一個單元處于狀態(tài)1,則系統處于失效工作狀態(tài);記為狀態(tài)1。
本文使用的操作符有第1、5、10類適用于多狀態(tài)系統的操作符。無人機貯存環(huán)境監(jiān)測系統通過Markov模型將系統不同單元劃分為三種狀態(tài),通過計算得出各個狀態(tài)的概率分布,最后將這些單元的可靠性概率分布作為輸入數據代入GO圖進行GO計算。
根據無人機貯存環(huán)境監(jiān)測系統中各單元的功能和GO法各類操作符的特點,本文將系統的各模塊與GO法操作符相對應分為三類,分別是:第1類操作符,包括信號處理單元、無線傳輸單元;第5類操作符,包括低壓電源單元、信號采集單元、報警單元;第10類操作符,表示各單元之間的邏輯關系。最后,將無人機貯存環(huán)境監(jiān)測系統原理圖轉換為GO圖,如圖 3所示。無人機貯存環(huán)境監(jiān)測系統各單元與GO圖中操作符的對應關系見表 1。
圖3 無人機貯存環(huán)境監(jiān)測系統GO圖
表1 無人機貯存環(huán)境監(jiān)測系統操作符
本節(jié)首先定義操作符到貝葉斯網絡(BN)的映射規(guī)則,之后給出本監(jiān)測系統不同操作符的映射過程,最后基于無人機貯存環(huán)境監(jiān)測系統GO圖映射出貝葉斯網絡。
從操作符到貝葉斯網絡映射規(guī)則如下:
1)將操作符(非邏輯門)及輸入信號流映射為BN的根節(jié)點;
2)將所有路的輸出信號流(不含第5類操作符)映射為BN節(jié)點,與步驟(1)建立父子關系;
3)根據操作符的狀態(tài)概率來確定根節(jié)點的先驗概率;
4)根據操作符運算邏輯來確定輸出信號流對應的BN子節(jié)點的條件概率表(Conditional Probability Table, CPT)。
GO操作符輸出信號的狀態(tài)是由輸入信號和其自身狀態(tài)通過GO運算得出的,根據不同的操作符邏輯建立不同的CPT,操作符輸入信號、輸出信號狀態(tài)及其自身關系以狀態(tài)概率組合表的形式呈現。
1)第1類操作符
第1類操作符是最常用的功能操作符,本文對第一類操作符根據Markov過程,將成功狀態(tài)劃分為兩種狀態(tài)2、3,故障狀態(tài)記為1。依據映射規(guī)則,其先驗概率及CPT如圖 4所示。
圖4 第1類操作符及對應貝葉斯網絡
2)第5類操作符
第5類操作符為最常用的輸入操作符。本文第5類操作符分為三種狀態(tài)(1-3)。依據映射規(guī)則,其先驗概率及CPT如圖 5所示。
圖5 第5類操作符及對應貝葉斯網絡
3)第10類操作符
第10類操作符是與門邏輯,該操作符有多路輸入、單路輸出信號,信號均為多狀態(tài)。圖 6中模擬了兩路輸入、單路輸出信號的邏輯單元,輸入、輸出信號均含三種狀態(tài)(1-3)。依據映射規(guī)則,其先驗概率及CPT如圖 6所示。
圖6 第10類操作符及對應貝葉斯網絡
上一節(jié)給出了工程中常用的三種不同的操作符對應的BN模型,本節(jié)給出一個完整系統的GO圖模型轉換為BN模型,進而計算整個監(jiān)測系統的狀態(tài)概率,GO圖模型映射流程如圖 7所示。
圖7 GO模型的BN轉換算法流程
步驟一:按編號i順序遍歷GO圖的信號流,將訪問到的信號流i映射到BN節(jié)點iS,訪問信號流i的前驅操作iQ,并判斷iQ操作符的類型。
1)若iO為第5類操作符,則將其狀態(tài)概率更新至BN節(jié)點iS上;
2)若iO為第10類操作符,將iO的輸入信號對應的BN節(jié)點與節(jié)點iS建立父子關系,根據iO的狀態(tài)運算邏輯建立節(jié)點iS的CPT;
3)若iO為第1類操作符,將iO映射出一個新的BN節(jié)點iC,更新CPT,將iC和iO的輸入信號對應的BN節(jié)點與iS節(jié)點建立父子關系,跟據iO的狀態(tài)概率建立節(jié)點iS的CPT。
步驟二:判斷i是否等于N,若不是N,則訪問下一個信號流;若為N則流程結束,完成GO模型到BN模型的映射。
本文為確保無人機貯存環(huán)境監(jiān)測系統可以安全可靠運行,選取了Markov空間狀態(tài)模型和GO法相結合的方式,結合貝葉斯網絡模型,進行無人機貯存環(huán)境監(jiān)測系統的可靠性分析。首先將無人機貯存環(huán)境監(jiān)測系統劃分為六個不同的單元,每個單元分為三種狀態(tài),針對無人機系統硬件的失效模式,對各單元的狀態(tài)進行劃分和假設,運用Markov空間狀態(tài)模型分析得出各個單元的狀態(tài)概率分布,之后構建的GO圖模型,為方便運算,將GO圖模型映射到貝葉斯網絡模型。運用以上方法,可以得出無人機貯存環(huán)境監(jiān)測系統各單元的狀態(tài)概率,結合貝葉斯網絡手段,解決了GO法在實際工程中計算復雜的難題,為環(huán)境監(jiān)測系統的維修和設計改進提供支持。