丁定浩
對 《定期檢修系統(tǒng)的可靠性建模與仿真》的商榷
丁定浩
商榷論文給出了描述連續(xù)工作狀態(tài)下的定期檢修系統(tǒng)的可靠性解析模型和仿真框圖,但文中并沒有涉及失效單元的檢修方式和檢修能力,并且沒有考慮檢修中的備件保障,因此難以正確地反映客觀實際。通過示例指出了文中的不合理之處,希望引起相關(guān)人員的重視。
定期檢修系統(tǒng);可靠性解析模型;數(shù)字仿真;連續(xù)工作狀態(tài);間斷工作狀態(tài)
在經(jīng)典的可靠性模型研究中,存在停機檢修和聯(lián)機檢修兩類模型。停機檢修是指當(dāng)工作中的冗余單元發(fā)生失效時,不能立即對其檢修,必須等到任務(wù)結(jié)束后或在下次開機前對其進行檢修;聯(lián)機檢修是指當(dāng)工作中的冗余單元發(fā)生失效時容許在不停機的條件下立即對其進行檢修,修復(fù)后隨即接入工作直到任務(wù)結(jié)束[1]。
但在實際的工程中,還需要進行定期檢修,由此需要研究定期檢修的模型。例如:對于在相控陣雷達天線射頻收發(fā)陣列中的冗余收發(fā)單元,在整機性能參數(shù)符合指標的情況下,高懸空間的天線環(huán)境使得不適宜頻繁地在每次任務(wù)結(jié)束后都對已經(jīng)失效了的冗余收發(fā)單元進行檢修。又如:對于密封在油箱中的、包含有冗余單元在內(nèi)的高壓整流硅堆的高壓電源,更不可能在每次任務(wù)結(jié)束后都對其進行檢修;因為是高壓,不可能在油箱外的引線處對其進行檢測,必須打開油箱進行。打開油箱后,當(dāng)發(fā)現(xiàn)有失效單元時便對其進行更換;但當(dāng)發(fā)現(xiàn)無失效單元時,打開和封閉油箱的一系列工作便成了無效的勞動。對于此類系統(tǒng),必須采用定期檢修的方式進行檢修,即工作過程中每隔規(guī)定的周期后,才對已經(jīng)失效了的冗余單元進行檢修,再重復(fù)前面的工作與檢修的整個過程。當(dāng)任務(wù)剖面為連續(xù)工作狀態(tài)時,檢修失效單元時是不停機的。
定期檢修的可靠度模型,筆者在參考文獻 [2-3]中已經(jīng)介紹過,它適用于任務(wù)剖面為間斷工作狀態(tài)。因此,在使用定期檢修的可靠度模型時必須權(quán)衡各種條件,最終確定合適的周期進行檢測檢修,具體的解析模型如下所示:
式 (1)中:T0——定期檢修周期;
ts——任務(wù)持續(xù)工作時間。
由式 (1)可知,對于由串聯(lián)結(jié)構(gòu)構(gòu)成的系統(tǒng)而言,定期檢修與停機檢修是相同的;而對于存在冗余結(jié)構(gòu)的系統(tǒng)而言,兩者則有明顯的差別。從物理概念上也不難理解,這是因為,對于由串聯(lián)結(jié)構(gòu)構(gòu)成的系統(tǒng),一旦系統(tǒng)發(fā)生故障,則必須立即對其進行檢修,否則系統(tǒng)將不能繼續(xù)工作;而對于存在冗余結(jié)構(gòu)的系統(tǒng),當(dāng)其中的冗余單元發(fā)生故障時,因為冗余單元失效并不影響系統(tǒng)正常工作,所以可以不立刻對故障進行檢修,但當(dāng)系統(tǒng)中的冗余單元減少時,系統(tǒng)的可靠性會降低。
定期檢修可以在不修復(fù)已經(jīng)發(fā)生故障的冗余單元的條件下而使系統(tǒng)繼續(xù)工作,但要以任務(wù)可靠度的降低為代價。但是,這一問題可以通過增加冗余單元數(shù)來補償。冗余單元的補償數(shù)量,可以通過式(1)來計算。
計算的目標值是Rs(ts|T0),即在定期檢修周期為T0條件下的任務(wù)可靠度的要求值,由此可以計算出在定期檢修條件下要求可靠度保持原有的水平時冗余單元增多的數(shù)量。
商榷論文最終討論的模型[4]不是任務(wù)剖面為間斷工作狀態(tài)的定期檢修的任務(wù)可靠度模型,而是任務(wù)剖面為連續(xù)工作狀態(tài)的平均致命故障間隔時間模型。這兩者都是定期檢修模型但又描述的是完全不同的狀態(tài)和不同的參數(shù)。前者的任務(wù)剖面是間斷工作狀態(tài),而后者的是連續(xù)工作狀態(tài);前者的參數(shù)是任務(wù)可靠度,而后者的是平均致命故障間隔時間(MTBCF:Mean Time Between Critical Failure)。商榷論文的示例顯示其參數(shù)是連續(xù)工作狀態(tài)下的平均致命故障間隔時間。
這種模型的過程應(yīng)該是系統(tǒng)在定期檢修周期中保持正常工作,在周期的最后時刻,在系統(tǒng)繼續(xù)保持正常工作的時間內(nèi),要求修復(fù)已經(jīng)失效了的冗余單元,隨后又轉(zhuǎn)入新一輪定期檢修周期,重復(fù)上述過程,直到發(fā)生系統(tǒng)失效為止。
從商榷論文給出的解析模型和仿真框圖可以看出,兩者均沒有涉及失效單元的檢修方式,而失效單元的檢修方式涉及修復(fù)時間的長短,因此,商榷論文就不可能反映定期檢修客觀過程的真實性。
檢修方式通常包括3種,即逐個檢修方式、同時檢修方式和有限同時檢修方式。逐個檢修方式是指對一批已經(jīng)失效的單元只能一個修復(fù)后再修復(fù)另一個,逐一地進行修復(fù),直到全部修復(fù)為止;同時檢修方式是指對所有的失效單元同時進行檢修;有限同時檢修方式是指同時對有限數(shù)量的失效單元進行檢修。
不言而喻,對于同一批失效單元,這3種檢修方式的修復(fù)時間是完全不同的。即,同時檢修方式的平均修復(fù)時間最短,有限同時檢修方式的平均修復(fù)時間次之,逐個檢修方式的平均修復(fù)時間無疑是最長的。
順便指出,對于多個失效單元同時檢修的平均修復(fù)時間,筆者已經(jīng)糾正了美國MIL-HDBK-338《電子設(shè)備可靠性設(shè)計手冊》中給出的平均修復(fù)時間模型[5],該手冊的模型表示多個相同單元同時檢修的平均修復(fù)時間與檢修1個失效單元的平均修復(fù)時間是相同的,這種觀念的錯誤在于把隨機變量的修復(fù)時間作為常數(shù)對待了。至于有限同時檢修模型,迄今為止仍未見此類模型問世,筆者也給出了相應(yīng)的模型[5]。
附帶指出,商榷論文對修復(fù)概率與修復(fù)率不加區(qū)分,并令故障檢測率、故障隔離率和修復(fù)率的乘積等于修復(fù)概率,這也是不適宜的。修復(fù)概率是在規(guī)定的時間內(nèi)修復(fù)故障的概率,而修復(fù)率是指在單位時間內(nèi)能夠修復(fù)故障的次數(shù),兩者的量綱是不同的。修復(fù)率通常包含故障檢測、故障隔離、拆卸、重裝、檢測和調(diào)整因素在內(nèi),并把這些因素占用的平均時間相加,作為平均修復(fù)時間。商榷論文中令故障檢測率與故障隔離率這兩個比例參數(shù)和修復(fù)率參數(shù)三者的乘積等于修復(fù)概率,但實際上,無論將這一乘積作為修復(fù)概率,還是作為修復(fù)率,都是不合適的。
最后,備件保障是修復(fù)失效單元的必要條件之一。沒有備件保障,定期檢修體制將無法實現(xiàn),但是,商榷論文卻沒有考慮備件保障問題。
在商榷論文所給出的仿真示例中,系統(tǒng)由1 000個相同的單元組成,其中,要求保持900個單元正常工作,其他100個單元容許失效,這是1 000中取900的表決結(jié)構(gòu)模型。單個單元的平均工作時間是20 000 h。
通過商榷論文中給出的仿真方法得到的MTBCF數(shù)據(jù)如表1所示。
表1 商榷論文系統(tǒng)仿真MTBCF數(shù)據(jù)
從表1中第1行的數(shù)據(jù)可以看出,定期檢修周期為90 d的系統(tǒng)的MTBCF為2 554.7 h。但實際上這是不可能出現(xiàn)的,因為在此周期內(nèi)已經(jīng)平均有102個單元發(fā)生了失效,而系統(tǒng)必須保持900個單元處于工作狀態(tài),這就是說,90 d的定期檢修周期是不容許的。
下面證明一下所給出的相應(yīng)定期檢修周期內(nèi)的平均失效數(shù)的依據(jù)。
在起始狀態(tài),由于平均工作時間為20 000 h的1 000個單元處于同時工作狀態(tài),所以第1次發(fā)生單元失效的時間是平均經(jīng)過20 h,原因是在此狀態(tài)下,系統(tǒng)的平均壽命是20 000 h除以1 000個工作單元,即20 h;第2次又發(fā)生1個單元失效的平均時間是20 000 h除以999個工作單元,即20.020 020 02 h;依此類推,把每次平均失效時間和失效數(shù)相加,就得到了累計時間為2 160 h、失效單元數(shù)為102個。
用相同的方法,可以得到其他6個定期檢修周期的平均失效單元數(shù)。
用人工手算的方式相加,上述過程還是比較繁瑣,但是,如果能夠編制一個簡單的計算程序,就可以快速地得到上述的結(jié)果。
下面我們再以表1中定期檢修周期為60天、MTBCF為1 151 200 h等數(shù)據(jù)為依據(jù),反推在此條件下失效單元的修復(fù)率和檢修方式,得到的結(jié)果是單元的修復(fù)率等于0.682 875/h,檢修方式為逐個地進行檢修。
在此檢修條件下,再計算其他定期檢修周期下系統(tǒng)的MTBCF,得到的結(jié)果如表2所示。
表2 筆者得到的系統(tǒng)的MTBCF數(shù)值
下面將對表2中定期檢修周期為90、85天的兩組數(shù)據(jù)進行分析。通過上述討論及表2中的數(shù)據(jù)可以看出,將90天作為周期是不能采用的,因為此時系統(tǒng)的MTBCF為2 128 h,實際上就是停機檢修狀態(tài)的MTBCF。85天檢修周期的數(shù)據(jù)是通過利用定期檢修周期為60天反推得到的失效單元的檢修方式和檢修能力數(shù)據(jù)得到的,此時,在檢修時間內(nèi)系統(tǒng)的累計失效單元達到了103個,系統(tǒng)已進入失效狀態(tài),因此,在此維修條件下,85天檢修周期也是不能采用的。
當(dāng)修復(fù)率為0.941 192/h且檢修方式為同時檢修時,要求MTBCF達到35 000 h,在定期檢修周期為70天的條件下,冗余單元的數(shù)量可以大大地減少,但要補充備件保障設(shè)計。
建造此類定期檢修的解析模型時,首先,要確立定期檢修周期的界限,以保證系統(tǒng)不進入失效期;然后,在此基礎(chǔ)上確定后續(xù)周期的工作時間,以使系統(tǒng)達到要求的MTBCF水平,這取決于3個必備的條件,即保持初始工作狀態(tài)的條件、修復(fù)已經(jīng)發(fā)生失效單元的條件和失效更換模塊備件得到保障的條件。
如何利用解析式表達初始狀態(tài)、上述3個必備的條件和狀態(tài)的持續(xù)與衰退同步發(fā)生直到狀態(tài)終止的整個過程,這就是定期檢修的設(shè)計模型需要解決的問題。對此,我們將另文導(dǎo)出。
定期檢修模型的提出,是可靠性理論模型研究中的一個突破,因為原來在可靠性經(jīng)典研究中只存在停機檢修和聯(lián)機檢修的兩類模型,而在實際的工程中許多系統(tǒng)均需要通過定期檢修的方式來檢修。解決了定期檢修方式的理論模型,是對實際工程可靠性設(shè)計的重要貢獻。
實際上,定期檢修模型是設(shè)計無人值守系統(tǒng)使用可用度的最佳途徑,因此,除了應(yīng)關(guān)注MTBCF參數(shù)外,還需注意系統(tǒng)的平均停機時間,包括平均修復(fù)時間、平均備件延誤時間和平均停機預(yù)防維修時間[6]。
此外,對于可靠性、維修性和保障性的數(shù)字仿真更要謹慎,必須對仿真設(shè)計模型的客觀符合性進行仔細推敲[7],因為此類仿真結(jié)果沒法通過儀器、儀表來驗證,只能進行試驗來驗證。但是,對可靠性、維修性和保障性的定量試驗驗證,在要求相當(dāng)?shù)闹眯哦葪l件下,通常需要的時間和費用均難以讓人接受。對于仿真結(jié)果可用儀器、儀表驗證的場合,數(shù)字仿真能發(fā)揮重要的作用,因為錯誤的數(shù)字仿真很容易被儀器、儀表檢測結(jié)果所否定。
[1]丁定浩.聯(lián)機檢修的冗余結(jié)構(gòu)使用可用度模型修正 [J].電子產(chǎn)品可靠性與環(huán)境試驗,2012,30(5):1-5.
[2]丁定浩.可靠性與維修性工程 [M].北京:北京電子工業(yè)出版社,1986.
[3]丁定浩.系統(tǒng)可靠性結(jié)構(gòu)模型的新進展 [J].電子學(xué)報,1988,16(5):110-112.
[4]胡寧,張三娣,黃永進.定期檢修系統(tǒng)的可靠性建模與仿真 [J].電子產(chǎn)品可靠性環(huán)境試驗,2014,32(2):22-26.
[5]丁定浩,陸軍.維修時間新參數(shù)和維修性設(shè)計新進展[J].中國電子科學(xué)研究院學(xué)報,2010,5(4):391-384,388.
[6]丁定浩.裝備壽命周期使用保障的理論模型與設(shè)計技術(shù)[M].北京:北京電子工業(yè)出版社,2011.
[7]丁定浩.可靠性數(shù)字仿真結(jié)果的作用、局限和陷阱的防范 [J].電子產(chǎn)品可靠性與環(huán)境試驗,2007,25(6):4-5.
Discussion on“Reliability Modeling and Simulation of Systems Periodically Maintained”
DING Ding-hao
The reliability analytical model and simulation block diagram of systems periodically maintained under continuous working state are given in the discussed article,but the maintenance mode and repair capacity of failure units are not involved and the service ability is not considered in the article,so it can't correctly reflect the objective process.And the unreasonable places are describled through an example,hoping to attract some attention of relevant personnel.
system periodically maintained;reliability analytical model;digital simulation;continuous working state;intermittent working state
TB 114.33;TP 391.92
A
1672-5468(2016)04-0001-04
10.3969/j.issn.1672-5468.2016.04.001
2015-05-05
丁定浩 (1929-),男,江蘇吳江人,中國電子科技集團公司電子科學(xué)研究院研究員,上海大學(xué)、南京航空航天大學(xué)兼職教授,長期從事系統(tǒng)可靠性、維修性、保障性理論和工程設(shè)計研究工作。ddh_ddh@126.com