(中國(guó)航空計(jì)算技術(shù)研究所,西安 710068)
伴隨著航空電子產(chǎn)品裝機(jī)數(shù)量的不斷增加,該類產(chǎn)品的故障也隨著增加,這些故障中大部分可以找到原因并修復(fù),但也有少量的在機(jī)上或外場(chǎng)維修中因故障而更換的設(shè)備或部件,返場(chǎng)維修后卻發(fā)現(xiàn)沒(méi)有故障或發(fā)現(xiàn)不了故障, 即所謂的“未發(fā)現(xiàn)故障”(No Fault Found,NFF)。NFF的原因很復(fù)雜,有的是因?yàn)樵O(shè)備本身沒(méi)有故障,但在裝機(jī)檢測(cè)后被判定為有故障,有的是設(shè)備本身存在斷續(xù)性故障但檢測(cè)維修時(shí)卻檢測(cè)不出來(lái),或者是測(cè)試設(shè)備的覆蓋率不足不能將故障檢測(cè)出來(lái)。
“未發(fā)現(xiàn)故障”(NFF)是國(guó)際上近年來(lái)困擾各航空公司和各型軍用飛機(jī)的一大難題,在2004年召開(kāi)的國(guó)際航電維修會(huì)議(AMC)上,NFF被列為最重要的問(wèn)題。在此后的歷屆AMC年會(huì)上,NFF繼續(xù)成為大家關(guān)注的焦點(diǎn)[1]。
NFF的故障率居高不下(據(jù)統(tǒng)計(jì)航電系統(tǒng)NFF的發(fā)生率為30%左右),使得航空公司和各種軍機(jī)的維修費(fèi)用明顯增加[2]。NFF不是某一單方面的因素造成的,要減少NFF的故障發(fā)生率,需要多管齊下。本文將重點(diǎn)分析造成NFF故障頻發(fā)的原因,介紹某機(jī)載設(shè)備此類故障產(chǎn)生的原因及解決方法。
NFF故障產(chǎn)生的原因較多,復(fù)雜的航電設(shè)備可能是導(dǎo)致NFF故障率上升的原因之一,機(jī)上電子設(shè)備之間的互相干擾以及供電系統(tǒng)的不穩(wěn)定性也是產(chǎn)生NFF故障的原因之一。
減小NFF的故障發(fā)生率,減少維修費(fèi)用,降低成本,確保飛行安全,是大家共同的目標(biāo)。要做到這一點(diǎn),就需要深入、具體地分析產(chǎn)生故障的原因。
NFF故障表面上看是一種偶發(fā)性故障或不確定性故障,其實(shí)往往隱含著某種質(zhì)量隱患,如設(shè)計(jì)隱患、生產(chǎn)工藝隱患等,不能簡(jiǎn)單當(dāng)作個(gè)性問(wèn)題處理,也不能簡(jiǎn)單當(dāng)作虛警、誤報(bào)等個(gè)案處理,它常常隱含著某種設(shè)計(jì)缺陷,追查下去也許會(huì)發(fā)現(xiàn)偶然事件背后隱含的必然性。
我們?cè)谠O(shè)計(jì)初期往往更多地考慮產(chǎn)品的功能和性能,而忽視了測(cè)試性設(shè)計(jì),或者對(duì)測(cè)試性設(shè)計(jì)考慮不足,使得測(cè)試覆蓋率很低。其實(shí)在產(chǎn)品真正投入使用后,測(cè)試功能就顯得尤為重要。許多NFF不是設(shè)備故障產(chǎn)生的,而是由于缺乏理想的診斷能力而造成的。
技術(shù)文檔編寫(xiě)不詳細(xì)、圖紙錯(cuò)誤較多始終是困擾我們的一大問(wèn)題。文檔不具備可操作性,只有編寫(xiě)者自己才能讀得懂的文件比比皆是,操作者拿著維修說(shuō)明也無(wú)法操作,給維修工作帶來(lái)很大的困難,問(wèn)題不能得到解決。
提高維修人員的技術(shù)水平是亟待解決的問(wèn)題。使維修人員對(duì)產(chǎn)品的作用、功能、性能、工作原理以及在機(jī)上的工作環(huán)境等情況有比較全面的了解,對(duì)排故工作將會(huì)起到很大的推動(dòng)作用。高水平的維修人員憑借豐富的經(jīng)驗(yàn)?zāi)軌蛘业焦收系恼嬲颍瑥亩鴾p少NFF故障的發(fā)生[1]。
時(shí)間壓力是造成NFF的主要原因。為保證飛行,排故的時(shí)間非常有限,要在很短的時(shí)間內(nèi)復(fù)現(xiàn)故障、進(jìn)行故障定位并修復(fù)設(shè)備,難度非常大。對(duì)于偶發(fā)的NFF故障件,測(cè)不出問(wèn)題時(shí)可能會(huì)重新裝機(jī),埋下隱患,反復(fù)發(fā)作的NFF故障件只能用備件代替。
首先應(yīng)該針對(duì)故障產(chǎn)生原因的幾個(gè)方面,在產(chǎn)品的設(shè)計(jì)階段盡量采用經(jīng)過(guò)驗(yàn)證的成熟設(shè)計(jì)電路,避免設(shè)計(jì)缺陷;在方案論證階段充分考慮測(cè)試性設(shè)計(jì),提高測(cè)試覆蓋率,提高自診斷能力;技術(shù)文檔的編寫(xiě)要求全面、準(zhǔn)確、操作性強(qiáng),為維修人員提供有價(jià)值的技術(shù)資料。除了以上環(huán)節(jié),還應(yīng)從以下幾方面著手減少NFF故障發(fā)生。
對(duì)故障產(chǎn)品建立數(shù)據(jù)庫(kù)。每當(dāng)有故障件返廠維修時(shí),對(duì)故障現(xiàn)象和故障類型進(jìn)行記錄,結(jié)合以往的歷史數(shù)據(jù)進(jìn)行分析,具有豐富工程經(jīng)驗(yàn)的技術(shù)人員通過(guò)對(duì)故障類型、故障發(fā)生時(shí)機(jī)的對(duì)比分析,能夠獲得排故所需的信息,某些連續(xù)兩次或兩次以上出現(xiàn)同一故障現(xiàn)象的NFF,很可能存在測(cè)試設(shè)備不能檢測(cè)的故障,就需要采取非正常的方法進(jìn)行排故和定位。所以,建立數(shù)據(jù)庫(kù)對(duì)排故工作的順利進(jìn)行將會(huì)提供很大的幫助。
NFF故障件往往分為兩類,一類是由于虛警、誤報(bào)等原因產(chǎn)生的故障件,這類產(chǎn)品經(jīng)過(guò)全面測(cè)試確保正確后可重新裝機(jī);另一類是真正的NFF故障件,這類產(chǎn)品我們檢測(cè)不出故障,但實(shí)際上確實(shí)發(fā)生了故障。對(duì)于第二類故障,如果出現(xiàn)3次同類的NFF故障,就應(yīng)該列入“黑名單”,對(duì)它進(jìn)行徹底檢查,如果能找到導(dǎo)致故障的真正原因并解決問(wèn)題,可以重新裝機(jī),否則只能更換備件,用作地面調(diào)試用,對(duì)列入“黑名單”的故障件要慎重使用[1]。
溝通與交流對(duì)于故障件的排故至關(guān)重要,通過(guò)交流,掌握了故障的產(chǎn)生時(shí)機(jī)、產(chǎn)生條件等重要信息,有助于我們分析故障產(chǎn)生的原因、故障發(fā)生時(shí)各項(xiàng)參數(shù)的運(yùn)行情況、現(xiàn)場(chǎng)其它設(shè)備的運(yùn)行狀態(tài)等信息也對(duì)排故和定位提供有力的支持,描述詳細(xì)的故障報(bào)告表對(duì)于故障定位也必不可少。
為保證正常飛行,足夠的備件必不可少。在有限的時(shí)間內(nèi)要把所有問(wèn)題全部解決基本上是不可能的,要保證安全可靠,準(zhǔn)備足夠的備件很有必要[3]。
以上介紹了NFF故障產(chǎn)生的背景、產(chǎn)生的原因、產(chǎn)生的危害以及解決的辦法,下面以某設(shè)備為例,介紹一例典型的機(jī)載設(shè)備“未發(fā)現(xiàn)故障”的處理方法。
某計(jì)算機(jī)裝機(jī)后偶爾出現(xiàn)報(bào)“AA-OFF”故障,返場(chǎng)維修時(shí)卻檢測(cè)不出故障,給產(chǎn)品排故帶來(lái)很大的困難。經(jīng)與現(xiàn)場(chǎng)人員聯(lián)系,反映在得到“AA-OFF”故障時(shí),飛參系統(tǒng)還在記錄數(shù)據(jù),由此判斷CPU還在運(yùn)行,那么可能的原因就是總線傳輸模塊故障導(dǎo)致該設(shè)備不能正常通信,從而產(chǎn)生“AA-OFF”現(xiàn)象。于是對(duì)總線模塊進(jìn)行了反復(fù)測(cè)試,誘發(fā)故障,但故障不能復(fù)現(xiàn),最后采取了更換總線模塊的辦法重新裝機(jī),裝機(jī)后有時(shí)偶爾還會(huì)報(bào)相同故障。
隨著時(shí)間的推移,“AA-OFF” 現(xiàn)象有所增加,為了誘發(fā)故障,對(duì)返修件進(jìn)行了大量的試驗(yàn),例如高低溫摸底試驗(yàn),模擬飛機(jī)的實(shí)際工作環(huán)境進(jìn)行了振動(dòng)試驗(yàn)、濕熱試驗(yàn),考慮到機(jī)上供電系統(tǒng)的相互影響,進(jìn)行了電磁兼容試驗(yàn),但一系列試驗(yàn)都沒(méi)有激發(fā)故障復(fù)現(xiàn)。
為了得到第一手資料,對(duì)多個(gè)用戶進(jìn)行了走訪,了解現(xiàn)場(chǎng)情況。通過(guò)對(duì)故障發(fā)生時(shí)飛行記錄數(shù)據(jù)的回放和分析,發(fā)現(xiàn)在“AA-OFF”出現(xiàn)時(shí),飛行參數(shù)記錄儀相關(guān)的傳輸數(shù)據(jù)一直不更新,說(shuō)明發(fā)生故障時(shí)CPU已經(jīng)工作異常,依據(jù)這一現(xiàn)象,初步排除總線模塊的問(wèn)題,問(wèn)題暫時(shí)定位為與主處理機(jī)相關(guān)的問(wèn)題。
通過(guò)進(jìn)一步交流與溝通,得知該現(xiàn)象大部分發(fā)生在地面通電過(guò)程中或發(fā)動(dòng)機(jī)開(kāi)車后電源切換時(shí),于是將目光聚焦在供電系統(tǒng)及電源模塊上。
電源模塊供電電壓為28 V,設(shè)計(jì)的允許輸入電壓為18~32 V??紤]到故障發(fā)生時(shí)機(jī)都出現(xiàn)在地面通電過(guò)程中或發(fā)動(dòng)機(jī)開(kāi)車后電源切換時(shí),所以不排除由于外部電網(wǎng)波動(dòng)或干擾導(dǎo)致電源模塊工作不正常,為此進(jìn)行了大量的驗(yàn)證試驗(yàn)。
對(duì)電源進(jìn)行了拉偏試驗(yàn),當(dāng)28 V輸入電壓降至15 V左右時(shí),+5 V輸出電壓降至+4.5 V左右,CPU模塊停止工作;當(dāng)輸入電壓回升時(shí),CPU有時(shí)恢復(fù)正常,有時(shí)不能恢復(fù),出現(xiàn)“死機(jī)”現(xiàn)象,復(fù)現(xiàn)了故障。
圖1是在試驗(yàn)室對(duì)電源模塊采集的信號(hào),在供電端發(fā)生掉電波動(dòng)時(shí),輸出電壓5 V將下降到4.5 V左右。
圖1 掉電時(shí)+5 V信號(hào)波形Fig.1 +5 V waveform during power-fail
對(duì)于出現(xiàn)的“死機(jī)”現(xiàn)象,分析認(rèn)為:當(dāng)28 V輸入電壓降至15 V左右時(shí),+5 V輸出電壓下降,當(dāng)+5 V電壓降至某個(gè)點(diǎn)時(shí),可能引起某些芯片工作異常,但此時(shí)并沒(méi)有引起復(fù)位電路復(fù)位,若此時(shí)28 V電壓迅速拉起,+5 V恢復(fù)正常,而那些已經(jīng)產(chǎn)生異常的芯片不能回到復(fù)位狀態(tài),CPU不能正常工作,處于“死機(jī)”狀態(tài)。
至此,故障現(xiàn)象復(fù)現(xiàn),并與故障發(fā)生時(shí)機(jī)相吻合。
根據(jù)以上分析,供電系統(tǒng)波動(dòng)時(shí)電源模塊輸出異常是故障的主要原因,對(duì)電源模塊提出以下修改方案。
(1)增加儲(chǔ)能電容,延長(zhǎng)掉電保持時(shí)間
原來(lái)的電源模塊掉電保持時(shí)間為6 ms,增加儲(chǔ)能電容后,掉電保持時(shí)間增加到40 ms左右。波形如圖2所示。
圖2 掉電后+5 V保持時(shí)間延長(zhǎng)Fig.2 +5 V signal delay after power-fail
(2)增加欠壓關(guān)斷功能,提高復(fù)位的可靠性
原來(lái)的電源模塊在供電電壓低于16 V時(shí),電源模塊處于開(kāi)環(huán)工作狀態(tài),輸出不穩(wěn)壓,輸出電壓隨著輸入電壓的下降而下降,輸入過(guò)渡狀態(tài)的電壓為16 V,引起+5 V異常。
更改后給電源模塊增加欠壓關(guān)斷功能,當(dāng)電源模塊供電電壓低于16 V以下時(shí),將電源模塊的輸出電壓全部關(guān)閉;在供電電壓恢復(fù)到16 V時(shí),打開(kāi)電源模塊的輸出,+5 V輸出正常供電,避免了由于+5 V輸出的不穩(wěn)定造成的設(shè)備工作異常。
通過(guò)以上措施,避免了外部供電電源的過(guò)渡態(tài)和異常態(tài)對(duì)設(shè)備的影響。
事實(shí)證明更改方案正確,措施到位。更改方案落實(shí)后無(wú)一例故障復(fù)發(fā)現(xiàn)象,達(dá)到了預(yù)期的目的。
上述NFF故障產(chǎn)生的原因是設(shè)計(jì)缺陷,在設(shè)計(jì)初期對(duì)產(chǎn)品的使用環(huán)境了解不足;排故過(guò)程中多次反復(fù)是因?yàn)榻涣鳒贤ㄇ啡保瑢?duì)故障發(fā)生時(shí)機(jī)和故障現(xiàn)象把握不準(zhǔn),減少NFF故障需要從設(shè)計(jì)、生產(chǎn)、售后等多個(gè)環(huán)節(jié)入手。生產(chǎn)階段要嚴(yán)把質(zhì)量關(guān),包括對(duì)元器件、原材料的采購(gòu)和二次篩選,生產(chǎn)過(guò)程要嚴(yán)格工藝紀(jì)律,任何一個(gè)環(huán)節(jié)不到位都可能造成質(zhì)量隱患;對(duì)于由多家單位合作的項(xiàng)目,設(shè)計(jì)初期應(yīng)該明確需求,故障出現(xiàn)后應(yīng)及時(shí)準(zhǔn)確反饋信息,降低故障發(fā)生率。在后續(xù)的研究中,將進(jìn)一步加強(qiáng)對(duì)NFF故障原因的分析與收集,尤其是多設(shè)備之間電磁干擾造成的影響以及設(shè)備接口之間偶發(fā)故障的技術(shù)原因分析。
參考文獻(xiàn):
[1] 比爾·伯切爾. 航電設(shè)備的“未發(fā)現(xiàn)故障”[J]. 國(guó)際航空,2007 (5): 50-54.
Bill Burchell. No Fault Found[J]. International Aviation, 2007 (5): 50-54.(in Chinese)
[2] 弗蘭克·杰克曼,成磊. 民用航空維修市場(chǎng)預(yù)測(cè)[J]. 航空維修與工程,2006 (4): 10-11.
Frank Jackman,CHENG Lei. MRO Market up Modestly as Efficiencies Take Hold[J].Aviation Maintenance & Engineering, 2006 (4): 10-11.(in Chinese)
[3] 賈麗巖. 航電設(shè)備故障測(cè)試和維修的新挑戰(zhàn)[J]. 航空維修與工程,2006 (4): 50-51.
JIA Li-yan.New Challenges to Avionics Fault Testing and Repair[J].Aviation Maintenance & Engineering, 2006 (4): 50-51.(in Chinese)