宋 丫,劉宵辰,王曉航
(中國(guó)航空工業(yè)集團(tuán)公司 西安航空計(jì)算技術(shù)研究所,陜西 西安 710065)
機(jī)載電子設(shè)備,例如機(jī)電管理計(jì)算機(jī),通常使用非易失隨機(jī)訪問(wèn)存儲(chǔ)器(NVRAM,Non-Volatile Random Access Memory)進(jìn)行產(chǎn)品故障信息記錄。主要由于NVRAM可實(shí)現(xiàn)持久化的信息存儲(chǔ),即在產(chǎn)品斷電后仍能保持所存儲(chǔ)的數(shù)據(jù)不會(huì)丟失,從而在故障發(fā)生后的第一時(shí)間讀取歷史信息,復(fù)原故障現(xiàn)場(chǎng)。
由于現(xiàn)代飛機(jī)功能設(shè)計(jì)越來(lái)越豐富,各接口部件間的交聯(lián)關(guān)系也愈發(fā)復(fù)雜,一起故障的發(fā)生往往是由于多重因素導(dǎo)致。傳統(tǒng)的故障記錄通常按照接口類(lèi)型逐一列舉,這種遍歷式的記錄方法雖然可以覆蓋硬件接口,但由于缺乏對(duì)重要接口及故障場(chǎng)景的區(qū)分,導(dǎo)致數(shù)據(jù)冗余,排查人員將大量時(shí)間耗費(fèi)在讀取并篩選數(shù)據(jù)上,同時(shí)要求排查人員精通項(xiàng)目設(shè)計(jì),能夠從大量平鋪式數(shù)據(jù)中甄別出異常以及相關(guān)聯(lián)系。這遠(yuǎn)不能滿(mǎn)足現(xiàn)有綜合化系統(tǒng)的故障診斷、分析及定位需求。
本文提出了一種基于失效場(chǎng)景的故障記錄方法,該方法具有維護(hù)效率高、可移植性強(qiáng)、靈活性高的特點(diǎn)。通過(guò)對(duì)失效場(chǎng)景下相關(guān)信息的綜合分析,快速排查故障可能誘因,節(jié)約時(shí)間及人力成本。
本文設(shè)計(jì)的故障記錄方法主要用于機(jī)載電子設(shè)備故障信息存儲(chǔ),并為設(shè)備的工作現(xiàn)場(chǎng)復(fù)現(xiàn)、故障分析、定位提供了依據(jù)。在進(jìn)行具體的案例設(shè)計(jì)時(shí),可以從以下幾個(gè)步驟入手:
1) 根據(jù)不同機(jī)載設(shè)備對(duì)失效場(chǎng)景的需求設(shè)計(jì)NVRAM模塊,例如對(duì)參考電壓的監(jiān)控,看門(mén)狗報(bào)警,機(jī)翼折疊展開(kāi)控制,火警告警等。另外,產(chǎn)品自測(cè)試(BIT,Built-in Test)作為一項(xiàng)重要的故障檢測(cè)手段也需要記錄在內(nèi),方便排查接口的硬線故障。
2) 根據(jù)設(shè)備配置的NVRAM存儲(chǔ)容量、失效場(chǎng)景種類(lèi)、接口BIT數(shù)量、單項(xiàng)故障信息記錄格式所占存儲(chǔ)容量等,進(jìn)行NVRAM區(qū)域劃分。
3) 在NVRAM中分別設(shè)置信息區(qū)域及索引區(qū)域。信息區(qū)域用來(lái)記錄各類(lèi)故障信息,索引區(qū)域用于記錄每類(lèi)故障信息的實(shí)時(shí)記錄位置,方便讀寫(xiě)的同時(shí)防止信息覆蓋。本文方案設(shè)計(jì)如圖1所示,BIT分為上電BIT、周期BIT、維護(hù)BIT,失效場(chǎng)景有參考電壓異常監(jiān)控,看門(mén)狗報(bào)警,火警告警。
圖1 NVRAM區(qū)域劃分
4) 當(dāng)發(fā)生一項(xiàng)故障時(shí),首先根據(jù)此項(xiàng)故障類(lèi)型,進(jìn)行索引查找,獲取該條記錄應(yīng)該的存儲(chǔ)地址,而后將發(fā)生該類(lèi)故障的故障時(shí)間、故障分類(lèi)、故障現(xiàn)場(chǎng)等信息寫(xiě)入NVRAM對(duì)應(yīng)位置中,最后更新索引為下一次記錄地址。
首先,根據(jù)產(chǎn)品設(shè)計(jì)需求,確定故障記錄的格式,即一條記錄包括哪些內(nèi)容。本文采用的故障記錄格式如圖2所示。
圖2 故障記錄格式
其次,根據(jù)設(shè)備配置的NVRAM容量,進(jìn)行NVRAM區(qū)域劃分。例如NVRAM為128 kB,可將0 kB~100 kB設(shè)置為信息記錄區(qū)域,而將索引區(qū)域設(shè)置在101 kB~128 kB范圍中。綜合考慮幾類(lèi)故障發(fā)生的頻次,為高頻次的故障類(lèi)型預(yù)留更多的記錄空間。本文為上電BIT、周期BIT、維護(hù)BIT,參考電壓異常,看門(mén)狗報(bào)警,火警告警分配的空間占比為1∶5∶1∶1∶1∶1。
另外,在進(jìn)行故障記錄時(shí),可結(jié)合設(shè)備的具體工作狀態(tài)和是否為重復(fù)單一型故障,為各類(lèi)型故障設(shè)置單次上電記錄上限,以避免出現(xiàn)某種故障反復(fù)發(fā)生而大量占用NVRAM存儲(chǔ)資源的情況,尤其是周期BIT的故障記錄,當(dāng)某一接口反復(fù)出錯(cuò)時(shí),只需要記錄一次故障狀態(tài),若后續(xù)故障消失,則記錄為非持續(xù)性故障。此外還需注意,如果同一時(shí)刻發(fā)生多項(xiàng)故障,應(yīng)根據(jù)設(shè)備的處理能力,在不影響正常功能運(yùn)行的前提下酌情選擇記錄。
最后,完整的故障記錄過(guò)程應(yīng)包括:1) 產(chǎn)品上電后,判斷現(xiàn)存的NVRAM索引區(qū)域范圍是否有效。如果某項(xiàng)索引未在預(yù)先設(shè)定的范圍內(nèi),則將該項(xiàng)索引重置到對(duì)應(yīng)范圍起始地址,開(kāi)始新一輪的記錄。2) 當(dāng)發(fā)生某類(lèi)故障時(shí),根據(jù)類(lèi)型進(jìn)行索引查找并記錄到索引位置,如果查找到的索引未在預(yù)設(shè)范圍內(nèi),則進(jìn)行索引重置,將該項(xiàng)索引重置到對(duì)應(yīng)范圍起始地址。3) 將該類(lèi)型故障的發(fā)生/消失時(shí)間、故障項(xiàng)編碼、故障機(jī)理等信息按照規(guī)定的故障記錄格式寫(xiě)入NVRAM中,并將相應(yīng)類(lèi)型的索引進(jìn)行更新。
在設(shè)備發(fā)生故障時(shí),NVRAM中存儲(chǔ)的故障信息對(duì)系統(tǒng)故障的診斷、分析及定位具有重要的參考價(jià)值。使用NVRAM的出發(fā)點(diǎn)是為了更好地記錄信息、還原故障現(xiàn)場(chǎng)。本文提出的故障信息記錄方法靈活可靠、可移植性強(qiáng)。通過(guò)對(duì)故障信息進(jìn)行分類(lèi)記錄,可快速還原失效場(chǎng)景,極大降低了故障排查、分析及定位難度,節(jié)約人力及時(shí)間成本,為設(shè)備的高效維護(hù)提供了有力保障。