王亮 吳雄洲 吳云 中航工業(yè)西安航空計算技術(shù)研究所
故障處理是機(jī)載計算機(jī)系統(tǒng)的重要組成部分,隨著機(jī)載計算機(jī)使用的增多,輸入輸出信號種類的增加,計算機(jī)內(nèi)部結(jié)構(gòu)越發(fā)復(fù)雜,對故障處理也提出了更高的要求。上一代機(jī)載計算機(jī)結(jié)構(gòu)簡單,相對故障處理分散,內(nèi)部基本無專門的故障處理程序。此種故障處理機(jī)制處理能力低,可維護(hù)性差,不利于提高機(jī)載計算機(jī)性能發(fā)揮。
為了提高機(jī)載計算機(jī)系統(tǒng)故障處理能力,本文提出一種以故障登記表為基礎(chǔ)的,分類、分級故障處理機(jī)制,將系統(tǒng)中的故障按照故障等級統(tǒng)一記錄在故障登記表中,進(jìn)行集中管理。
本文以雙余度機(jī)載計算機(jī)為平臺,詳細(xì)闡述一種故障處理的方法。該雙余度計算機(jī)由以下模塊組成:中央處理模塊(CPM)、總線接口模塊(BIM)、電源模塊(PSM)。其中BIM模塊采集模擬量、離散量等數(shù)據(jù),同時對其進(jìn)行故障檢測,CPM模塊接收并處理來自BIM模塊的數(shù)據(jù)及故障信息,將故障記錄在NVRAM中,BIM模塊與CPM通過ARINC659總線實(shí)現(xiàn)數(shù)據(jù)互傳。雙余度機(jī)載計算機(jī)組成結(jié)構(gòu)如圖1所示。
圖1 雙余度機(jī)載計算機(jī)組成結(jié)構(gòu)圖
雙余度機(jī)載計算機(jī)系統(tǒng)軟件由驅(qū)動程序、互比監(jiān)控模塊軟件、余度管理軟件、故障處理軟件以及系統(tǒng)測試軟件構(gòu)成,如圖2所示。
(1)互比監(jiān)控軟件,接收來自驅(qū)動程序的雙通道數(shù)據(jù),根據(jù)故障表中的互比參數(shù),對數(shù)據(jù)進(jìn)行互比監(jiān)控,并將互比故障信息上報給故障處理模塊,輸入數(shù)據(jù)上報給余度管理模塊。
(2)系統(tǒng)測試軟件,對整個計算機(jī)系統(tǒng)的所有硬件設(shè)備進(jìn)行上電自測試和周期自測試并將測試故障信息報給故障處理軟件。
(3)余度管理軟件,獲取來自故障處理軟件的故障等級表信息,根據(jù)故障等級表中的信息,對計算機(jī)內(nèi)部雙余度資源進(jìn)行管理。
(4)故障處理軟件,接收來自互比監(jiān)控軟件和系統(tǒng)測試軟件的故障信息,并將故障信息登記在故障表中,同時將故障信息以故障碼的形式發(fā)送給應(yīng)用程序,由應(yīng)用程序?qū)⒐收洗a發(fā)送給地面檢測設(shè)備。本文著重介紹故障處理軟件的設(shè)計。
圖2 系統(tǒng)軟件架構(gòu)圖
雙余度計算機(jī)故障處理算法以故障登記表為核心,獲取計算機(jī)故障統(tǒng)一管理,算法分為:故障檢測、故障記錄、故障申報、故障隔離與恢復(fù)。
故障處理軟件建立了故障登記表,將計算機(jī)故障信息記錄在故障表中,實(shí)現(xiàn)了系統(tǒng)故障的統(tǒng)一管理,通過查找故障登記表,系統(tǒng)就可以獲取當(dāng)前計算機(jī)的所有故障狀態(tài),極大的方便了后期系統(tǒng)排故維護(hù)。與故障分類對應(yīng),將故障表分為兩種類型:故障總表和故障子表。其中故障總表用于記錄與遍歷故障子表,故障子表用于記錄不同類型的故障,故障子表中包含:故障編碼,故障計數(shù),故障現(xiàn)場,故障互比類型與互比門限。
當(dāng)故障發(fā)生時,故障處理軟件遍歷故障總表與故障子表,定位該故障在故障表中的位置,將其對應(yīng)的故障計數(shù)加1。若故障計數(shù)大于或等于故障門限,則記錄故障狀態(tài)為永久故障(否則為瞬時故障),并將該故障狀態(tài)上報給余度管理軟件,由余度管理軟件,對系統(tǒng)資源進(jìn)行重新分配,同時將故障編碼上報給應(yīng)用程序,由應(yīng)用軟件完成故障的對外申報。故障記錄算法流程如圖3所示。
圖3 故障記錄算法
故障處理模塊遍歷故障總表與故障子表,若發(fā)生瞬時故障,則置當(dāng)前數(shù)據(jù)狀態(tài)為失效,由余度管理軟件向應(yīng)用程序上報歷史數(shù)據(jù),若該故障恢復(fù)正常,故障計數(shù)減為零,則清除當(dāng)前故障,由余度管理軟件向應(yīng)用程序上報當(dāng)前數(shù)據(jù),實(shí)現(xiàn)瞬時故障數(shù)據(jù)恢復(fù)的功能。
若信號數(shù)據(jù)故障狀態(tài)達(dá)到永久故障,判斷該故障的故障等級,若為I級或II級故障,則切除故障模塊,若為III級故障,則按照信號名稱,切除該信號對應(yīng)功能模塊,將故障影響域限制在最小范圍內(nèi),實(shí)現(xiàn)永久故障隔離。
本文提出的以故障登記表為基礎(chǔ),對故障進(jìn)行分類分等級管理,能夠更好的將影響飛機(jī)安全的故障隔離,適時恢復(fù)影響部分功能的故障,提高系統(tǒng)可用性。所有故障信息均登記在同一個故障表中,便于用戶的管理。所有故障信息均有唯一的故障編碼,便于用戶外場定位和排查故障。