郭陽(yáng)明1,米 琪1,張 雙,孔德岐
(1.西北工業(yè)大學(xué) 計(jì)算機(jī)學(xué)院,西安 710072;2.航空工業(yè)西安航空計(jì)算技術(shù)研究所,西安 710072)
高性能、高可靠的航空電子系統(tǒng)是先進(jìn)戰(zhàn)機(jī)實(shí)現(xiàn)作戰(zhàn)任務(wù)功能、實(shí)施作戰(zhàn)任務(wù)管理和提升作戰(zhàn)任務(wù)效能的重要保障。隨著未來(lái)信息化戰(zhàn)爭(zhēng)模式的變革與發(fā)展,先進(jìn)戰(zhàn)機(jī)機(jī)載設(shè)備數(shù)量不斷增加,作戰(zhàn)能力需求不斷提升,這種發(fā)展情形下龐大的信息和實(shí)時(shí)的處理需求對(duì)系統(tǒng)資源能力提出了更高的要求,如何提高系統(tǒng)資源保證能力、系統(tǒng)任務(wù)完成效率、系統(tǒng)容錯(cuò)能力成為航空電子平臺(tái)需要面對(duì)的基礎(chǔ)問(wèn)題。
PHM技術(shù)作為DIMA資源組織和系統(tǒng)重構(gòu)的基礎(chǔ),是系統(tǒng)完成任務(wù)的保證。為此,PHM技術(shù)在航空電子領(lǐng)域得到廣泛的重視與研究。PHM技術(shù)采用先進(jìn)的傳感器采集航電系統(tǒng)數(shù)據(jù),利用神經(jīng)網(wǎng)絡(luò)、模糊邏輯、專(zhuān)家系統(tǒng)等推理算法對(duì)航電系統(tǒng)的健康狀態(tài)進(jìn)行評(píng)估,并對(duì)可能發(fā)生的故障進(jìn)行預(yù)測(cè),根據(jù)評(píng)估及預(yù)測(cè)結(jié)果對(duì)系統(tǒng)提供一系列維修保障措施,是一種集故障檢測(cè)、診斷、隔離、健康預(yù)測(cè)、評(píng)估、系統(tǒng)維護(hù)、決策于一體的綜合技術(shù)[1-2]。從資源級(jí)到任務(wù)級(jí),PHM技術(shù)將支撐航電系統(tǒng)狀態(tài)的數(shù)據(jù)采集與檢測(cè)、故障監(jiān)控與管理、系統(tǒng)重構(gòu)與降級(jí)等任務(wù)實(shí)現(xiàn)。此外,PHM作為基于狀態(tài)的視情維修(CBM)的使能技術(shù),可以大大地提高資源利用率和任務(wù)成功率,降低全壽命周期費(fèi)用[3]。
DIMA動(dòng)態(tài)重構(gòu)技術(shù)可以使飛行器充分利用功能冗余來(lái)進(jìn)行系統(tǒng)重構(gòu),使其快速適應(yīng)故障或特殊任務(wù)環(huán)境,因此動(dòng)態(tài)重構(gòu)技術(shù)可以降低航電系統(tǒng)對(duì)硬件資源余度的要求,允許飛行器在出現(xiàn)大規(guī)模故障或戰(zhàn)斗損傷的情況下,仍能保證一定的飛行能力,使飛行員繼續(xù)完成任務(wù)或安全返航[4]。因此,當(dāng)PHM系統(tǒng)檢測(cè)到航電系統(tǒng)資源退化或功能變異時(shí),依據(jù)系統(tǒng)硬件資源的有效性,面向任務(wù)需求進(jìn)行資源重組,可以使航電系統(tǒng)以最優(yōu)方式為任務(wù)的完成提供服務(wù)。
本文在梳理PHM技術(shù)內(nèi)涵及DIMA體系架構(gòu)的基礎(chǔ)上,分析了DIMA任務(wù)組織和調(diào)度特點(diǎn),并在此基礎(chǔ)上面向任務(wù)需求,論述了基于PHM的DIMA動(dòng)態(tài)重構(gòu)機(jī)制,給出了DIMA動(dòng)態(tài)重構(gòu)模型及重構(gòu)策略。
根據(jù)DO-297設(shè)計(jì)手冊(cè)對(duì)航電系統(tǒng)PHM的定義[5],PHM技術(shù)包括故障預(yù)測(cè)與健康管理兩層含義。其中故障預(yù)測(cè)是指根據(jù)傳感器采集到的數(shù)據(jù)預(yù)先診斷部件或系統(tǒng)完成其功能的狀態(tài),預(yù)測(cè)部件的性能下降狀況,從而確定部件的剩余使用壽命或維持正常工作的時(shí)間長(zhǎng)度;健康管理是指根據(jù)故障預(yù)測(cè)結(jié)果、設(shè)備可用資源情況及系統(tǒng)任務(wù)需求對(duì)維修活動(dòng)做出適當(dāng)?shù)囊?guī)劃和決策[6-7]。
PHM的技術(shù)結(jié)構(gòu)如圖1所示。在航空電子領(lǐng)域,PHM技術(shù)主要分為以下幾個(gè)步驟:1)通過(guò)分布式傳感器采集航電設(shè)備的數(shù)據(jù)信息;2)對(duì)采集到的數(shù)據(jù)進(jìn)行預(yù)處理、特征提取、信息融合等處理,獲得表征系統(tǒng)性能狀態(tài)的特征信息;3)基于數(shù)據(jù)處理的結(jié)果運(yùn)用智能推理算法監(jiān)控和管理航電設(shè)備的健康狀態(tài),預(yù)測(cè)系統(tǒng)發(fā)生故障的部位、時(shí)間及部件的剩余使用壽命;4)根據(jù)系統(tǒng)健康狀態(tài)變化趨勢(shì)、歷史狀態(tài)信息、任務(wù)執(zhí)行狀況、資源使用情況等,給出系統(tǒng)維修保障措施。
圖1 PHM技術(shù)結(jié)構(gòu)框圖
PHM作為航空電子系統(tǒng)健康監(jiān)測(cè)與管理的技術(shù),能夠?yàn)楹诫娤到y(tǒng)提供全面的故障檢測(cè)、隔離、預(yù)測(cè)及狀態(tài)的管理,顯著提高對(duì)航電系統(tǒng)工作狀態(tài)的了解,最大限度的利用傳統(tǒng)故障檢測(cè)技術(shù)和先進(jìn)軟件建模方法獲得極為精準(zhǔn)的故障檢測(cè)和隔離結(jié)果,并能收集和處理航電設(shè)備部件的性能信息從而有效地預(yù)測(cè)這些部件的剩余使用壽命,最終實(shí)現(xiàn)精確預(yù)測(cè)將要發(fā)生的故障并在故障發(fā)生前更換該部件或?qū)で笞顑?yōu)解決途徑,實(shí)現(xiàn)視情維修[8-9]。
DIMA在繼承IMA優(yōu)勢(shì)的同時(shí),通過(guò)分布式系統(tǒng)架構(gòu)和高容錯(cuò)的實(shí)時(shí)通信網(wǎng)絡(luò),將分布于飛行器的多個(gè)綜合化模塊相連接,進(jìn)而提供資源共享的魯棒式分區(qū)系統(tǒng)。同時(shí),DIMA通過(guò)將分布式模塊電子就近分布在靠近信號(hào)源的區(qū)域,并且與前端信號(hào)源的預(yù)處理相結(jié)合,從而提高整個(gè)航電系統(tǒng)的資源整合與信息共享程度[10]。因此,DIMA能夠高效地設(shè)計(jì)具有混合關(guān)鍵型應(yīng)用的分布式系統(tǒng),避免了傳統(tǒng)分布式系統(tǒng)中對(duì)關(guān)鍵和非關(guān)鍵型功能靈活整合所面臨的沖突。
DIMA作為分布式系統(tǒng),其每個(gè)子系統(tǒng)都基于自身的IMA體系架構(gòu),如圖2所示。
圖2 DIMA體系架構(gòu)圖
DIMA通過(guò)分布式實(shí)時(shí)通信網(wǎng)絡(luò)在分布式處理單元和各個(gè)功能模塊間傳輸數(shù)據(jù),同時(shí)應(yīng)用程序間通信和I/O處理技術(shù)使得系統(tǒng)中能夠集成多個(gè)應(yīng)用程序,并且在應(yīng)用程序間保持強(qiáng)大的時(shí)空分區(qū)[11]。因此,DIMA實(shí)現(xiàn)了I/O處理模塊與應(yīng)用處理模塊在物理層次上的嚴(yán)格隔離,形成了天然的故障傳播壁壘,此外,遠(yuǎn)程數(shù)據(jù)集中單元可用于與下一個(gè)通信系統(tǒng)處理單元交換I/O數(shù)據(jù),層次化的體系架構(gòu)降低了布線及系統(tǒng)的復(fù)雜度,處理單元間的數(shù)據(jù)共享降低了所需的總體系統(tǒng)處理功耗及所需硬件。
航電系統(tǒng)的功能需求與其任務(wù)使命是緊密相關(guān)的[12],因此可以通過(guò)研究DIMA任務(wù)組織與結(jié)構(gòu)之間的關(guān)系,給出DIMA任務(wù)組織結(jié)構(gòu),用于指導(dǎo)DIMA動(dòng)態(tài)重構(gòu)模型的搭建。
如圖3所示,DIMA按任務(wù)組織可以劃分為層次化的網(wǎng)狀拓?fù)浣Y(jié)構(gòu),按照任務(wù)最小耦合關(guān)系劃分原則,可以將任務(wù)劃分到不同的分區(qū),分區(qū)中任務(wù)被分解為原子化的子任務(wù),子任務(wù)由通用功能提供支撐,通用功能可以分解為多個(gè)相互獨(dú)立的操作過(guò)程,最終每個(gè)操作過(guò)程被映射到相應(yīng)的物理實(shí)體上。因此系統(tǒng)中針對(duì)應(yīng)用的實(shí)現(xiàn)都可以通過(guò)一個(gè)概念標(biāo)示的任務(wù)—功能—資源層次結(jié)構(gòu)來(lái)實(shí)現(xiàn)。由此可以看出,系統(tǒng)的生存能力與硬件資源的可用狀態(tài)以及任務(wù)的邏輯調(diào)度直接相關(guān)[13]。
圖3 DIMA任務(wù)組織結(jié)構(gòu)
在圖3所示的DIMA任務(wù)組織結(jié)構(gòu)下,ARINC 653標(biāo)準(zhǔn)規(guī)定了DIMA任務(wù)調(diào)度的特點(diǎn)如下[14-15]:
1)采用多分區(qū)雙層調(diào)度模型,上層運(yùn)行分區(qū)調(diào)度器,下層運(yùn)行核心調(diào)度器。其中分區(qū)調(diào)度器按照優(yōu)先級(jí)對(duì)分區(qū)內(nèi)的任務(wù)進(jìn)行調(diào)度,核心調(diào)度器按照系統(tǒng)配置的調(diào)度表對(duì)分區(qū)進(jìn)行調(diào)度。
2)核心調(diào)度器以分區(qū)為調(diào)度單元,系統(tǒng)中包含多個(gè)分區(qū),分區(qū)無(wú)優(yōu)先級(jí)。每個(gè)分區(qū)擁有特定的周期,核心調(diào)度器采用時(shí)間片輪轉(zhuǎn)的方式為每個(gè)分區(qū)提供時(shí)間窗口,分區(qū)間相互獨(dú)立,加載于分區(qū)上的任務(wù)只能在所屬分區(qū)的時(shí)間窗口內(nèi)才可能被執(zhí)行。
3)分區(qū)由一個(gè)或多個(gè)任務(wù)組成,每個(gè)任務(wù)隸屬于特定的分區(qū),任務(wù)具有優(yōu)先級(jí)。分區(qū)調(diào)度器以任務(wù)為調(diào)度單元,任務(wù)在任何時(shí)刻都可以被更高優(yōu)先級(jí)的任務(wù)搶占資源。
PHM能力主要體現(xiàn)在故障監(jiān)測(cè)、診斷、預(yù)測(cè)以及健康管理幾個(gè)方面。故障監(jiān)測(cè)、診斷、預(yù)測(cè)的作用是實(shí)時(shí)提取特征數(shù)據(jù)并加以分析,鑒別和定位系統(tǒng)問(wèn)題;健康管理的作用則是針對(duì)已知的系統(tǒng)問(wèn)題,對(duì)系統(tǒng)資源配置進(jìn)行自適應(yīng)調(diào)整,針對(duì)系統(tǒng)任務(wù)進(jìn)行重構(gòu)、降級(jí)等決策與操作。
可重構(gòu)DIMA希望通過(guò)移動(dòng)駐留于故障運(yùn)算模塊的應(yīng)用軟件至備用運(yùn)算模塊,以達(dá)到改變平臺(tái)配置的目的,從而提高飛行器的可靠性、保障其安全性,減少計(jì)劃外維護(hù)費(fèi)用及重構(gòu)對(duì)取證帶來(lái)的影響。當(dāng)PHM系統(tǒng)檢測(cè)到航電系統(tǒng)資源退化或功能變異時(shí),DIMA動(dòng)態(tài)重構(gòu)系統(tǒng)會(huì)依據(jù)當(dāng)前航電系統(tǒng)的資源及功能有效性,面向任務(wù)需求進(jìn)行資源重組,使航電系統(tǒng)以最優(yōu)方式完成任務(wù)的執(zhí)行。
DIMA動(dòng)態(tài)重構(gòu)機(jī)制是在PHM實(shí)時(shí)檢測(cè)或預(yù)測(cè)信息的基礎(chǔ)上,基于當(dāng)前系統(tǒng)的有效能力,針對(duì)某個(gè)任務(wù)需求對(duì)系統(tǒng)進(jìn)行重新配置,以實(shí)現(xiàn)資源的合理分配,總體方案如圖4所示。在進(jìn)行系統(tǒng)重構(gòu)時(shí),還需要考慮有效性的時(shí)效,在分析資源與任務(wù)需求相容關(guān)系的基礎(chǔ)上,通過(guò)對(duì)系統(tǒng)資源能力進(jìn)行評(píng)估,調(diào)整系統(tǒng)的資源配置。當(dāng)硬件資源無(wú)法支撐所有任務(wù)需求時(shí),則被迫進(jìn)行系統(tǒng)降級(jí),在盡可能維持系統(tǒng)安全狀態(tài)的基礎(chǔ)上,去除一些優(yōu)先級(jí)較低的任務(wù)需求,用一個(gè)新的需求向量進(jìn)行重新配置。
圖4 基于PHM的DIMA動(dòng)態(tài)重構(gòu)機(jī)制
DIMA動(dòng)態(tài)重構(gòu)行為由通用系統(tǒng)管理(GSM)控制,在執(zhí)行重構(gòu)時(shí),GSM所需的配置信息由藍(lán)印系統(tǒng)提供[16-17]。依據(jù)ARINC 653標(biāo)準(zhǔn)機(jī)載電子設(shè)備健康監(jiān)控體系[18-19]以及DIMA體系架構(gòu)、任務(wù)組織結(jié)構(gòu)及動(dòng)態(tài)重構(gòu)機(jī)制,可以看出,重構(gòu)可以分為系統(tǒng)級(jí)重構(gòu)、子系統(tǒng)級(jí)重構(gòu)、模塊級(jí)重構(gòu)以及分區(qū)級(jí)重構(gòu)。當(dāng)系統(tǒng)檢測(cè)到資源故障或功能變異時(shí),系統(tǒng)故障管理或應(yīng)用發(fā)送重構(gòu)命令給系統(tǒng)級(jí)重構(gòu)管理,系統(tǒng)級(jí)重構(gòu)管理接收命令后開(kāi)始由上到下逐級(jí)進(jìn)行重構(gòu)工作,確保重構(gòu)時(shí)系統(tǒng)、子系統(tǒng)、任務(wù)邏輯及資源狀態(tài)的一致性,使得系統(tǒng)最終達(dá)到一個(gè)確定的狀態(tài),重構(gòu)過(guò)程如圖5所示。
圖5 DIMA動(dòng)態(tài)重構(gòu)過(guò)程
分區(qū)級(jí)重構(gòu)負(fù)責(zé)管理一個(gè)分區(qū)單元,監(jiān)視本分區(qū)內(nèi)軟硬件資源的健康狀態(tài),對(duì)故障進(jìn)行監(jiān)測(cè)、定位、隔離,并選擇合適的重構(gòu)策略對(duì)故障進(jìn)行處理,本級(jí)無(wú)法處理的故障則交由上級(jí)進(jìn)行處理。
模塊級(jí)重構(gòu)負(fù)責(zé)管理一個(gè)IMA模塊,監(jiān)視本模塊內(nèi)各分區(qū)的健康狀態(tài),處理產(chǎn)生的故障,本級(jí)無(wú)法處理的故障交由上級(jí)進(jìn)行處理。
子系統(tǒng)級(jí)重構(gòu)負(fù)責(zé)管理一個(gè)IMA子系統(tǒng),監(jiān)視該子系統(tǒng)內(nèi)各模塊的健康狀態(tài),處理子系統(tǒng)內(nèi)產(chǎn)生的故障,本級(jí)無(wú)法處理的故障交由上級(jí)進(jìn)行處理。
系統(tǒng)級(jí)重構(gòu)是整個(gè)系統(tǒng)的最高管理級(jí)別,負(fù)責(zé)管理整個(gè)系統(tǒng),監(jiān)視各子系統(tǒng)的健康狀態(tài),處理本級(jí)和下級(jí)上報(bào)的故障,響應(yīng)系統(tǒng)的重構(gòu)命令。
根據(jù)ARINC 653標(biāo)準(zhǔn)中健康管理相關(guān)規(guī)定[19]及目前已有的DIMA重構(gòu)管理方法相關(guān)研究[17-18],DIMA動(dòng)態(tài)重構(gòu)策略如下:
規(guī)則1:在子系統(tǒng)中進(jìn)行的是分區(qū)級(jí)的模塊重構(gòu),采用N+1方式實(shí)現(xiàn)重構(gòu),所有同一類(lèi)型模塊在同一機(jī)箱內(nèi)只有一個(gè)備份模塊,并且備份模塊都處于熱備份狀態(tài),當(dāng)子系統(tǒng)中任一模塊發(fā)生故障時(shí),都可以使用備份模塊替代故障模塊進(jìn)行工作。
規(guī)則2:當(dāng)子系統(tǒng)中每種故障類(lèi)型模塊都有備份模塊時(shí),則可以使用備份模塊替代故障模塊進(jìn)行工作。
規(guī)則3:當(dāng)子系統(tǒng)中主控模塊出現(xiàn)故障,并且沒(méi)有主控備份模塊但有普通備份模塊時(shí),則選擇一個(gè)普通備份模塊替代主控模塊進(jìn)行工作,對(duì)整個(gè)子系統(tǒng)進(jìn)行故障管理。
規(guī)則4:當(dāng)子系統(tǒng)中模塊出現(xiàn)故障,并且沒(méi)有備用模塊可用時(shí),按照規(guī)則5進(jìn)行系統(tǒng)級(jí)重構(gòu)。
規(guī)則5:當(dāng)系統(tǒng)中某個(gè)子系統(tǒng)有備份模塊時(shí),則選擇一個(gè)備份模塊代替故障模塊進(jìn)行工作,對(duì)整個(gè)系統(tǒng)進(jìn)行故障管理,當(dāng)系統(tǒng)中任何子系統(tǒng)都沒(méi)有備份模塊時(shí),則按照規(guī)則6進(jìn)行降級(jí)重構(gòu)。
規(guī)則6:系統(tǒng)中各功能應(yīng)用都具有優(yōu)先級(jí),當(dāng)系統(tǒng)中無(wú)備份模塊可用時(shí),系統(tǒng)會(huì)根據(jù)優(yōu)先級(jí)進(jìn)行降級(jí)重構(gòu)。如果故障模塊上執(zhí)行功能的優(yōu)先級(jí)最低則關(guān)閉故障模塊,系統(tǒng)失去相應(yīng)模塊的功能;如果存在比故障模塊上執(zhí)行功能優(yōu)先級(jí)低的功能應(yīng)用時(shí),則系統(tǒng)關(guān)閉優(yōu)先級(jí)最低的功能應(yīng)用,然后修改配置信息,最后將故障模塊上的功能應(yīng)用重新定位到新的處理模塊上。
PHM作為航空電子系統(tǒng)故障預(yù)測(cè)與健康管理的關(guān)鍵技術(shù),是一種集故障檢測(cè)、隔離及維修保障于一體的綜合技術(shù),這種技術(shù)能夠更為全面的了解航空電子系統(tǒng)的工作狀態(tài),最大程度的利用傳統(tǒng)故障檢測(cè)技術(shù)及先進(jìn)的軟件建模方法,對(duì)可能發(fā)生的故障進(jìn)行監(jiān)測(cè),以獲得高精確度的故障檢測(cè)和隔離結(jié)果。PHM技術(shù)還能通過(guò)傳感器采集到的數(shù)據(jù)預(yù)測(cè)關(guān)鍵部件的剩余使用壽命,增強(qiáng)操作人員對(duì)系統(tǒng)剩余能力的了解,以便及時(shí)對(duì)關(guān)鍵部件進(jìn)行維修。當(dāng)PHM系統(tǒng)檢測(cè)到DIMA系統(tǒng)資源退化或功能變異時(shí),DIMA動(dòng)態(tài)重構(gòu)技術(shù)能夠根據(jù)系統(tǒng)現(xiàn)有的資源能力狀態(tài),從軟件層面對(duì)系統(tǒng)進(jìn)行重新配置,以實(shí)現(xiàn)資源的合理利用及系統(tǒng)的正常工作。用于維修決策的動(dòng)態(tài)重構(gòu)模型構(gòu)建以及重構(gòu)過(guò)程中智能推理算法的選擇將成為健康管理的關(guān)鍵,因此按照可靠性、實(shí)時(shí)性的方向?qū)ο到y(tǒng)動(dòng)態(tài)重構(gòu)技術(shù)進(jìn)行不斷改進(jìn)是十分必要的。
本文在研究PHM技術(shù)內(nèi)涵、DIMA體系架構(gòu)的基礎(chǔ)上,分析了DIMA任務(wù)組織和調(diào)度的特點(diǎn),并在此基礎(chǔ)上詳細(xì)介紹了DIMA動(dòng)態(tài)重構(gòu)過(guò)程及動(dòng)態(tài)重構(gòu)策略,為下一步硬件資源能力評(píng)估、系統(tǒng)動(dòng)態(tài)重構(gòu)仿真以及重構(gòu)過(guò)程可靠性分析提供了更有效的指導(dǎo)。
PHM技術(shù)作為航空電子系統(tǒng)上的健康診斷和管理技術(shù),不僅能最大限度保障飛行器的運(yùn)行安全,完成既定的任務(wù),而且能夠提高系統(tǒng)的可用性和降低系統(tǒng)的壽命周期費(fèi)用,目前已經(jīng)在航空電子領(lǐng)域得到大力發(fā)展和廣泛應(yīng)用。采用PHM技術(shù)是提高飛行器經(jīng)濟(jì)可承受性、保障性和安全性的有效途徑,從國(guó)內(nèi)外研究現(xiàn)狀可以看出,PHM技術(shù)已經(jīng)成為飛行器設(shè)計(jì)和使用過(guò)程中的一個(gè)重要組成部分,大力開(kāi)展PHM技術(shù)的研究、解決PHM技術(shù)的瓶頸問(wèn)題,能夠?yàn)槲覈?guó)新一代航空電子設(shè)備的研制提供技術(shù)儲(chǔ)備,更好地促進(jìn)我國(guó)航空工業(yè)的快速發(fā)展。