陳 奎
(中航工業(yè)西安航空計(jì)算技術(shù)研究所,陜西西安,710065)
機(jī)載分布式雙余度機(jī)電系統(tǒng)的容錯(cuò)與重構(gòu)
陳 奎
(中航工業(yè)西安航空計(jì)算技術(shù)研究所,陜西西安,710065)
機(jī)電系統(tǒng)是飛機(jī)系統(tǒng)的重要組成部分,其可靠性和技術(shù)的先進(jìn)性直接影響到飛機(jī)的性能。本文利用分布式雙余度容錯(cuò)技術(shù)、系統(tǒng)重構(gòu)技術(shù)、高速航空總線技術(shù),對(duì)機(jī)載分布式雙余度機(jī)電系統(tǒng)進(jìn)行研究和設(shè)計(jì),并重點(diǎn)討論了該系統(tǒng)的組成、工作原理、系統(tǒng)容錯(cuò)和系統(tǒng)重構(gòu)和異常處理。
系統(tǒng)容錯(cuò);系統(tǒng)重構(gòu);異常處理
飛機(jī)機(jī)電系統(tǒng)是飛機(jī)的重要組成部分,其性能和可靠性直接影響到飛機(jī)的性能和可靠性。因而有必要對(duì)機(jī)電系統(tǒng)內(nèi)各個(gè)專用控制器資源進(jìn)行整理和歸納,減少機(jī)載產(chǎn)品數(shù)量和機(jī)上電纜重量,實(shí)現(xiàn)機(jī)電系統(tǒng)內(nèi)數(shù)據(jù)共享,提高機(jī)電系統(tǒng)綜合管理水平,同時(shí),還要進(jìn)一步提高系統(tǒng)可靠性和安全性,增加系統(tǒng)容錯(cuò)能力,實(shí)現(xiàn)系統(tǒng)故障重構(gòu)功能,從而達(dá)到實(shí)現(xiàn)機(jī)電系統(tǒng)內(nèi)最優(yōu)控制管理和進(jìn)一步綜合化的拓展。而采用分布式雙余度系統(tǒng)是一個(gè)較為合適的方案。
在分布式雙余度系統(tǒng)中,由一臺(tái)雙余度機(jī)電管理計(jì)算機(jī)和可配置數(shù)量的雙余度遠(yuǎn)程接口單元組成。UMC作為機(jī)電系統(tǒng)的運(yùn)算和控制中心,通過兩個(gè)高速航空總線網(wǎng)絡(luò)收集所有遠(yuǎn)程接口單元采集到的數(shù)據(jù)信息。并對(duì)機(jī)電內(nèi)部信息進(jìn)行分析、綜合處理,并將最終結(jié)果上報(bào)給上位機(jī)。機(jī)電管理計(jì)算機(jī)和遠(yuǎn)程接口單元通過高速、智能1394B總線網(wǎng)絡(luò)進(jìn)行信息交換,機(jī)電管理計(jì)算機(jī)完成機(jī)電系統(tǒng)信息綜合處理,遠(yuǎn)程接口單元完成機(jī)電數(shù)據(jù)采集、機(jī)電作動(dòng)器驅(qū)動(dòng)以及機(jī)電數(shù)據(jù)上傳。
在分布式雙余度機(jī)電系統(tǒng)中。機(jī)電管理計(jì)算機(jī)和遠(yuǎn)程接口單元都是雙余度架構(gòu),機(jī)電管理計(jì)算機(jī)的A通道和遠(yuǎn)程接口單元的A通道組成一個(gè)總線網(wǎng)絡(luò),完成信息交換;機(jī)電管理計(jì)算機(jī)的B通道和遠(yuǎn)程接口單元的B通道組成另外一個(gè)總線網(wǎng)絡(luò),完成信息交換;在機(jī)電管理計(jì)算機(jī)內(nèi)部A、B通道之間設(shè)置高速交叉數(shù)據(jù)鏈路,將兩個(gè)獨(dú)立的機(jī)電內(nèi)網(wǎng)絡(luò)數(shù)據(jù)在機(jī)電管理計(jì)算機(jī)內(nèi)部的A、B通道之間實(shí)現(xiàn)數(shù)據(jù)共享;兩條總線網(wǎng)絡(luò)同時(shí)工作。
遠(yuǎn)程接口單元采用統(tǒng)一的軟硬件平臺(tái),根據(jù)飛機(jī)上不同的機(jī)位信號(hào),自動(dòng)加載遠(yuǎn)程接口單元內(nèi)部的表驅(qū)動(dòng),實(shí)現(xiàn)自動(dòng)配置,完成該位置的產(chǎn)品功能。
在該系統(tǒng)中,當(dāng)機(jī)電管理計(jì)算機(jī)或遠(yuǎn)程接口單元中的任何一個(gè)產(chǎn)品雙通道同時(shí)故障而導(dǎo)致無法完成該節(jié)點(diǎn)功能時(shí),該產(chǎn)品進(jìn)入安全模式,封鎖所有總線接口通訊、輸出接口進(jìn)入自鎖狀態(tài),以保障飛機(jī)其它機(jī)電系統(tǒng)的安全。同時(shí)在機(jī)電管理計(jì)算機(jī)和遠(yuǎn)程接口單元內(nèi)部均設(shè)置功能模塊相關(guān)監(jiān)控機(jī)制。該系統(tǒng)中所有節(jié)點(diǎn)都具備自身故障監(jiān)測(cè)、定位、隔離能力,并根據(jù)故障點(diǎn)自動(dòng)完成資源配置,實(shí)現(xiàn)故障后系統(tǒng)資源重組,完成系統(tǒng)功能。
分布式雙余度機(jī)電系統(tǒng)由機(jī)電管理計(jì)算機(jī)和多個(gè)遠(yuǎn)程接口單元構(gòu)成。由于系統(tǒng)任務(wù)的關(guān)鍵程度不同,將系統(tǒng)任務(wù)配置單節(jié)點(diǎn)節(jié)任務(wù)和雙節(jié)點(diǎn)機(jī)任務(wù),同時(shí)在節(jié)點(diǎn)機(jī)內(nèi)部全部配置成雙通道任務(wù)。因此該系統(tǒng)中節(jié)點(diǎn)機(jī)級(jí)容錯(cuò)和影響性分析分為:節(jié)點(diǎn)機(jī)內(nèi)部單通道故障和節(jié)點(diǎn)機(jī)內(nèi)部雙通道故障兩種模式。
① 節(jié)點(diǎn)機(jī)內(nèi)部單通道故障時(shí),故障通道封鎖所有總線接口,并將所有驅(qū)動(dòng)輸出接口置為安全態(tài),該節(jié)點(diǎn)機(jī)進(jìn)入單通道工作模式;與該節(jié)點(diǎn)機(jī)故障通道相交聯(lián)的信號(hào)喪失一個(gè)余度;對(duì)于僅僅配置到該節(jié)點(diǎn)機(jī)上信號(hào),降級(jí)為單余度模式;對(duì)于配置到包含該節(jié)點(diǎn)機(jī)和另外一個(gè)節(jié)點(diǎn)機(jī)上的信號(hào),降級(jí)為雙余度工作模塊。在該故障模式下,系統(tǒng)余度降級(jí),系統(tǒng)功能可以正常實(shí)現(xiàn)。
② 節(jié)點(diǎn)機(jī)內(nèi)部雙通道故障時(shí),故障節(jié)點(diǎn)機(jī)封鎖所有總線接口,并將所有驅(qū)動(dòng)輸出接口置為安全態(tài),該節(jié)點(diǎn)機(jī)進(jìn)入安全工作模式;對(duì)于僅僅配置到該節(jié)點(diǎn)機(jī)上信號(hào),喪失功能;對(duì)于配置到包含該節(jié)點(diǎn)機(jī)和另外一個(gè)節(jié)點(diǎn)機(jī)上的信號(hào),降級(jí)為雙余度工作模塊。在該故障模式下,系統(tǒng)中一個(gè)節(jié)點(diǎn)機(jī)功能喪失,系統(tǒng)功能降級(jí),無法完全實(shí)現(xiàn)系統(tǒng)全部功能。
為實(shí)現(xiàn)分布式雙余度機(jī)電系統(tǒng)容錯(cuò)和重構(gòu)功能,在硬件上配置如下功能:看門狗檢測(cè)功能、電源異常檢測(cè)功能、智能總線底層校驗(yàn)功能、硬件連鎖功能以及故障注入檢測(cè)功能。
① 看門狗檢測(cè)功能。在該系統(tǒng)中的每個(gè)節(jié)點(diǎn)里通過FPGA設(shè)計(jì)可配置看門狗檢測(cè)功能,用來檢測(cè)處理器運(yùn)行狀態(tài),當(dāng)出現(xiàn)異常時(shí),該看門狗告警信號(hào)連鎖到本通道的通道控制邏輯中,實(shí)現(xiàn)將本通道故障處理;
② 電源異常檢測(cè)功能。在該系統(tǒng)中的每個(gè)節(jié)點(diǎn)里設(shè)置獨(dú)立的電源異常檢測(cè)電路,同時(shí)對(duì)輸入到產(chǎn)品的電源信號(hào)和產(chǎn)品內(nèi)部的二次電源進(jìn)行檢測(cè),當(dāng)外部輸入電壓超出規(guī)定時(shí),產(chǎn)品產(chǎn)生告警信息,記錄此告警信息,當(dāng)檢測(cè)到產(chǎn)品內(nèi)部二次電源故障時(shí),記錄該故障信息。
③ 智能總線底層校驗(yàn)功能。該系統(tǒng)中大量使用智能總線,在總線層對(duì)數(shù)據(jù)進(jìn)行循環(huán)冗余碼校驗(yàn)、垂直奇偶校驗(yàn)等校驗(yàn)功能,并將結(jié)果上報(bào)軟件,參與系統(tǒng)通道控制邏輯。
④ 硬件連鎖功能。當(dāng)通道功能喪失時(shí),通過硬件連鎖功能封鎖總線輸出,并將驅(qū)動(dòng)輸出連鎖到安全狀態(tài)。
⑤ 故障注入檢測(cè)功能。在每個(gè)節(jié)點(diǎn)中設(shè)置故障注入檢測(cè)功能,當(dāng)從外界注入故障后,觸發(fā)節(jié)點(diǎn)內(nèi)部的通道故障邏輯,導(dǎo)致節(jié)點(diǎn)失效,便于驗(yàn)證通道故障邏輯功能和開展系統(tǒng)故障注入試驗(yàn)。
本文在分布式技術(shù)、雙余度容錯(cuò)技術(shù)以及高速航空總線技術(shù)的基礎(chǔ)上,通過對(duì)分布式雙余度的系統(tǒng)架構(gòu)、資源管理、容錯(cuò)策略等進(jìn)行研究,設(shè)計(jì)完成了一個(gè)具有故障識(shí)別、資源共享以及容錯(cuò)重構(gòu)功能的分布式雙余度機(jī)電系統(tǒng)。該系統(tǒng)具有可靠性高、可擴(kuò)展性好以及減少機(jī)載產(chǎn)品數(shù)量等優(yōu)點(diǎn)。目前使用這種集故障識(shí)別、資源共享以及容錯(cuò)重構(gòu)功能的分布式雙余度機(jī)電系統(tǒng),已在某重點(diǎn)科研項(xiàng)目中成功運(yùn)用,不僅填補(bǔ)了國(guó)產(chǎn)飛機(jī)在先進(jìn)分布式雙余度機(jī)電系統(tǒng)上的空白,同時(shí)為后續(xù)的飛機(jī)平臺(tái)級(jí)大綜合奠定技術(shù)基礎(chǔ)。
[1] Valentino,G.J.;Johnson,D.L.Advanced photonic subsystems to implement reconfigurable,fault-tolerant avionics. Digital Avionics Systems,2001.DASC.20th Conference
[2]唐利紅,邵清.嵌入式系統(tǒng)中基于DAG的容錯(cuò)調(diào)度算法設(shè)計(jì)[J].信息技術(shù), 2015, ,(2):138~141,146.
[3]楊芳萍,陳海鴻,呂浩音,王艷麗,張中琦.多通道余度模型的表決控制算法和可靠性分析[J].蘭州理工大學(xué)學(xué)報(bào),2015, 41(1):107-111.
The Fault-Tolerant and reconfiguration technique of distributed dualredundancy on airborne electromechanical system
Chen Kui
(AVIC Xi'an Aeronautics Computing Technique Research Institute,Xi'an 710065,China)
The Advancement and reliability of the electromechanical system will directly affects the performance of the aircraft,since it is an important part of the aircraft systems.This paper makes a research on the design of distributed dual-redundancy electromechanical system which uses the faulttolerant technology,system reconfiguration technology and high-speed avionics bus technology, and the composition of the system, working principle and fault tolerance,as well as reconfiguration mechanism are mainly discussed.
system fault-tolerant technology;system reconfiguration;exception handing
陳奎(1985-),男,安徽阜陽人,本科,工程師,主要研究方向?yàn)闄C(jī)載機(jī)電系統(tǒng)計(jì)算機(jī)。