楊濤,余波
(1.中國(guó)電子科技集團(tuán)公司第二十七研究所,河南 鄭州 450047;2.太原衛(wèi)星發(fā)射中心,山西 太原 030027)
隨著信息技術(shù)的快速發(fā)展,航天測(cè)控系統(tǒng)功能越來越復(fù)雜,體系越來越龐大,影響設(shè)備可靠性的因素也就越來越多,設(shè)備故障的可能性增加,任何一個(gè)微小部件的故障都可能會(huì)導(dǎo)致系統(tǒng)功能退化或停止運(yùn)行,因此設(shè)備的維修保障活動(dòng)也就越來越重要。
裝備維修大致經(jīng)歷三個(gè)階段:第一個(gè)階段是反應(yīng)性維修,裝備故障后進(jìn)行反應(yīng)性的事后維修;第二階段是預(yù)防性維修,對(duì)裝備進(jìn)行定期巡檢、維護(hù)等預(yù)防性的維修;第三個(gè)階段是視情維修(Condition Based Maintenance,CBM),主要是實(shí)現(xiàn)在正確的時(shí)間對(duì)正確的部件進(jìn)行正確的維修。前兩個(gè)階段的維修方式存在諸多問題,反應(yīng)性維修錯(cuò)過了故障初期的最佳維修時(shí)間,導(dǎo)致裝備性能退化,引發(fā)功能性故障甚至系統(tǒng)性故障,導(dǎo)致維修時(shí)間和成本的增加;預(yù)防性維修不具備故障針對(duì)性,會(huì)在裝備正常情況下采取維修措施,影響正常使用,造成資源浪費(fèi)。
視情維修是一種全新的維修方式,能夠滿足現(xiàn)代裝備維修保障需求,降低維修成本和故障風(fēng)險(xiǎn)。健康管理技術(shù)是視情維修的重要技術(shù)基礎(chǔ),利用傳感器技術(shù)采集數(shù)據(jù),并采用數(shù)據(jù)處理進(jìn)行信息融合處理,生成裝備的健康狀態(tài)、故障預(yù)測(cè)等決策信息,進(jìn)行維修決策以及壽命管理,提高裝備的可靠性。
PHM(Prognostic and Health Management)技術(shù)促使維修保障活動(dòng)由傳統(tǒng)的反應(yīng)性事后維修,到定期預(yù)防,再到實(shí)時(shí)監(jiān)控、預(yù)測(cè)分析、綜合管理,受到各國(guó)的廣泛關(guān)注,分別采取了各種方式進(jìn)行研究和開發(fā)。
PHM 概念20世紀(jì)后期首先由美國(guó)NASA 提出,目前其研究和應(yīng)用領(lǐng)域已經(jīng)遍及航空、航天、車輛、核電站以及大型水壩等,成為各種復(fù)雜裝備系統(tǒng)設(shè)計(jì)的重要組成部分。F-35 應(yīng)用的PHM 技術(shù)是美國(guó)國(guó)防部倡導(dǎo)的基于狀態(tài)的維修技術(shù)的具體體現(xiàn),代表了CBM 技術(shù)所能達(dá)到的最高水平。采用PHM 技術(shù)后飛機(jī)的故障不可復(fù)現(xiàn)率減少82%,維修人力減少20%~40%,后勤規(guī)模減小50%,出動(dòng)架次率提高25%,保障費(fèi)用減少了50%以上。
如今,PHM 技術(shù)的發(fā)展體現(xiàn)在以系統(tǒng)級(jí)集成應(yīng)用為牽引,提高故障診斷與預(yù)測(cè)精度、擴(kuò)展健康監(jiān)控的應(yīng)用對(duì)象范圍,支持CBM 的發(fā)展,進(jìn)而建立起以PHM 為核心的自主式綜合保障體系。
PHM 技術(shù)在國(guó)內(nèi)的研究和發(fā)展都處于起步階段,2005年北航曾聲奎論述了PHM 現(xiàn)狀,2006年國(guó)防科大木志高采用分布式結(jié)構(gòu),進(jìn)行分析決策判斷。2008年哈工大張嘉鐘綜合理論將系統(tǒng)分為狀態(tài)檢測(cè)、狀態(tài)預(yù)報(bào)、故障診斷、故障評(píng)估及故障處理五類處理機(jī)制??哲姽こ檀髮W(xué)張亮提出了異常檢測(cè)、故障診斷推理機(jī)和故障預(yù)測(cè)三種推理機(jī)概念模型。2010年以來,PHM 研發(fā)及學(xué)術(shù)交流活動(dòng)非?;钴S,有效推進(jìn)了PHM 在國(guó)內(nèi)的發(fā)展。整體來說,PHM 在國(guó)內(nèi)仍需做大量深入的基礎(chǔ)技術(shù)研究、工程設(shè)計(jì)開發(fā)以及驗(yàn)證工作。
航天測(cè)控系統(tǒng)健康管理體系的建立首先需要開展健康管理系統(tǒng)的頂層設(shè)計(jì),建立健康管理體系架構(gòu);然后由系統(tǒng)的最小可更換單元開始,從部件、分機(jī)、子系統(tǒng)、分系統(tǒng)等分層次設(shè)置監(jiān)測(cè)點(diǎn),通過傳感器實(shí)現(xiàn)系統(tǒng)健康狀態(tài)監(jiān)測(cè),并將評(píng)估預(yù)測(cè)結(jié)果反饋給測(cè)控系統(tǒng),輔助測(cè)控系統(tǒng)更好地完成任務(wù)。
健康管理系統(tǒng)主要由兩個(gè)數(shù)據(jù)庫和六個(gè)功能模塊構(gòu)成。兩個(gè)數(shù)據(jù)庫包括信息數(shù)據(jù)庫和知識(shí)數(shù)據(jù)庫,功能模塊包括數(shù)據(jù)采集與預(yù)處理、狀態(tài)監(jiān)測(cè)、故障診斷、狀態(tài)評(píng)估、預(yù)測(cè)分析及裝備維護(hù)六類,具體構(gòu)成如圖1所示。健康管理系統(tǒng)各功能模塊相對(duì)獨(dú)立,實(shí)現(xiàn)從狀態(tài)檢測(cè)、特征提取、故障診斷、綜合評(píng)估、趨勢(shì)預(yù)測(cè)以及維修決策的全過程管理,具備測(cè)站終端系統(tǒng)級(jí)自主設(shè)備健康管理能力,建立良好的人機(jī)交互與輔助決策機(jī)制,作為測(cè)站設(shè)備裝備維護(hù)與使用的主要設(shè)備管理平臺(tái)。系統(tǒng)整體架構(gòu)如圖1所示。
圖1 健康管理架構(gòu)示意圖
健康管理系統(tǒng)硬件主要由信號(hào)采集單元和數(shù)據(jù)處理單元組成。信號(hào)采集單元將各類型傳感器通過串口和高、低速采集終端完成部分狀態(tài)數(shù)據(jù)和環(huán)境數(shù)據(jù)的采集,并通過光纜發(fā)送至數(shù)據(jù)處理單元;數(shù)據(jù)處理單元接收信號(hào)采集單元發(fā)送的采集數(shù)據(jù),完成數(shù)據(jù)的存儲(chǔ)和轉(zhuǎn)發(fā),實(shí)現(xiàn)數(shù)據(jù)本地處理或發(fā)送至中心進(jìn)行處理兩種運(yùn)行模式。
軟件采用C/S 架構(gòu),由客戶端軟件和服務(wù)器軟件組成??蛻舳塑浖δ芗梢惑w化設(shè)計(jì),完成實(shí)時(shí)狀態(tài)監(jiān)測(cè)、故障診斷、綜合狀態(tài)評(píng)估、趨勢(shì)預(yù)測(cè)分析以及輔助裝備維修的任務(wù);服務(wù)器軟件完成數(shù)據(jù)庫管理、裝備全壽命周期管理以及數(shù)據(jù)挖掘分析的任務(wù)。
一般來說,測(cè)控系統(tǒng)從功能上劃分為天伺饋、發(fā)射、接收、基帶、記錄、監(jiān)控等多個(gè)分系統(tǒng)。PHM 系統(tǒng)作為測(cè)控系統(tǒng)的一個(gè)獨(dú)立分系統(tǒng)存在,統(tǒng)一納入系統(tǒng)監(jiān)控體系,通過監(jiān)控網(wǎng)實(shí)現(xiàn)對(duì)監(jiān)控與測(cè)試環(huán)境搭建,完成狀態(tài)數(shù)據(jù)與自檢數(shù)據(jù)采集任務(wù);通過數(shù)據(jù)網(wǎng)完成業(yè)務(wù)數(shù)據(jù)采集與測(cè)控計(jì)劃接收任務(wù);通過中心網(wǎng)借助遠(yuǎn)程會(huì)商平臺(tái)實(shí)現(xiàn)中心診斷及遠(yuǎn)程支援,流程圖如圖2所示。
圖2 測(cè)控系統(tǒng)健康管理流程圖
信息數(shù)據(jù)庫將各測(cè)控站診斷信息源分別建庫獨(dú)立存儲(chǔ),存儲(chǔ)兩類信息:診斷信息源,主要包括監(jiān)控命令、狀態(tài)信息、日志、標(biāo)校測(cè)試結(jié)果、測(cè)控?cái)?shù)據(jù)等狀態(tài)數(shù)據(jù);用戶信息、計(jì)劃信息、歷史診斷報(bào)告、健康檔案、維修方案等裝備信息。
知識(shí)數(shù)據(jù)庫主要進(jìn)行知識(shí)庫的運(yùn)行管理,具有以下幾點(diǎn)功能:
(1)具備對(duì)故障診斷知識(shí)的獲取能力。首先根據(jù)信號(hào)判斷系統(tǒng)是否故障,然后通過對(duì)系統(tǒng)功能的分析確定故障可能發(fā)生位置,逐層分解,最終確定故障源,獲取故障信息。
(2)具備對(duì)業(yè)務(wù)知識(shí)和故障診斷知識(shí)進(jìn)行管理的能力,確保知識(shí)的完備性和一致性。
(3)具備可復(fù)用性和可擴(kuò)展性。知識(shí)庫的建立是一個(gè)長(zhǎng)期積累的過程,應(yīng)具備可復(fù)用性和可擴(kuò)展性。在系統(tǒng)測(cè)試的過程中會(huì)不斷發(fā)現(xiàn)新的故障模式,一旦新故障模式被識(shí)別出來,即將有關(guān)的故障知識(shí)通過故障樹繪制的方式,添加到故障診斷知識(shí)庫中。
(4)具備對(duì)故障診斷知識(shí)的有效性檢測(cè)的能力,實(shí)現(xiàn)故障檢測(cè)知識(shí)庫中系統(tǒng)淺層知識(shí)的識(shí)別。淺層知識(shí)的表示方法是產(chǎn)生式規(guī)則,通過線性法、特征量閾值法等建立,主要用來檢測(cè)被測(cè)組、部件、子系統(tǒng)、分系統(tǒng)、系統(tǒng)故障和有效驗(yàn)證。
健康管理系統(tǒng)采用松耦合形式,各個(gè)功能模塊相對(duì)獨(dú)立,具體模塊的功能設(shè)計(jì)為:
(1)數(shù)據(jù)采集與預(yù)處理功能:利用各種傳感器采集系統(tǒng)的相關(guān)參數(shù)信息,通過時(shí)間同步等算法進(jìn)行數(shù)據(jù)歸一化預(yù)處理,同時(shí)消除異常數(shù)據(jù),將數(shù)據(jù)處理成監(jiān)測(cè)和評(píng)估要求的格式。
(2)狀態(tài)監(jiān)測(cè)功能:狀態(tài)監(jiān)測(cè)模塊主要是指實(shí)時(shí)監(jiān)測(cè)設(shè)備關(guān)鍵部件的主要參數(shù),完成異常值定位申報(bào)并主動(dòng)推送,改變以往被動(dòng)的工作模式,減輕系統(tǒng)巡檢的工作量。
(3)狀態(tài)評(píng)估功能:狀態(tài)評(píng)估模塊接收來自不同監(jiān)測(cè)模塊以及其他健康評(píng)估模塊的數(shù)據(jù),實(shí)現(xiàn)對(duì)系統(tǒng)的全范圍覆蓋,包括對(duì)關(guān)鍵部件、分系統(tǒng)、系統(tǒng)的狀態(tài)評(píng)估。
(4)故障診斷功能:故障診斷模塊接收來自狀態(tài)監(jiān)測(cè)功能模塊的狀態(tài)信息以及狀態(tài)評(píng)估結(jié)果,分析設(shè)備狀態(tài)信息,完成故障診斷記錄并確定故障發(fā)生的可能性、對(duì)故障特征進(jìn)行跟蹤與對(duì)比,進(jìn)一步檢測(cè)故障和隔離以及設(shè)備健康狀態(tài)報(bào)警。
(5)預(yù)測(cè)分析功能:利用相關(guān)智能預(yù)測(cè)模型對(duì)設(shè)備的剩余使用壽命進(jìn)行預(yù)測(cè),結(jié)合設(shè)備運(yùn)行機(jī)理和決策樹對(duì)可能發(fā)生的故障進(jìn)行預(yù)測(cè),為維修決策提供依據(jù)。
(6)裝備維護(hù)功能:綜合健康結(jié)果和裝備維修需求,整合維修資源,制定維護(hù)保養(yǎng)計(jì)劃,并向用戶提供裝備維護(hù)指導(dǎo)支持服務(wù)。
健康管理根據(jù)多源數(shù)據(jù)進(jìn)行融合,進(jìn)而分析出故障模式,對(duì)系統(tǒng)進(jìn)行狀態(tài)評(píng)估及預(yù)測(cè),達(dá)到智能決策的目的,其關(guān)鍵技術(shù)主要包括數(shù)據(jù)采集、數(shù)據(jù)融合、圖形化處理、故障模式、健康評(píng)估與故障預(yù)測(cè)及智能推理與決策支持等方面,關(guān)鍵技術(shù)架構(gòu)如圖3所示。
圖3 健康管理關(guān)鍵技術(shù)架構(gòu)
構(gòu)建健康管理系統(tǒng)的數(shù)據(jù)基礎(chǔ)是利用傳感器(震動(dòng)傳感器、溫度傳感器等)采集數(shù)據(jù)。傳感器可以將收集到的各種信息轉(zhuǎn)換成電信號(hào)或其他形式,然后就可以對(duì)和設(shè)備相關(guān)的信息進(jìn)行進(jìn)一步的整理和處理?,F(xiàn)代化傳感器技術(shù)融合微電子、計(jì)算機(jī)和自動(dòng)測(cè)試(ATE)等技術(shù),具有接收信息、數(shù)據(jù)傳輸、發(fā)送信息、信息儲(chǔ)存以及數(shù)據(jù)處理的能力,實(shí)現(xiàn)傳感器的集成化、智能化和網(wǎng)絡(luò)化。
健康管理系統(tǒng)建立遍歷全系統(tǒng)的監(jiān)測(cè)點(diǎn),獲取海量監(jiān)測(cè)數(shù)據(jù),需要利用數(shù)據(jù)融合技術(shù)在海量數(shù)據(jù)中剔除冗余數(shù)據(jù),提取有效信息。數(shù)據(jù)融合技術(shù)在健康管理中的應(yīng)用是數(shù)據(jù)分析的一個(gè)重要開端,直接影響后續(xù)工作量和健康管理的效率。如何快速有效地在海量原始數(shù)據(jù)中提取有用信息、發(fā)現(xiàn)數(shù)據(jù)模式、識(shí)別異常和找出隱含的關(guān)系是健康管理的重要基礎(chǔ)。
數(shù)據(jù)圖形化技術(shù)是指把大量的數(shù)據(jù)通過基本的圖表、圖形或者3D 模型等顯示出來。通過后臺(tái)進(jìn)行的數(shù)據(jù)處理和分析,圖形化顯示可以將數(shù)據(jù)所顯示的故障模式、裝備的狀態(tài)變化趨勢(shì)等信息直觀、形象地顯示給操作人員。通過圖形化展示給操作人員以簡(jiǎn)單、明確指示、內(nèi)含豐富且易掌握的方式來顯示裝備健康信息。
故障模式及影響主要研究故障發(fā)生和發(fā)展的規(guī)律,主要包括兩方面:故障發(fā)生的機(jī)理和故障發(fā)生的統(tǒng)計(jì)規(guī)律。故障發(fā)生的機(jī)理主要研究設(shè)備或者部件隨著物理、化學(xué)等內(nèi)在或外在環(huán)境條件的變化發(fā)生的功能或性能上的變化,導(dǎo)致設(shè)備或部件不能正常工作的規(guī)律。故障發(fā)生的統(tǒng)計(jì)規(guī)律主要研究故障發(fā)生與設(shè)備狀態(tài)之間的變化關(guān)系,研究故障發(fā)展規(guī)律。
測(cè)控設(shè)備故障模式、影響及危害性(FMECA)研究主要包括:以FMECA 分析為基礎(chǔ),研究典型的故障模式、故障演化與分布規(guī)律、故障機(jī)理,建立故障演化動(dòng)態(tài)模型。
構(gòu)建測(cè)控設(shè)備健康狀態(tài)評(píng)估指標(biāo)體系、研究預(yù)測(cè)方法以及評(píng)估和故障預(yù)測(cè)模型,制定評(píng)定設(shè)備健康等級(jí)的指標(biāo)等是健康評(píng)估與故障預(yù)測(cè)的重要研究?jī)?nèi)容。
設(shè)備健康狀態(tài)用設(shè)備健康指數(shù)HI 來表示,基于設(shè)備功能性能指標(biāo)和安全要求得出,能夠定量的反映設(shè)備當(dāng)前的健康狀態(tài)水平,并根據(jù)使用中反饋的數(shù)據(jù)對(duì)評(píng)估模型加以修正。
故障預(yù)測(cè)是綜合利用監(jiān)測(cè)數(shù)據(jù)、環(huán)境數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù)以及歷史數(shù)據(jù)等,借助智能推理技術(shù)評(píng)估部件或者系統(tǒng)的剩余使用壽命,預(yù)測(cè)出設(shè)備的未來健康狀態(tài)。目前,故障預(yù)測(cè)方法主要有:基于物理模型的故障預(yù)測(cè)技術(shù)、基于數(shù)據(jù)驅(qū)動(dòng)的故障預(yù)測(cè)技術(shù)和基于知識(shí)經(jīng)驗(yàn)統(tǒng)計(jì)可靠性的故障預(yù)測(cè)技術(shù)。
主要對(duì)設(shè)備智能推理算法和維修決策支持推理算法進(jìn)行研究。設(shè)備智能推理決策結(jié)合故障狀態(tài)評(píng)估狀況和健康診斷報(bào)告,提前向用戶推送合理的維修建議,建議內(nèi)容包括檢查更換關(guān)鍵部件、設(shè)備降壓運(yùn)行、購置備品備件以及維修資源分配等。
PHM 技術(shù)的發(fā)展是裝備智能化管理的一個(gè)重要基礎(chǔ),可以保證裝備維修活動(dòng)低成本、高效率、自動(dòng)化、智能化的進(jìn)行,開展基于測(cè)控系統(tǒng)的故障預(yù)測(cè)與健康管理技術(shù)的深入研究和推廣有助于加強(qiáng)軍用裝備質(zhì)量管理模式的體系化、信息化發(fā)展,有助于提升測(cè)控裝備試驗(yàn)保障能力。