楊海峰, 肖雪迪, 俞 進(jìn)
(北京空間飛行器總體設(shè)計部, 北京 100094)
2022 年4 月16 日9 時56 分,隨著神舟十三號返回艙在東風(fēng)著陸場安全降落,標(biāo)志著中國空間站關(guān)鍵技術(shù)驗證階段第二次載人交會對接任務(wù)獲得圓滿成功。 神舟十三號在軌運行180 d,創(chuàng)造了神舟飛船載人飛行任務(wù)時長新紀(jì)錄。 隨著中國進(jìn)入空間站任務(wù)時代,神舟飛船發(fā)射頻率將顯著提高,天地往返運輸任務(wù)將成為常態(tài)。
神舟十一號及以前在軌飛行任務(wù)時間均不超過30 d,飛行時間較短。 為確保航天員安全,隨時應(yīng)對應(yīng)急情況,飛控任務(wù)以地面人工監(jiān)控為主,對飛船狀態(tài)的故障診斷均通過人工完成。 在載人航天工程二期發(fā)射任務(wù)間隔時間長、在軌飛行時間短的背景下是可行的。 隨著空間站任務(wù)階段一年發(fā)射2 艘載人飛船、單次任務(wù)持續(xù)180 d 成為常態(tài),完全依靠人工判斷和故障診斷顯然不可行,必須借助于自動化手段。
航天器故障診斷方法可以分為3 大類:基于規(guī)則、基于數(shù)據(jù)驅(qū)動和基于模型[1-4]。 NASA 已經(jīng)開發(fā)出一些較為成熟的故障診斷工具, 如TEAMS-RT、Livingstone 等[5]。 基于規(guī)則的故障診斷方法通過對專家的經(jīng)驗總結(jié),描述故障現(xiàn)象,方法簡單直觀,易于開發(fā)實現(xiàn);基于數(shù)據(jù)驅(qū)動的故障診斷方法通過歷史數(shù)據(jù)或仿真學(xué)習(xí),總結(jié)規(guī)律并診斷故障,分為基于統(tǒng)計分析的方法、基于信號處理的方法和基于人工智能的方法;基于模型的故障診斷方法通過建立計算模型進(jìn)行故障診斷,包括定性模型、定量模型和解析模型。其中,基于數(shù)據(jù)驅(qū)動的方法需要開發(fā)具有自主學(xué)習(xí)能力的復(fù)雜故障診斷軟件,基于模型的方法需要建立整船復(fù)雜的數(shù)學(xué)模型,這2 種方法對神舟飛船來說均難以實現(xiàn),且設(shè)計師難以確定診斷結(jié)果的正確性,短時間內(nèi)無法在關(guān)乎航天員生命安全的系統(tǒng)上實現(xiàn)。
本文針對空間站任務(wù)階段神舟飛船在軌長期飛行任務(wù)特點,開展組合體停靠段故障診斷需求分析、數(shù)據(jù)包絡(luò)分析、規(guī)則設(shè)置分析,提出了基于規(guī)則的故障診斷方案,并在神舟十三號飛控任務(wù)中首次成功應(yīng)用。
空間站任務(wù)神舟飛船的飛控任務(wù)階段主要包括:發(fā)射段、交會對接段、組合體停靠段、撤離及返回準(zhǔn)備段、返回再入段和回收著陸段。 其中發(fā)射及交會對接段、組合體分離后的返回段分別采用了快速交會對接、快速返回技術(shù),均能夠在7 h 以內(nèi)完成交會對接和返回,典型任務(wù)剖面見圖1。這2 個任務(wù)段關(guān)鍵事件密集、模式轉(zhuǎn)換快、持續(xù)時間短,需要專業(yè)的飛控技術(shù)人員24 h 在崗,適合人工判讀及故障診斷。 而在組合體??慷?,神舟飛船具有以下特點:
圖1 空間站任務(wù)階段神舟飛船任務(wù)剖面示意圖Fig.1 The mission profile of Shenzhou spacecraft in the space station mission
1)飛船已有14 次在軌完整飛行試驗經(jīng)歷,而組合體??咳蝿?wù)則經(jīng)過了神舟八號至神舟十二號共計5 次飛行驗證,有一定的試驗數(shù)據(jù)積累。
2)飛船大部分設(shè)備處于斷電貯存模式,與衛(wèi)星型號長期獨立工作狀態(tài)明顯不同。 如儀表、對接機(jī)構(gòu)、推進(jìn)、GNC、測控等處于完全或大部分?jǐn)嚯娰A存狀態(tài),平臺設(shè)備狀態(tài)及工作模式相對穩(wěn)定。
3)飛船組批生產(chǎn)模式下技術(shù)狀態(tài)相對穩(wěn)定,一年2 次發(fā)射任務(wù),在軌飛行試驗的數(shù)據(jù)一致性較好,便于試驗數(shù)據(jù)的持續(xù)積累和比對。
4)空間站飛行姿態(tài)及構(gòu)型有變化,會對飛船能源、外熱流產(chǎn)生影響,表現(xiàn)在飛船平臺設(shè)備熱控參數(shù)波動劇烈、供配電模式變化。 大系統(tǒng)接口及影響也比較明確。
基于以上任務(wù)特點分析,采用基于規(guī)則的故障診斷方法比較適合神舟飛船組合體??慷物w控任務(wù),相對簡單且短時間內(nèi)容易實現(xiàn)。 而數(shù)據(jù)驅(qū)動、基于模型等故障診斷方法等對智能化、建模水平等要求很高[6-8],更適用于起點高的新一代航天器[9-10]。
神舟飛船組合體??慷沃饕蝿?wù)為等待停靠任務(wù)、正常結(jié)束實施返回任務(wù)、出現(xiàn)組合體失火失壓等緊急重大故障時,隨時待命應(yīng)急撤離。
停靠期間航天員主要在空間站艙段工作和生活,載人飛船一般故障均不會影響組合體安全及駐留任務(wù)。 此外設(shè)計了應(yīng)急救援飛船方案,最壞情況下,停靠的載人飛船發(fā)生故障不能實施返回任務(wù)時,還可以發(fā)射應(yīng)急救援飛船,以確保航天員安全返回。 因此故障診斷原則如下:
1)將直接影響空間站組合體安全的故障模式相關(guān)參數(shù)作為核心參數(shù),加嚴(yán)判讀,包括推進(jìn)劑、并網(wǎng)供電電流等。
2)將直接影響飛船平臺及返回安全的故障模式相關(guān)參數(shù)作為核心或重要參數(shù),視故障緊急情況加嚴(yán)判讀,包括消耗性資源、母線電壓和電流、充放電電流、放電深度等。
3)其他不影響組合體及飛船平臺安全的參數(shù)作為一般參數(shù)進(jìn)行監(jiān)視。
根據(jù)以上故障診斷原則,設(shè)計神舟飛船故障診斷方案流程,見圖2。
圖2 神舟飛船故障診斷方案設(shè)計流程Fig.2 Design process of the fault diagnosis scheme for Shenzhou spacecraft
數(shù)據(jù)包絡(luò)分析的目的是識別所有平臺設(shè)備在特定任務(wù)階段、特定工作模式及特定外部環(huán)境條件下的參數(shù)邊界或狀態(tài),是基于規(guī)則的故障診斷方法的重要工作內(nèi)容,直接決定著故障診斷的準(zhǔn)確性,本文特指神舟飛船組合體停靠階段關(guān)鍵參數(shù)的數(shù)據(jù)包絡(luò)分析。
包絡(luò)分析的輸入包括歷史所有相同技術(shù)狀態(tài)型號的地面測試數(shù)據(jù)、地面試驗數(shù)據(jù)、地面仿真數(shù)據(jù)及在軌飛行試驗數(shù)據(jù)等。 分析時,力求數(shù)據(jù)歸一化。 按照是否滿足技術(shù)指標(biāo)要求、是否在成功包絡(luò)范圍內(nèi)分為4 類:合格/包絡(luò)、合格/不包絡(luò)、超差/包絡(luò)、超差/不包絡(luò)。對于超差/包絡(luò)、超差/不包絡(luò)情況,需復(fù)核是否為偶發(fā)狀態(tài),是否影響任務(wù)實施,根據(jù)復(fù)核結(jié)果決定是否引入或剔除包絡(luò)。
神舟飛船組合體??慷侮P(guān)鍵參數(shù)按照設(shè)置規(guī)則包括門限類參數(shù)、狀態(tài)字參數(shù)及常值區(qū)間參數(shù)。
1)門限類參數(shù)。 門限類參數(shù)是神舟飛船中最普遍的參數(shù),主要包括:溫度、濕度、總壓、氧分壓、壓強(qiáng)、轉(zhuǎn)速、電壓、電流、放電深度等。 這類參數(shù)的診斷規(guī)則為一個數(shù)值區(qū)間,其中表征電子產(chǎn)品狀態(tài)的電壓和電流參數(shù)、表征載人環(huán)境相關(guān)的總壓、氧分壓等參數(shù)與空間站組合體構(gòu)型、飛行姿態(tài)等無關(guān),均可通過數(shù)據(jù)包絡(luò)分析、技術(shù)指標(biāo)分析等制定相對準(zhǔn)確的門限;而溫度、加熱功耗等參數(shù)與空間站組合體構(gòu)型、飛行姿態(tài)引起的外熱流變化直接相關(guān),且難以通過測試手段獲取,只能通過熱仿真、熱試驗等作為先驗數(shù)據(jù),再考慮仿真和試驗偏差,作為門限制定的輸入,后續(xù)通過在軌驗證再進(jìn)行迭代完善。
對于同一??咳蝿?wù)段,因工況或工作模式發(fā)生變化導(dǎo)致門限變化,還需進(jìn)行關(guān)聯(lián)判斷,提高故障診斷的準(zhǔn)確度,避免漏判或誤判。 以載人飛船帆板全遮擋并網(wǎng)供電工況為例,并網(wǎng)供電工況下電池不放電,整船峰值功耗不高于1500 W,密封艙設(shè)備溫度水平相對非并網(wǎng)供電工況都會降低,需要針對并網(wǎng)工況和非并網(wǎng)工況單獨設(shè)置判斷門限,見表1。
表1 神舟飛船典型關(guān)聯(lián)參數(shù)門限規(guī)則示例Table 1 Example of the threshold rules for typical associated parameters of Shenzhou spacecraft
消耗性資源相關(guān)參數(shù)是典型的門限類參數(shù),飛船轉(zhuǎn)??慷魏笳G闆r下所有資源均不消耗,相關(guān)參數(shù)應(yīng)為恒定值。 如推進(jìn)劑、應(yīng)急電池容量、氧氣瓶壓力、空氣瓶壓力等,考慮溫度波動等引起的偏差后,應(yīng)加嚴(yán)判讀,每次轉(zhuǎn)組合體停靠任務(wù)后根據(jù)剩余量重新設(shè)置。
2)狀態(tài)字參數(shù)。 如果說門限類參數(shù)規(guī)則是做區(qū)間判斷題,狀態(tài)字類參數(shù)則類似做狀態(tài)判斷題或選擇題,主要是對軟件的控制或工作模式進(jìn)行診斷,判斷軟件是否進(jìn)入了非預(yù)期的工作模式或發(fā)生了異常復(fù)位等,診斷規(guī)則實現(xiàn)起來相對簡單,見表2。 根據(jù)設(shè)備工作特點,狀態(tài)字參數(shù)也可以設(shè)置關(guān)聯(lián)判據(jù)。
表2 神舟飛船狀態(tài)字參數(shù)診斷規(guī)則示例Table 2 Example of the diagnosis rules for the status parameters of Shenzhou spacecraft
3)常值區(qū)間參數(shù)。 常值區(qū)間類診斷主要是用于判斷連續(xù)計數(shù)類參數(shù)表征的軟件是否發(fā)生了死機(jī)、機(jī)構(gòu)是否發(fā)生了卡滯等故障模式。 根據(jù)設(shè)備工作特點,常值區(qū)間參數(shù)也可設(shè)置關(guān)聯(lián)判據(jù)。典型的常值區(qū)間參數(shù)診斷規(guī)則見表3。
表3 神舟飛船常值區(qū)間參數(shù)診斷規(guī)則示例Table 3 Example of the diagnosis rules for the constant interval parameters of Shenzhou spacecraft
神舟飛船按照以上故障診斷方案,依次完成了故障診斷需求分析、??慷卧O(shè)備工作模式分析、停靠段參數(shù)包絡(luò)分析及診斷規(guī)則設(shè)置等工作,識別參數(shù)2400 個,其中核心參數(shù)為125 個,重要參數(shù)為700 個,一般參數(shù)為1575 個。 在所有準(zhǔn)備工作就緒后,經(jīng)過確認(rèn)、評審,將所有參數(shù)錄入診斷系統(tǒng)并在神舟飛船任務(wù)中試運行一周,試運行結(jié)束后,轉(zhuǎn)為正式執(zhí)行任務(wù)。
為了能夠及時處置報警信息,提升應(yīng)急處置能力水平,確保航天員乘組及空間站組合體安全,地面制定了應(yīng)急處置流程,并通過管理規(guī)范的形式明確各級責(zé)任,見圖3。
圖3 神舟飛船應(yīng)急響應(yīng)流程Fig.3 The emergency response process of Shenzhou spacecraft
從正式運行到神舟飛船返回任務(wù),故障診斷系統(tǒng)值班約6 個月,發(fā)生報警信息26 項,經(jīng)確認(rèn)均為虛警,對相關(guān)參數(shù)的診斷規(guī)則進(jìn)行了完善。從報警參數(shù)類型看,占比最高的為并網(wǎng)供電相關(guān)參數(shù)、管路壓強(qiáng)和溫度參數(shù),總數(shù)占比86%。 主要由并網(wǎng)供電關(guān)聯(lián)參數(shù)的復(fù)雜性、溫度參數(shù)的不確定性導(dǎo)致難以準(zhǔn)確設(shè)置判讀門限引起,與預(yù)期一致。 見表4。
表4 報警信息按照參數(shù)統(tǒng)計Table 4 The alarm information counted according to the parameters
從報警信息發(fā)生的時間分布上看,運行前2個月最多,占比86%,2 個月后報警信息明顯減少并趨于穩(wěn)定,見表5。 主要由于飛行2 個月后,神舟飛船徑向停靠的并網(wǎng)供電模式基本固化成熟,外熱流邊界、工作模式等基本覆蓋,參數(shù)完善后的故障診斷規(guī)則的設(shè)置更加合理,與預(yù)期一致。
表5 報警信息按照發(fā)生時間統(tǒng)計Table 5 The alarm information counted according to the occurrence time
為驗證故障診斷方案的正確性,在神舟飛船定期巡檢期間(相對于??磕J?,設(shè)備工作模式、開關(guān)機(jī)狀態(tài)等發(fā)生變化,相當(dāng)于模擬了真實故障),利用故障診斷系統(tǒng)對巡檢模式下靠的報警信息進(jìn)行了一一對比分析,報警信息準(zhǔn)確率100%,巡檢結(jié)束后,報警信息恢復(fù)為0。 以上驗證了神舟飛船基于長期??磕J焦收显\斷方案設(shè)計的正確性。
神舟飛船推進(jìn)相關(guān)設(shè)備在停靠段不工作,出于安全考慮,推進(jìn)的氣、液管路閥門均處于關(guān)閉截止?fàn)顟B(tài),防止管路泄漏或發(fā)動機(jī)異常工作。 其中推進(jìn)劑密閉管路受外熱流影響會造成壓力持續(xù)波動,當(dāng)預(yù)計超過2.8 MPa 安全上限時就需要地面發(fā)送指令,打開上游的閥門進(jìn)行管路維護(hù)。
對神舟飛船診斷系統(tǒng)6 個月運行結(jié)果進(jìn)行分析發(fā)現(xiàn),推進(jìn)的管路壓力參數(shù)超限后均能準(zhǔn)確報警,報警次數(shù)比較頻繁且對地面技術(shù)人員處置時效性要求非常高。 從出現(xiàn)報警信息到組織地面人員上行指令往往需要0.5 ~1 h,有時發(fā)送指令時發(fā)現(xiàn)已經(jīng)出測控區(qū),極端情況下會出現(xiàn)約4.5 h不在測控區(qū)情況,不具備處置條件,導(dǎo)致管路壓力有超上限的風(fēng)險。
經(jīng)過綜合分析,對神舟飛船數(shù)據(jù)管理軟件提出了技術(shù)狀態(tài)更改建議:后續(xù)??科陂g,推進(jìn)管路壓力由數(shù)管軟件自動判斷,超過2.8 MPa 時,數(shù)管軟件自動發(fā)送程控指令,打開相關(guān)閥門進(jìn)行管路維護(hù);維護(hù)后5 min 自動關(guān)閉管路閥門,實現(xiàn)船上自主健康管理,徹底解決地面應(yīng)急處置時效性不高的問題,可有效降級故障處置風(fēng)險,提高整船的安全性水平。
1)設(shè)計了神舟飛船在組合體??慷蔚墓收显\斷方案,并在神舟十三號任務(wù)中首次成功應(yīng)用,實現(xiàn)了神舟飛船飛控任務(wù)從人工監(jiān)視到地面自動故障診斷的歷史性跨越,極大地提高了故障診斷效率,解放了人力資源,為其他載人航天器故障診斷提供了參考;
2)采用基于規(guī)則的故障診斷方法更適合神舟飛船這種??慷螤顟B(tài)固定、有較多歷史數(shù)據(jù)、任務(wù)重復(fù)性好的航天器,但是故障處置依賴于地面技術(shù)人員,需要制定明確的應(yīng)急故障處置規(guī)范,確??蓪嵤?;
3)長期來看,針對成熟航天器的緊急重大故障,在不顯著增加研制成本和技術(shù)難度的情況下,適當(dāng)增加船/器上自主健康管理功能,可有效降低對地面處置的依賴程度,提升載人航天器安全性水平。