何 驍,譚述君,2,吳志剛,張立勇,劉玉璽
(1.大連理工大學(xué)工業(yè)裝備結(jié)構(gòu)分析國家重點實驗室,大連 116024; 2.大連理工大學(xué)遼寧省空天飛行器前沿技術(shù)重點實驗室,大連 116024;3. 大連理工大學(xué)電子與信息工程學(xué)院,大連 116024; 4.上海宇航系統(tǒng)工程研究所,上海 201109)
根據(jù)1980年至2004年世界航天器發(fā)射故障統(tǒng)計,推進(jìn)系統(tǒng)故障占絕大多數(shù)。其中,美國31次發(fā)射失敗中有16次是由推進(jìn)系統(tǒng)故障引起的,俄羅斯65次發(fā)射失敗中有37次是由推進(jìn)系統(tǒng)故障引起的。近年來,推進(jìn)系統(tǒng)故障中推力下降故障依舊不斷,如2017年LM-5/Y2發(fā)射、2012年Delta 4發(fā)射和2012年SpaceX Falcon 9發(fā)射。當(dāng)發(fā)動機(jī)發(fā)生推力下降故障時,跟蹤地面設(shè)計的標(biāo)稱彈道是不可行的。我國的運(yùn)載火箭的動力系統(tǒng)余量較小,推力下降故障會導(dǎo)致到目標(biāo)軌道無法到達(dá)。為了解決運(yùn)載火箭因推力下降故障而墜毀的問題,需要研究一種在線任務(wù)重構(gòu)方法,或叫飛行任務(wù)降級方法,來求解最優(yōu)救援軌道對應(yīng)的飛行軌跡(最優(yōu)軌跡)。
一般來說,求解航天器軌跡優(yōu)化問題的主流方法是數(shù)值法,可分為直接法、間接法。由于直接法求解效率高,在航天器軌跡優(yōu)化問題中得到了更多的應(yīng)用。因此有學(xué)者用直接法來研究火箭推力故障下的軌跡規(guī)劃問題。文獻(xiàn)[10]提出了一種狀態(tài)觸發(fā)指標(biāo)法(State-triggered indices, STI),解決了運(yùn)載火箭推力下降時目標(biāo)軌道和飛行軌跡的在線聯(lián)合優(yōu)化問題。在文獻(xiàn)[11]中,利用凸優(yōu)化方法,將原來的非凸優(yōu)化問題轉(zhuǎn)化為一種凸問題在線優(yōu)化。文獻(xiàn)[12]設(shè)計決策等級以確定任務(wù)目標(biāo),結(jié)合目標(biāo)軌道根數(shù)的約束情況,采用自適應(yīng)偽譜法規(guī)劃出滿足要求的飛行彈道。然而,在線用直接法求解任務(wù)重構(gòu)問題存在在線求解計算消耗大的問題。計算消耗大主要體現(xiàn)在:1)在線計算需依次求解多個優(yōu)化問題,能量高的軌道的最優(yōu)軌跡求解依賴于能量低的軌道;2)軌跡優(yōu)化問題的初值與最優(yōu)解的偏差較大,迭代計算收斂慢。
近年來,隨著機(jī)器學(xué)習(xí)技術(shù)的發(fā)展,將機(jī)器學(xué)習(xí)技術(shù)與傳統(tǒng)的航天器研究方法結(jié)合是一大研究趨勢。其中機(jī)器學(xué)習(xí)技術(shù)中的監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí)在改進(jìn)軌跡規(guī)劃算法方面很有潛力。文獻(xiàn)[17]提出了一種通過強(qiáng)化學(xué)習(xí)訓(xùn)練導(dǎo)彈制導(dǎo)律的新方法,與比例制導(dǎo)律相比,該制導(dǎo)律對控制器模型具有更好的魯棒性。然而,由于需要與環(huán)境交互,強(qiáng)化學(xué)習(xí)的計算負(fù)擔(dān)往往會影響在線應(yīng)用的可行性。利用監(jiān)督學(xué)習(xí)技術(shù),在預(yù)先產(chǎn)生的數(shù)據(jù)集上訓(xùn)練神經(jīng)網(wǎng)絡(luò),生成軌跡或?qū)б墒且粋€可在線應(yīng)用的方案。文獻(xiàn)[19]提出了一種基于神經(jīng)網(wǎng)絡(luò)的非線性混合算法,在降低復(fù)雜度和成本的前提下為控制、制導(dǎo)系統(tǒng)提供反饋。文獻(xiàn)[20-21]提出了基于徑向基神經(jīng)網(wǎng)絡(luò)救援軌道決策的軌跡重規(guī)劃方法,該方法可快速預(yù)測出救援軌道。徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)(Radial basis function neural network, RBFNN)是一種監(jiān)督學(xué)習(xí)方法,在函數(shù)逼近中具有良好的非線性映射能力。與標(biāo)準(zhǔn)前向反饋傳播的BP網(wǎng)絡(luò)相比,RBFNN具有學(xué)習(xí)速度快、陷入局部極小點可能性小等優(yōu)點。
針對在線計算輕量化的任務(wù)重構(gòu)問題,本文提出一種基于徑向基神經(jīng)網(wǎng)絡(luò)軌跡決策的在線任務(wù)重構(gòu)方法。與傳統(tǒng)的航天器軌跡優(yōu)化方法不同,提出的方法在線應(yīng)用時,不需要基于動力學(xué)模型迭代求解,只需將離線訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)遷移到在線應(yīng)用,即可快速決策最優(yōu)救援軌道對應(yīng)飛行軌跡的近似解。
以兩級運(yùn)載火箭為研究對象,假設(shè)推力下降故障發(fā)生在二級飛行段。定義地心慣性坐標(biāo)系:原點在地心,軸在赤道平面內(nèi)指向發(fā)射時刻本初子午線方向,軸垂直赤道平面指向北極,軸滿足右手定則。在地心慣性坐標(biāo)系中建立火箭的上升段二級飛行動力學(xué)方程如下:
(1)
(2)
(3)
式中:=[,,],=[,,]為運(yùn)載火箭的位置、速度向量;為地球引力常數(shù);是火箭的總質(zhì)量;為火箭的發(fā)動機(jī)比沖;=[,,]為發(fā)動機(jī)的推力單位矢量在地心慣性坐標(biāo)系中的分量,是可控的;當(dāng)發(fā)動機(jī)發(fā)生故障,推力下降的比例是,推力大小是(1-),是發(fā)動機(jī)標(biāo)稱推力;假設(shè)發(fā)動機(jī)比沖不變,若推力下降的比例是,那么推進(jìn)劑的秒耗量下降;是海平面上的重力加速度。下文所有計算都是以式(1)~(3)作為狀態(tài)方程,包含7個狀態(tài)量=[,,]和3個控制量=[,,]。
傳統(tǒng)的運(yùn)載火箭軌跡優(yōu)化是一個最優(yōu)控制問題,優(yōu)化飛行軌跡使得運(yùn)載火箭進(jìn)入確定的目標(biāo)軌道。然而,當(dāng)推力下降故障嚴(yán)重時,運(yùn)載火箭無法進(jìn)入目標(biāo)軌道。這種情況下,為了避免運(yùn)載火箭墜入大氣層,需要解決一個沒有確定目標(biāo)軌道的飛行任務(wù)重構(gòu)問題。
在任務(wù)重構(gòu)問題中,救援軌道和飛行軌跡同時被優(yōu)化。任務(wù)重構(gòu)問題的目標(biāo)函數(shù)可表示為五個軌道要素絕對偏差的加權(quán)和,優(yōu)化問題可表示為問題0,如下所示:
(4)
在問題0的目標(biāo)函數(shù)中,由于軌道平面元素(,)和軌道形狀元素(,,)之間的矛盾,導(dǎo)致解的搜索方向發(fā)散或搜索步長減小,從而大大降低了求解效率。文獻(xiàn)[10]提出了一種狀態(tài)觸發(fā)指數(shù)(STI)策略來求解問題0,在STI策略中,從安全的角度出發(fā),保證軌道高度是優(yōu)先考慮的,只有當(dāng)剩余運(yùn)載能力大于某一閾值時,才考慮對軌道平面進(jìn)行調(diào)整。參考STI策略,本文根據(jù)救援軌道的類型將問題0轉(zhuǎn)化為兩個子問題。
在故障較嚴(yán)重但非致命的情況,為保證救援軌道的高度,優(yōu)先考慮提高軌道高度。即在故障發(fā)生時,尋找當(dāng)前時刻同一軌道平面上的最高圓軌道。在這種情況下,問題0可轉(zhuǎn)化為尋找最高圓救援軌道的最優(yōu)控制問題1,如下所示:
(5)
其中,是彈道傾角,是飛行的總時間。用兩個等效的終端約束代替=0,以減小位置、速度與軌道根數(shù)轉(zhuǎn)換函數(shù)的非線性。兩個等效終端約束的物理意義是彈道傾角等于0,重力提供向心加速度。
如果問題1的軌道高度大于目標(biāo)軌道的近地點高度,則表明可以使用一定量的推進(jìn)劑來減小軌道平面偏差。在這種情況下,在保持軌道高度的同時,調(diào)整軌道傾角和升交點赤經(jīng),問題0可轉(zhuǎn)化為尋找最優(yōu)橢圓救援軌道的優(yōu)化問題2,如下所示:
(6)
綜上所述,原任務(wù)重構(gòu)問題0轉(zhuǎn)化為問題1和問題2,如圖1所示。
圖1 任務(wù)重構(gòu)的示意圖Fig.1 Schematic of mission reconstruction
采用航天器軌跡優(yōu)化的直接法,如自適應(yīng)配點法或其改進(jìn)方法,依次求解問題1和問題2可解決任務(wù)重構(gòu)問題。然而,這種序列求解多個優(yōu)化問題的策略有在線計算消耗大的問題。計算消耗大主要體現(xiàn)在:1)問題1和問題2的入軌軌道未知,很難設(shè)置合適的初始猜測值,這導(dǎo)致問題1和問題2求解計算消耗大;2)問題2飛行軌跡求解依賴于問題1軌道的飛行軌跡,需在線依次求解多個優(yōu)化問題,這進(jìn)一步增大了在線的計算消耗。
為了解決運(yùn)載火箭推力故障下任務(wù)重構(gòu)在線計算消耗大的問題,本文引入神經(jīng)網(wǎng)絡(luò)技術(shù),采用離線學(xué)習(xí)“故障狀態(tài)-最優(yōu)軌跡”動力學(xué)關(guān)系,再遷移到在線決策最優(yōu)軌跡近似解的策略,提出了一種在線計算輕量化的任務(wù)重構(gòu)方法。整個任務(wù)重構(gòu)方法的策略如圖2所示。在離線部分,遍歷大量的故障狀態(tài),采用凸優(yōu)化與自適應(yīng)配點法離線求解軌跡優(yōu)化問題1和問題2,建立“故障狀態(tài)-最優(yōu)軌跡”數(shù)據(jù)集。以數(shù)據(jù)集為基礎(chǔ)離線訓(xùn)練徑向基神經(jīng)網(wǎng)絡(luò),建立軌跡決策模型。在線部分,將軌跡決策模型遷移到在線應(yīng)用,以實際飛行的故障狀態(tài)作為輸入,在線決策最優(yōu)軌跡。與基于動力學(xué)模型迭代求解的方法相比,本文方法避免了在線求解一個難以構(gòu)造合適初值的優(yōu)化問題。同時,本文求解策略可直接獲得最優(yōu)軌跡的近似解,避免了一系列子問題的求解過程。
圖2 在線任務(wù)重構(gòu)策略Fig.2 Online mission reconstruction strategy
神經(jīng)網(wǎng)絡(luò)是通過訓(xùn)練來學(xué)習(xí)數(shù)據(jù)集中的知識與規(guī)律,數(shù)據(jù)集中軌跡的正確性必須要保證。為了獲得最優(yōu)的救援軌道與飛行軌跡,凸優(yōu)化與自適應(yīng)配點法結(jié)合的方法(Convex optimization and adaptive collocation method, CAC method)被用來求解問題1和問題2,以生成軌跡集。CAC方法是STI策略中采用的一種對救援軌道和飛行軌跡聯(lián)合求解的方法。凸優(yōu)化具有收斂性好,且不會陷入局部最小值的優(yōu)點。采用凸優(yōu)化的解提供初值,可保證數(shù)據(jù)集中軌跡的最優(yōu)性。由于問題1和問題2軌跡的分布差異較大,將問題1和問題2的解保存到兩個數(shù)據(jù)子集中,分別為數(shù)據(jù)子集1、數(shù)據(jù)子集2。
發(fā)生故障前,如果運(yùn)載火箭能準(zhǔn)確跟蹤標(biāo)稱彈道,那么推力下降的大小、發(fā)生推力故障的時刻足以描述所有故障模式。實際飛行中,由于存在噪聲干擾,火箭的位置、速度在標(biāo)稱彈道附近。為了更全面的描述故障,故障狀態(tài)的特征是故障發(fā)生的時間、推力下降的比例、故障時的狀態(tài)變量(位置、速度、質(zhì)量)。
圖3 數(shù)據(jù)集的求解流程圖Fig.3 Flow chart of solving datasets
徑向基神經(jīng)網(wǎng)絡(luò)(Radial basis function neural network, RBFNN)被用來決策最優(yōu)軌跡近似解。RBFNN是一種局部逼近網(wǎng)絡(luò),通常由輸入層、隱藏層、輸出層三層網(wǎng)絡(luò)構(gòu)成。理論上,具有足夠多隱層神經(jīng)元的徑向基神經(jīng)網(wǎng)絡(luò)能以任意精度逼近任意連續(xù)函數(shù)。
隱藏單元由基函數(shù)激活,本文采用高斯基函數(shù),第個隱藏層的輸出為:
(7)
輸出層對徑向基函數(shù)隱藏層的輸出進(jìn)行線性組合以生成預(yù)期的輸出。輸出層第個節(jié)點的輸出為
(8)
式中:為第個隱層神經(jīng)元到第個輸出神經(jīng)元的權(quán)重,為隱層神經(jīng)元的數(shù)量。正交最小二乘法(Orthogonal least-squares, OLS)被用來訓(xùn)練徑向基神經(jīng)網(wǎng)絡(luò)。OLS是一種由Chen等提出的一種選擇RBFNN數(shù)據(jù)中心的方法,訓(xùn)練的網(wǎng)絡(luò)規(guī)模小,隱藏層采用少量的神經(jīng)元節(jié)點就能映射非線性關(guān)系。OLS形式的徑向基神經(jīng)網(wǎng)絡(luò)中神經(jīng)元數(shù)量參數(shù)較少,神經(jīng)元連接權(quán)重參數(shù)也少。因此遷移到在線應(yīng)用的神經(jīng)網(wǎng)絡(luò)模型占用的存儲空間小,神經(jīng)網(wǎng)絡(luò)正向傳播的計算消耗也少,適合用于軌跡決策。
圖4 軌跡決策神經(jīng)網(wǎng)絡(luò)Fig.4 Neural network of trajectory decision-making
圖5 軌跡決策的示意圖Fig.5 Schematic diagram of trajectory decision-making
在本節(jié)中,以運(yùn)載火箭的二級飛行階段為研究對象,發(fā)射參數(shù)見表1。地球引力系數(shù)設(shè)為3.986×10m/s,假設(shè)地球是一個均勻的球體,地球半徑是6378140 m。第二階段上升階段為真空環(huán)境,其中是發(fā)動機(jī)比沖,海平面重力加速度設(shè)為9.8 m/s。
表1 發(fā)射參數(shù)Table 1 Launcher parameters
表2給出了地心慣性坐標(biāo)系中的第二階段初始狀態(tài)。目標(biāo)軌道的近地點和遠(yuǎn)地點高度分別為200 km和300 km。目標(biāo)軌道的軌道要素見表3。安全軌道高度=160 km。
表2 二級的初始狀態(tài)Table 2 Second stage initial states
表3 目標(biāo)軌道的軌道根數(shù)Table 3 Target orbital elements
本文的數(shù)值仿真都是在英特爾酷睿i7-7700 CPU 3.60 GHz電腦上進(jìn)行的,MATLAB版本為2018b。自適應(yīng)配點法所采用的配點是正交Legendre多項式的零點。
因為標(biāo)稱情況下,二級段飛行時間是378 s。如果推力下降比例低于12%時,采用迭代制導(dǎo)仍然可以到達(dá)目標(biāo)軌道,不需要在線任務(wù)重構(gòu)。數(shù)據(jù)集的故障發(fā)生時間是0~378 s,步長為0.5 s;推力下降大小12%~30%,步長為0.1%。取值依據(jù)具體的飛行任務(wù),本算例中近地點和遠(yuǎn)地點高度分別為200 km和300 km,Δ取5 km。在問題2中優(yōu)先調(diào)整軌道平面,目標(biāo)函數(shù)權(quán)重,,,取值10,10,10,10。數(shù)據(jù)子集1中共18494個圓救援軌道類型樣本,數(shù)據(jù)子集2中有9350個橢圓救援軌道類型樣本。在數(shù)據(jù)集中,隨機(jī)抽取90%的數(shù)據(jù)作為訓(xùn)練集,剩余10%的數(shù)據(jù)作為測試集。
為了驗證算法的正確性與在線計算效率的先進(jìn)性,采用本文提出的方法和文獻(xiàn)[10]的CAC方法求解在線任務(wù)重構(gòu)問題。采用本文方法與CAC方法求解這些故障下的任務(wù)重構(gòu)問題,用來對比驗證本文方法的精度與在線計算的效率。文獻(xiàn)[10]未明確說明自適應(yīng)配點法的自適應(yīng)規(guī)則與配點設(shè)置,本文CAC方法的復(fù)現(xiàn)工作采用經(jīng)典自適應(yīng)配點法。
..決策精度驗證
為了驗證軌跡決策的準(zhǔn)確性,在測試集上仿真了本文方法決策的軌跡與CAC方法計算出的軌跡,并統(tǒng)計這兩個方法結(jié)果的誤差。軌跡中狀態(tài)量的誤差用所有時間節(jié)點上狀態(tài)量的平均絕對誤差(Mean absolute error, MAE)來刻畫,其表達(dá)式為
(9)
(10)
誤差采用盒狀圖表示,如圖6所示。盒狀圖是一種統(tǒng)計數(shù)據(jù)分布的可視化方法,單個盒狀圖從下往上分別是數(shù)據(jù)的下限、下四分位數(shù)、中位數(shù)、上四分位數(shù)、上限。
數(shù)據(jù)子集1用來訓(xùn)練圓軌道救援的軌跡決策神經(jīng)網(wǎng)絡(luò),徑向基寬度是1,最終訓(xùn)練好的隱藏層神經(jīng)元數(shù)量是100。圓軌道救援類型結(jié)果中的位置、速度、控制變量在測試集上的誤差如圖6(a)~(c)所示??梢钥闯?75%的位置誤差在100 m以內(nèi),位置誤差的上限是500 m。75%的速度誤差在0.2 m/s以內(nèi),速度誤差的上限是1.4 m/s。75%的控制變量誤差在5×10以內(nèi),控制變量的上限是2.5×10。
圖6 軌跡決策的誤差Fig.6 Errors of trajectory decision-making
數(shù)據(jù)子集2用來訓(xùn)練橢圓軌道救援的軌跡決策神經(jīng)網(wǎng)絡(luò),徑向基寬度是1,最終訓(xùn)練好的隱藏層神經(jīng)元數(shù)量是100。橢圓軌道救援類型結(jié)果中的位置、速度、控制變量在測試集上的誤差如圖6(d)~(f)所示。橢圓軌道救援軌跡決策的位置、速度與控制變量誤差比圓軌道救援類型的大。這是因為橢圓軌道救援的優(yōu)化問題中,目標(biāo)函數(shù)包含多個變量,故障狀態(tài)與最優(yōu)軌跡的非線性關(guān)系更復(fù)雜。
通過統(tǒng)計、分析本文方法決策的軌跡與CAC方法計算出的軌跡之間的誤差,驗證了本文方法在多種圓、橢圓軌道救援情況下軌跡決策的誤差小,建立的軌跡決策模型泛化能力強(qiáng)。
..在線計算時間對比驗證
為了驗證本文算法在線計算時間的先進(jìn)性,仿真對比了本文方法和CAC方法的在線計算時間。為了繪圖的清晰,圖7和圖8分別展示了100個故障對應(yīng)的在線計算時間,這100個故障是在測試集中隨機(jī)抽取的。
圖7 在線任務(wù)重構(gòu)CPU耗時(圓軌道)Fig.7 CPU time consuming of online mission reconfiguration (circular orbit)
圖8 在線任務(wù)重構(gòu)CPU耗時(橢圓軌道)Fig.8 CPU time consuming of online mission reconfiguration (elliptical orbit)
圖7顯示了本文方法與CAC方法在求解問題1的在線計算時間比較。與CAC方法相比,采用本文方法,在線任務(wù)重構(gòu)的平均計算時間由1.06 s降至0.007 s。本文方法的平均計算時間比CAC方法節(jié)省了99.3%。
圖8顯示了本文方法與CAC方法在求解問題2的在線計算時間比較。與CAC方法相比,采用本文方法在線任務(wù)重構(gòu)的平均計算時間由6.253 s降至0.006 s。本文方法的平均計算時間比CAC方法節(jié)省了99.9%。此外,圖8中CAC方法在不同故障下的計算時間數(shù)量級差別大。這是因為橢圓情況下優(yōu)化問題的初值敏感性高,自適應(yīng)配點法在結(jié)果不滿足精度的情況下,自適應(yīng)地增加了配點,導(dǎo)致計算成本增長,計算時間變長。由此可見,本文提出的基于軌跡智能決策的在線任務(wù)重構(gòu)方法顯著地縮減了在線部分的計算時間。這是因為本文方法將離線訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)遷移到在線應(yīng)用,在線部分只需計算神經(jīng)網(wǎng)絡(luò)的正向傳播,是簡單的矩陣相乘、相加運(yùn)算。航天器軌跡優(yōu)化的直接法是基于動力學(xué)模型離散原問題,再利用迭代的方法去求解。而本文方法在線部分的計算無需迭代計算,有著更少的計算成本,因此在線計算時間更少。此外,本文方法的所有測試仿真的時間都在一個量級,計算時間更穩(wěn)定。
為了分析本文算法重構(gòu)的救援軌道與飛行軌跡的魯棒性,在兩種典型故障狀態(tài)下,做了本文方法與文獻(xiàn)[10]的CAC方法在不同工況下的仿真。由于飛行過程中存在不確定性的影響,運(yùn)載火箭距離標(biāo)稱軌跡有一定的誤差。因此,為了驗證方法的魯棒性,假設(shè)故障發(fā)生時刻的位置、速度有偏差。
在運(yùn)載火箭二級飛行段,火箭的位置在地心慣性坐標(biāo)系軸的變化少,分別設(shè)置正、負(fù)不確定性為:Δ=[5,05,5]km,Δ=[5,5,5]m/s,圖例中表示為“+5 km,+5 m/s”;Δ=[-5,-05,-5]km,Δ=[-5,-5,-5]m/s,圖例中表示為“-5 km,-5 m/s”。
假設(shè)在第二級飛行階段,推力在110 s時減少25%。這種故障下的任務(wù)重構(gòu)問題屬于問題1,本文方法與CAC方法在不同工況下的結(jié)果如圖9、圖10和表4所示。圖9是海拔高度曲線,圖10是速度曲線。無偏差情況下,本文方法與CAC方法規(guī)劃出的軌跡結(jié)果一致。存在偏差的情況下,本文方法與CAC方法的軌跡結(jié)果很接近。本文方法與CAC方法在線求解的救援軌道見表4。表4中幾種工況下,救援軌道的偏心率是0,表示是圓救援軌道,而軌道傾角、升交點赤經(jīng)為發(fā)生故障時的值,從而最大程度地利用推進(jìn)劑能量來提高軌道高度。
圖9 海拔高度曲線(圓軌道)Fig.9 Altitude curve (circular orbit)
圖10 速度曲線(圓軌道)Fig.10 Speed curve (circular orbit)
表4 入軌點軌道根數(shù)(圓軌道)Table 4 Orbital elements of injection point (circular orbit)
若推力在144.5 s下降25%,這種故障下的任務(wù)重構(gòu)問題屬于問題2,本文方法與CAC方法在不同工況下的結(jié)果如圖11、圖12和表5所示。
圖11 海拔高度曲線(橢圓軌道)Fig.11 Altitude curve (circular orbit)
圖12 速度曲線(橢圓軌道)Fig.12 Speed curve (elliptical orbit)
表5 入軌點軌道根數(shù)(橢圓軌道)Table 5 Orbital elements of injection point (elliptical orbit)
與問題1的結(jié)果類似,無偏差情況下,本文方法與CAC方法規(guī)劃出的軌跡結(jié)果一致。存在偏差的情況下,本文方法與CAC方法的軌跡結(jié)果很接近。
因此,本文提出的基于軌跡智能決策的任務(wù)重構(gòu)方法可以獲得推力故障下任務(wù)重構(gòu)問題近似最優(yōu)解,并對于初始位置、速度的偏差有一定魯棒性。
針對運(yùn)載火箭推力下降故障下任務(wù)重構(gòu)問題的在線計算輕量化需求,采用徑向基神經(jīng)網(wǎng)絡(luò)離線學(xué)習(xí)“故障狀態(tài)-最優(yōu)軌跡”動力學(xué)關(guān)系,再遷移到在線應(yīng)用,提出了一種基于軌跡智能決策的任務(wù)重構(gòu)方法。得到如下結(jié)論:
1)通過“故障狀態(tài)-最優(yōu)軌跡”數(shù)據(jù)集訓(xùn)練徑向基神經(jīng)網(wǎng)絡(luò)可得到軌跡決策模型,該模型能決策出近似最優(yōu)的軌道與對應(yīng)的飛行軌跡。此外軌跡決策方法對于初值點的位置、速度偏差有魯棒性。
2)提出的基于軌跡智能決策的任務(wù)重構(gòu)方法具有在線計算時間短、計算時間穩(wěn)定的特點。與目前的軌跡優(yōu)化方法CAC相比,對于圓、橢圓軌道救援類型,本文方法的平均在線計算時間減少了三個數(shù)量級,且本文方法的仿真計算時間均穩(wěn)定在0.01 s以內(nèi)。
上述結(jié)論表明,本文提出的基于軌跡決策的在線計算輕量化的任務(wù)重構(gòu)方法可顯著提高在線計算的效率、增強(qiáng)發(fā)射的可靠性,有很強(qiáng)的工程應(yīng)用前景。