楊 奔,李天任,馬曉媛
(中國運載火箭技術(shù)研究院研究發(fā)展部,北京,100076)
跳躍式飛行器是一種在大氣層內(nèi)波動飛行的再入飛行器,能夠通過自身攜帶的動力裝置進行多次開關(guān)機,補充大氣阻力消耗的能量,實現(xiàn)“向下俯沖-動力轉(zhuǎn)彎-慣性爬升”的波浪式飛行。本文主要針對跳躍飛行軌跡特性進行分析,進而探討該類飛行器軌跡的優(yōu)化方法。從本質(zhì)上來講這是一種帶過程約束的兩點邊值問題,解決該問題目前有2 種主流的算法,分別為基于非線性優(yōu)化理論的直接法和基于極大值原理的間接法。1955 年,Eggers和 Seiff在簡化模型下,理論推導出再入飛行器射程的解析表達式,并據(jù)此分析了平衡再入和跳躍再入軌跡的射程與氣動力/氣動熱關(guān)系。Istratie考慮了熱流密度和剩余速度,基于極大值原理研究了跳躍軌跡的優(yōu)化問題。雍恩米基于高斯偽譜法對再入飛行軌跡進行了優(yōu)化,驗證了偽譜法具有較高的求解速度和效率。施劍鋒等利用混沌粒子群法研究了跳躍飛行器在滿足過程約束和航程約束的前提下實現(xiàn)總加熱量最小的軌跡優(yōu)化問題。間接法需要很強的數(shù)學理論知識,且該方法幾乎無法有效解決較復雜問題;應用直接法對多階段問題的建模較為繁瑣;而粒子群法等啟發(fā)式算法對于計算量大、優(yōu)化參數(shù)多的復雜模型優(yōu)化問題,需反復交叉、變異、迭代,計算效率較低。
20 世紀90 年代以來,由于神經(jīng)網(wǎng)絡(luò)較大的非線性擬合能力,在魯棒飛行控制方法、氣動參數(shù)在線辨識及故障診斷等方面引起了學者們廣泛地研究。從原理上來講,控制系統(tǒng)設(shè)計是基于模型的,因此建模是至關(guān)重要的,而對于跳躍飛行器這類非常復雜的系統(tǒng),建立準確模型方法及關(guān)鍵參數(shù)的準確辨識問題一直無法有效解決,鑒于神經(jīng)網(wǎng)絡(luò)具有較強的映射能力優(yōu)點,理論上對于對象復雜程度多高,均能快速適應。因此,成為辨識非線性系統(tǒng)的一種有效途徑,被廣泛應用于飛行器軌跡規(guī)劃及控制中。
再入飛行器由于長時間在大氣層內(nèi)飛行,所面臨的熱、力等環(huán)境比較嚴峻,如何快速準確的實現(xiàn)其軌跡規(guī)劃問題也顯得尤為重要。本文采用RBF 神經(jīng)網(wǎng)絡(luò)對含動力的再入模型進行辨識,避免了強非線性、多階段優(yōu)化模型難以建立的困難,然后基于該辨識系統(tǒng)利用序列二次規(guī)劃算法進行軌跡優(yōu)化,在計算時間和尋優(yōu)結(jié)果上均比傳統(tǒng)方法更具優(yōu)勢。
德國科學家Eugen S?nger 最早提出大氣層內(nèi)跳躍飛行軌跡樣式,帶補能裝置的跳躍再入軌跡形式如圖1所示。這種軌跡最顯著的特點是飛行高度起伏變化大且不具規(guī)律性,相比于傳統(tǒng)的拋物形、平衡再入式軌跡,其特征參數(shù)更加不易獲取。除此之外,由于長時間在高空飛行,可以減少速度損失和降低熱載,具備一定的工程應用價值。
圖1 跳躍軌跡示意Fig.1 Schematic Diagram of Skip Trajectory
為簡化問題,只研究再入飛行器縱向平面內(nèi)的運動,假定地球為一靜止的圓球,帶動力的再入飛行器無量綱動力學模型為
式中為大氣密度;為飛行器質(zhì)量,=907 kg;為參考面積,=0.4839 m;為升力系數(shù);為阻力系數(shù),均參考國外滑翔飛行器CAV-H。對升力系數(shù)和阻力系數(shù)進行擬合,得到兩者對攻角的關(guān)系式:
再入跳躍軌跡優(yōu)化問題一般可以轉(zhuǎn)化為包含路徑約束、邊值約束以及補能發(fā)動機工作時間約束的優(yōu)化問題。本文主要研究不同飛行策略對末級發(fā)動機開關(guān)機時間點的影響,暫不考慮攻角對結(jié)果的影響,因此借鑒航天飛機的程序攻角設(shè)計方法,采用典型的二次分段標稱攻角剖面,其具體表達形式為
式中為再入初始攻角,在再入段的初始階段,以大攻角飛行,避免飛行器超過熱流的約束;為飛行攻角設(shè)置的速度閾值;為常量系數(shù)。
再入軌跡優(yōu)化問題一般是考慮射程最遠為優(yōu)化指標,但防熱問題也是再入飛行器在大氣層內(nèi)飛行時需要考慮的一個重要方面。本文將兩者綜合考慮,將熱流約束通過罰函數(shù)策略加入到性能指標中,因此選擇兩者的加權(quán)作為設(shè)計的優(yōu)化指標,并討論不同飛行策略下的開關(guān)機方案,即:
式中為性能指標;為射程;為峰值熱流密度;,分別為射程和峰值熱流的權(quán)值系數(shù)。
針對該多階段優(yōu)化模型,文獻[5]中基于混沌粒子群法進行計算,但該方法中選擇、變異、混沌化以及軌跡積分等操作過程需要大量迭代運算,計算量大,且實際求解過程中的計算精度難以保證,難以滿足實時性要求。
因此,本小節(jié)將引入RBF 神經(jīng)網(wǎng)絡(luò),利用其強大的非線性映射能力,構(gòu)建以末級發(fā)動機3 次波谷的工作時間和適應度值的映射關(guān)系,完成基于RBF 神經(jīng)網(wǎng)絡(luò)的再入跳躍系統(tǒng)辨識。
RBF 網(wǎng)絡(luò)是一種包含輸入層、隱含層和輸出層的前饋神經(jīng)網(wǎng)絡(luò),輸入端到輸出端的映射關(guān)系是非線性的,但中間層到輸出端的映射是線性的,該網(wǎng)絡(luò)一般結(jié)構(gòu)如圖2 所示。
圖2 RBF 神經(jīng)網(wǎng)絡(luò)拓撲結(jié)構(gòu)Fig.2 RBF Neural Network Topology
圖2中:a)輸入層:由感知單元組成,主要是用來感知外部環(huán)境變化。b)隱含層:也可稱為激勵函數(shù),是網(wǎng)絡(luò)對輸入條件產(chǎn)生局部調(diào)節(jié)。c)輸出層:該層的節(jié)點對隱含層的輸出數(shù)據(jù)進行線性處理,從而形成輸入端到輸出端的映射空間。因其網(wǎng)絡(luò)結(jié)構(gòu)簡單、訓練簡潔、學習收斂速度快,適合實時控制的要求。
本文中,為避免直接求解非線性、多階段的優(yōu)化問題的困難,將末級發(fā)動機3 次的工作時間作為輸入,射程、熱流以及兩者的加權(quán)函數(shù)等不同飛行策略指標作為輸出,利用RBF 網(wǎng)絡(luò)實現(xiàn)對發(fā)動機每次波谷工作時間與適應值函數(shù)非線性系統(tǒng)的辨識。
在網(wǎng)絡(luò)結(jié)構(gòu)中,= [,, …, x]為網(wǎng)絡(luò)的輸入向量。設(shè)基向量= [,,… , h],其中,為底函數(shù),即:
式中 第個節(jié)點的中心向量為
設(shè)基寬向量為= [,,… , b],為節(jié)點的基寬參數(shù),且為大于零的數(shù)。網(wǎng)絡(luò)的權(quán)向量為
則,RBF 網(wǎng)絡(luò)的輸出為
網(wǎng)絡(luò)逼近的性能指標函數(shù)為
網(wǎng)絡(luò)學習過程采用監(jiān)督學習方式,網(wǎng)絡(luò)中各個參數(shù)的迭代算法如下:
式中為學習速率,∈[0 ,1 ];為動量因子,∈[0 ,1 ]。
序列二次規(guī)劃算法的原理是在參考點處,降階求解二次規(guī)劃的子問題,通過尋優(yōu)結(jié)果更新參考點,使其逐步逼近原優(yōu)化問題的最優(yōu)解。由于該算法具有全局最優(yōu)性的同時保持部分超1 次收斂性能,成為目前求解非線性規(guī)劃問題最受歡迎的算法之一。
設(shè),,分別表示性能指標、等式與不等式約束,考慮如下最優(yōu)控制問題(P):
在 x處,與式(15)對應的二次規(guī)劃子問題(QP)表示為
式中 ?(x),?(x),?(x)分別為函數(shù),,在 x處的梯度;矩陣B為問題(P)的 Lagrange 函數(shù)(,,) =() +() ?()在Hessian 矩陣的擬牛頓近似矩陣;為搜索方向。為使算法具有收斂性,通常要求B對稱正定。對于式(16)的二次規(guī)劃問題,一般可采取罰函數(shù)等方法進行快速優(yōu)化。
假設(shè)再入飛行器攜帶燃料一定,并規(guī)定燃料在前3 次波谷階段完全燃燒。在此基礎(chǔ)上,隨機生成組Δ、Δ和Δ數(shù)據(jù),分別為每次波谷發(fā)動機的工作時間。正如第1.2 節(jié)所分析的,選擇發(fā)動機開機時刻為波谷點,體現(xiàn)在時間-地心距曲線上即曲線的凹點,其表示為
式(17)中所表示的是連續(xù)系統(tǒng)的波谷點,但實際仿真過程是一系列的離散點,所以必須對式(17)進行處理,從而得到式(18)表示的開機點時刻。
隨后,從再入飛行器的初始狀態(tài)通過龍格庫塔四階積分,直到飛行器達到末端高度約束,計算每組數(shù)據(jù)所對應的適應值,從而形成大量的樣本用于RBF 網(wǎng)絡(luò)訓練。
基于上述辨識系統(tǒng),利用序列二次規(guī)劃算法對其進行軌跡優(yōu)化。
為驗證本文方法的準確性和有效性,選取美國通用飛行器的再入任務(wù)進行仿真分析,該飛行器總質(zhì)量為907 kg,參考面積為0.48 m。標稱攻角剖面為:0=22°,=16,=0.11。飛行器的初始飛行狀態(tài)如表1 所示。飛行器所攜帶燃料為16 kg,末級發(fā)動機推力為2000 N,比沖為=49 000 m/s。
表1 飛行器再入點參數(shù)Tab.1 Reentry Point Parameters
按照第2.2 節(jié)中數(shù)據(jù)產(chǎn)生的方式,生成10 000 組發(fā)動機各個波谷點工作時間組合以及對應的適應值數(shù)據(jù),作為監(jiān)督學習的數(shù)據(jù)庫。網(wǎng)絡(luò)輸入層感知單元為3 個,輸出神經(jīng)元的數(shù)量為1,考慮網(wǎng)絡(luò)的映射能力和學習效率,隱含層節(jié)點數(shù)量為112。
在網(wǎng)絡(luò)訓練過程中,隨著逐步迭代,其輸出與樣本真值之間的差值逐漸減小,最終收斂至穩(wěn)定,誤差最終收斂于 1 × 1 0,表明網(wǎng)絡(luò)達到了較高的收斂精度。
為驗證所建立的RBF 神經(jīng)網(wǎng)絡(luò)對原非線性、多階段系統(tǒng)的逼近程度,隨機生成100 組Δ、Δ和Δ數(shù)據(jù),輸入到RBF 網(wǎng)絡(luò)模型中,并同時將其帶入到式(1)中進行飛行參數(shù)計算,將兩者所得的結(jié)果比較,作為網(wǎng)格辨識精度的評價標準,進行誤差分析。在隨機生成100 組輸入量的狀態(tài)下,所訓練的網(wǎng)格成功得到了輸入量對應的的適應值。與真實值相比,最大誤差2.5 × 10。說明該網(wǎng)格可以實現(xiàn)對原有系統(tǒng)的準確辨識,準確地建立了3 次波谷發(fā)動機工作時間和與適應度函數(shù)的非線性映射模型。
基于第3.1 節(jié)中RBF 神經(jīng)網(wǎng)絡(luò)對原復雜系統(tǒng)的逼近模型,采用序列二次規(guī)劃算法進行軌跡優(yōu)化。下例中,規(guī)定式(6)中=1,=70 綜合考慮射程最優(yōu)和熱流約束。通過給定不同的初始參考點,對比分析其優(yōu)化結(jié)果(見表2),說明該模型對初始值的依賴較低,可以很好地避免對原系統(tǒng)直接優(yōu)化不易建模的困難。
表2 軌跡優(yōu)化結(jié)果對比Tab.2 Result Contrast
由表2 可知,3 組不同的初始方案,得到的優(yōu)化結(jié)果一致,說明基于RBF 神經(jīng)網(wǎng)絡(luò)和SQP 算法跳躍軌跡優(yōu)化方法對初值敏感度低,并且在較少的迭代次數(shù)后達到收斂,迭代結(jié)果如圖3 所示,3 種情況耗時均在0.275 s 左右。
圖3 不同初始軌跡的優(yōu)化結(jié)果Fig.3 Optimization Results of Different Initial Trajectories
圖3是不同初始參考值所對應的優(yōu)化結(jié)果,由于本次仿真所選取的性能指標是綜合考慮了射程最優(yōu)和熱流約束,所以優(yōu)化結(jié)果是第2 次波谷時刻發(fā)動機工作時間最長,其次是第1 次波谷時刻,第3 次發(fā)動機并未開機,在此之前燃料已經(jīng)消耗完畢。在第3.4 節(jié)里,會對不同飛行策略的軌跡特性進行分析對比,并說明其對每次波谷發(fā)動機工作時間的影響。
由圖3 可知,末級發(fā)動機分別在108.4 s 和361 s時刻開始點火,并分別持續(xù)工作17.62 s 和22.38 s。在前2 次波谷附近內(nèi),速度有短暫的增加,軌跡傾角和高度變化并沒有發(fā)生突變,過渡比較平穩(wěn),說明該優(yōu)化方案是可行的。
粒子群算法對性能指標和約束條件的限制較少,具有較強的全局尋優(yōu)能力,優(yōu)化模型簡單、通用性強,但對于較為復雜的問題,受其交叉、迭代等步驟的影響,粒子群法的優(yōu)化效率較低,優(yōu)化時間一般在幾十分鐘甚至小時量級。在傳統(tǒng)粒子群算法中,初始化是隨機設(shè)置的,可能導致某些可行域被遺漏,無法保證種群空間的隨機性與多樣性,很難求得最優(yōu)解。將混沌算法與粒子群算法相結(jié)合,將其應用于優(yōu)化搜索中,利用混沌運動的隨機性、充分調(diào)整種群的進化方向,最大程度上避免陷入局部最優(yōu)解。
為驗證本文算法的準確性和高效性,將優(yōu)化結(jié)果與混沌粒子群算法的尋優(yōu)結(jié)果進行對比,粒子群算法主要參數(shù)設(shè)置為:學習率==1.4,最大迭代次數(shù)為=45,粒子空間為3 維,種群數(shù)量維為100。具體的對比結(jié)果見表3 和圖4。
表3 尋優(yōu)結(jié)果對比Tab.3 Comparison of Optimization Results
圖4 兩種算法優(yōu)化的射程-高度曲線Fig.4 Range-height Curve Optimized by Two Algorithms
由表3 和圖4 知,采用基于混沌粒子群法的尋優(yōu)過程在經(jīng)過44 次反復迭代尋優(yōu)、交叉變異步驟后,計算結(jié)果與本文算法基本一致,總計耗時1441 s 左右,時效性不高,尋優(yōu)結(jié)果與本文算法計算結(jié)果相比,無論是從計算效率還是結(jié)果的最優(yōu)性方面,基于RBF 神經(jīng)網(wǎng)絡(luò)和SQP 算法的跳躍軌跡優(yōu)化結(jié)果都表現(xiàn)出絕對的優(yōu)勢。
為了分析不同的飛行策略對末級發(fā)動機各波谷工作時間的影響,本小節(jié)通過設(shè)置不同的適應值函數(shù)以及對應的優(yōu)化指標,分別采用RBF 神經(jīng)網(wǎng)絡(luò)對原多階段系統(tǒng)進行逼近,隨后利用序列二次規(guī)劃算法對其進行軌跡優(yōu)化,具體方法同第3.1 節(jié)和第3.2 節(jié)。
分別采用如射程最遠、最大熱流密度最小化等不同的飛行策略,研究其對末級發(fā)動機各波谷工作時間的影響。仿真結(jié)果見表4、圖5、圖6 等。
表4 不同飛行策略的結(jié)果對比Tab.4 Comparison of Results under Different Flight Strategies
圖5 不同飛行策略對應的射程-高度曲線Fig.5 Range-altitude Curve Corresponding to Different Flight Strategies
圖6 不同飛行策略對應的熱流密度曲線Fig.6 Heat Flux Curves Corresponding to Different Flight Strategies
由圖6 可知,在只考慮熱流密度約束時,所優(yōu)化的結(jié)果是,發(fā)動機工作時間比較靠后,反而第1 次發(fā)動機工作時間只有1.0432 s,這也與第1種情況相對應。因此可以得到,發(fā)動機工作時間越靠前,射程越遠,但熱環(huán)境壓力大。發(fā)動機工作時間越靠后,能減輕熱環(huán)境壓力,但卻嚴重減小了飛行器的射程。在這種情況下,本文綜合考慮射程與熱環(huán)境條件,以射程與熱流罰函數(shù)加權(quán)為優(yōu)化指標,達到兼顧兩者的效果。
本文通過采用RBF 神經(jīng)網(wǎng)絡(luò)對原強非線性、多階段的再入跳躍式軌跡模型進行辨識,借助神經(jīng)網(wǎng)絡(luò)強大的非線性映射能力,建立了末級發(fā)動機3 次開機點時間和與適應度函數(shù)的非線性映射模型。在此基礎(chǔ)上,采用序列二次規(guī)劃算法進行軌跡優(yōu)化,避免了直接求解該優(yōu)化問題的困難。并與基于混沌粒子群算法的尋優(yōu)結(jié)果進行對比,驗證了該方法的準確性和高效性。
另外,討論了射程最大、熱流最小等不同的飛行策略對開關(guān)機時間的影響,并從實際工程角度出發(fā),為兼顧不同的性能指標,提出以射程和熱流罰函數(shù)加權(quán)為優(yōu)化指標,并通過對大升組比再入飛行器CAV-H進行仿真分析,得到了較優(yōu)的軌跡,具有一定的工程應用價值。