姜 添,李 健,戈嗣誠
(北京空間機(jī)電研究所, 北京 100094)
降落傘技術(shù)是飛行器進(jìn)入、下降和著陸[1](Entry, Descent, and Landing,EDL)關(guān)鍵技術(shù)的核心部分,降落傘的典型工作過程包括傘系拉直、充氣展開、穩(wěn)定減速三個(gè)階段。其中傘衣的充氣展開最為重要,該過程的研究關(guān)注點(diǎn)主要面向傘的載荷變化和應(yīng)力分布、傘衣變形和阻力面積等,工程應(yīng)用及科學(xué)探索對該階段的常用研究手段包括以下三種:完全試驗(yàn)法、數(shù)值模擬法與半理論半試驗(yàn)法。其中,完全試驗(yàn)法一般用風(fēng)洞實(shí)驗(yàn)[2]或空投試驗(yàn)[3]等方式直接獲取傘的相關(guān)數(shù)據(jù),準(zhǔn)備周期長、試驗(yàn)成本高,適用于理論研究與產(chǎn)品的初樣驗(yàn)證,工程設(shè)計(jì)階段已很少采用;數(shù)值模擬法多以任意拉格朗日-歐拉法[4](Arbitrary Lagrange-Eulerian method,ALE)以及變空間域/穩(wěn)定時(shí)間-空間法[5](Deforming-Spatial-Domain / Stabilized Space-Time, DSD/SST)等計(jì)算機(jī)仿真方法處理物傘系統(tǒng)的流固耦合問題,并在實(shí)踐中有所應(yīng)用[6-7],但受限于技術(shù)能力,數(shù)值模擬法目前難以滿足產(chǎn)品初步設(shè)計(jì)過程中計(jì)算簡單、快速應(yīng)用的需求;為了對一些典型應(yīng)用工況進(jìn)行快速、準(zhǔn)確的計(jì)算分析,有學(xué)者結(jié)合大量的傘系試驗(yàn)總結(jié)出應(yīng)用于物傘系統(tǒng)的經(jīng)驗(yàn)公式[8],而后發(fā)展成為半理論半試驗(yàn)法,這類方法可以讓研究人員迅速獲取給定條件下的開傘力及飛行速度等重要參數(shù)的預(yù)測數(shù)值并據(jù)此判斷傘的性能狀態(tài)是否滿足設(shè)計(jì)要求,是工程中常用和高效的方法,不足之處是具有非常強(qiáng)的經(jīng)驗(yàn)參數(shù)依賴性和應(yīng)用場景局限性,很多學(xué)者針對此問題對經(jīng)驗(yàn)公式進(jìn)行了改進(jìn)與優(yōu)化[9-10],但仍存在較大的提升空間。近年來快速發(fā)展的機(jī)器學(xué)習(xí)理論憑借其強(qiáng)大的非線性擬合與泛化性能受到了部分研究者的關(guān)注,進(jìn)行傳統(tǒng)方法結(jié)合機(jī)器學(xué)習(xí)的學(xué)科交叉研究可以為提高經(jīng)驗(yàn)公式模型的精度與適用性提供一種新的研究思路。
由于機(jī)器學(xué)習(xí)的細(xì)分種類繁雜,選擇合適的模型對提升訓(xùn)練的效率與準(zhǔn)確性大有裨益??紤]空投試驗(yàn)中飛行器與降落傘的飛行狀態(tài)變化,將空投過程在時(shí)間維度上進(jìn)行離散,可以認(rèn)為:物傘系統(tǒng)每一時(shí)刻的飛行狀態(tài)與前一時(shí)刻或幾個(gè)時(shí)刻的狀態(tài)量密切相關(guān);與較遠(yuǎn)時(shí)刻狀態(tài)的相關(guān)性較??;與后續(xù)時(shí)刻狀態(tài)無關(guān)。這種以時(shí)間序列為基礎(chǔ)的數(shù)據(jù)特性尤其適用于循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Networks,RNN)模型[11],該類網(wǎng)絡(luò)與其變種——長短時(shí)記憶網(wǎng)絡(luò)[12](Long Short-Term Memory,LSTM)目前在處理序列問題中表現(xiàn)出較大優(yōu)勢,并廣泛應(yīng)用于互聯(lián)網(wǎng)中的自然語言處理相關(guān)領(lǐng)域,在部分非互聯(lián)網(wǎng)行業(yè)中也有涉獵[13-15]。而在降落傘的相關(guān)行業(yè)中,國內(nèi)外使用機(jī)器學(xué)習(xí)方法進(jìn)行研究的參考案例較少,且大部分限于對傘綢透氣性[16]及傘衣織物強(qiáng)度[17]的研究,對展開過程中載荷特性等問題的探索有限,循環(huán)網(wǎng)絡(luò)與降落傘的交叉應(yīng)用具有很大的挖掘空間。
本文針對開傘過程中開傘力的預(yù)測,提出了一種使用循環(huán)網(wǎng)絡(luò)結(jié)合經(jīng)驗(yàn)公式的補(bǔ)償計(jì)算模型,包括模型架構(gòu)的詳細(xì)設(shè)計(jì)以及對訓(xùn)練集與測試集的數(shù)據(jù)預(yù)處理方法等。使用3種不同的網(wǎng)絡(luò)模型對開傘力的仿真結(jié)果進(jìn)行比較分析并探索循環(huán)網(wǎng)絡(luò)中超參數(shù)對訓(xùn)練結(jié)果的影響,給出本模型的最優(yōu)訓(xùn)練參數(shù)。
半理論半試驗(yàn)法中常用的計(jì)算方法有充氣距離法與充氣時(shí)間法,二者由動量方程的自變量不同進(jìn)行區(qū)分,本文使用的是以充氣時(shí)間作為自變量的充氣時(shí)間法。
降落傘與回收物在開傘過程中的平面受力情況如圖 1所示。建立該系統(tǒng)運(yùn)動方程時(shí),首先給定以下假設(shè)條件:①該運(yùn)動為雙質(zhì)點(diǎn)運(yùn)動,傘質(zhì)心位于傘衣底邊中心且相對底邊位置不發(fā)生變化;②忽略物傘系統(tǒng)升力;③物傘軸線始終重合;④忽略傘繩彈性,物傘相對位置不發(fā)生變化。
圖1 平面物傘系統(tǒng)力學(xué)模型Fig.1 Mechanical model of object-parachute system
在上述假設(shè)條件的前提下,可建立物傘系統(tǒng)合速度V關(guān)于時(shí)間t的微分方程以及降落傘拉力Fk的表達(dá)式:
(1)
(2)
其中:θ為物傘系統(tǒng)軸線與水平方向夾角;mw為回收物質(zhì)量;ms為降落傘質(zhì)量;mf為附加質(zhì)量,
mf=ρkfC1.5
(3)
C表示降落傘的瞬時(shí)阻力特征,
(4)
式中,tm1表示初始充氣時(shí)間,tm表示充滿時(shí)間,且各參數(shù)滿足關(guān)系式:
(5)
式(1)~(5)中其余物理量及參數(shù)含義為:D0表示傘衣名義直徑,VL表示拉直速度,C1表示初始充氣時(shí)期的傘衣阻力特征,Cs表示充滿傘衣的阻力特征,Cw表示回收物的阻力特征;kf表示附加質(zhì)量系數(shù),λ1是與傘型有關(guān)的常數(shù),λ2是與傘衣透氣性有關(guān)的常數(shù),指數(shù)p在充氣時(shí)間法中通常取1~5。
上述系數(shù)和常數(shù)為經(jīng)驗(yàn)參數(shù),是充氣時(shí)間理論的核心部分,一般通過大量試驗(yàn)測試綜合總結(jié)獲得。
循環(huán)網(wǎng)絡(luò)相當(dāng)于是以時(shí)間順序串聯(lián)的前饋網(wǎng)絡(luò)(Feedforward Neural Networks, FNN),其模型原理和隱層細(xì)胞結(jié)構(gòu)如圖 2所示。標(biāo)準(zhǔn)3層RNN結(jié)構(gòu)下t時(shí)刻網(wǎng)絡(luò)的前向傳播過程可由下列公式計(jì)算:
(6)
式中:x(t)、h(t)、y(t)分別表示輸入向量、隱層向量與輸出向量;U、V、W分別表示輸入與隱層、隱層與輸出層、隱層與隱層之間的權(quán)重參數(shù);b和c分別表示隱層與輸出層神經(jīng)元的閾值;σ為sigmoid函數(shù)。
圖2 RNN模型及其隱層細(xì)胞結(jié)構(gòu)Fig.2 RNN model and cell structure of hidden layer
標(biāo)準(zhǔn)RNN模型的缺點(diǎn)是時(shí)間序列過長時(shí),訓(xùn)練梯度會趨向于消失或者爆炸,該現(xiàn)象被稱為循環(huán)網(wǎng)絡(luò)的長期依賴挑戰(zhàn)。為了緩解這一問題,近年來學(xué)者們研究了RNN的多種變體,其中的LSTM模型較為有效,其隱層細(xì)胞結(jié)構(gòu)如圖3所示。
圖3 LSTM細(xì)胞結(jié)構(gòu)Fig.3 Cell structure of LSTM
LSTM具有內(nèi)部的循環(huán)(自環(huán))結(jié)構(gòu),引入了狀態(tài)單元C與“門控”的概念,包括輸入門、遺忘門和輸出門。新結(jié)構(gòu)的加入使LSTM對細(xì)胞內(nèi)部信息的處理變得更加細(xì)化,信息的存儲與更新也更有效率,訓(xùn)練過程不再是簡單的輸入量與循環(huán)單元之間的仿射變換。相較RNN,LSTM的網(wǎng)絡(luò)復(fù)雜度與網(wǎng)絡(luò)性能均有所上升,其前向傳播公式為:
(7)
式中:f、i、C、o分別表示遺忘門、輸入門、狀態(tài)單元和輸出門,h、y表示當(dāng)前隱層向量與輸出向量,b、U、W表示對應(yīng)門控的閾值、輸入連接權(quán)重和隱層連接權(quán)重,σ為sigmoid函數(shù),⊙表示向量積運(yùn)算。
訓(xùn)練數(shù)據(jù)需通過Min-max標(biāo)準(zhǔn)化方法處理后,使用基于時(shí)間的反向傳播算法(Back Propagation Through Time,BPTT)結(jié)合批梯度下降法(Batch Gradient Descent, BGD)進(jìn)行訓(xùn)練,其中批尺寸B取100。
本文所使用的基于充氣時(shí)間法的經(jīng)驗(yàn)公式已經(jīng)具備一定的工程應(yīng)用價(jià)值,開傘載荷補(bǔ)償模型的原理是將基于該經(jīng)驗(yàn)公式的理論拉力計(jì)算值代入循環(huán)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,其目的是將理論值向試驗(yàn)真值進(jìn)行補(bǔ)償,并獲取成熟的網(wǎng)絡(luò)訓(xùn)練結(jié)果,使補(bǔ)償后的載荷計(jì)算值更加接近試驗(yàn)真值,以此提高最終結(jié)果的預(yù)測精度。
考慮所能夠使用的有效數(shù)據(jù)量和數(shù)據(jù)特征,并滿足循環(huán)神經(jīng)網(wǎng)絡(luò)的應(yīng)用能力,構(gòu)建開傘載荷補(bǔ)償計(jì)算模型框架如圖 4所示,該框架主要包括經(jīng)驗(yàn)公式、網(wǎng)絡(luò)訓(xùn)練和輸出預(yù)測三個(gè)功能模塊。該模型的運(yùn)行思路如下:①利用經(jīng)驗(yàn)公式初步獲得某工況條件下開傘過程中的開傘力預(yù)測初值;②將預(yù)測值經(jīng)過數(shù)據(jù)預(yù)處理,獲得可以進(jìn)行網(wǎng)絡(luò)訓(xùn)練的輸入特征向量;③選用相應(yīng)的網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練;④訓(xùn)練集的網(wǎng)絡(luò)輸出參與反向傳播更新網(wǎng)絡(luò)權(quán)重,測試集的網(wǎng)絡(luò)輸出經(jīng)過反標(biāo)準(zhǔn)化方法獲得補(bǔ)償后的開傘力輸出值。
圖4 開傘載荷補(bǔ)償模型框架Fig.4 Compensation model framework of parachute deployment load
3.2.1 訓(xùn)練數(shù)據(jù)獲取
試驗(yàn)數(shù)據(jù)來源于4種條件下的低空開傘空投試驗(yàn):配重質(zhì)量為6 040 kg,降落傘傘型為盤-縫-帶傘,傘名義面積為200 m2,設(shè)計(jì)無限質(zhì)量開傘方式。試驗(yàn)過程中使用拉力傳感器同時(shí)采集時(shí)間與拉力信號,采樣頻率為2 kHz,同時(shí)搭配GPS接收機(jī)采集其他試驗(yàn)數(shù)據(jù)。經(jīng)驗(yàn)公式法的初始條件由空投試驗(yàn)要求給定,氣象條件使用當(dāng)?shù)卦缕骄鶜庀髷?shù)據(jù)或探空氣球?qū)崪y數(shù)據(jù)。
本文的主要研究對象是傘充氣階段的開傘力變化,對開傘過程中傘系拉直至載荷峰值時(shí)間和開傘載荷均進(jìn)行了統(tǒng)一的標(biāo)準(zhǔn)化處理,如圖 5所示,具體數(shù)據(jù)處理方式如下:
(a) 開傘力真值(a) Truth force (b) 公式計(jì)算值(b) Calculated value 圖5 開傘力數(shù)據(jù)處理過程Fig.5 Parachute deployment data processing
1)對空投試驗(yàn)拉力及經(jīng)驗(yàn)公式計(jì)算拉力進(jìn)行有效數(shù)據(jù)截取,選取區(qū)間固定為傘系拉直時(shí)刻至拉力峰值時(shí)刻;
2)通過插值方法將上述區(qū)間內(nèi)的拉力數(shù)據(jù)統(tǒng)一規(guī)范至相同維度,本文選取的數(shù)據(jù)維度為4 000,即單次試驗(yàn)參與網(wǎng)絡(luò)訓(xùn)練的有效數(shù)據(jù)有4 000個(gè);
3)將所有拉力數(shù)據(jù)采用Min-max標(biāo)準(zhǔn)化方法進(jìn)行歸一化處理,數(shù)據(jù)序列上下限選取為(0,200)。
經(jīng)過上述步驟處理的拉力數(shù)據(jù)在時(shí)間與量級兩個(gè)方面實(shí)現(xiàn)了歸一化,以經(jīng)驗(yàn)公式法的計(jì)算值作為網(wǎng)絡(luò)輸入、以空投試驗(yàn)數(shù)據(jù)作為目標(biāo)值參與網(wǎng)絡(luò)訓(xùn)練。
3.2.2 樣本劃分與驗(yàn)證方法
為了滿足網(wǎng)絡(luò)訓(xùn)練要求與樣本數(shù)據(jù)量,需要對歸一化的數(shù)據(jù)進(jìn)行分割,以獲取訓(xùn)練集的輸入向量與目標(biāo)向量。由上節(jié)可知,單次空投條件下由經(jīng)驗(yàn)公式產(chǎn)生的訓(xùn)練樣本及對應(yīng)真值為:
(8)
設(shè)循環(huán)網(wǎng)絡(luò)輸入向量維度為n,輸出向量維度為m,時(shí)間維度為τ,從x1開始順序選取連續(xù)n個(gè)數(shù)據(jù)構(gòu)成單一時(shí)刻內(nèi)的輸入,同理,從y1順序選取連續(xù)m個(gè)數(shù)據(jù)作為對應(yīng)的目標(biāo)向量,則第i組向量的表達(dá)式為:
(9)
式中,1≤i≤4 000-[max(n,m)-1]。
再從x1和y1開始分別順序選取τ個(gè)向量構(gòu)成滿足時(shí)間維度的網(wǎng)絡(luò)輸入與目標(biāo)矩陣:
(10)
式中,1≤i≤4 002-max(n,m)-τ。
由x′i、y′i組成對應(yīng)數(shù)組di=[x′i,y′i],將di代入網(wǎng)絡(luò)即是完成對RNN/LSTM的一次訓(xùn)練,遍歷所有樣本視為完成一次循環(huán)。由此可以得到一組試驗(yàn)數(shù)據(jù)產(chǎn)生的訓(xùn)練樣本:
(11)
式中,1≤i≤4 002-max(n,m)-τ。
本文共使用了4組空投試驗(yàn)數(shù)據(jù),選取其中3組用作網(wǎng)絡(luò)訓(xùn)練,共產(chǎn)生樣本d1、d2、d3,將所有樣本進(jìn)行混合,然后再亂序排列,即可得到訓(xùn)練集總樣本:
{d|d=(di)}
(12)
式中:1≤i≤3×[4 002-max(n,m)-τ]。
驗(yàn)證集數(shù)據(jù)的處理相對簡單,將未參與訓(xùn)練的1組數(shù)據(jù)用作結(jié)果驗(yàn)證,首先按照上述方法獲得d4,代入網(wǎng)絡(luò)計(jì)算并獲得輸出矩陣,其形式為:
(13)
式中,1≤i≤4 002-max(n,m)-τ。
(14)
式中,2≤k≤4 000-[max(n,m)-1]。
使用該方式的目的:一是為了盡量減小驗(yàn)證過程中初始隨機(jī)隱層的影響;二是考慮到循環(huán)網(wǎng)絡(luò)的計(jì)算特點(diǎn),過去時(shí)刻的數(shù)據(jù)會對當(dāng)前時(shí)刻的樣本預(yù)測結(jié)果產(chǎn)生影響,該種數(shù)據(jù)處理的形式可以提高樣本的利用率。
使用FNN、RNN與LSTM三種網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行實(shí)驗(yàn)。其中FNN為5層結(jié)構(gòu),包括輸入層、3層全連接隱藏層、輸出層,每層神經(jīng)元個(gè)數(shù)均為4 000,與輸入層維度相同,網(wǎng)絡(luò)信息遺失率(Dropout)取0.5。經(jīng)過前期試錯(cuò),F(xiàn)NN采用的訓(xùn)練方案是以整體經(jīng)驗(yàn)公式計(jì)算結(jié)果作為輸入,以整體空投真值作為目標(biāo)值,該方法在網(wǎng)絡(luò)層數(shù)為3層和4層時(shí)無法收斂,在5層結(jié)構(gòu)下可以獲得有效結(jié)果。RNN和LSTM模型則是使用3.2節(jié)介紹的數(shù)據(jù)處理方式與訓(xùn)練方法,二者均采用輸入層—隱藏層—輸出層的3層結(jié)構(gòu),網(wǎng)絡(luò)輸入維度n=10,隱層維度h=6,輸出維度m=1,學(xué)習(xí)率η=0.05,時(shí)間序列τRNN=50、τLSTM=100。圖 6給出了驗(yàn)證集數(shù)據(jù)經(jīng)過不同模型進(jìn)行補(bǔ)償后的拉力變化曲線。
圖6 補(bǔ)償模型的擬合結(jié)果Fig.6 Fitting result with compensation model
從圖 6可以看出,在載荷曲線的比較中,總體上看三種補(bǔ)償結(jié)果均能正確地反映拉力變化趨勢,相較經(jīng)驗(yàn)公式計(jì)算的開傘力,補(bǔ)償后計(jì)算值更加貼合試驗(yàn)真值;在開傘力峰值的比較中,補(bǔ)償值與真值之間的相對誤差明顯縮小,但是FNN的補(bǔ)償結(jié)果整體低于循環(huán)網(wǎng)絡(luò);在實(shí)驗(yàn)方法的比較中,兩種循環(huán)網(wǎng)絡(luò)的計(jì)算結(jié)果相近,且均優(yōu)于FNN。
圖 7給出了各模型的歸一化載荷絕對誤差變化曲線。由圖可知,經(jīng)驗(yàn)公式計(jì)算值在前40%的時(shí)間內(nèi)與真值的絕對誤差小于0.02,之后二者的誤差迅速攀升,F(xiàn)NN模型約在60%的時(shí)刻后才出現(xiàn)誤差的明顯增長,RNN與LSTM則將該時(shí)間點(diǎn)向后推延至70%,這些曲線分歧點(diǎn)的延后可以說明模型仿真能力的增強(qiáng),保證了擬合結(jié)果在分歧點(diǎn)前與試驗(yàn)真值的一致性。
圖7 多模型歸一化載荷絕對誤差變化曲線Fig.7 Normalized load absolute error of multiple compensation models
各種擬合模型與真值的誤差出現(xiàn)較大增長的主要因素是未能反映出圖 6空投試驗(yàn)數(shù)據(jù)的拉力平臺期現(xiàn)象,基于經(jīng)驗(yàn)公式的網(wǎng)絡(luò)補(bǔ)償方法在結(jié)果上表現(xiàn)出的數(shù)據(jù)規(guī)律仍與經(jīng)驗(yàn)公式較為相似。文獻(xiàn)[18]中利用RNN以同源數(shù)據(jù)的不同方案擬合出的載荷曲線可以展示出該拉力波動,表明循環(huán)網(wǎng)絡(luò)具有訓(xùn)練出盤-縫-帶傘充氣展開過程中拉力波動的能力,說明本文實(shí)驗(yàn)的預(yù)測結(jié)果存在過擬合的成分,補(bǔ)償模型與訓(xùn)練方式仍有改進(jìn)的空間;文中使用的3組訓(xùn)練樣本相較其他機(jī)器學(xué)習(xí)案例來說仍然是偏少的,3.2.2節(jié)的數(shù)據(jù)預(yù)處理過程即是針對循環(huán)網(wǎng)絡(luò)樣本不足問題所采取的數(shù)據(jù)增強(qiáng)手段,以求在一定程度上彌補(bǔ)數(shù)據(jù)量缺失的弱勢。本實(shí)驗(yàn)中的樣本數(shù)據(jù)相對有限且訓(xùn)練特征較為單一,結(jié)果容易存在過擬合,這樣的情況在FNN中更為突出,這也是FNN訓(xùn)練結(jié)果不如RNN與LSTM的因素之一。
除此之外,本文比較了學(xué)習(xí)率、輸入層維度、隱層維度等超參數(shù)對網(wǎng)絡(luò)性能的影響。超參數(shù)是在開始進(jìn)行訓(xùn)練之前設(shè)置的參數(shù)值,不是通過訓(xùn)練得到的參數(shù),神經(jīng)網(wǎng)絡(luò)的訓(xùn)練目的之一是對超參數(shù)進(jìn)行優(yōu)化而提高網(wǎng)絡(luò)的學(xué)習(xí)性能。
圖8給出了不同學(xué)習(xí)率下三種網(wǎng)絡(luò)的峰值誤差與均方誤差的變化情況,具體數(shù)據(jù)如表1所示,訓(xùn)練條件與圖6所示案例相同。
圖8 不同學(xué)習(xí)率的模型精度對比Fig.8 Comparison of model accuracy with different learning rate
表1 不同學(xué)習(xí)率的模型精度
學(xué)習(xí)率影響著網(wǎng)絡(luò)訓(xùn)練過程中梯度下降的速度,學(xué)習(xí)率過低容易使網(wǎng)絡(luò)在訓(xùn)練過程中陷入局部極小,太大又會出現(xiàn)訓(xùn)練發(fā)散的情況。從圖 8中可以看出,F(xiàn)NN的均方誤差波動增長,且峰值誤差明顯大于RNN與LSTM,開傘試驗(yàn)中峰值誤差對開傘成功率的影響更為重要,從這兩個(gè)方面看,F(xiàn)NN的性能不如循環(huán)網(wǎng)絡(luò);在兩種循環(huán)網(wǎng)絡(luò)的比較中,RNN的均方誤差對學(xué)習(xí)率的變化并不敏感,LSTM的均方誤差先減小后增大,整體變化范圍較小且η=0.05時(shí)有最小值,二者的峰值誤差隨著學(xué)習(xí)率的增大有逐漸下降的趨勢,且學(xué)習(xí)率較小時(shí)LSTM的峰值誤差變化率較大。綜合圖8與表1數(shù)據(jù),在使用循環(huán)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練時(shí),為保證訓(xùn)練要求,學(xué)習(xí)率選取0.05,訓(xùn)練結(jié)果穩(wěn)定且精度較高。
實(shí)驗(yàn)還比較了學(xué)習(xí)率為0.05時(shí),LSTM網(wǎng)絡(luò)在不同輸入維度與隱層維度下的峰值誤差,如圖9所示。其中,輸入層維度變化時(shí),固定隱層維度h=8;隱層維度變化時(shí),固定輸入層維度n=10。從圖中可以明顯看出,當(dāng)輸入層維度n=10、隱藏層維度h=8時(shí),峰值誤差取得最小值,模型訓(xùn)練結(jié)果具有最優(yōu)解。
(a) 不同輸入層的峰值誤差變化(a) Peak error variation of different input layers
上述實(shí)驗(yàn)的訓(xùn)練過程中發(fā)現(xiàn),隱層維度取某些值時(shí),網(wǎng)絡(luò)訓(xùn)練極易成功,而取某些值時(shí)卻連續(xù)多次訓(xùn)練未收斂,由此現(xiàn)象本文探究了隱層維度對網(wǎng)絡(luò)訓(xùn)練成功率的影響。由于計(jì)算資源有限,本實(shí)驗(yàn)統(tǒng)計(jì)了5個(gè)隱層維度下各20次訓(xùn)練后的網(wǎng)絡(luò)收斂次數(shù),圖 10為統(tǒng)計(jì)數(shù)據(jù)融合峰值誤差的結(jié)果,以顏色表示訓(xùn)練的難易程度。其中隱層維度h=8時(shí)訓(xùn)練成功次數(shù)明顯高于其他情況,隨著隱層維度的變化,訓(xùn)練成功率曲線整體類似于正態(tài)分布曲線。因此,綜合圖 8、圖 9及圖 10三組實(shí)驗(yàn)結(jié)果可知,本文采用的開傘載荷補(bǔ)償模型在使用LSTM時(shí)的參考超參數(shù)為:學(xué)習(xí)率η=0.05、輸入層維度n=10、隱層維度h=8。采用該參數(shù)組合時(shí)最容易獲得優(yōu)質(zhì)補(bǔ)償結(jié)果,且結(jié)果可復(fù)現(xiàn)能力強(qiáng)。
圖10 不同隱層維度下的網(wǎng)絡(luò)收斂次數(shù)Fig.10 Number of convergence with different hidden layer dimension
針對降落傘開傘載荷的預(yù)測,建立了一種利用循環(huán)網(wǎng)絡(luò)的載荷補(bǔ)償方法,該方法在經(jīng)驗(yàn)公式的計(jì)算結(jié)果上進(jìn)行二次計(jì)算,使最終結(jié)果更加貼近試驗(yàn)真值。本文比較了三種網(wǎng)絡(luò)模型的補(bǔ)償結(jié)果,探討了學(xué)習(xí)率對實(shí)驗(yàn)精度的影響,并重點(diǎn)分析了LSTM模型中超參數(shù)的選擇,得到以下結(jié)論:
1)開傘載荷補(bǔ)償模型可以正確反映拉力變化趨勢,相較經(jīng)驗(yàn)公式計(jì)算的開傘力,經(jīng)過補(bǔ)償?shù)那€更加貼合試驗(yàn)真值。
2)本模型中循環(huán)網(wǎng)絡(luò)性能明顯優(yōu)于前饋網(wǎng)絡(luò),隨著學(xué)習(xí)率增大,兩種循環(huán)網(wǎng)絡(luò)的峰值誤差逐漸減小,為保證訓(xùn)練要求,用于訓(xùn)練的推薦學(xué)習(xí)率為0.05。
3)當(dāng)學(xué)習(xí)率為0.05時(shí),LSTM在輸入層維度n=10、隱層維度h=8的條件下最容易獲得優(yōu)質(zhì)補(bǔ)償結(jié)果,且結(jié)果可復(fù)現(xiàn)能力強(qiáng)。
另外,本文建立的開傘載荷補(bǔ)償模型作為機(jī)器學(xué)習(xí)與經(jīng)典力學(xué)兩種方向的交叉學(xué)科研究,目前仍處于初步探索階段,方法仍有很大的改進(jìn)空間,如預(yù)測結(jié)果的數(shù)據(jù)規(guī)律未能表現(xiàn)出盤-縫-帶傘的拉力波動變化以及參與訓(xùn)練的樣本特征較為單一等;除此之外,結(jié)合實(shí)踐經(jīng)驗(yàn),還有高低空開傘試驗(yàn)數(shù)據(jù)歸一化方法引起的數(shù)據(jù)分布不均與不同組試驗(yàn)傳感器差異引起的樣本特征種類不一致等問題有待進(jìn)一步的解決,上述方向可為其他學(xué)者的繼續(xù)研究提供一定的參考。