石慶研 張澤中 韓 萍
(中國民航大學(xué)天津市智能信號與圖像處理重點實驗室,天津 300300)
近年來隨著民航業(yè)的快速發(fā)展,空中交通流量急劇加大,給空中交通管理(Air Traffic Management,ATM)系統(tǒng)帶來了巨大的負(fù)擔(dān)。鑒于此,國際民航組織提出基于航跡運行(Trajectory Based Operations,TBO)的空中交通管理模式,該模式以精準(zhǔn)的4D 航跡預(yù)測為基礎(chǔ),在空管單位、航空公司等相關(guān)方共享航跡動態(tài)信息,通過協(xié)同決策實現(xiàn)航班精細(xì)化運行[1]。其中,4D 航跡預(yù)測指對飛機(jī)在未來一段時間內(nèi)航跡數(shù)據(jù)變量進(jìn)行預(yù)測,包括航跡點的三維坐標(biāo)(經(jīng)度、緯度和高度)及過該航跡點時間。精確的航跡預(yù)測有助于管制員預(yù)先獲取航班飛行態(tài)勢,減小未知飛行條件帶來的工作負(fù)荷。航跡預(yù)測還為其他決策系統(tǒng)提供了必要的信息輸入,如出發(fā)和到達(dá)管理、航空器異常行為監(jiān)測、短期沖突告警(Short-term Conflict Alert,STCA)等等。例如,提高大約4~8 min 視野范圍內(nèi)的航跡預(yù)測精度,有助于減少STCA 的錯誤告警,從而提高系統(tǒng)的整體效率[2]。
目前,人們已經(jīng)在航跡預(yù)測算法上進(jìn)行了大量研究,這些算法可以分為基于質(zhì)點運動、基于狀態(tài)估計和基于機(jī)器學(xué)習(xí)三類?;谫|(zhì)點運動的預(yù)測方法,將航空器看作一個質(zhì)點,基于動力學(xué)、運動學(xué),利用飛機(jī)性能參數(shù)建立約束關(guān)系推測出航空器航跡[3-5]。狀態(tài)估計方法是根據(jù)航空器的位置、速度、加速度等屬性來建立一個狀態(tài)轉(zhuǎn)移模型進(jìn)行航跡預(yù)測。謝麗等基于混雜系統(tǒng)理論,針對航空器的不同模式提出了基于交互多模型(Interacting Multiple Model,IMM)的航跡預(yù)測算法[6]。湯新民等利用IMM 讓不同的飛行模式匹配相應(yīng)的運動狀態(tài),實現(xiàn)動態(tài)校正初始預(yù)測值的航跡預(yù)測[7]。戴定成等提出了一種改進(jìn)的馬爾可夫參數(shù)自適應(yīng)IMM 算法,通過自適應(yīng)調(diào)整模型切換矩陣,從而提高了對目標(biāo)跟蹤的精度[8]?;谫|(zhì)點運動的航跡預(yù)測,需要依賴大量先驗條件。而基于狀態(tài)估計的方法,所構(gòu)建的模型往往難以充分捕捉航跡信息中復(fù)雜的非線性關(guān)系,在特征提取方面存在較大局限性。
機(jī)器學(xué)習(xí)算法的快速發(fā)展,為航跡預(yù)測提供了新的方法。這種方法是將航跡預(yù)測轉(zhuǎn)化為多維時間序列預(yù)測問題,通過挖掘航空器的航跡特征隨時間變化的關(guān)系進(jìn)行航跡預(yù)測,具有從大量數(shù)據(jù)中學(xué)習(xí)復(fù)雜模式和捕捉非線性關(guān)系的能力,已經(jīng)成為航跡預(yù)測的研究熱點。Wu 等人為解決傳統(tǒng)航跡預(yù)測方法不能滿足多維度和實時性的問題,提出了基于誤差反向傳播(Back Propagation,BP)神經(jīng)網(wǎng)絡(luò)的4D 航跡預(yù)測方法[9]。Shi 等提出了一種基于長短期記憶(Long Short-Term Memory,LSTM)網(wǎng)絡(luò)的航跡預(yù)測模型,利用LSTM 捕捉航跡的時間依賴關(guān)系[10]。石慶研等考慮飛機(jī)過程中不確定因素對預(yù)測航跡的影響,設(shè)計了基于在線更新的LSTM 模型,有效提升預(yù)測精度[11]。針對輸入信息有限的問題,TRAN等引入豐富的飛機(jī)意圖數(shù)據(jù),使用CNN 和GRU 實現(xiàn)了低方差的航跡預(yù)測[2]。Zeng等設(shè)計了序列到序列的深度長短期記憶網(wǎng)絡(luò)(Sequence-to-Sequence Deep Long Short-Term Memory Network,SS-DLSTM),來提取航跡之間的長、短時間依賴性和重復(fù)性[12]。為了捕捉航跡復(fù)雜的時空關(guān)系,Ma 等人使用1D-CNN 對原始航跡數(shù)據(jù)進(jìn)行卷積,融合了卷積核內(nèi)多個變量的空間信息,再用LSTM 挖掘航跡時間維度的信息[13]。Jia 等人使用LSTM 對航跡進(jìn)行隱藏特征提取,引用注意力機(jī)制對LSTM 輸出的隱藏狀態(tài)向量的每個特征維度進(jìn)行打分,增強(qiáng)關(guān)鍵特征維度影響[14]。文獻(xiàn)[13]和文獻(xiàn)[14]在循環(huán)神經(jīng)網(wǎng)絡(luò)LSTM 的基礎(chǔ)上,分別使用CNN 捕獲航跡數(shù)據(jù)空間特征和引入注意力機(jī)制提高了航跡預(yù)測精度。本研究同時將CNN 和注意力機(jī)制融合到GRU 模型上,設(shè)計了時間特征通道和空間特征通道,進(jìn)一步改善航跡預(yù)測的性能。
本文為探尋航跡變量的時空特征,實現(xiàn)多步高精度的航跡預(yù)測,提出了融合時空特征的Encoder-Decoder 短期4D 航跡預(yù)測模型。Encoder 含有時間特征通道和空間特征通道,時間特征通道使用GRU獲取某個變量的時序模式,空間特征通道先使用級聯(lián)GRU-CNN 網(wǎng)絡(luò)對航跡多變量進(jìn)行高級特征提取并實現(xiàn)信息交互,再通過注意力機(jī)制對高級特征進(jìn)行加權(quán)分配,以增強(qiáng)關(guān)鍵特征的影響。在Decoder中,對Encoder 所產(chǎn)生的時空信息進(jìn)行拼接融合,使用GRU實現(xiàn)多步航跡預(yù)測。
本文研究的多步4D航跡預(yù)測,可以看作是一個序列到序列的任務(wù),根據(jù)歷史和當(dāng)前航跡信息來預(yù)測未來一段時間內(nèi)的航跡信息。定義飛機(jī)在第i時刻的4D 航跡信息為,其中分別代表飛機(jī)在第i時刻航跡點的經(jīng)度、緯度、高度和時間。輸入窗長為W的4D航跡信息P=[pt-W+1,pt-W+2,pt-W+3,…,pt]?∈RW×4,預(yù)測未來Q步的4D航跡信息。根據(jù)模型輸入是否需要更新,將多步預(yù)測方式分為兩類:迭代多步預(yù)測方法和直接多步預(yù)測方法。迭代多步預(yù)測方法通常采用遞歸方式進(jìn)行預(yù)測,該方法以單步預(yù)測為基礎(chǔ),將預(yù)測的一個航跡點與歷史航跡點拼接,通過滑動窗口更新模型的輸入,以此迭代多次實現(xiàn)多步航跡預(yù)測。直接多步預(yù)測模型可以直接從輸入序列中預(yù)測多個未來時間點的輸出結(jié)果,無須進(jìn)行多次迭代。
選擇哪種多步預(yù)測方式的主要考慮因素是在實際航跡預(yù)測應(yīng)用時有較高預(yù)測精度。由于預(yù)測階段,輸出的第q個航跡點與第q-1 個航跡點具有依賴關(guān)系,因此可以傳遞預(yù)測航跡點的狀態(tài)到下一個航跡點,以便更好的來進(jìn)行預(yù)測。而Encoder-Decoder 結(jié)構(gòu)可在預(yù)測輸出時實現(xiàn)狀態(tài)傳遞,該結(jié)構(gòu)由Cho 等人提出,應(yīng)用于自然語言處理(Natural Language Processing,NLP)領(lǐng)域的機(jī)器翻譯任務(wù)[15]。在多維時間序列預(yù)測任務(wù)中,該結(jié)構(gòu)有助于緩解預(yù)測誤差隨視野增加而急劇增加的問題[16]。Encoder按順序讀取輸入序列并編碼為固定長度的語義向量C,Decoder 則對語義向量C解碼并遞歸輸出,Encoder-Decoder結(jié)構(gòu)如圖1所示。
圖1 Encoder-Decoder結(jié)構(gòu)Fig.1 Encoder-decoder structure
航跡預(yù)測是一個多變量預(yù)測任務(wù),模型訓(xùn)練過程中以經(jīng)度、緯度、高度和時間的整體預(yù)測誤差加權(quán)求和最小化為目標(biāo),預(yù)測時可能會帶來局部變量預(yù)測精度損失的問題。實際應(yīng)用中,經(jīng)度和緯度的預(yù)測準(zhǔn)確性對預(yù)測點與真實點之間的距離影響更大,高度的影響較小,若經(jīng)度、緯度的預(yù)測精度得不到保障,會使預(yù)測航跡和真實航跡偏差較大。為避免局部變量預(yù)測精度損失,使用了四個多輸入單輸出的STED 模型進(jìn)行4D 航跡預(yù)測,為經(jīng)度、緯度、高度和時間建立單獨的預(yù)測模型,每個STED 模型所預(yù)測的航跡變量定義為目標(biāo)變量v(經(jīng)度、緯度、高度或時間)。每個模型訓(xùn)練時優(yōu)化單個航跡特征,預(yù)測輸出為目標(biāo)變量v的數(shù)值p(v)(其中v∈{lon,lat,alt,time}),從而提高整體的預(yù)測性能。四個Encoder接收航跡信息P,為每個目標(biāo)變量v捕獲了各自的時空特征作為語義向量C。四個Decoder 接收對應(yīng)Encoder 輸出的語義向量C并遞歸輸出目標(biāo)變量v,同時刻輸出組成一個4D 航跡預(yù)測點,基于STED 模型的航跡預(yù)測結(jié)構(gòu)如圖2所示。
圖2 基于STED的4D航跡預(yù)測結(jié)構(gòu)Fig.2 4D trajectory prediction structure based on STED
在每個STED 模型中,既要提取目標(biāo)變量v在時間窗口內(nèi)的時序模式,又要充分提取目標(biāo)變量v和所有變量依賴的空間信息。時序模式是指目標(biāo)變量v隨時間的變化規(guī)律,包括長期趨勢性和短期波動性。長期趨勢性反映了目標(biāo)變量v在較長時間尺度內(nèi)的整體變化趨勢,比如飛機(jī)由航路點A 飛往航路點B中,數(shù)據(jù)整體走向反映了長期變化趨勢;而短期波動性則反映了目標(biāo)變量v在較短時間尺度內(nèi)的波動,在實現(xiàn)飛往航路點B過程中,受其他不確定因素影響,會有波動性??臻g信息是指目標(biāo)變量v與全部航跡變量之間的依賴關(guān)系,它反映了全部變量對目標(biāo)變量v的影響程度。在航跡數(shù)據(jù)中,不同變量之間的依賴關(guān)系也是不同的。例如飛機(jī)在巡航階段,某個輸入時間窗口內(nèi)經(jīng)度的變化對未來時間段的高度影響不大,但對經(jīng)度本身的變化趨勢影響較大,因此獲取各變量的依賴關(guān)系有助于提升航跡預(yù)測精度。
根據(jù)這個建模策略,窗長為W的4D 航跡數(shù)據(jù)P作為STED 模型的輸入,Encoder 中使用時間特征通道學(xué)習(xí)目標(biāo)變量v在時間窗口內(nèi)的時序模式,使用空間特征通道學(xué)習(xí)目標(biāo)變量v和所有變量高階依賴關(guān)系,Decoder 輸出目標(biāo)變量v的Q步預(yù)測。STED 模型結(jié)構(gòu)如圖3 所示,圖中GRU 神經(jīng)網(wǎng)絡(luò)為按時間展開后的結(jié)構(gòu),設(shè)置GRU 隱藏層神經(jīng)元個數(shù)為m,CNN 卷積核個數(shù)為K。預(yù)測過程具體步驟如下。第一步,在4D 航跡數(shù)據(jù)P中,復(fù)制目標(biāo)變量v隨時間變化的序列并將其取出記為Pv=,將Pv作為時間特征通道的輸入,對目標(biāo)變量v進(jìn)行單序列時間建模。第二步,將4D 航跡數(shù)據(jù)P送入到由GRU、CNN 和Attention 構(gòu)成的空間特征通道進(jìn)行建模,做Attention 時查詢向量為時間特征通道的輸出,以確定哪些特征對目標(biāo)變量v影響更大,此時空間特征通道輸出為目標(biāo)變量v和所有變量高階交互的空間信息。最后,Decoder 對Encoder 所產(chǎn)生的語義向量(Encoder 中時間特征通道和空間特征通道的輸出)進(jìn)行拼接融合,使用GRU 遞歸輸出目標(biāo)變量v的Q步預(yù)測。
圖3 STED模型結(jié)構(gòu)Fig.3 STED model structure
2.3.1 時間特征通道
使用時間特征通道對歷史和當(dāng)前時間步的目標(biāo)變量v進(jìn)行建模,捕捉時序模式。循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)是最早用來對時間序列進(jìn)行建模的深度學(xué)習(xí)網(wǎng)絡(luò),序列的長期依賴性導(dǎo)致梯度消失和梯度爆炸的問題。LSTM 是RNN的一種變體,比RNN 多出了三個控制器,分別為輸入門、遺忘門、輸出門,可以緩解梯度消失和梯度爆炸問題,使其具有長期記憶的能力[17]。隨著不斷地研究和演化,又出現(xiàn)了與LSTM 具有相近性能的GRU,GRU 將LSTM 中輸入門和遺忘門融合為單一的更新門,GRU 擁有更少的參數(shù),所以訓(xùn)練效率更高。其神經(jīng)單元結(jié)構(gòu)如圖4所示,其中zt為更新門,控制前一時間步狀態(tài)信息輸入當(dāng)前狀態(tài)的程度;rt為重置門,決定前一時間步狀態(tài)的哪些信息被傳遞到候選狀態(tài)上。式(1)至(4)為t時間步GRU神經(jīng)單元狀態(tài)ht更新的計算公式。兼容訓(xùn)練效率與航跡預(yù)測精度,本文使用GRU對航跡序列進(jìn)行隱藏特征提取。
圖4 GRU神經(jīng)元結(jié)構(gòu)Fig.4 GRU neural network structure
式中σ和tanh 分別為sigmoid 和tanh 激活函數(shù),Wz、Wr和Wh是可訓(xùn)練的權(quán)重矩陣。在訓(xùn)練過程中,模型會根據(jù)序列中的不同飛行階段自動學(xué)習(xí)到適應(yīng)這些階段的權(quán)重矩陣,使得可訓(xùn)練的權(quán)重矩陣在不同飛行階段通用,來識別各個階段的航跡變化模式。
在時間特征通道,使用GRU 來學(xué)習(xí)目標(biāo)變量v的隱藏狀態(tài)。獲取每一個目標(biāo)變量v在窗口內(nèi)的數(shù)據(jù)p(v),送入到GRU 中取出最后時間步的隱藏狀態(tài)作為目標(biāo)變量v的隱藏狀態(tài),得到隱藏狀態(tài)向量,其中m是GRU 隱藏神經(jīng)元個數(shù)。隱藏狀態(tài)向量表達(dá)了目標(biāo)變量v在窗口內(nèi)的時序模式。獲取這一過程可表示為:
2.3.2 空間特征通道
航跡數(shù)據(jù)序列各變量之間存在潛在的依賴關(guān)系,使用級聯(lián)GRU-CNN 網(wǎng)絡(luò)對全部航跡變量進(jìn)行高級特征提取,使用注意力機(jī)制來獲取不同高級特征對目標(biāo)變量v的重要程度,實現(xiàn)目標(biāo)變量v和全部航跡變量的高階特征交互,提取變量之間依賴性的空間信息??臻g特征通道共分為三個階段。
第一階段:
GRU 對窗長為W的4D 航跡信息P進(jìn)行隱藏特征提取,輸出所有時間步的隱藏狀態(tài)向量并構(gòu)成隱藏特征矩陣H=[ht-W+1,ht-W+2,…,ht]∈Rm×W,隱藏特征矩陣是飛機(jī)的速度、加速度、時間和位置信息的高階表達(dá)。對于GRU 對航跡變化趨勢所提取的隱藏特征矩陣H而言,允許每一個維度具有相同的特征信息。每一行代表單個隱藏特征在各個時間步下的狀態(tài),每一列代表一個時間步中所有隱藏特征構(gòu)成的向量。
第二階段:
使用1D-CNN 對隱藏特征矩陣H進(jìn)行高級特征提取。1D-CNN 卷積核只在數(shù)據(jù)的某一個維度上進(jìn)行移動,主要應(yīng)用于對時間序列進(jìn)行高級特征提?。?8-20]。本文卷積核沿特征維度上進(jìn)行遍歷,這使得卷積核可以融合窗長W內(nèi)單個隱藏特征隨時間變化的高級信息。使用K個卷積核Ci∈R1×W,有助于單個隱藏特征變化趨勢的多角度表達(dá)。最終生成高級特征矩陣E∈Rm×K。對于CNN 輸出矩陣E中,Ei,j代表第i行的隱藏特征Hi和第j個卷積核Cj卷積產(chǎn)生的結(jié)果,結(jié)果Ei,j可表如式(6)所示。
第三階段:
目標(biāo)變量v和高級特征之間存在相互依賴關(guān)系,獲取這種空間信息有助于提升模型的預(yù)測精度。在此階段引入注意力機(jī)制,根據(jù)不同高級特征對目標(biāo)變量v的影響程度來計算權(quán)重,以增強(qiáng)對關(guān)鍵特征的提取,減少對噪聲特征的注意。常用的注意力打分方式有兩種:加性注意力和點積注意力。前者較為經(jīng)典[21],它使用含有隱藏層的前饋神經(jīng)網(wǎng)絡(luò)來計算注意力打分。后者通過計算兩個向量的相似度進(jìn)行打分,更有效的實現(xiàn)特征提?。?2],本文使用點積注意力機(jī)制打分。
使用注意力機(jī)制計算特征矩陣E中各行向量和隱藏狀態(tài)向量的相關(guān)情況,區(qū)分對目標(biāo)變量v的重要性,使用式(7)進(jìn)行打分,用式(8)獲得每一行的權(quán)重:
式中Ei代表CNN輸出的高級特征矩陣E的第i個行向量,Wa∈RK*m為可訓(xùn)練的權(quán)重矩陣。
對高級特征矩陣E的行向量進(jìn)行加權(quán)求和,得到含有空間信息的向量,提取出目標(biāo)變量v隱藏狀態(tài)向量影響大的關(guān)鍵信息。的第i維表示為:
Encoder 時間特征通道和空間特征通道的輸出作為Decoder 的輸入,對目標(biāo)變量v的時空特征進(jìn)行拼接融合,最終得到目標(biāo)變量v的時空特征向量:
在上述所提的STED 模型基礎(chǔ)上,結(jié)合數(shù)據(jù)處理、模型訓(xùn)練和應(yīng)用測試環(huán)節(jié),基于STED 模型的航跡預(yù)測完整流程,如圖5所示。
圖5 航跡預(yù)測流程圖Fig.5 Trajectory prediction process diagram
在模型訓(xùn)練之前需要構(gòu)造模型輸入數(shù)據(jù)和標(biāo)簽數(shù)據(jù)。在某航班歷史飛行次數(shù)為M的航跡集T={T1,T2,…,TM}中,使用滑動窗口方法對每條航跡進(jìn)行分割。從第一個航跡點開始,按照時序順序選取W個航跡點作為模型的輸入數(shù)據(jù),再選取所要預(yù)測的Q個點作為標(biāo)簽數(shù)據(jù),生成第一個樣本。接著將窗口移動到第二個航跡點,以生成第二個樣本。重復(fù)這個過程,直至窗口覆蓋到全部航跡點。t時刻的樣本如圖6 所示,行表示航跡變量經(jīng)度、緯度、高度和時間,列表示時序關(guān)系。最后將M條航跡分割后的結(jié)果堆疊在一起,形成最終的數(shù)據(jù)集。
圖6 滑窗構(gòu)建樣本示意圖Fig.6 Illustration of sliding window for sample construction
航跡是由不同數(shù)據(jù)特征構(gòu)成的時間序列,不同特征量綱不同且取值范圍差異較大。為避免影響航跡預(yù)測結(jié)果,通過式(11)對航跡特征進(jìn)行歸一化。使用歸一化后的數(shù)據(jù),一方面可以提升航跡預(yù)測模型的收斂速度,另一方面可以降低預(yù)測誤差。輸入模型的數(shù)據(jù)大小控制在[0,1]。
訓(xùn)練目標(biāo)是最小化預(yù)測輸出與真實值之間的誤差。首先建立STED 航跡預(yù)測模型并初始化參數(shù)。在參數(shù)迭代優(yōu)化的正向傳播過程之中,以式(12)作為模型的損失函數(shù),誤差反向傳播時采用Adam 優(yōu)化器對GRU、CNN 和FC 的權(quán)重和偏置進(jìn)行迭代更新,同時計算驗證集中預(yù)測值和標(biāo)簽值的loss,當(dāng)在驗證集上loss 減少時保存STED 中各層網(wǎng)絡(luò)的模型參數(shù),直到迭代次數(shù)到達(dá)最大值。本文采用Keras 深度學(xué)習(xí)框架進(jìn)行模型訓(xùn)練和驗證,并在硬件環(huán)境為Intel CPU i7-10700 2.9 GHz、16 GB內(nèi)存的計算機(jī)上進(jìn)行實驗。
式中N為訓(xùn)練樣本數(shù)量,是第τ步的預(yù)測值和真實值。
為驗證所提模型的性能,本文采用某航班從重慶機(jī)場到烏魯木齊機(jī)場的真實飛行歷史數(shù)據(jù)開展仿真實驗和分析。該飛行數(shù)據(jù)是由一系列離散航跡點組成的時間序列,數(shù)據(jù)特征包括航班號、飛機(jī)ID、數(shù)據(jù)接收時間、經(jīng)度、緯度、高度、俯仰、航向、地速等信息,數(shù)據(jù)時間間隔約為60 s。本文采用均方根誤差(Root Mean Square Error,RMSE)和平均絕對誤差(Mean Absolute Error,MAE)來評價模型預(yù)測的第τ步航跡點準(zhǔn)確性,計算如下:
式中N表示測試樣本數(shù)量。MAE 和RMSE 越小,表示模型預(yù)測結(jié)果與實際觀測值之間的差異越小。
為了比較不同多步預(yù)測方式對4D航跡預(yù)測精度的影響,本文分別構(gòu)建了基于STED的迭代多步預(yù)測和直接多步預(yù)測方法,并分別記為“IT”、“DI”。在IT方法中,Decoder只輸出未來一步的航跡信息,將預(yù)測下一點的航跡信息與歷史航跡數(shù)據(jù)進(jìn)行拼接,通過滑動窗口更新STED模型的輸入,如此迭代多次實現(xiàn)多步航跡預(yù)測。在DI方法中,Decoder中的GRU進(jìn)行循環(huán)輸出未來多步的航跡信息。本實驗中輸入時間窗口長度W為8,預(yù)測步長Q為10。表1中展示了第1步、第5步和第10步的各個變量預(yù)測誤差。
表1 不同多步預(yù)測方式RMSE和MAE值比較Tab.1 Comparison of RMSE and MAE values for different multi-step prediction methods
在表1 中可以看出,IT 方法的預(yù)測誤差隨時間急劇增加,這種結(jié)果是因為IT 方法以單步預(yù)測為基礎(chǔ)來輸出多個時間步長的預(yù)測結(jié)果,IT 方法每一次預(yù)測的誤差都會被累加到后續(xù)的預(yù)測中,導(dǎo)致誤差急劇增加。相較于IT方法而言,DI方法在整體上具有更高預(yù)測精度,分析原因可能在預(yù)測時,Decoder會逐步生成每個輸出元素,每次生成一個輸出元素時,都會考慮之前生成的元素和Encoder 的輸出。在這個過程中,Decoder 的狀態(tài)會根據(jù)之前生成的元素而改變,因此考慮了預(yù)測點之間的狀態(tài)傳遞問題,預(yù)測精度相對較高,使用DI方法作為STED模型的多步航跡輸出策略。
合理的超參數(shù)設(shè)定是神經(jīng)網(wǎng)絡(luò)訓(xùn)練中至關(guān)重要的因素,對于模型的性能和泛化能力具有重要影響。在本研究中,將預(yù)測的航跡點數(shù)Q設(shè)置為10,Encoder 和Decoder 中GRU 神經(jīng)元個數(shù)m相同且隱藏層數(shù)L都為1,同時Encoder 的空間特征通道中CNN 卷積核個數(shù)K設(shè)置為64。將批尺寸B設(shè)置為64,學(xué)習(xí)率μ設(shè)置為0.001,以確保模型能夠在訓(xùn)練時有效的更新權(quán)重。為了進(jìn)一步優(yōu)化模型的性能,對模型關(guān)鍵超參數(shù)進(jìn)行尋優(yōu)。輸入不同窗長的航跡點對航跡預(yù)測模型的性能產(chǎn)生不同影響。過短可能忽略關(guān)鍵時序信息,過長可能會增加冗余信息。隱藏神經(jīng)元個數(shù)m決定了神經(jīng)網(wǎng)絡(luò)的擬合程度。對關(guān)鍵超參數(shù)W和m在取值上進(jìn)行網(wǎng)格化搜索,搜索范圍為W={5,6,7,8,9,10}、m={32,64,128,256},得到24 種超參數(shù)組合下模型的驗證集loss。圖7為不同超參數(shù)下的實驗結(jié)果,當(dāng)使用歷史航跡窗口長度W=8,GRU 隱藏神經(jīng)元個數(shù)m=128時,驗證集loss取得最小值,模型預(yù)測效果較好。最終的模型參數(shù)如表2所示。
表2 模型超參數(shù)選擇Tab.2 Selection of model hyperparameters
圖7 不同超參數(shù)組合下的驗證集lossFig.7 The validation set loss for different combinations of hyperparameters
本文所提STED 航跡預(yù)測模型與效果較為先進(jìn)的數(shù)據(jù)驅(qū)動模型LSTM[10]、CNN-LSTM[13]、ATLSTM[14]進(jìn)行比較,以驗證本文模型的有效性。為了保證對比的公平性,我們將這三種模型與STED模型采用相同的多步預(yù)測方式進(jìn)行比較。如圖8和圖9 所示,計算預(yù)測航跡點的經(jīng)度、緯度、高度和時間的RMSE 和MAE 隨預(yù)測視野增加的曲線,來更清楚說明本文模型與對比模型的預(yù)測誤差。在圖8和圖9 中可以看出,本文模型在測試集整體上都取得了最好的航跡預(yù)測結(jié)果。在預(yù)測第一個航跡點時,STED 在各個維度上表現(xiàn)出色,達(dá)到了最佳的性能水平。相比之下,CNN-LSTM 和AT-LSTM 的性能相近,但都低于STED 模型,LSTM 所預(yù)測航跡點與真實航跡點存在著較大的偏差且性能最差。隨著預(yù)測視野的增加,四個模型的誤差都隨時間增加而增加,在整體數(shù)據(jù)上來看STED 波動更小。在多步預(yù)測時預(yù)測誤差隨時間增加是不能完全避免的,STED模型避免了誤差隨時間的急劇增加并獲得了較高的精度。特別的是,在時間維度的線性預(yù)測任務(wù)上,STED取得了更顯著的優(yōu)勢。
圖8 不同時間步各個模型RMSE值比較Fig.8 Comparison of RMSE values for different models at different time steps
圖9 不同時間步各個模型MAE值比較Fig.9 Comparison of MAE values for different models at different time steps
此外,如圖10 所示,在測試結(jié)果中選擇了轉(zhuǎn)彎處各個模型一次性預(yù)測的航跡(未來10 min 航跡),圖中箭頭為飛機(jī)運動方向。從整體趨勢來看,STED模型所預(yù)測航跡和真實航跡誤差更小,CNN-LSTM模型和AT-LSTM 模型具有相近的性能,LSTM 模型預(yù)測的航跡遠(yuǎn)遠(yuǎn)偏離真實航跡。分析具體原因為在飛行器轉(zhuǎn)彎過程,相鄰航跡點之間的各個特征值變化較為顯著,由于STED 模型能夠深度分析每個預(yù)測變量的時序模式和空間信息,并且可以在預(yù)測輸出時進(jìn)行隱藏狀態(tài)傳遞,因此STED 模型在航跡變化顯著的轉(zhuǎn)彎處預(yù)測效果更為準(zhǔn)確。
圖10 轉(zhuǎn)彎預(yù)測對比Fig.10 Comparison of turn prediction
為了進(jìn)一步驗證本文方法的性能,使用北京機(jī)場到西昌機(jī)場實際飛行數(shù)據(jù)來進(jìn)行4D 航跡預(yù)測實驗。各個模型的預(yù)測誤差如表3所示。
表3 北京-西昌飛行數(shù)據(jù)進(jìn)行實驗RMSE和MAE值比較Tab.3 Comparison of experimental RMSE and MAE values for Beijing-Xichang flight data
表3 可以看出,對于其他航班的實際飛行數(shù)據(jù),STED 模型預(yù)測精確度同樣優(yōu)于基線模型,表現(xiàn)出了較好的預(yù)測性能。由此得出,STED 模型網(wǎng)絡(luò)結(jié)構(gòu)較優(yōu),預(yù)測結(jié)果更加接近于真實飛行航跡。此外,預(yù)測一個航跡點的平均耗時為0.002 s,小于航跡間隔60 s,證明了STED 模型具有良好的實時性。
精準(zhǔn)的多步航跡預(yù)測是ATM 工具的基礎(chǔ)?;贜LP 中Encoder-Decoder 的結(jié)構(gòu)和分析單個預(yù)測變量的時空特征為建模思路,針對多步4D 航跡預(yù)測提出了一種融合時空特征的Encoder-Decoder 模型。隨后與LSTM、CNN-LSTM 和AT-LSTM 模型進(jìn)行對比,實驗結(jié)果表明本文所提的STED 模型具有更好的預(yù)測性能,為ATM 提供更加可靠的預(yù)測信息。在以后的研究中,引入更豐富的特征信息,如速度、轉(zhuǎn)向、俯仰等。同時改進(jìn)深度學(xué)習(xí)模型的結(jié)構(gòu),考慮使用圖神經(jīng)網(wǎng)絡(luò)等進(jìn)行航跡序列的時空特征建模,提升模型預(yù)測精度。