王飛,韓翔宇
中國民航大學(xué) 空管學(xué)院,天津 300300
隨著空中交通需求的持續(xù)快速增長,以航班個體為控制對象的傳統(tǒng)空中交通管理模式在大型復(fù)雜任務(wù)求解的復(fù)雜性、實(shí)時性和魯棒性等方面面臨不可逾越的瓶頸。未來空中交通管理模式將從“單個航班控制”向“交通流群體管理”方式發(fā)生革命性改變。
空中交通流量(簡稱流量)是描述空中交通流的核心指標(biāo)之一。流量預(yù)測是對未來一段時間、在某一空域范圍內(nèi)航空器數(shù)量的估計。根據(jù)預(yù)測時間范圍的不同,流量預(yù)測又可分為中長期預(yù)測和短期預(yù)測。流量中長期預(yù)測服務(wù)于流量管理的戰(zhàn)略階段,一般以年、月、日為單位,為制定發(fā)展戰(zhàn)略、空域規(guī)劃、航班時刻表調(diào)整等提供參考。流量短期預(yù)測服務(wù)于流量管理的戰(zhàn)術(shù)階段,一般以小時、分鐘為單位,對未來24小時內(nèi)交通流量的預(yù)測,動態(tài)實(shí)時性很強(qiáng),對空管運(yùn)行更具指導(dǎo)作用和實(shí)際意義。空中交通流量短期預(yù)測對于空中交通流優(yōu)化與管理的有效性和精準(zhǔn)性具有導(dǎo)向作用,是空中交通流量管理中迫切需要解決的基礎(chǔ)性問題。
在研究初期,由于交通密度小,外部人為和天氣干預(yù)對飛行計劃造成的擾動較小,主要通過預(yù)測航空器的4D航跡來分析進(jìn)入和離開扇區(qū)的時間,從而統(tǒng)計出一段時間內(nèi)扇區(qū)的流量。這一階段的預(yù)測方法雖然經(jīng)歷了從確定型到概率型的改進(jìn),但是以單個航班為控制對象依然存在弊端:一方面難以解決大規(guī)模的計算難題,另一方面忽略了大量航空器所構(gòu)成的交通流因交互作用而形成的內(nèi)在非線性特征和演化規(guī)律。隨后,在“交通流群體管理”理念指引下,以時間序列為手段,諸多學(xué)者發(fā)現(xiàn)空中交通流具有混沌、分形等典型非線性特征,應(yīng)用混沌理論進(jìn)行流量短期預(yù)測也取得一些成果。楊陽建立了流量時間序列混沌特性動態(tài)識別方法,提出了基于人工神經(jīng)網(wǎng)絡(luò)的空中交通流量時間序列預(yù)測算法,取得了較好的預(yù)測效果,但是神經(jīng)網(wǎng)絡(luò)模型的參數(shù)敏感性、過度擬合、消耗時間長等問題沒有得到本質(zhì)上解決。王超等研究了基于改進(jìn)加權(quán)一階局域法的混沌交通流量時間序列預(yù)測模型,但是相空間重構(gòu)過程中諸如嵌入維數(shù)、延遲時間等參數(shù)的選擇主觀性較大,導(dǎo)致結(jié)果并不穩(wěn)定。
不同于混沌,分形理論是基于部分與整體的自相似性,從部分出發(fā)來確立整體的性質(zhì),沿著微觀到宏觀的方向展開的。現(xiàn)實(shí)社會中,絕大多數(shù)系統(tǒng)并非嚴(yán)格意義上分形系統(tǒng),而是統(tǒng)計意義的分形系統(tǒng)。分形預(yù)測模型有兩大類:一類是分形分布模型,適用于隨著特征線度增大也呈現(xiàn)增長趨勢的數(shù)據(jù)預(yù)測,比如股票價格、居民消費(fèi)價格指數(shù)、宏觀交通量等,通常以年、月、日為統(tǒng)計單位進(jìn)行中長期預(yù)測;另一類是應(yīng)用分形自仿射特征的分形插值模型,通過構(gòu)建迭代函數(shù)系(Iterated Function Systems,IFS)來擬合數(shù)據(jù),并外推實(shí)現(xiàn)預(yù)測,適用于具有明顯周期性的數(shù)據(jù),比如電力負(fù)荷、城市用水量、地面交通流等,通常是以小時(h)、分鐘(min)為統(tǒng)計單位進(jìn)行短期預(yù)測。
與電力負(fù)荷、地面交通流類似,空中交通流每天的變化具有一定的相似性或周期性,但應(yīng)用分形插值模型預(yù)測空中交流的研究尚未見諸于報導(dǎo)。本文以流量時間序列為研究對象,首先應(yīng)用重標(biāo)極差(Rescaled Range Analysis,R/S)方法識別其分形特征,然后應(yīng)用分形插值模型建立每個相似日流量數(shù)據(jù)的IFS,并通過加權(quán)求和構(gòu)建預(yù)測日的IFS,進(jìn)而實(shí)現(xiàn)流量預(yù)測。
應(yīng)用分形插值模型的前提是時序數(shù)據(jù)具有自相似性或統(tǒng)計上自相似性。R/S方法通過分析時序數(shù)據(jù)不同時間尺度的統(tǒng)計特性變化規(guī)律來研究自相似性特征。該方法將原始時間序列劃分為若干個子序列,對每個子序列按照式(1)計算,即可得到該時間序列的Hurst指數(shù)。
(1)
式中:為所考察的時間序列的時間區(qū)間,每個時間區(qū)間內(nèi)的流量值組成子時間序列,如[2,5,7,…,9];和分別為第個子時間序列的極差和標(biāo)準(zhǔn)差;為一個常數(shù),由模型擬合自動確定;表示Hurst指數(shù);(,)為第個子序列累計離差;表示原始時間序列中的第個數(shù)值;表示第個子時間序列的均值。
繪制lg~lg()曲線圖,應(yīng)用回歸分析計算斜率,即為Hurst指數(shù)。當(dāng)=0.5表示觀測序列是隨機(jī)變化的,無規(guī)律可循,不可預(yù)測;否則說明觀測時序具有分形特征,即具備自相似性,可以短期預(yù)測。
分形插值函數(shù)是根據(jù)給定的插值點(diǎn)構(gòu)造相應(yīng)的IFS,使得該IFS形成的吸引子通過全部插值點(diǎn)。根據(jù)吸引子定理和分形拼貼定理,利用該IFS從此函數(shù)空間的任一初始點(diǎn)開始迭代,得到的吸引子都為通過該組插值點(diǎn)的函數(shù)圖象。這就為應(yīng)用分形插值模型進(jìn)行預(yù)測奠定了理論基礎(chǔ)。
將一維小時流量時間序列按照時間先后順序進(jìn)行排序,通過添加數(shù)據(jù)序號構(gòu)建二維流量數(shù)組{(,)∈R,且<,…,<,=1,2,…,}。如將一維[2,5,7,…,9]轉(zhuǎn)換為二維[(1,2),(2,5),(3,7),…,(100,9)],通過構(gòu)造IFS{R,,=2,…,},使得吸引子是內(nèi)插數(shù)據(jù)的連續(xù)函數(shù):[,]→R繪制的圖像??梢?確定分形插值函數(shù)的核心就是計算出,具體表達(dá)式為
(2)
并且滿足
(3)
(4)
式中:(,)為二維數(shù)組某個點(diǎn)的坐標(biāo),表示序號,表示對應(yīng)的流量值;為IFS中第個仿射變換關(guān)系;、為仿射變換矩陣的元素;和為變換后的常數(shù)。將垂直比例因子∈(-1,1)作為自由變量,則可得到
(5)
可見,只要計算出,即可確定中的相關(guān)參數(shù)和分形插值函數(shù),再根據(jù)確定型和隨機(jī)型迭代算法,進(jìn)行多次迭代,將形成一條穩(wěn)定的IFS吸引子曲線,不僅通過插值點(diǎn),也與原曲線充分逼近。此時的IFS本質(zhì)上是對歷史數(shù)據(jù)進(jìn)行插值操作,針對多組歷史數(shù)據(jù)將多個IFS加權(quán)求和形成1個IFS,用于生成預(yù)測數(shù)據(jù)的吸引子圖像,進(jìn)而實(shí)現(xiàn)數(shù)據(jù)預(yù)測。
垂直比例因子關(guān)乎插值圖形的形狀,對插值結(jié)果有極大影響。文獻(xiàn)[24]采用在[0,1]區(qū)間隨機(jī)取值,該方法雖然簡單,但沒能有效利用相鄰插值區(qū)間的差異性,無法精準(zhǔn)刻畫插值函數(shù)形狀。文獻(xiàn)[25]中解析法是基于等間距的離散點(diǎn)集給出的,而實(shí)際應(yīng)用中存在大量非等間距的點(diǎn)集,因此應(yīng)用受限。本文采用可應(yīng)用于非等間距的離散點(diǎn)集、能反映數(shù)據(jù)點(diǎn)分布性質(zhì)的計算方法——解析法。
(6)
3個中間變量、、的計算式為
(7)
式中:滿足
≤+≤+1
(8)
空中交通流每天24個小時流量走勢也具有一定相似性,因此可利用過去幾個相似日的流量數(shù)據(jù),預(yù)測未來24小時流量值。具體步驟如下:
選擇個相似日。相似日的選擇方法有多種,以預(yù)測日為起點(diǎn),向前順次選擇連續(xù)天作為相似日。每個相似日數(shù)據(jù)是由24個數(shù)值組成的時間序列。
針對每個相似日數(shù)據(jù),確定插值點(diǎn)集合。通常情況,將數(shù)據(jù)極值點(diǎn)、拐點(diǎn)設(shè)置為插值點(diǎn),由于24個小時數(shù)據(jù)計算量不大,本文將24個數(shù)據(jù)點(diǎn)均作為插值點(diǎn)。
建立每日流量數(shù)據(jù)的IFS。根據(jù)式(2)~式(8),可確定所有天的IFS。
對已求得的個IFS進(jìn)行加權(quán)求和,得到1個統(tǒng)計意義上IFS。權(quán)重選取可按照“近大遠(yuǎn)小”的原則進(jìn)行賦值,賦予離預(yù)測日越近的相似日IFS越高的權(quán)值。
在加權(quán)IFS基礎(chǔ)上,從任意一點(diǎn)開始迭代即可得到吸引子,即由歷史數(shù)據(jù)擬合而成的預(yù)測日流量數(shù)據(jù)曲線。
吸引子曲線上的點(diǎn)坐標(biāo)極有可能不是整數(shù),不符合流量數(shù)據(jù)的要求。針對1~24中每一個整數(shù)橫坐標(biāo),設(shè)定參數(shù),計算橫坐標(biāo)在[-,+]范圍內(nèi)所有點(diǎn)的縱坐標(biāo)的均值,將其取整即為預(yù)測的。
根據(jù)式(9)計算均衡系數(shù)和平均絕對相對誤差。數(shù)值越大預(yù)測效果越好,數(shù)值越小預(yù)測效果越好。
(9)
(10)
采集三亞01號扇區(qū)2017年9月22日—10月27日運(yùn)行數(shù)據(jù),除了9月30日因采集技術(shù)原因?qū)е聰?shù)據(jù)異常外,一共35天運(yùn)行數(shù)據(jù)。期間并沒有出現(xiàn)明顯的強(qiáng)干擾事件,可以認(rèn)為本文使用的數(shù)據(jù)為常態(tài)下的運(yùn)行數(shù)據(jù)。前34天數(shù)據(jù)用于分析與預(yù)測,第35天10月27日(星期五)數(shù)據(jù)用于驗(yàn)證預(yù)測結(jié)果準(zhǔn)確性。
以60 min為統(tǒng)計尺度構(gòu)造流量時間序列,并采用R/S分析法繪制的lg~lg()曲線如圖1所示。計算出的Hurst指數(shù)為0.333 6,分形維數(shù)為1.666 4,說明所研究時間序列數(shù)據(jù)具有分形特征,可以應(yīng)用分形理論進(jìn)行研究。
圖1 Hurst指數(shù)擬合曲線Fig.1 Fitting curve of Hurst exponent
01和04號扇區(qū)屬于高低扇,雖然存在合扇運(yùn)行的可能,但是所使用的歷史流量數(shù)據(jù)統(tǒng)計是按照獨(dú)立01號扇區(qū)范圍(含高度范圍)進(jìn)行統(tǒng)計,預(yù)測的流量值也是針對獨(dú)立01號扇區(qū)范圍的。因此,所研究的01號扇區(qū)范圍和航路航線結(jié)構(gòu)是固定不變的,無論選擇哪一天作為相似日,都是具有相同的空域結(jié)構(gòu)。
通常,離預(yù)測日越近,其數(shù)據(jù)影響越大,可以選擇預(yù)測日前幾天作為相似日。選擇10月20日—10月26日共7日數(shù)據(jù),每天的流量變化趨勢如圖2所示。
圖2 空中交通流量曲線Fig.2 Curves of air traffic flow
從圖2可以看出,每日的24小時流量雖然部分時段的極值分布有差異,但整體變化趨勢是一致的,說明每一天的小時流量分布具有相似性,預(yù)測日的數(shù)據(jù)變化趨勢也應(yīng)與此類似,利用相似日數(shù)據(jù)進(jìn)行預(yù)測是可行的。
應(yīng)用10月20日—10月26日數(shù)據(jù),采用解析法生成7個IFS。由于分形系統(tǒng)受近期影響較大,而航空公司同在星期五的飛行計劃相似度也較高,因此將10月20日(同為周五)和10月26日(最近一天)生成的IFS權(quán)重設(shè)置高一些,其余IFS權(quán)重小一些,從而將7個IFS加權(quán)求和,形成統(tǒng)計意義上的1個IFS。從任意已知點(diǎn)出發(fā),采用確定型迭代方法,經(jīng)過4次迭代,即可獲得預(yù)測日流量的吸引子圖像,如圖3所示。
圖3 預(yù)測流量的吸引子圖像Fig.3 Attractor image of forecast flow
根據(jù)該吸引子計算得到的24個小時流量預(yù)測值如表1所示,變化趨勢如圖4所示,預(yù)測絕對誤差如圖5所示,計算出的為0.957 4、為0.086 7,預(yù)測結(jié)果較好。產(chǎn)生誤差可能的原因,一方面原始數(shù)據(jù)集合不是嚴(yán)格意義上,而是統(tǒng)計意義上的的分形集合,另一方面原數(shù)據(jù)有噪聲。
表1 預(yù)測流量值Table 1 Predicted flow value 架次
圖4 小時流量預(yù)測結(jié)果Fig.4 Hourly flow forecast results
采用隨機(jī)因子法計算垂直比例因子,得到的預(yù)測結(jié)果為0.957 1、為0.079 8,與解析法并沒有顯著差異。
圖5 預(yù)測絕對誤差Fig.5 Absolute error of prediction
以預(yù)測日為起點(diǎn),順序選擇之前的1~14日作為相似日,研究不同相似日數(shù)量對預(yù)測結(jié)果的影響,如圖6所示。
圖6 不同相似日數(shù)量對應(yīng)的預(yù)測結(jié)果Fig.6 Forecast results corresponding to different characteristic days
從圖6可以看出,采用的相似日數(shù)量在7日以內(nèi)時,預(yù)測結(jié)果的和數(shù)值不穩(wěn)定,7日以上時預(yù)測結(jié)果的和數(shù)值變化不大。對于本算例而言,選擇12個相似日,對應(yīng)的和最優(yōu),分別為0.959 9和0.093 2。
在流量管理實(shí)際工作中,除了預(yù)測統(tǒng)計尺度為60 min的流量之外,往往還需要預(yù)測統(tǒng)計尺度為30 min和15 min的流量。按照相同的方法,計算的Hurst指數(shù)分別為0.392 9和0.380 3。選擇7天臨近相似日,預(yù)測結(jié)果如圖7和圖8所示。在小統(tǒng)計尺度條件下,由于有部分真實(shí)值為0,導(dǎo)致為無窮大,因此本部分只采用來分析預(yù)測結(jié)果。
圖7 30 min流量預(yù)測結(jié)果Fig.7 Flow forecast results per 30 min
圖8 15 min流量預(yù)測結(jié)果Fig.8 Flow forecast results per 15 min
從圖7和圖8可以看出,預(yù)測結(jié)果能反映流量整體變化趨勢,但隨著統(tǒng)計尺度變小,數(shù)值波動性變大。計算出的分別為0.925 9和0.875 7,說明統(tǒng)計尺度變小,預(yù)測準(zhǔn)確性有所下降。
航班具有周計劃的特點(diǎn),在同一航季周期內(nèi),理論上,相同周天具備相似場景。因此,除了選擇臨近相似日,也可以選擇相同周天相似日。本文預(yù)測日10月27日是周五,選擇9月8日—10月20日共7個周五作為相似日,最近的3日權(quán)值取0.2,其余天取0.1,計算得到為0.954 0,為0.106 5,與臨近相似日預(yù)測結(jié)果差別不大。究其原因,由于航班運(yùn)行過程中受到諸多不確定因素影響,即便是相同飛行計劃也可能產(chǎn)生不同的運(yùn)行結(jié)果,航班計劃與實(shí)際運(yùn)行狀況存在差異,航班計劃相似性并不直接導(dǎo)致相同周天小時流量分布相似性,因此相同周天相似日也能獲得較好預(yù)測結(jié)果,但并沒有明顯優(yōu)于臨近相似日預(yù)測結(jié)果。
傳統(tǒng)的時間序列預(yù)測方法有自回歸模型(Auto Regressive,AR)、移動平均模型(Moving Average,MA)及自回歸移動平均模型(Auto Regressive and Moving Average,ARMA),采用臨近7日相似日數(shù)據(jù)進(jìn)行預(yù)測,結(jié)果如表2所示。從表2可以看出,傳統(tǒng)時序預(yù)測方法預(yù)測結(jié)果明顯劣于本文方法,說明對于非線性分形時序數(shù)據(jù),本文方法有更好的適應(yīng)性。
表2 不同方法預(yù)測結(jié)果比較
驗(yàn)證了空中交通流具有非線性分形特征,應(yīng)用分形插值模型構(gòu)建了流量時序的IFS,并在此基礎(chǔ)上實(shí)現(xiàn)了流量預(yù)測,得到以下結(jié)論:
1) 應(yīng)用分形插值模型建立相似日的IFS,從而進(jìn)行24小時流量的短期預(yù)測是可行的和有效的。非嚴(yán)格分形集合是產(chǎn)生預(yù)測誤差的主要原因。
2) 相似日數(shù)量對于預(yù)測結(jié)果有一定影響,針對本文算例,相似日數(shù)量在7日以上時,預(yù)測效果相差不大。臨近相似日和相同周天相似日的預(yù)測結(jié)果沒有顯著差異。
3) 統(tǒng)計尺度越小,數(shù)據(jù)波動性越大,預(yù)測效果越差。對于這一類數(shù)據(jù),可考慮采用分解集成方法,有效降噪后再進(jìn)行預(yù)測。
4) 相對于AR、MA和ARMA等傳統(tǒng)時序預(yù)測方法,分形插值法對于非線性分形時序數(shù)據(jù)預(yù)測具有更好適應(yīng)性。
5) 由于每天的空中交通流量時序數(shù)據(jù)具有較好的周期性,采用分形插值方法取得了較好預(yù)測效果,然而對于周期性較差的時序數(shù)據(jù),分形插值方法的適用性還需進(jìn)一步驗(yàn)證。