邢志偉,劉子碩,羅 謙+,文 濤,陳肇欣,代 軍
(1.中國(guó)民航大學(xué) 電子信息與自動(dòng)化學(xué)院,天津 300300; 2.中國(guó)民用航空局第二研究所工程技術(shù)研究中心,四川 成都 610041)
近年來(lái),智能綜合交通發(fā)展迅速,民航機(jī)場(chǎng)陸側(cè)綜合交通高效運(yùn)行也成為行業(yè)關(guān)注的熱點(diǎn)問(wèn)題[1]。相比國(guó)外迪拜、亞特蘭大等大型機(jī)場(chǎng)航班中轉(zhuǎn)率超過(guò)50%,國(guó)內(nèi)大型機(jī)場(chǎng)北京首都、廣州白云等機(jī)場(chǎng)航班中轉(zhuǎn)率只有約10%[2],國(guó)內(nèi)機(jī)場(chǎng)高比例的目的地直達(dá)進(jìn)港旅客使得陸側(cè)換乘客流龐大,從而對(duì)陸側(cè)綜合交通資源的高效運(yùn)行和協(xié)同調(diào)度提出更高的要求。對(duì)機(jī)場(chǎng)而言,要做好陸側(cè)資源協(xié)同調(diào)度的關(guān)鍵點(diǎn)之一就是應(yīng)實(shí)時(shí)準(zhǔn)確掌控進(jìn)港旅客的流動(dòng)態(tài)勢(shì)。機(jī)場(chǎng)進(jìn)港旅客到達(dá)口是旅客從航空換乘地面交通的關(guān)鍵節(jié)點(diǎn),因此對(duì)到達(dá)口旅客人數(shù)進(jìn)行短時(shí)預(yù)測(cè)是掌握進(jìn)港旅客流動(dòng)態(tài)勢(shì)的基礎(chǔ)。
對(duì)到達(dá)口旅客人數(shù)進(jìn)行預(yù)測(cè)的關(guān)鍵是對(duì)旅客下機(jī)后的流動(dòng)過(guò)程及態(tài)勢(shì)進(jìn)行建模。在航班落地至旅客到達(dá)航站樓聚散大廳過(guò)程中,機(jī)位距離遠(yuǎn)近直接影響旅客在航站樓內(nèi)的步行時(shí)間,因此機(jī)位距離是預(yù)測(cè)模型中的重要影響因素;分析旅客下機(jī)流程,進(jìn)港旅客與其它交通樞紐相比多了提取行李環(huán)節(jié),因在行李提取過(guò)程中旅客提取行李的實(shí)際時(shí)間和數(shù)量難以采集,所以將行李總數(shù)作為影響旅客到達(dá)口人數(shù)預(yù)測(cè)的特征因素之一。根據(jù)旅客快速換乘的出行需求,航班落地、上輪擋、開(kāi)艙門(mén)等時(shí)間信息決定了旅客何時(shí)能下機(jī)進(jìn)入陸側(cè)換乘區(qū),在一定程度上影響了旅客的換乘心理和需求[3],使得旅客出行選擇和步行速度發(fā)生變化,這類(lèi)時(shí)間信息可統(tǒng)一定義為航班信息時(shí)間以作用于預(yù)測(cè)模型。通過(guò)對(duì)上述旅客下機(jī)流動(dòng)過(guò)程的特征信息量化建模后,可實(shí)現(xiàn)到達(dá)口旅客人數(shù)預(yù)測(cè)。
研究者們已經(jīng)提出了許多典型的客流預(yù)測(cè)模型,目前已經(jīng)在回歸模型[4,5]、機(jī)器學(xué)習(xí)模型[6,7]和混合模型[8,9]等方面取得了部分研究成果。在對(duì)進(jìn)港旅客使用客流預(yù)測(cè)模型時(shí)發(fā)現(xiàn)不同航班旅客因存在步行距離、是否提取行李以及提取行李等待時(shí)間等因素的差異,因此不同航班旅客離開(kāi)到達(dá)口規(guī)律存在較大差異。傳統(tǒng)回歸模型中,依靠歷史數(shù)據(jù)建立統(tǒng)計(jì)模型的方法實(shí)現(xiàn)客流預(yù)測(cè)精度難以提高;機(jī)器學(xué)習(xí)模型中的K近鄰算法可以通過(guò)篩選數(shù)據(jù)中的相關(guān)性數(shù)據(jù)樣本,減小無(wú)關(guān)歷史數(shù)據(jù)對(duì)預(yù)測(cè)的影響,以提高距離、行李提取等重要特征因素影響下的模型預(yù)測(cè)精度[10]。考慮到航站樓離港客流量短期的周期性變化易受到天氣、航班延誤等不確定因素影響,針對(duì)其復(fù)雜的非線性特點(diǎn),以往有研究提出先用K近鄰計(jì)算相匹配的歷史航班,再用K近鄰實(shí)現(xiàn)離港人數(shù)預(yù)測(cè)的雙層K近鄰算法,提高了離港旅客短時(shí)預(yù)測(cè)精度[11]。林培群等[12]面對(duì)地鐵客流發(fā)展模式具有一定規(guī)律的特點(diǎn),提出基于誤差變化率的計(jì)算方式,從而自動(dòng)獲取合適K值提高預(yù)測(cè)精度。以上模型大多以客觀環(huán)境因素特征作為模型輸入,預(yù)測(cè)時(shí)忽略了時(shí)間導(dǎo)致的旅客主觀因素對(duì)旅客流動(dòng)態(tài)勢(shì)的影響。
航班信息時(shí)間作為描述旅客主觀感受的抽象化特征,可以通過(guò)構(gòu)建時(shí)間價(jià)值函數(shù)的方式進(jìn)行量化描述。時(shí)間價(jià)值函數(shù)最早由Kahneman等[13]提出,在金融經(jīng)濟(jì)學(xué)領(lǐng)域針對(duì)期望效用理論存在的整體風(fēng)險(xiǎn)預(yù)估不足,將隨時(shí)間的收益定義為凹函數(shù),損失定義為凸函數(shù),從而對(duì)某項(xiàng)投資整體做出風(fēng)險(xiǎn)計(jì)算。在交通領(lǐng)域,近些年學(xué)者們展開(kāi)對(duì)出行者在時(shí)間約束下的感知研究[14-16]。宗剛等[17]在居民出行中借鑒時(shí)間價(jià)值函數(shù)理論對(duì)居民時(shí)間成本加以考慮,提出累積前景理論更適用于出行方式研究,實(shí)現(xiàn)了居民出行不同交通方式時(shí)間滿意度的整體感知計(jì)算。姚蘭[18]選取通勤者在出行方式選擇的兩個(gè)參照點(diǎn):行程所用時(shí)間和行程所需費(fèi)用,借鑒時(shí)間價(jià)值函數(shù)中的收益與損失概念解決了上班者在通勤過(guò)程中不同目的地導(dǎo)致的感知數(shù)值差異的計(jì)算問(wèn)題。
基于上述對(duì)時(shí)間價(jià)值的研究,本文通過(guò)刻畫(huà)旅客對(duì)航班信息時(shí)間的感知模型,在傳統(tǒng)K近鄰算法的基礎(chǔ)上,平衡主要因素的影響得到加權(quán)歐式距離,最終建立基于航班信息時(shí)間價(jià)值函數(shù)的雙加權(quán)K近鄰模型實(shí)現(xiàn)對(duì)進(jìn)港旅客到達(dá)口的人數(shù)預(yù)測(cè)。
根據(jù)上文對(duì)旅客下機(jī)后流動(dòng)過(guò)程的影響因素分析,設(shè)計(jì)了如圖1所示的到達(dá)口旅客人數(shù)預(yù)測(cè)思路。首先針對(duì)旅客下機(jī)至到達(dá)口的整體流程,提取機(jī)位距離、行李總數(shù)、航班信息時(shí)間作為進(jìn)港旅客到達(dá)口人數(shù)的影響特征,構(gòu)建航班信息時(shí)間價(jià)值函數(shù)。其次在傳統(tǒng)K近鄰算法的基礎(chǔ)上改善K值的量化方法,將行李總數(shù)與時(shí)間價(jià)值函數(shù)量化后的航班信息時(shí)間與機(jī)位距離輸入到改進(jìn)的加權(quán)歐氏距離中,從而實(shí)現(xiàn)基于時(shí)間價(jià)值函數(shù)的雙加權(quán)K近鄰混合模型預(yù)測(cè)。
將進(jìn)港航班信息時(shí)間類(lèi)比影響旅客主觀心理變化的時(shí)間節(jié)點(diǎn),航班的時(shí)間差異導(dǎo)致旅客感知數(shù)值發(fā)生變化,符合時(shí)間價(jià)值理論感知數(shù)值的變化準(zhǔn)則,故將其作為航班信息時(shí)間特征的量化方法。假設(shè)進(jìn)港航班的落地時(shí)間為ta, 上輪擋時(shí)間ts, 開(kāi)艙門(mén)時(shí)間to, 第一位旅客步行至到達(dá)口時(shí)間tf與最后一位旅客步行至到達(dá)口時(shí)間tl為參考點(diǎn)時(shí)間。
定義國(guó)內(nèi)進(jìn)港航班旅客在進(jìn)港換乘過(guò)程中,旅客隨航班信息時(shí)間的心理感受和換乘需求變化的價(jià)值函數(shù)符合負(fù)值向正值過(guò)渡的分布規(guī)律,具有負(fù)值和正值感受非對(duì)稱(chēng)的特征。
航班信息時(shí)間價(jià)值函數(shù)如圖2所示。
依據(jù)時(shí)間價(jià)值感知理論[19],旅客在ta與ts之間時(shí),受到航班業(yè)務(wù)節(jié)點(diǎn)時(shí)間的約束旅客不具有主動(dòng)權(quán),旅客想離開(kāi)飛機(jī)的狀態(tài)需求受到制約,于是產(chǎn)生損失感受,因此為負(fù)區(qū)間;當(dāng)飛機(jī)停下后,旅客具有了自己的主動(dòng)權(quán)開(kāi)始收拾行李、排隊(duì)下機(jī),航班時(shí)間節(jié)點(diǎn)對(duì)旅客的下機(jī)需求約束逐漸弱化,旅客正值感受呈現(xiàn)上升趨勢(shì);開(kāi)艙門(mén)后旅客完全具有主動(dòng)權(quán)而進(jìn)入航站樓,因此旅客的時(shí)間價(jià)值達(dá)到最大值;下機(jī)后因提取行李或其它隨機(jī)因素(如尋找行李推車(chē)、接打電話等)影響旅客時(shí)間感知價(jià)值逐漸下降,當(dāng)位于到達(dá)口時(shí),旅客關(guān)注度由離開(kāi)飛機(jī)轉(zhuǎn)移到交通換乘,航班時(shí)間信息對(duì)旅客的約束逐漸消失,旅客的航班時(shí)間感受價(jià)值趨向于0。為方便描述,定義Ⅰ區(qū)為飛機(jī)滑行損失區(qū),Ⅱ區(qū)為獲得上升區(qū),Ⅲ區(qū)為獲得下降區(qū)。
根據(jù)航班信息時(shí)間價(jià)值函數(shù)定義,借鑒時(shí)間約束下感知數(shù)值的計(jì)算方法[20],刻畫(huà)旅客從航班落地至達(dá)到出口的時(shí)間價(jià)值感知過(guò)程,得到旅客的時(shí)間價(jià)值函數(shù)如下
(1)
根據(jù)航班信息時(shí)間價(jià)值函數(shù)的定義,為了將旅客的正感知表示為凹函數(shù),負(fù)感知表示為凸函數(shù)得到0<αi≤1。 其中β表示損失規(guī)避程度,由前景理論的定義可知對(duì)于損失的感應(yīng)比獲得更敏感,所以Ⅰ區(qū)的斜率高于Ⅱ區(qū)。由之前總結(jié),開(kāi)艙門(mén)前旅客因具有主動(dòng)權(quán)正感知迅速上升與開(kāi)艙門(mén)后旅客排隊(duì)下機(jī)正感知緩慢下降相比Ⅱ區(qū)比Ⅲ區(qū)斜率高,得到:β1>β2>β3>β4。
根據(jù)田麗君等[20]關(guān)于前景理論的探討,以及所給β參數(shù)的利用得到旅客在ti時(shí)到達(dá)出站口時(shí)間的感知數(shù)值
(2)
同理在時(shí)間tf后每隔n分鐘旅客到達(dá)出站口時(shí)間的感知數(shù)值也可求得。其中π-,π+分別是正感知與負(fù)感知所對(duì)應(yīng)的權(quán)重,為各部分的時(shí)間價(jià)值函數(shù)的數(shù)值與總時(shí)間價(jià)值函數(shù)數(shù)值的比值。
tf由機(jī)位距離M決定,定義旅客步行的平均速度v, 可得
從表1可知,對(duì)于所提取的特征量具有2種缺陷的樣本,神經(jīng)網(wǎng)絡(luò)完全能夠識(shí)別出缺陷的存在,而只具有某一種缺陷的樣本,神經(jīng)網(wǎng)絡(luò)存在識(shí)別錯(cuò)誤。該錯(cuò)誤主要是由于用于訓(xùn)練的樣本數(shù)量不夠?qū)е聦?duì)網(wǎng)絡(luò)的訓(xùn)練不足。綜合來(lái)看,神經(jīng)網(wǎng)絡(luò)的缺陷檢測(cè)率達(dá)到了80%,說(shuō)明采用此方法對(duì)勺子缺陷進(jìn)行檢測(cè)是可行的。
(3)
式中:Mi表示機(jī)位i至到達(dá)口的步行距離。
式(2)量化了航班信息時(shí)間以構(gòu)建航班信息時(shí)間價(jià)值函數(shù),將其與行李總數(shù)共同作為特征輸入到達(dá)口旅客人數(shù)預(yù)測(cè)模型。因?yàn)榱炕蟮暮桨嘈畔r(shí)間數(shù)值V(t) 與行李總數(shù)L(t) 對(duì)預(yù)測(cè)對(duì)象的比重是不同的,在構(gòu)建模型時(shí)需要考慮特征數(shù)值在樣本空間中的分布情況,因此本文設(shè)計(jì)了一種加權(quán)歐氏距離的方法量化特征權(quán)重。權(quán)重系數(shù)的定義如下
(4)
(5)
再根據(jù)加權(quán)歐氏距離得到預(yù)測(cè)值的K個(gè)近鄰后,傳統(tǒng)的K近鄰將此K個(gè)近鄰等權(quán)重看待,但距離小的近鄰值在預(yù)測(cè)中應(yīng)當(dāng)占更大的權(quán)重,因此對(duì)K個(gè)近鄰采取帶權(quán)重的預(yù)測(cè)算法,得到基于時(shí)間價(jià)值的雙加權(quán)K近鄰模型(P-KNN)
(6)
式中:p(t) 表示t時(shí)刻到達(dá)口旅客的預(yù)測(cè)人數(shù),pi(t)(i=1,2,…,K) 表示在K個(gè)近鄰點(diǎn)中,第i個(gè)點(diǎn)所對(duì)應(yīng)歷史時(shí)刻到達(dá)口旅客人數(shù)。
表1 進(jìn)港航班信息數(shù)據(jù)樣例
遠(yuǎn)機(jī)位旅客下機(jī)后即乘坐擺渡車(chē)離開(kāi),與近機(jī)位直接從廊橋到達(dá)航站樓類(lèi)比,中間沒(méi)有等待擺渡車(chē)時(shí)間,且兩輛擺渡車(chē)之間銜接緊密,因此只多了擺渡車(chē)運(yùn)行時(shí)間。根據(jù)機(jī)場(chǎng)擺渡車(chē)運(yùn)行服務(wù)水平評(píng)價(jià),擺渡車(chē)的平均運(yùn)行速度為20 km/h,可根據(jù)機(jī)場(chǎng)遠(yuǎn)機(jī)位擺渡車(chē)運(yùn)行距離的測(cè)量值計(jì)算得到不同遠(yuǎn)機(jī)位擺渡車(chē)的運(yùn)行時(shí)間。綜上根據(jù)以上初始數(shù)據(jù),對(duì)機(jī)位距離和航班信息時(shí)間特征進(jìn)行量化。
假設(shè)旅客步行速度為1.2 m/s,設(shè)置預(yù)測(cè)時(shí)間跨度n=5 min,根據(jù)式(3)可計(jì)算出不同機(jī)位的tf, 根據(jù)表1可知ta、ts和to。 再根據(jù)航班信息時(shí)間價(jià)值函數(shù),分別計(jì)算到達(dá)口旅客時(shí)間價(jià)值感知數(shù)值。
最終得到近遠(yuǎn)機(jī)位從tf開(kāi)始,每隔5 min到達(dá)口旅客時(shí)間價(jià)值感知數(shù)值。以近機(jī)位為例,部分結(jié)果見(jiàn)表2。
表2 近機(jī)位旅客時(shí)間價(jià)值感知數(shù)值(部分)
通過(guò)測(cè)試數(shù)據(jù)對(duì)模型的K值選取進(jìn)行了實(shí)驗(yàn)測(cè)試,分析結(jié)果表明不同K值對(duì)模型精度的影響差異較大,如圖3所示。最終選取誤差最小的K=7作為模型參數(shù)。
以預(yù)測(cè)從tf后第5 min的人數(shù)為例,利用航班信息時(shí)間價(jià)值函數(shù)得到第5 min旅客時(shí)間感知數(shù)值以及第5 min行李總數(shù)動(dòng)態(tài)化數(shù)值作為特征輸入,出站口的人數(shù)作為模型輸出。分別將近遠(yuǎn)機(jī)位數(shù)據(jù)組的后20組數(shù)據(jù)作為測(cè)試組,剩余數(shù)據(jù)作為實(shí)驗(yàn)組,得到20組測(cè)試航班中每個(gè)航班第5 min位于到達(dá)口的人數(shù),同理預(yù)測(cè)得到每間隔5 min的到達(dá)口人數(shù)。在以上預(yù)測(cè)數(shù)據(jù)的基礎(chǔ)上,選取近機(jī)位20組測(cè)試數(shù)據(jù)中表1樣例數(shù)據(jù)每5 min的預(yù)測(cè)結(jié)果進(jìn)行組合,如圖4所示。
分析近機(jī)位到達(dá)口旅客人數(shù)預(yù)測(cè)圖4發(fā)現(xiàn),不同機(jī)位距離和行李數(shù)量的航班旅客在到達(dá)口的分布規(guī)律存在差異。究其原因,航班1、航班2因機(jī)位距離較近以及行李數(shù)量較小導(dǎo)致的行李處理時(shí)間短,使得不提取行李旅客與提取行李旅客短時(shí)間內(nèi)集中出站,因此圖4(a)、圖4(b)出現(xiàn)了單個(gè)高峰。而航班3、航班4因?yàn)闄C(jī)位距離較遠(yuǎn)因此旅客集散過(guò)程更為離散,且航班行李數(shù)量較多導(dǎo)致行李處理時(shí)間較長(zhǎng),因此使得圖4(c)、圖4(d)不取行李旅客和提取行李旅客的分布規(guī)律在圖形中出現(xiàn)了兩個(gè)高峰。
遠(yuǎn)機(jī)位旅客一般由擺渡車(chē)分兩批運(yùn)送,時(shí)間分布較長(zhǎng)。因第一批旅客到達(dá)航站樓后由于擺渡車(chē)在該機(jī)場(chǎng)送達(dá)位置距離到達(dá)口較近,因此與以上圖4(a)、圖4(b)近機(jī)位旅客分布規(guī)律相似,在短時(shí)間內(nèi)出現(xiàn)了單個(gè)高峰。隨著時(shí)間的推移,根據(jù)擺渡車(chē)運(yùn)送距離和速度測(cè)算在第25 min~30 min處遠(yuǎn)機(jī)位航班兩批旅客在到達(dá)口會(huì)發(fā)生客流重疊,于是遠(yuǎn)機(jī)位航班旅客呈現(xiàn)出兩個(gè)相似高峰規(guī)律。如圖5所示。
針對(duì)近遠(yuǎn)機(jī)位利用20組檢驗(yàn)的預(yù)測(cè)與實(shí)際數(shù)據(jù)的值,使用均方根誤差RMSE和擬合優(yōu)度R2進(jìn)行誤差分析,并增加了機(jī)器學(xué)習(xí)的支持向量機(jī)(SVR)預(yù)測(cè)模型進(jìn)行對(duì)比誤差分析。以預(yù)測(cè)位于到達(dá)口較近的近機(jī)位旅客人數(shù)為例,計(jì)算基于時(shí)間價(jià)值的雙加權(quán)K近鄰模型的RMSE值以及擬合優(yōu)度R2的值與SVR模型和傳統(tǒng)的K近鄰模型對(duì)比效果如圖6、圖7所示。
從圖6、圖7可以分析得到,基于時(shí)間價(jià)值的雙加權(quán)K近鄰模型與傳統(tǒng)的K近鄰模型和SVR模型比較,均方根誤差RMSE的值最小且其性能平均提高了5.8%。同時(shí)擬合優(yōu)度R2的值最大且其擬合優(yōu)度提高了7.2%,顯示了雙加權(quán)的K近鄰算法具有良好的預(yù)測(cè)性。
通過(guò)對(duì)國(guó)內(nèi)某大型機(jī)場(chǎng)2019年1月~2019年4月期間的國(guó)內(nèi)航班進(jìn)港信息進(jìn)行分析,對(duì)單航班進(jìn)港旅客到達(dá)口人數(shù)進(jìn)行預(yù)測(cè),最終得到以下研究成果:
(1)提取影響旅客到達(dá)口的因素并考慮對(duì)預(yù)測(cè)對(duì)象的比重不同,賦予因素不同的權(quán)重從而改進(jìn)歐式距離,實(shí)現(xiàn)了K值選取方法的優(yōu)化;
(2)針對(duì)航班信息時(shí)間復(fù)雜和難以量化的問(wèn)題,提出了進(jìn)港航班旅客的時(shí)間感知價(jià)值刻畫(huà)方法;
(3)構(gòu)建基于進(jìn)港航班信息時(shí)間價(jià)值函數(shù)的雙加權(quán)K近鄰混合模型,均方根誤差RMSE的性能和擬合優(yōu)度R2的值與其它方法相比均有所提高。
進(jìn)港航班信息時(shí)間價(jià)值函數(shù)的雙加權(quán)K近鄰模型雖表現(xiàn)出較好的預(yù)測(cè)效果,但仍存在缺少特征數(shù)據(jù)、特征體系不完善等問(wèn)題,未來(lái),隨著空港交通體系的信息化發(fā)展不斷累積特征數(shù)據(jù),完善模型特征體系,從而進(jìn)一步提升方法的有效性和適用性。