楊 敏 任怡鳳 盛 強 劉冬梅 李宏偉
(1 東南大學交通學院, 南京 210096)(2 上海攜程商務有限公司, 上海 200335)(3 交通運輸部公路科學研究院, 北京 100088)
黨中央、國務院發(fā)布的《交通強國建設綱要》提出打造旅客聯程出行系統,提升出行服務水平.空鐵聯運作為典型的聯程出行模式,讓旅客使用航空和鐵路2種出行方式多階段實現其完整出行,有助于擴大典型樞紐交通覆蓋范圍,提供豐富城際出行選擇.空鐵聯運中轉城市選擇是聯程出行的關鍵環(huán)節(jié),不同中轉城市會直接造成聯運服務經濟性、快速性、便捷性差異.對旅客空鐵聯運中轉城市選擇進行分析和預測,有助于挖掘聯程出行需求、預估樞紐客流量水平,對于反饋樞紐設施建設、提升出行服務水平十分重要.
目前空鐵聯運領域的相關研究主要集中于以下3方面. ①服務設施規(guī)劃層面.丁玲玲[1]和高克林等[2]采用定性分析方式,針對烏魯木齊市、鄭州市的空鐵聯運樞紐規(guī)劃進行案例研究,從功能定位、聯運設施、聯運管理等角度對空鐵聯運服務規(guī)劃提出具體要求;可鈺等[3]提出空鐵聯運OD 可達性約束,建立面向關鍵空鐵聯運OD可達性的高鐵時刻表優(yōu)化模型,從而提升空鐵聯運服務可達性;Li等[4]基于網絡理論提出一種分析空鐵聯運系統薄弱點的方法,并根據運行時間表和位置坐標數據識別空鐵聯運系統中的關鍵城市.②集計運量需求預測層面.戴福青等[5]基于超級網絡理論構建空鐵聯運超級路網,并用Floyd算法進行求解,模型有效建立了城市間空鐵聯合交通流分布與現有供給運力之間的定量關系;黃娟等[6]考慮到鐵路運輸與航空運輸間的聯運和競爭關系,基于Logit模型采用分類預測的形式對湖北鄂州機場的空鐵聯運分擔率進行預測;可鈺等[7]基于既有航空和高鐵的統計客流數據建立關于空鐵聯運換乘點選擇的Logit模型,應用129對OD線路數據標定,分析經濟性、快速性和方便性對空鐵聯運換乘點選擇的影響.③旅客服務偏好層面.Jiang等[8]基于機場歷史運營數據和意向調查,探究班次設置頻率、機場銜接度、飛機票價、航班延誤情況等各因素對旅客選擇空鐵聯運服務的影響重要程度;李興華等[9]使用k-means聚類算法評估空鐵聯運各項服務的重要度,發(fā)現票價優(yōu)惠、換乘信息、安檢互認等服務被認為是重要的聯程聯運服務類型,并且不同特性旅客存在不同的需求偏好;芮海田等[10]使用自主設計的調查問卷,應用Logit模型從個人特征和出行特征2個維度分析旅客在中長距離出行時出行方式選擇的影響因素及影響過程,發(fā)現目的地城市等級、年齡、出發(fā)時間彈性等因素具有重要影響效果;Román等[11]通過構建多項Logit模型和混合Logit模型探究旅客選擇空鐵聯運方式的影響因素和偏好特征,模型結果表明設計聯合時刻表縮短換乘時間的方式能有效提升旅客空鐵聯運出行的意向,同時模型還標定了用戶對空鐵聯運服務各環(huán)節(jié)的支付意愿.
而近年來,機器學習領域中的隨機森林模型因其基于數據挖掘能夠得到良好預測準確度的特性,已在諸多方面得到普遍應用,如交通流量預測、交通事故分析、模式識別等[12-17].但是,因機器學習中非參數模型的“黑箱”特性,在模型結果的可解釋性上常被詬病[18].盡管如此,隨著機器學習領域研究的發(fā)展,一些學者開始嘗試挖掘隨機森林模型在行為分析領域的可解釋性.如Hagenauer等[19]構建多個機器學習模型對比分析出行者市內交通方式選擇行為的預測效果,嘗試通過因變量的敏感度分析和自變量的準確度貢獻挖掘關鍵影響因素.Cheng等[20]對比隨機森林模型和多項Logit模型對居民出行方式選擇的建模結果,評估個人屬性和建成環(huán)境等各影響變量的不同重要性,并發(fā)現隨機森林模型的預測精度相對最高.Zhao等[21]和Cheng等[22]通過構建隨機森林模型并嘗試使用部分依賴圖拓展分析各解釋變量對出行方式選擇的非線性影響關系,分析曲線變化趨勢.
目前,空鐵聯運領域針對個體偏好的相關研究,其研究數據主要依托問卷方式進行行為調查和意向調查獲取,研究方法則以建立離散選擇模型分析旅客對聯運各服務環(huán)節(jié)的偏好選擇為主,鮮有應用機器學習模型在旅客個體層面針對空鐵聯運中轉地選擇行為的探討.經典的離散選擇模型要求數據符合嚴格的統計學假設分布,難以準確揭示自變量對因變量間的復雜非線性關系,機器學習模型則依托真實數據進行挖掘,可實現靈活和高精度的預測.因此,針對上述研究不足,本文應用攜程旅行網提供的空鐵聯運旅客互聯網歷史訂單脫敏數據,以京津冀城市群中保定-上??砧F聯運場景為例,基于隨機森林算法構建旅客空鐵聯運中轉城市選擇模型,并對比其他常用的機器學習算法和多項Logit離散選擇模型,深入挖掘影響旅客空鐵聯運中轉城市選擇的因素及復雜非線性關系.
本研究使用隨機森林(random forests,RF)算法來預測旅客城際空鐵聯運中轉城市的選擇,并探究影響因素與被選擇的聯程中轉城市之間的復雜非線性關系.隨機森林算法是一種靈活、易于使用的有監(jiān)督機器學習算法.此算法首先由Ho[23]使用隨機子空間方法提出,而后由Breiman[24]擴展,該擴展結合了Bagging理念和隨機選擇特征.大量的理論和實證研究都證明了隨機森林算法具有很高的預測準確率, 對異常值和噪聲具有很好的容忍度, 且不容易出現過擬合[25].從模型訓練時耗角度,隨機森林算法由于其Bagging并行構建決策樹和Bootstrap抽樣的機制,對于大量數據的訓練具有高效的運行速度.該算法是一種基于決策樹的集成算法,包含多棵由Bagging(并行)集成學習技術訓練得到的決策樹{h(X,Θn),n=1,2,…,N},其中X為輸入向量,Θn為獨立同分布的隨機向量.當輸入待分類的樣本時,最終的分類結果由多棵獨立的決策樹的輸出結果投票決定.該方法首先在原始數據集上通過Bootstrap有放回抽樣重新選出N個新數據集;隨后根據選出的N個數據集訓練N棵決策樹并組成RF分類器,并以決策樹投票的方式決定分類結果,將得票最高的類別作為最終標簽.圖1為本研究案例中RF算法的示意圖,首先將原始旅客訂單數據使用Bootstrap有放回重采樣方法劃分為N個子樣本集,而后針對每個子樣本集Dn構建相應的決策樹Tn,基于旅客多維度特征變量(如年齡、性別、出行偏好等),預測其選擇的中轉城市(如城市A、B、C).因輸入的子樣本集不同,可能會造成各弱分類器決策樹的節(jié)點分裂情況不完全相同,即圖1中各變量節(jié)點分裂閾值βnm(n=1,2,…,N;m∈N+)存在差異,但應用Bagging集成學習機制可有效降低模型方差,提升預測精度.
應用隨機森林算法的建模流程具體如下.①對原訓練集Dtrain進行Bootstrap有放回采樣,得到N個新的子數據集Dn(n=1,2,…,N),并基于每個子數據集Dn來訓練一棵決策樹;②從子數據集Dn包含的所有M維特征中隨機選取k維特征,k 圖1 隨機森林算法圖解 因為隨機森林模型基于Bootstrap重采樣技術,對于每一棵子決策樹僅使用部分樣本進行訓練,未被選擇的樣本則被稱為袋外樣本,則其可以通過袋外誤差(out-of-bag error, OOB Error)衡量模型的預測精度和泛化能力.對于每個子決策樹分類器Tn的袋外誤差率εn定義為 (1) 式中,Wn為對袋外子數據集錯誤分類的個數;Sn為袋外子數據集的樣本數量. 對于含有N棵子決策樹的隨機森林模型,其使用袋外數據估計的泛化誤差ERF為 (2) 隨機森林算法可以基于Gini不純度指數計算決策樹劃分節(jié)點的不純度從而衡量特征重要度[26].每次對變量Xi進行節(jié)點拆分時,2個后代節(jié)點的Gini不純度指數則會均小于父節(jié)點.本文使用Gini不純度指數來識別有助于空鐵聯運中轉城市選擇的重要解釋變量.對于用于進行分割的解釋變量,先計算內部樹節(jié)點處Gini不純度指數的降低值,然后計算隨機森林中所有決策樹的Gini不純度指數的平均下降值,從而作為相應觀測變量的重要性度量.對于一個具備J個類別的節(jié)點分割變量Xi,其Gini不純度指數計算如下: (3) 式中,G(Xi)表示解釋變量Xi的Gini不純度指數;P(Xi=j)表示估計節(jié)點Xi處樣本屬于類別j的概率.而后決策樹的分裂子節(jié)點構建則會按照Gini不純度指數由高至低分配. 近年來,一些學者開始展開對機器學習模型的可解釋性方面的研究.上述的特征重要度即為一個常用的衡量指標,用于評估解釋變量對于因變量的影響程度大小[19-20,27].但是,特征重要度無法像傳統統計學模型一樣通過標準化系數的符號和大小來分析解釋變量對因變量的影響趨勢、邊際效應、彈性等重要指標. 為改進機器學習模型中的可解釋性不足的問題,本文應用部分依賴圖(partial dependence plot)來描述已標定的機器學習模型中解釋變量對因變量的復雜非線性影響效果.部分依賴圖首次被Friedman[28]提出,其在考慮了所有其他自變量的平均影響后,通過衡量特定自變量子集Xs對選擇的因變量的log-odds對數幾率或者概率的影響,對自變量子集Xs對因變量的影響趨勢與程度進行圖形化分析.受限于計算機圖形化空間維度展示限制,一般自變量子集Xs的維度會選取較小,即選擇1、2、3維,從而可繪制部分依賴圖觀察因變量與自變量子集之間的函數關系.對于因變量有K個分類的問題,部分依賴函數則會有K個獨立的模型一一對應各分類.對于每一個分類各自的部分依賴概率函數,可由下式計算[29]: (4) 式中,fk(X)表示因變量為第k個分類時對自變量X的部分依賴概率;pk為隨機森林模型對類別k正確分類的比例;pl為隨機森林模型對類別l正確分類的比例. 為評估機器學習模型分類效果,本文應用精確率、召回率、F1得分、準確率4個指標進行評價,如下所示: (5) (6) (7) (8) 式中,C為所有預測正確的樣本數;T為所有預測的樣本數;nTP,k為對于類別k把正的判斷為正的數目,即將實際中轉城市正確判斷為中轉城市的數目;nFN,k為對于類別k把正的錯判為負的數目,即將實際中轉城市錯誤判斷為非中轉城市的數目;nFP,k為對于類別k把負的錯判為正的數目,即將非實際中轉城市錯誤判斷為中轉城市的數目;nTN,k為對于類別k把負的判斷為負的數目,即將非實際中轉城市正確判斷為非中轉城市的數目;Pk為對于類別k的精確率,表示對正樣本結果中的預測準確程度;Rk為對于類別k的召回率,表示在實際為正的樣本中被預測為正樣本的概率;F1,k為對于類別k的F1得分,同時考慮精確率和召回率,是二者的等比例調和平均;A為模型總體預測準確率,表示所有預測正確的結果占總樣本的百分數.因在樣本集不均衡時,會導致準確率偏高,無法真實反映模型對于小樣本量類別的預測效果;而應用此4個指標同時從多方面予以評價,可有效對比模型綜合分類效果. 京津冀區(qū)域交通一體化協同發(fā)展是實現京津冀世界級城市群目標的重要內容.然而目前京津冀范圍內交通發(fā)展不均衡現象突出,尤其是河北省內地級市的高鐵、航空建設不發(fā)達,限制旅客中長距離便捷出行,需依靠聯程出行模式擴展其出行半徑.本文選擇保定-上海特定空鐵聯運場景進行案例實證研究.目前,保定市尚未建設機場,且保定市至上海市未有在運營的直達鐵路線路,故有大量旅客選擇鐵路轉飛機的聯程出行模式完成其保定-上海的長途城際出行. 攜程旅行網是當前中國擁有最多月活躍用戶的在線旅游平臺,匯聚海量多模式出行大數據,包含豐富的互聯網用戶訂單和樞紐時刻表信息.本文使用攜程旅行網提供的2020年8—10月從保定去往上海的空鐵聯運的旅客歷史訂單脫敏數據進行分析,其中共包含768條有效樣本數據.樣本數據中,旅客空鐵聯運共涉及3個中轉城市,分別是北京(樣本數102條)、天津(樣本數61條)和石家莊(樣本數605條).目前,保定與北京、天津、石家莊間均有多個火車站在運營鐵路班次,樣本中共覆蓋保定站、保定東站、定州東站、白洋淀站4個火車站,其中石家莊與保定間運營的火車班次數量相對最多,天津最少;在機場航班運營方面,石家莊飛往上海的航班數量最少,北京與上海間運營的航空班次數量則相對最多. 該樣本數據的描述性統計顯示(見表1和表2),從保定至上海的空鐵聯運旅客中大部分選擇從石家莊中轉,相對較少的旅客從天津中轉,數據集存在不均衡分布現象.在旅客個人屬性特征維度,男性占比相較于女性更多,平均年齡在30歲左右.在旅客出行計劃安排角度,雖大部分旅客在首程出發(fā)前將兩程的行程一起提前預定,但在北京中轉的旅客不提前購買下一程機票的比例相對更高;出發(fā)場站選擇受其抵達便捷性及班次設定影響存在分布差異;首程出發(fā)時段的安排對于不同聯程中轉城市差異性不大.從空鐵聯運時耗特征角度,平均總行程時間在7 h左右;其中在北京中轉的間隔時間最長,在石家莊中轉的間隔時間最短.在空鐵聯運票價特征角度,首程火車票價會因運營線路、行駛里程、車輛類型、座位席次等級等因素變化,第2程接續(xù)的飛機票價則會因航線、運營航空公司、購票時間等因素波動;其中在北京中轉的旅客相對平均花費最高,但其票價波動性變化也較大,在石家莊中轉的旅客相對平均花費最少,其票價也更為穩(wěn)定. 表1 分類型觀測變量描述性統計結果 表2 數值型觀測變量描述性統計結果 為評估隨機森林算法的分類效果,基于精確率、召回率、F1得分、準確率4個指標,與多項Logit模型(multinominal logistics regression, MNL)以及常用的機器學習分類算法K近鄰(k-nearest neighbor, KNN)算法、支持向量機(support vector machine, SVM)算法進行對比,并將75%的樣本數據用于訓練,25%的樣本數據用于測試,應用網格搜索的方法和10折交叉驗證的方式訓練分類器[30].MNL模型是最為廣泛應用的離散選擇模型之一,其基于隨機效用最大化理論并假設效用隨機項相互獨立且服從極值分布.KNN是“懶惰學習”的著名代表,其在定類決策上依據最鄰近的K個樣本的類別來決定待分樣本所屬的類別,對于類域交叉或重疊較多的待分樣本集處理簡單有效[31].SVM算法使用鉸鏈損失函數計算經驗風險并在求解時加入正則化項優(yōu)化結構風險,通過核方法進行非線性映射,是一個具有稀疏性和穩(wěn)健性的分類器[32]. 為防止模型訓練過擬合或者欠擬合,圖2展示了隨機森林模型基于訓練集調參過程中的袋外誤差率隨決策樹數量、最大特征數、最少樣本劃分數、最大深度的變化.由圖2可以發(fā)現,針對本案例數據,當決策樹數量超過20棵、最大深度超過10層時,袋外誤差率趨于收斂;最大特征數、最少樣本劃分數對模型效果的影響差別不大,均能取得訓練集的袋外誤差率在15%左右的效果.考慮到模型的運算效率和預測準確度,本案例設置隨機森林模型的4個重要參數:決策樹數量為100,最大特征數為無限制,最少樣本劃分數為8,最大深度為無限制. (a) 決策樹數量與最大特征數 (b) 最大深度與最少樣本劃分數 基于測試集的預測效果如表3所示,可以發(fā)現:①隨機森林算法在分類的效果上表現最佳,其次是支持向量機算法,而多項Logit模型和K近鄰算法表現相對較差.②根據精確率、召回率和F1得分3個指標,觀察對于分類為北京、天津的樣本數據預測結果,隨機森林算法對于不均衡樣本集的分類效果仍表現較好,具有較強的抗噪聲和泛化能力;相對地,其余3種對比算法在占比較少的小樣本中預測效果不佳.③隨機森林算法對中轉城市選擇的總體分類準確率可達到88.54%,其中對于石家莊市的預測準確率可達到90%以上,表明算法應用效果較好. 表3 模型測試集預測效果比較 % 隨機森林模型可基于Gini不純度指數計算觀測變量的特征重要度,從而評估影響旅客空鐵聯運中轉城市選擇的自變量重要性差異.表4中,相對重要度即指將計算得到的各自變量的Gini不純度指數使用歸一化處理計算其在所有自變量中的重要性占比,累計重要度即指將各自變量的相對重要度按從大至小排序的累加計算值.結果表明,總行程時間、換乘間隔時長、總票價這3個運營服務層面的自變量對中轉城市選擇的各自相對影響可達到20%以上,再疊加首程出發(fā)時段、旅客年齡這2個變量,其對影響中轉城市選擇的累計重要度貢獻可達到86.3%.而火車席次等級、是否提前購買下一程機票、性別等變量則對中轉城市選擇的影響程度不大,均低于5%的貢獻率. 表4 空鐵聯運中轉城市選擇的影響因素特征重要度 根據標定的隨機森林模型繪制影響因素的部分依賴圖,進一步分析其與中轉城市選擇的非線性關系,結果如圖3和圖4所示.由于基于決策樹的模型會產生不連續(xù)的分段常數模型并延續(xù)至樹木總數,從而造成曲線并非嚴格平滑的碎片化分段效果,可更為細致描述自變量對因變量的影響.總體上,在默認情況下,旅客選擇河北省省會石家莊市作為從保定去往上海的空鐵聯運中轉城市的概率較大,可達到80%~90%左右;其次是首都北京,而選擇天津作為從保定去往上海的空鐵聯運中轉城市的概率最小.與前述影響因素重要性分析一致,總行程時間、換乘間隔時長、總票價這3個觀測變量對中轉城市的選擇概率影響較大,并且呈現非線性影響關系.總行程時間、總票價對石家莊市被選擇的部分依賴概率呈現Z形特征,由一高位平緩穩(wěn)定值驟減降至一低位穩(wěn)定值;而總行程時間、總票價對北京市、天津市被選擇的部分依賴概率則呈現S形特征,由一低位平緩穩(wěn)定值驟增升至一高位穩(wěn)定值. (a) 換乘間隔時長 (b) 總行程時間 (c) 總票價 (d) 火車席次等級 (e) 首程出發(fā)時段 (f) 出發(fā)場站 (g) 是否提前購買下一程機票 (h) 年齡 (i) 性別 (a) 北京中轉概率 (b) 天津中轉概率 (c) 石家莊中轉概率 3.2.1 運營方服務供給層面分析 在班次設置方面,當旅客計劃的總行程時間不超過300 min時,石家莊市作為中轉城市被選擇的概率較高;而隨著總行程時間的增加,石家莊市被選擇的概率會驟然下降,天津和北京被選擇的概率會相應上升,最終三者趨于穩(wěn)定.當換乘間隔時長在100~200 min以內時,隨著換乘間隔時長的增加,北京和天津被選擇的概率會逐漸下降;而當換乘間隔時長超過200 min以后,北京市被選擇作為中轉城市的概率會隨著間隔時長的增加而緩慢上升.從服務供給方的換乘銜接效率角度分析,石家莊市依托正定機場高鐵站與正定國際機場相距僅約3.4 km的地理空間區(qū)位優(yōu)勢能提供高效的機場大巴接駁服務,北京市憑借其發(fā)達的軌道交通系統可為旅客提供便利的鐵路樞紐與機場樞紐之間的轉換.從旅客的出行計劃角度分析,當旅客計劃的換乘間隔時長和總行程時長超過一定閾值上限時,更為傾向選擇具有豐富功能性的大城市中轉,因為其可在中轉城市進行除換乘目的以外的其他需求活動,如旅游、購物、公務等. 在票務定價方面,當總票價低于1 300元時,3個城市被選擇的概率均維持較為穩(wěn)定的狀態(tài);而當總票價超過1 300元時,隨著旅客支付的總票價的增長,北京市被選擇作為中轉城市的概率急速上升,而石家莊市被選擇的概率急速下降,天津市被選擇的概率則變化不大.火車席次等級對于中轉城市選擇的影響波動性不大,但是若旅客傾向于商務座、特等座和一等座等高級席次,則選擇北京的概率會相較于其在選擇高鐵二等座的情況下更高.從旅客的經濟承受能力角度分析,當旅客能承受相對更高的價格時,其會更傾向選擇在一線大都市北京中轉而非二線城市石家莊市. 在時間價格綜合作用方面,北京市被高票價承受能力和時間預留充裕的旅客選擇的概率較大,天津市在中等價格區(qū)間和中長時間預留的旅客中具有優(yōu)勢,石家莊市在偏好低票價區(qū)間和注重通行快速性的旅客中被選擇的概率達到80%. 3.2.2 旅客方個人需求層面分析 在出行計劃安排方面,其計劃首程出發(fā)時段在03:00~08:00時段選擇北京中轉的概率相較于之后時段選擇北京的概率更高,但總體大概率選擇石家莊中轉,并且時段越晚概率越高.從出發(fā)場站選擇角度分析,從白洋淀站出發(fā)的旅客更有可能選擇天津中轉而非北京,其余選擇保定站、保定東站、定州東站出發(fā)對于中轉城市的選擇影響不大.同時,若旅客未提前整體購買下一程機票,則旅客選擇北京中轉的概率會有所上升,但仍然是石家莊市被選擇的概率最大.從服務供給方的運營班次數量角度分析,石家莊市與保定間運營的鐵路班次數量最多,而北京市與上海間運營的航空班次數量最多,旅客更為傾向選擇具有更多班次的中轉城市為其出行提供更多保障. 在個人社會屬性方面,其年齡、性別的部分依賴圖曲線總體均較為水平,表明此2個屬性對于中轉城市的選擇幾乎無影響.盡管旅客年齡對于中轉城市的選擇概率影響在30~40歲區(qū)間內會有一個小波動,但總體變化不大. 1) 本文對城際出行互聯網訂單數據進行挖掘,基于隨機森林算法對旅客空鐵聯運中轉城市選擇行為進行模型構建與標定.研究結果表明,隨機森林算法相較于多項Logit模型、K近鄰算法、支持向量機算法在空鐵聯運中轉城市選擇問題上具有更高預測準確度,能有效處理不均衡樣本,其總體準確率可達到88.54%,并具備描述解釋變量與因變量間復雜非線性關系優(yōu)勢.同時,使用部分依賴圖細致描述各屬性特征對旅客中轉地選擇概率的影響趨勢. 2) 在影響聯程中轉城市選擇的因素中,運營方的服務供給側屬性相較于個人屬性,即班次設置和票務定價相較于旅客出行計劃和社會特征,會占據更高比重且為非線性影響作用,從而造成不同服務水平特征城市被選擇概率差異.相較于傳統單一方式的出行模式,聯程出行服務模式中特有的換乘銜接效率等方面屬性影響則更為突顯,合理的時刻表銜接設置、便利的樞紐間接駁換乘服務有助于提升空鐵聯運服務吸引力.本研究結果可有助于鐵路和民航部門進行聯程中轉城市市場份額估計,并在運輸班次設置、樞紐場站選址、票價調控等方面進行相關政策制定和服務改善研究,如定制需求響應式接駁車、基于接駁服務水平設計一體化聯運票務方案等. 3) 本文研究使用的旅客空鐵聯運出行訂單樣本數據量有限,并且互聯網訂單脫敏數據缺少較多個人社會經濟屬性,后續(xù)可以繼續(xù)擴充數據量和特征維度來驗證所述主要結論.此外,解析城際聯程出行更復雜多模式場景,深入分析聯程出行旅客特性需求、服務設施供給水平是下一步研究的重點.1.2 袋外誤差率
1.3 特征重要度
1.4 部分依賴圖
1.5 模型評估指標
2 數據采集
3 結果與分析
3.1 旅客空鐵聯運中轉城市選擇預測建模
3.2 旅客空鐵聯運中轉城市選擇影響因素分析
4 結論