徐 進(jìn),宋浩男
(1.西南交通大學(xué) 經(jīng)濟(jì)管理學(xué)院,四川 成都 610031;2.西南交通大學(xué) 綜合交通大數(shù)據(jù)應(yīng)用技術(shù)國家工程實(shí)驗(yàn)室,四川 成都 610031;3.西南交通大學(xué) 四川省服務(wù)科學(xué)與創(chuàng)新重點(diǎn)實(shí)驗(yàn)室,四川 成都 610031)
交通運(yùn)輸在人口流動中起著重要作用[1-2]。截至2021年底,我國鐵路運(yùn)營里程超過15萬km,其中高速鐵路超過4 萬km。2020 年新冠疫情爆發(fā)以前,我國民用航空客運(yùn)量占總?cè)丝诒戎夭粩嗌仙?,民航業(yè)發(fā)展迅速,2019年,我國民用航空客運(yùn)量占總?cè)丝跀?shù)的47%。隨著高速鐵路線路和車站的不斷建設(shè),不同地區(qū)之間的可達(dá)性不斷增加,經(jīng)濟(jì)蓬勃發(fā)展[3]。隨著鐵路和航空客運(yùn)量的增加,描述和發(fā)現(xiàn)鐵路和航空旅客的流動特征和模式變得更加重要[4-5]。近年來,使用復(fù)雜網(wǎng)絡(luò)方法對鐵路和航空網(wǎng)絡(luò)的研究有所增加,其研究表明,我國鐵路和航空復(fù)雜網(wǎng)絡(luò)具有小世界和無標(biāo)度分布的特點(diǎn)[5-7]。當(dāng)前的研究描述鐵路復(fù)雜網(wǎng)絡(luò)的拓?fù)鋵傩裕瑥恼麄€網(wǎng)絡(luò)分析鐵路和航空網(wǎng)絡(luò)的可達(dá)性和脆弱性[8],并為交通網(wǎng)絡(luò)的建設(shè)提供強(qiáng)有力的理論支持[9-10]。雖然當(dāng)前有關(guān)交通復(fù)雜網(wǎng)絡(luò)的研究取得較好進(jìn)展,但目前對鐵路和航空網(wǎng)絡(luò)的研究大多基于對整個建成網(wǎng)絡(luò)的分析,基于個體出行的鐵路和航空出行網(wǎng)絡(luò)的特征仍有待探索。
個人的移動軌跡可以表示為出行序列,序列內(nèi)包含個人依次訪問的地點(diǎn)集合,從而可以獲得個人流動性特征[11-13]。雖然可以從出行序列抽取個人的出行特征,但單個行程序列包含重復(fù)訪問的位置。例如,在旅行者的旅行序列中,如果a地點(diǎn)和b地點(diǎn)之間有多個往返行程,則該序列將包含多個a→b,這種重復(fù)的行程軌跡對于描述行程特征是多余的[14]。因此,在描述旅行特征時,僅使用旅行序列并不能有效消除冗余訪問。解決該問題的更好方法是將個人行程提取為有向圖。一些學(xué)者通過將數(shù)千人的運(yùn)動軌跡構(gòu)建為復(fù)雜網(wǎng)絡(luò),提取個人日?;顒拥?7個獨(dú)特模體(motif)[15],這些獨(dú)特的模體代表由不同類型的個人每天訪問的地方組成的完整行程。然而,雖然鐵路和航空旅行具有與日常旅行不同的其他特征,但在一段時間內(nèi),其仍然表示個人旅行。將模體研究方法應(yīng)用于鐵路和航空出行,可以獲得更多鐵路和航空旅客的出行特征。
研究嘗試從以下2 點(diǎn)對既有研究進(jìn)行拓展。一是構(gòu)建旅客出行模體識別模型,對鐵路和航空出行旅客的出行特征進(jìn)行刻畫,直觀反映不同出行群體的出行模式;二是構(gòu)建鐵路旅客出行網(wǎng)絡(luò)(RRTN)和航空旅客出行網(wǎng)絡(luò)(RATN),基于相關(guān)拓?fù)渲笜?biāo)量化出行網(wǎng)絡(luò)結(jié)構(gòu),發(fā)掘旅客出行的整體模式和演化特征。
每日出行可以相對全面的方式獲得個人的出行序列,因?yàn)榭梢曰谝苿与娫挼男帕顢?shù)據(jù)輕松定位個人旅行序列。然而,從鐵路旅行記錄中獲得的旅行序列通常相對不完整,因?yàn)槌丝驮诔霭l(fā)或返回時可能會選擇鐵路或航空以外的交通方式,如公共汽車、私家車等。交通模式的這種變化可能導(dǎo)致在出行序列中從同一起點(diǎn)到同一目的地的重復(fù)記錄,其可以被提取為(A→B,A→B)。此外,對于長途旅行和訪問更多地點(diǎn)的乘客,在鐵路旅行序列中,最后一次旅行的終點(diǎn)站和下一次旅程的起點(diǎn)站也可能不一致,例如(A→B,C→D)。
為了解決上述問題,研究提出以下鐵路出行序列提取規(guī)則。①如果2 個相鄰行程的起點(diǎn)和終點(diǎn)相同,則2個行程將合并為一個行程,然后添加到行程序列中;②如果旅行者2 次相鄰旅行的目的地和出發(fā)地不同,則將在2 次相鄰旅程之間添加從前一目的地到下一目的地的旅行鏈接。對于提取規(guī)則①,研究考慮合并相鄰的重復(fù)始發(fā)站和目的站,旅客在2 個相同地點(diǎn)之間出行時,可能會在出發(fā)時選擇鐵路,而返回時選擇其他出行方式,對于這種單向鐵路選擇構(gòu)成的序列,進(jìn)行序列的簡化,即旅行序列(A→B,A→B)將轉(zhuǎn)換為(A→B);提取規(guī)則②等同于行程序列的完成,即行程序列(A→B,C→D)將轉(zhuǎn)換為(A→B→C→D)。
在將旅行數(shù)據(jù)轉(zhuǎn)換為序列之后,需要提取各個旅行主題,生成的基序?qū)?yīng)于有向圖。模體提取和同構(gòu)判定如圖1所示。在圖1中,3名乘客通過不同的車站,并且有向圖的組成存在一些差異。然而,這些有向圖彼此同構(gòu)。因此,需要確定每個乘客的旅行有向圖的同構(gòu),以獲得唯一的旅行模體。步驟如下。①通過上述的提取規(guī)則提取序列后,將序列中出發(fā)地和目的地的名稱轉(zhuǎn)換為數(shù)字序列號,生成包含該序列的有向圖。②將所有乘客的這些圖保存到列表中,并對每個圖執(zhí)行主題提??;對于具有相同旅行模式但不同圖形結(jié)構(gòu)的乘客,圖同構(gòu)匹配(VF2)算法設(shè)計為選擇指定的有向圖作為這些乘客的主題,也就是說,具有相同旅行模式的乘客具有相同的主題。最終生成的基序表示為mij,其中i表示構(gòu)成基序的節(jié)點(diǎn)數(shù),j表示當(dāng)前節(jié)點(diǎn)數(shù)下基序的序列號。例如,m21表示節(jié)點(diǎn)數(shù)量為2的第一個基序。
圖1 模體提取和同構(gòu)判定Fig.1 Motif extraction and isomorphism determination
構(gòu)造用于鐵路和航空出行的加權(quán)有向網(wǎng)絡(luò)G=(V,E,w)。其中,節(jié)點(diǎn)V表示旅客通過的所有車站;邊E表示站點(diǎn)之間的客流和方向;w表示每個邊緣的重量,即從一個站點(diǎn)流向另一個站點(diǎn)的乘客數(shù)量。研究選擇以下復(fù)雜網(wǎng)絡(luò)分析指標(biāo)來描述鐵路和航空出行網(wǎng)絡(luò)的拓?fù)涮卣鳌?/p>
(1)節(jié)點(diǎn)度ki。節(jié)點(diǎn)度表示節(jié)點(diǎn)與網(wǎng)絡(luò)中其他節(jié)點(diǎn)之間連接的邊數(shù)。節(jié)點(diǎn)度越大,連接邊的數(shù)量越高。
式中:nij表示節(jié)點(diǎn)i和節(jié)點(diǎn)j之間存在一條邊。
(2)節(jié)點(diǎn)強(qiáng)度si。節(jié)點(diǎn)強(qiáng)度表示網(wǎng)絡(luò)中連接到一個節(jié)點(diǎn)的其他節(jié)點(diǎn)的總權(quán)重。
式中:wij表示節(jié)點(diǎn)i與節(jié)點(diǎn)j之間的連接權(quán)重。
(3)同配系數(shù)r。同配系數(shù)衡量復(fù)雜網(wǎng)絡(luò)中節(jié)點(diǎn)與其他節(jié)點(diǎn)之間的關(guān)聯(lián)度。同配網(wǎng)絡(luò)表明,網(wǎng)絡(luò)中具有較大度的節(jié)點(diǎn)之間存在較強(qiáng)的連接趨勢。相反,異配網(wǎng)絡(luò)意味著具有大程度的節(jié)點(diǎn)和具有小程度的節(jié)點(diǎn)之間存在強(qiáng)烈的連接趨勢。-1 ≤r≤1,當(dāng)r≥0時表示網(wǎng)絡(luò)呈現(xiàn)同配性,反之則呈現(xiàn)異配性。
式中:M表示網(wǎng)絡(luò)邊的數(shù)量;αe,βe表示連接到第e條邊的節(jié)點(diǎn)的程度。
(4)聚類系數(shù)Ci。聚類系數(shù)表示復(fù)雜網(wǎng)絡(luò)中的節(jié)點(diǎn)與其相鄰節(jié)點(diǎn)的連接程度。對于鐵路出行網(wǎng)絡(luò),節(jié)點(diǎn)的聚類系數(shù)表示車站與其相鄰車站之間的連接程度。整個網(wǎng)絡(luò)的聚類系數(shù)表示為所有節(jié)點(diǎn)的聚類系數(shù)的平均值。
式中:Ei表示節(jié)點(diǎn)i的連接邊的數(shù)量。
(5)網(wǎng)絡(luò)效率E。網(wǎng)絡(luò)效率表示整個網(wǎng)絡(luò)的平均效率,通常用于描述整個網(wǎng)絡(luò)的平均接近度和魯棒性。網(wǎng)絡(luò)效率也是衡量復(fù)雜網(wǎng)絡(luò)中節(jié)點(diǎn)間信息交換的必要指標(biāo)。網(wǎng)絡(luò)效率越高,節(jié)點(diǎn)間交互消耗的能量就越少,網(wǎng)絡(luò)上的信息傳輸就越有效。
式中:εij表示節(jié)點(diǎn)i和節(jié)點(diǎn)j之間的效能;Dij表示節(jié)點(diǎn)i和節(jié)點(diǎn)j之間的距離。
式中:N表示網(wǎng)絡(luò)中的節(jié)點(diǎn)個數(shù)。
研究基于四川省成都市2015—2018 年鐵路和航空旅客出行數(shù)據(jù),根據(jù)旅客出行模體識別方法,分析鐵路和航空旅客的出行模體。選取出現(xiàn)頻率大于1%的出行模體作為高頻出行模體,得到關(guān)于鐵路和航空的高頻出行模體分布。
2015—2018 年鐵路高頻出行模體如圖2 所示。2015—2018年鐵路高頻出行模體大約占總體出行模體的75%以上,包含了鐵路出行的絕大部分出行方式。出行模體的節(jié)點(diǎn)構(gòu)成不超過4 個,表示旅客的出行活動大多是基于2~4 個地區(qū)之間的重復(fù)往來。2 節(jié)點(diǎn)構(gòu)成的鐵路出行模體包含一個地點(diǎn)到另外一個地點(diǎn)的單次出行(m21)和往返出行(m22);2 個節(jié)點(diǎn)的單次出行說明該部分出行群體在一年之內(nèi)只進(jìn)行了一次鐵路出行,對鐵路出行方式的依賴較??;2015年的出行模體中,單次出行頻率與往返出行的頻率之差最大,隨著年份的增加,兩者頻率的差距逐漸變小,其中2017 年的往返出行旅客數(shù)量甚至高于單次出行旅客的數(shù)量,說明該地區(qū)旅客出行中對鐵路出行方式選擇在逐年增加。3節(jié)點(diǎn)構(gòu)成的模體中,3個出行地點(diǎn)之間的順序出行(m31)和一個地點(diǎn)與其他2 個地點(diǎn)的往返出行(m33)的出行頻率較高,其中2015 年與2018 年的鐵路出行的旅客大多進(jìn)行基于m31 的出行,其余年份大多進(jìn)行基于m33 的出行。4 節(jié)點(diǎn)構(gòu)成的鐵路出行模體中旅客的出行模體主要為4 個節(jié)點(diǎn)的順序訪問,但終點(diǎn)和起點(diǎn)并不相同,表示旅客可能在返回出行起點(diǎn)時選擇了其他交通工具。觀察不同年份3節(jié)點(diǎn)模體和4節(jié)點(diǎn)模體的數(shù)量,可以發(fā)現(xiàn)2015—2017年鐵路旅客的3節(jié)點(diǎn)出行模體其出現(xiàn)頻率要高于2018年,而4節(jié)點(diǎn)模體中2018年出行模體的出行頻率則高于其他3 年,且出行模體更為復(fù)雜(m43),說明鐵路旅客的出行模體在逐漸復(fù)雜,對鐵路出行方式的選擇更多。
圖2 2015—2018年鐵路高頻出行模體Fig.2 High frequency travel motif of railway from 2015 to 2018
2015—2018 年航空出行高頻模體如圖3 所示。2 節(jié)點(diǎn)構(gòu)成的模體所包含的2 個地點(diǎn)之間的往返出行(m21)頻率最高,從起點(diǎn)到終點(diǎn)的單向單次出行(m22)較少。與鐵路出行的2 節(jié)點(diǎn)模體出現(xiàn)占比比較,可以發(fā)現(xiàn)鐵路出行中存在2 種出行模體出現(xiàn)頻率差距較大的情況,而航空出行中這種差距很小,最大差距不到5%。同時航空出行中2 節(jié)點(diǎn)出行模體的出行占比最高,這說明航空出行的旅客主要分為常往返于固定地點(diǎn)的旅客和只進(jìn)行一次航空出行的旅客。同樣在2 節(jié)點(diǎn)出行模體中,隨著年份增加,2 種出行模體的頻率差距越來越小,這可能表明航空出行方式對出行旅客的吸引力逐步下降,這與鐵路出行形成相反的對比。3 節(jié)點(diǎn)出行模體中的高頻出行模體與鐵路出行類似,主要為一個地點(diǎn)到另外一個地點(diǎn)的往返出行(m31)和3 個節(jié)點(diǎn)之間的順序出行(m32)。4節(jié)點(diǎn)出行模體中占比最高的出行模體為3 個節(jié)點(diǎn)之間的順序訪問和2 個節(jié)點(diǎn)之間的往返(m41),可以看作是m21 與m32 出行模體的組合。
圖3 2015—2018年航空出行高頻模體Fig.3 High frequency travel motif of airlines from 2015 to 2018
結(jié)合上述分析,可以發(fā)現(xiàn)成都市鐵路和航空旅客出行的主要模式為2 節(jié)點(diǎn)的出行,隨著年份增加,鐵路出行對旅客出行的吸引力變大,而航空出行對旅客出行的吸引力變小。3 節(jié)點(diǎn)的高頻出行模體在2 種出行方式中較為相似,但鐵路出行中旅客更多選擇順序訪問3 個地點(diǎn),而航空出行的旅客更傾向于從起點(diǎn)到2 個其他地點(diǎn)之間的多次往返,顯示了鐵路和航空出行方式的差異。4 節(jié)點(diǎn)出行模體中鐵路的模體數(shù)量要多于航空,但從其中的高頻模體中可以發(fā)現(xiàn)航空出行模體更加完整,存在旅客從出發(fā)到返回的路徑,這也說明航空旅客在較復(fù)雜的出行模式中對航空出行方式的依賴度較高。
在旅客出行分析中,研究基于成都市鐵路和航空旅客的實(shí)際出行記錄,將旅客訪問過的站點(diǎn)作為節(jié)點(diǎn),旅客在站點(diǎn)之間的實(shí)際出行活動作為連邊,構(gòu)建鐵路旅客出行網(wǎng)絡(luò)和航空旅客出行網(wǎng)絡(luò)。與一般鐵路和航空復(fù)雜網(wǎng)絡(luò)不同的是,研究構(gòu)建的出行網(wǎng)絡(luò)是基于該地區(qū)旅客實(shí)際訪問的站點(diǎn)和實(shí)際出行活動,而不是所有的建成站點(diǎn)和開通的運(yùn)營線路。
基于拓?fù)渲笜?biāo),計算不同年份下鐵路和航空出行網(wǎng)絡(luò)的拓?fù)涮卣鳎?015—2018年鐵路和航空出行網(wǎng)絡(luò)拓?fù)渲笜?biāo)如表1 所示。觀察不同年份的網(wǎng)絡(luò)平均度,可以推測網(wǎng)絡(luò)中站點(diǎn)之間平均的連接數(shù)量,同時鐵路出行網(wǎng)絡(luò)的平均度整體而言大于航空出行網(wǎng)絡(luò)。平均強(qiáng)度方面,可以看出出行網(wǎng)絡(luò)中旅客在相同站點(diǎn)之間的出行次數(shù)較多;2 種不同的出行網(wǎng)絡(luò)相比,航空出行網(wǎng)絡(luò)的平均強(qiáng)度遠(yuǎn)大于鐵路出行網(wǎng)絡(luò),這可能是由于航空線路較少并且航空旅客出行次數(shù)較多;同時隨著年份增加,不同類型出行網(wǎng)絡(luò)的平均強(qiáng)度在逐步增加。研究計算得到不同網(wǎng)絡(luò)的同配系數(shù)均小于0,說明鐵路出行網(wǎng)絡(luò)和航空出行網(wǎng)絡(luò)均具有異質(zhì)性且航空出行網(wǎng)絡(luò)的異質(zhì)性明顯,大規(guī)模站點(diǎn)往往會選擇和小規(guī)模站點(diǎn)相連接,說明該地區(qū)的旅客可能存在較多的大規(guī)模站點(diǎn)和小規(guī)模站點(diǎn)之間的出行。通過出行網(wǎng)絡(luò)聚類系數(shù)的計算結(jié)果,可以發(fā)現(xiàn)2 種出行網(wǎng)絡(luò)均具有較大的聚類系數(shù),旅客在出行站點(diǎn)之間的出行活動構(gòu)成的網(wǎng)絡(luò)結(jié)構(gòu)十分緊密;同時航空出行網(wǎng)絡(luò)的聚類系數(shù)更高,這可能是由于航空出行速度較快,旅客較遠(yuǎn)距離的出行只需要進(jìn)行1 次乘坐,而鐵路可能存在中途換乘的情況,使得鐵路出行網(wǎng)絡(luò)中站點(diǎn)的連接緊密程度劣于航空出行網(wǎng)絡(luò)。
表1 2015—2018年鐵路和航空出行網(wǎng)絡(luò)拓?fù)渲笜?biāo)Tab.1 Topological indicators of railway and air travel network from 2015 to 2018
2015—2018 年鐵路出行流向如圖4 所示,結(jié)合表1 和圖4,可以發(fā)現(xiàn)成都市的鐵路出行網(wǎng)絡(luò)結(jié)構(gòu)較為穩(wěn)定,旅客在不同年份的出行流向類似;大多表現(xiàn)為省內(nèi)的出行;省外出行大多分布在周邊省份與東南沿海地區(qū),西北部地區(qū)的出行流向較少。2015—2018年航空出行流向如圖5所示,可以發(fā)現(xiàn)2015—2018 年期間該地區(qū)的航空出行流在逐漸增加,旅客出行所覆蓋的范圍逐漸增加,航空網(wǎng)絡(luò)平均強(qiáng)度的增長反映了這一事實(shí);與鐵路出行不同,航空出行中旅客的出行地點(diǎn)更為分散,西北地區(qū)也有明顯的出行流向。
圖4 2015—2018年鐵路出行流向Fig.4 Railway travel flow from 2015 to 2018
圖5 2015—2018年航空出行流向Fig.5 Airline travel flow from 2015 to 2018
結(jié)合出行網(wǎng)絡(luò)的拓?fù)涮卣骱统鲂辛飨?,可以發(fā)現(xiàn)成都市鐵路出行的網(wǎng)絡(luò)結(jié)構(gòu)已經(jīng)趨于穩(wěn)定,鐵路出行人群的出行流向已經(jīng)固定。而航空出行的網(wǎng)絡(luò)結(jié)構(gòu)經(jīng)歷一定的發(fā)展后也逐步趨于穩(wěn)定。鐵路出行網(wǎng)絡(luò)中的出行流向大多集中于我國東南部發(fā)達(dá)地區(qū)和周圍地區(qū),而航空出行網(wǎng)絡(luò)中的出行流向相較于鐵路出行更為分散。
隨機(jī)失效下的RRTN 和RATN 的效率分析過程如下。隨機(jī)從網(wǎng)絡(luò)中移除站點(diǎn)和對應(yīng)的連邊,重新計算網(wǎng)絡(luò)效率,直到網(wǎng)絡(luò)中節(jié)點(diǎn)被全部移除。對2種網(wǎng)絡(luò)進(jìn)行20次重復(fù)移除過程,得到2種網(wǎng)絡(luò)效率的平均變化率,基于隨機(jī)失效的RRTN 和RATN 效率變化如圖6 所示。圖6a 表示RRTN 效率的變化,可以看到不同年份的網(wǎng)絡(luò)效率變化趨勢類似,網(wǎng)絡(luò)中大部分節(jié)點(diǎn)對整體出行的影響很小,并且當(dāng)節(jié)點(diǎn)移除數(shù)量超過1 200 時,網(wǎng)絡(luò)效率有大幅提高。不同年份中,2018年網(wǎng)絡(luò)效率存在最大值,說明2018年鐵路旅客更多出行在小范圍網(wǎng)絡(luò)中。圖6b 所示RATN效率的變化具有類似特征。
圖6 基于隨機(jī)失效的RRTN和RATN效率變化Fig.6 Efficiency change of RRTN and RATN based on random failure
基于網(wǎng)絡(luò)中節(jié)點(diǎn)介數(shù)中心性的計算,按照計算結(jié)果從大到小的順序移除對應(yīng)站點(diǎn),直至網(wǎng)絡(luò)中不存在節(jié)點(diǎn)?;谛钜馄茐牡腞RTN 和RATN 效率變化如圖7所示。蓄意破壞下,中樞節(jié)點(diǎn)被最早移除,網(wǎng)絡(luò)連通性受到極大影響,網(wǎng)絡(luò)效率逐漸降低至0,但在圖7a中,2016和2018年的RRTN中,當(dāng)網(wǎng)絡(luò)中大多數(shù)節(jié)點(diǎn)被移除后,網(wǎng)絡(luò)效率有部分提高,說明這2年鐵路旅客出行中可能存在特定地區(qū)的出行。
圖7 基于蓄意破壞的RRTN和RATN效率變化Fig.7 Efficiency change of RRTN and RATN based on intentional destruction
研究設(shè)計基于模體的旅客出行特征識別方法,對成都市旅客的出行特征進(jìn)行有效抽取,發(fā)現(xiàn)鐵路和航空旅客的出行特征相較日常出行較為簡單,鐵路對旅客的吸引力逐年增大。通過觀察網(wǎng)絡(luò)中出行人口的出行流向,分析旅客出行的流動規(guī)律,鐵路出行人口的流向較為穩(wěn)定,東南部地區(qū)流向較多,西北部較少;航空出行人口的流向逐漸發(fā)展并趨于穩(wěn)定,出行流向不斷向外擴(kuò)展,出行流向較為分散。2 種網(wǎng)絡(luò)的效率一般,只在一定的區(qū)域內(nèi)流動性較好。研究從模體識別和復(fù)雜網(wǎng)絡(luò)角度出發(fā),對了解人口出行特征有重要意義。此外,研究僅使用了基礎(chǔ)的拓?fù)涮卣骱途W(wǎng)絡(luò)效率分析方法,對于出行網(wǎng)絡(luò)的其他特征還有待進(jìn)一步討論。