馬小東,任芃錕,趙 凡
起止點(diǎn)數(shù)據(jù)可視分析研究
馬小東1,2,3,任芃錕1,2,3,趙 凡1,3
(1. 中國科學(xué)院新疆理化技術(shù)研究所,新疆 烏魯木齊 830011;2.中國科學(xué)院大學(xué),北京 100049;3. 新疆民族語音語言信息處理研究室,新疆 烏魯木齊 830011)
起止點(diǎn)數(shù)據(jù)是一種由起點(diǎn)、終點(diǎn)、起止點(diǎn)時(shí)間及一些其他屬性構(gòu)成的軌跡數(shù)據(jù)。其是一類非常典型的時(shí)空數(shù)據(jù),大量產(chǎn)生于城市交通管理、人口遷移、社交媒體等領(lǐng)域??梢暦治黾夹g(shù)目前被廣泛用于研究大規(guī)模起止點(diǎn)數(shù)據(jù)的時(shí)空模式,能夠?qū)崿F(xiàn)對數(shù)據(jù)深層次的探索。首先介紹了起止點(diǎn)數(shù)據(jù)特征以及可視分析的任務(wù),其次梳理了近年來起止點(diǎn)數(shù)據(jù)可視分析中的可視化方法、交互技術(shù)和可視化系統(tǒng),并對不同領(lǐng)域的應(yīng)用案例進(jìn)行介紹。最后,對起止點(diǎn)數(shù)據(jù)可視研究中面臨的問題進(jìn)行總結(jié),對起止點(diǎn)數(shù)據(jù)可視化研究的前景做出了展望,以期為未來的研究提供新的思路。
起止點(diǎn)數(shù)據(jù);時(shí)空數(shù)據(jù);可視分析
OD (origin-destination)數(shù)據(jù)通常被翻譯為“起始點(diǎn)-目的地”或“源-目的地”數(shù)據(jù),本文稱OD數(shù)據(jù)為“起止點(diǎn)”數(shù)據(jù);OD數(shù)據(jù)是一個(gè)比較寬泛的概念,其中的O點(diǎn)和D點(diǎn)不僅可以是移動(dòng)對象時(shí)空路徑的起始點(diǎn)和終止點(diǎn),也可以是抽象意義上的起點(diǎn)和終點(diǎn)。OD數(shù)據(jù)與移動(dòng)軌跡數(shù)據(jù)同樣具有時(shí)空特征、且數(shù)據(jù)規(guī)模大、數(shù)據(jù)維度高等特點(diǎn),但又略有不同,OD數(shù)據(jù)是由起始點(diǎn)位置、終止點(diǎn)位置、起止點(diǎn)時(shí)間、統(tǒng)計(jì)信息以及一些其他屬性構(gòu)成,兩者區(qū)別是OD數(shù)據(jù)不記錄移動(dòng)的具體路徑,只描述一對起始點(diǎn)、終止點(diǎn)之間的移動(dòng)。
由于OD數(shù)據(jù)本身的時(shí)空特性,使用可視化方法可以高效、直觀地展示數(shù)據(jù),發(fā)現(xiàn)數(shù)據(jù)中多個(gè)維度之間的關(guān)系,探索數(shù)據(jù)背后的時(shí)空規(guī)律。例如,通過分析不同維度出租車OD數(shù)據(jù)潛在的時(shí)空模式,對特定區(qū)域進(jìn)行挖掘,可以反映區(qū)域內(nèi)車與人流動(dòng)的關(guān)系,對城市交通和規(guī)劃布局有重要參考意義[1-3]。在人口遷移方面,構(gòu)建OD模型、進(jìn)行模式對比可分析影響人口遷移的因素和規(guī)律,并為相關(guān)部門的決策提供支持。OD數(shù)據(jù)也常常應(yīng)用于各種移動(dòng)服務(wù)領(lǐng)域如貿(mào)易流、技術(shù)流和信息流等[4]。
其中,(x,y)為起始點(diǎn)(origin)的空間位置;t為事件起始時(shí)間;(x,y)為終止點(diǎn)(destination)的空間位置;t為事件終止時(shí)間;為此條記錄的統(tǒng)計(jì)信息或其他屬性。
OD對數(shù)據(jù)由一起始點(diǎn)點(diǎn)(x,y,t)和終止點(diǎn)點(diǎn)(x,y,t)組合而成的OD對,由起始點(diǎn)指向終止點(diǎn)的連線叫OD流,且具有空間位置的指向性。OD流在空間位置上的變化反映了物體的移動(dòng)模式,由于具有時(shí)間屬性,可以利用OD數(shù)據(jù)在時(shí)間維度上的變化,分析其時(shí)變規(guī)律。
在已有的時(shí)空數(shù)據(jù)可視分析的研究中,通過分析文獻(xiàn)[5-8]可大致將可視分析任務(wù)分為:概覽、放大、過濾、細(xì)節(jié)、關(guān)聯(lián)、歷史記錄、提取。根據(jù)OD數(shù)據(jù)的定義,可視分析任務(wù)關(guān)注4個(gè)焦點(diǎn):起點(diǎn)、終點(diǎn)、時(shí)間和每一次的起止點(diǎn)對。經(jīng)過總結(jié)可將任務(wù)分為:
(1) OD流的空間概覽(T1)。展示區(qū)域內(nèi)流量空間屬性的統(tǒng)計(jì)信息,能夠回答“區(qū)域的流量主要從哪里流出、流向哪里”等問題,可從宏觀上了解OD數(shù)據(jù)的空間分布情況。
(2) OD流的時(shí)間概覽(T2)。對流量時(shí)間屬性的統(tǒng)計(jì)信息進(jìn)行展示,能夠回答“流量在哪段時(shí)間比較活躍、何時(shí)發(fā)生、何時(shí)結(jié)束”等問題,了解OD數(shù)據(jù)的時(shí)間分布規(guī)律。
(3) 探索感興趣區(qū)域的OD流(T3)。用戶自定義感興趣區(qū)域,提取OD流,對感興趣的區(qū)域進(jìn)行移動(dòng)行為的細(xì)節(jié)探索,可以回答“此區(qū)域何時(shí)流量活躍、流量的流向和大小”等問題。
(4) 區(qū)域間流量對比(T4)。支持對2個(gè)特定區(qū)域的OD流進(jìn)行分析和對比,能夠反映2個(gè)區(qū)域間流量對比的相似性或差異性,對2個(gè)區(qū)域之間OD流發(fā)生的關(guān)聯(lián)關(guān)系和因果關(guān)系進(jìn)行挖掘解釋。
OD數(shù)據(jù)是具有時(shí)間屬性和空間屬性的多維數(shù)據(jù),時(shí)空數(shù)據(jù)中常常蘊(yùn)含著復(fù)雜的時(shí)空模式,因此研究如何將數(shù)據(jù)的時(shí)空特征等多種屬性合理地編碼、直觀地顯示,是時(shí)空數(shù)據(jù)可視化中的熱點(diǎn)和難點(diǎn)之一。
探索空間屬性需關(guān)注數(shù)據(jù)在空間屬性上的繪制、移動(dòng)物體的空間位置以及周圍的地理情況[9]。如在對城市規(guī)劃中的區(qū)域功能性探究時(shí),需要進(jìn)行空間劃分、統(tǒng)計(jì)人口密度[10]。好的空間維度的展示需與人員的交互進(jìn)行結(jié)合,能更有效地探索OD數(shù)據(jù)。
主流的可視化方法有流向圖、OD矩陣和OD圖,后續(xù)多種空間屬性的新表現(xiàn)方式陸續(xù)出現(xiàn)。
流向圖是在地圖上將起始點(diǎn)和終止點(diǎn)的位置用邊連接起來,其寬度表征流量的大小。由于OD流圖使用地理地圖來表示,很好地揭示了空間特征,是最直觀的一種方式。TOBLER[11]最早使用箭頭元素繪制了人口遷移圖,但巨大的數(shù)據(jù)量導(dǎo)致OD流中的箭頭相互遮擋,造成視覺混淆,如圖1(a)所示。
為了克服遮擋和視覺混淆等問題,研究者提出了邊過濾[12-13]、邊捆綁[14-16]和聚類[17-19]等技術(shù)。SELASSIE等[20]提出了邊捆綁技術(shù),通過彎曲邊讓相似及相近的邊捆綁形成一束,減少相互遮蓋,如圖1(b)所示。ZENG等[21]提出了一種路由感知邊捆綁方法,在保證視覺簡化的同時(shí),保留了原始軌跡。邊過濾是一種過濾出大于給定閾值的方法,STEPHEN和JENNY[22]使用過濾交互操作來表示美國重要的移民流。GUO和ZHU[23]使用核密度估計(jì)方法測量起止點(diǎn)數(shù)據(jù)的流量,結(jié)合流采樣方法,對數(shù)據(jù)進(jìn)行規(guī)范化和平滑處理,以減少邊的數(shù)量。
OD矩陣的行和列分別表示流的起始點(diǎn)和終止點(diǎn),用小方格的深淺顏色來編碼流量大小[24]。但因丟失了地理信息,往往需要結(jié)合其他的地圖才能直觀地發(fā)現(xiàn)空間信息,如圖1(c)所示。
OD圖將地理地圖分割成同樣大小的方格,在每個(gè)方格中嵌入一個(gè)分割好的小地圖,從一個(gè)地點(diǎn)到另一個(gè)地點(diǎn)的流量大小就用該點(diǎn)嵌套的另一個(gè)地點(diǎn)單元格的深淺顏色表示其流量大小。WOOD等[25]將美國按照規(guī)則網(wǎng)格劃分成一系列矩形區(qū)域,畫出了人口遷移OD圖,如圖1(e)所示。YANG等[26]設(shè)計(jì)了OD圖的改進(jìn)版MapTrix,分別用2個(gè)地圖存放起點(diǎn)和終點(diǎn),用連線將其和一個(gè)OD矩陣連接起來,保留了OD數(shù)據(jù)的地理空間位置信息,如圖1(f)所示。SLINGSBY等[27]將行政區(qū)的地理位置近似排列成矩陣,解決了OD圖只適用于規(guī)則網(wǎng)格劃分的地理空間上的問題。
如圖1(d)左所示,BOSTOCK[28]繪制了舊金山地區(qū)遷移變化和旋圖。弦圖放棄了實(shí)際的地理定位,用徑向布局來表示位置,用不同寬度的線條表示地區(qū)之間的流量,相同地點(diǎn)流出的流歸為同一分組。SPECKMANN和VERBEEK[29]提出弦圖的變體——項(xiàng)鏈圖(necklace map),其試圖保留一定地理信息,由于使用顏色編碼,只適用于相對較少的節(jié)點(diǎn),如圖1(d)右所示。
圖1 空間屬性的可視化((a)人口遷移流向圖[11];(b)邊捆綁[20];(c)交通流向圖和OD矩陣[24];(d)人口遷移OD圖[28-29];(e)空間區(qū)域劃分[25];(f)Maptrix的設(shè)計(jì)[26])
之前,時(shí)空分析方法利用城市交通數(shù)據(jù)集來提取熱點(diǎn)的區(qū)域,而忽略了區(qū)域之間的流動(dòng)關(guān)系。一些方法無法自動(dòng)確定具有相似空間特征的時(shí)間步長,或無法識別城市的演化模式。SHI等[30]提出一個(gè)基于LDA的主題模型,從OD數(shù)據(jù)中發(fā)現(xiàn)隱藏的語義層面的城市動(dòng)態(tài)。馮濤等[31]利用空間區(qū)域等粒度的規(guī)則網(wǎng)格劃分,以及四叉樹編碼的方法對北京城區(qū)進(jìn)行劃分,實(shí)現(xiàn)OD數(shù)據(jù)的空間多尺度可視化。YANG等[32]比較了平面地圖、三維球體和Mapslink的可視化編碼,通過對比,最準(zhǔn)確和直觀的表現(xiàn)形式是具有凸起流的三維球體。
OD數(shù)據(jù)可視化的主要挑戰(zhàn)是將數(shù)據(jù)的空間和時(shí)間維度相結(jié)合,以便能夠探索時(shí)間和非時(shí)間的關(guān)系,挖掘時(shí)空數(shù)據(jù)價(jià)值。在時(shí)間屬性上具有在粒度上的層級關(guān)系,多尺度的時(shí)間屬性編碼可以支持更高效、細(xì)粒度的數(shù)據(jù)可視分析。在數(shù)據(jù)量巨大、軌跡相互遮擋問題嚴(yán)重時(shí),合理的時(shí)間多尺度表達(dá)和便捷的交互操作有利于對OD數(shù)據(jù)進(jìn)行細(xì)粒度的分析。
在進(jìn)行時(shí)空數(shù)據(jù)的可視化設(shè)計(jì)時(shí),有些學(xué)者選擇動(dòng)態(tài)效果展示時(shí)變規(guī)律,也有選擇靜態(tài)的展示。Small muliples是一系列靜態(tài)圖像,其描繪了某個(gè)時(shí)刻的OD數(shù)據(jù)變化情況,但顯示的時(shí)間段越多,每個(gè)圖像就必須足夠小,難以看到細(xì)節(jié),如圖2(d)所示。
動(dòng)畫類型的展示常常用在時(shí)間屬性的可視化上,動(dòng)畫中每一幅圖像依次出現(xiàn)或使用交互控件在特定時(shí)間段內(nèi)切換,如圖2(e)所示。文獻(xiàn)[33]對動(dòng)畫和small multiples編碼流向圖的時(shí)間屬性的差異性做了定性實(shí)驗(yàn)對比,該實(shí)驗(yàn)不是為了衡量二者表現(xiàn),而是為了找出2種表現(xiàn)方式分析出的結(jié)論是否有質(zhì)的差異。結(jié)果發(fā)現(xiàn)利用動(dòng)畫,用戶對局部事件和隨后幾年的變化能有更多發(fā)現(xiàn),而small multiples需要多個(gè)時(shí)間周期,才能對視圖有更多地發(fā)現(xiàn)。
圖2 時(shí)間屬性的可視化((a)弦圖的時(shí)間多尺度表達(dá)[31];(b)OD行程時(shí)間圖設(shè)計(jì)[35];(c)Flowstrates時(shí)間熱力圖[36];(d)Small multiples視圖[33];(e)動(dòng)畫視圖設(shè)計(jì)[33];(f)第三維度展示時(shí)間[37])
研究人員將圓形視圖繪制成鐘形來進(jìn)行時(shí)間屬性的可視化。ZENG等[34]使用等時(shí)線視圖、等時(shí)流圖、OD起止對行程進(jìn)行可視化,高效執(zhí)行關(guān)于OD數(shù)據(jù)的分析任務(wù)。文獻(xiàn)[31]使用Circos弦圖對OD數(shù)據(jù)進(jìn)行時(shí)間屬性多尺度的可視化,通過改變外圈的時(shí)間粒度,結(jié)合熱度圖、直方圖以及弦圖探索居民出行數(shù)據(jù),如圖2(a)所示。LIU等[35]設(shè)計(jì)了一個(gè)漸變顏色的圓環(huán)來編碼一天的時(shí)間,軌跡顯示在圓中心,統(tǒng)計(jì)信息的條形圖編碼在圓的外部,軌跡的兩端分別表示起始和終止時(shí)間,如圖2(b)所示,對出租車數(shù)據(jù)的線路多樣性進(jìn)行可視分析。
單個(gè)視圖難以表現(xiàn)時(shí)空數(shù)據(jù)的特征,BOYANDIN等[36]開發(fā)了Flowstrates,將OD流的起點(diǎn)和終點(diǎn)分別顯示在2個(gè)單獨(dú)的地圖中,流量大小隨時(shí)間的變化在中間的一個(gè)單獨(dú)的熱力圖中展示,如圖2(c)所示。除了以上幾種表現(xiàn)形式,3D也被用在時(shí)間屬性的可視化設(shè)計(jì)中。PROULX等[37]用第三維度顯示時(shí)間變化,另外,2個(gè)維度用于顯示每個(gè)特定時(shí)刻的二維表示,但該表現(xiàn)方式只適用于流量少的情況,若發(fā)生在大流量的情況下,容易出現(xiàn)遮擋、視覺混淆等問題,如圖2(f)所示。
可視化技術(shù)可用來展示抽象數(shù)據(jù)的不同特征,當(dāng)用戶不知復(fù)雜的數(shù)據(jù)能反映出什么樣的規(guī)律和知識時(shí),通過交互手段對數(shù)據(jù)進(jìn)行分析挖掘是非常重要的。
選擇和過濾、篩選的交互方式常常被用在時(shí)空數(shù)據(jù)的可視化中,CUENCA等[38]提出了交互式可視化工具EvoFlows,其使用多個(gè)交互組件對OD數(shù)據(jù)進(jìn)行時(shí)間和空間的探索;大量使用動(dòng)畫過渡展示時(shí)空屬性,條形圖的橫坐標(biāo)可以鎖定特定時(shí)間周期內(nèi)的最大值,而縱軸可以篩選需要展示的OD流子集,如圖3(d)所示。ZENG等[39]提出途徑限制的OD數(shù)據(jù)可視化方法,通過交互式過濾滿足途徑限制的軌跡;連續(xù)點(diǎn)擊2次,選擇一個(gè)OD流流入點(diǎn)和流出點(diǎn),或從流入點(diǎn)拖動(dòng)到流出點(diǎn)來限制路徑,如圖3(a)所示。
圖3 用戶交互((a)交互式設(shè)置途徑限制[39];(b)標(biāo)注工具標(biāo)注正確地點(diǎn)[42];(c)OD-Wheel探測感興趣區(qū)域的交通量[44];(d)允許修改布局的條形圖[38];(e)交互式聚類界面[41])
多視圖協(xié)同的方式能高效地從多個(gè)角度對時(shí)空數(shù)據(jù)進(jìn)行挖掘分析,SHI等[40]設(shè)計(jì)了公共自行車數(shù)據(jù)流的可視化分析系統(tǒng)。4個(gè)視圖協(xié)同工作,分析過程從空間過濾開始,在地圖上選擇地點(diǎn)或刷選區(qū)域,再進(jìn)行時(shí)間視圖的篩選,平行坐標(biāo)圖和熱力圖同步更新以探索細(xì)節(jié)。DING等[41]設(shè)計(jì)了系統(tǒng)支持特定時(shí)間的窗口,以查詢移動(dòng)數(shù)據(jù),且支持交互式聚類,如圖3(e)所示,用平行坐標(biāo)圖可視化計(jì)算出的簇并通過參數(shù)的調(diào)整進(jìn)一步探索感興趣的簇。
YU等[42]開發(fā)了iVizTRANS交互式分析組件,結(jié)合機(jī)器學(xué)習(xí)組件,可知曉通勤者出行的動(dòng)態(tài)信息,當(dāng)分類器給出一個(gè)被人類認(rèn)為是錯(cuò)誤的推斷時(shí),用戶可以進(jìn)行標(biāo)注和注釋,對可視分析進(jìn)行糾正;如圖3(b)所示。LU等[43]提出OD輪的可視化方法,支持交互式探索并檢測異常;后LU等[44]改進(jìn)了OD輪,不限于中心區(qū)域相關(guān)的OD簇,目的在于探索簇動(dòng)態(tài)變化的同時(shí),詳細(xì)比較簇之間的OD模式,如圖3(c)所示。
對OD數(shù)據(jù)可視化的研究產(chǎn)生了各種各樣的可視化工具和系統(tǒng),一個(gè)功能完善的可視化系統(tǒng)應(yīng)該盡可能地滿足用戶的可視分析任務(wù)。姜曉睿等[45]利用出租車數(shù)據(jù)的OD信息設(shè)計(jì)了可視分析系統(tǒng),從全局概覽圖上選擇感興趣的區(qū)域,使用環(huán)形像素圖對時(shí)間進(jìn)行編碼,結(jié)合時(shí)空堆棧圖分析數(shù)據(jù)背后的時(shí)空模式,為交通管理部門調(diào)配車輛做出協(xié)助。文獻(xiàn)[38]提出的EvoFlows結(jié)合了依賴于時(shí)間序列可視化的系統(tǒng)MultiStream和流向圖,通過交互在不同層次上對難民遷移數(shù)據(jù)進(jìn)行研究,如圖4(a)所示。GUO[46]針對人口遷移提出的框架包括層次化分區(qū)、流映射、多元聚類和交互式可視化方法,支持處理較大數(shù)據(jù),同時(shí)有效地發(fā)現(xiàn)主要的流結(jié)構(gòu)和多元關(guān)系,如圖4(b)所示。HUANG等[47]利用上海軌道交通數(shù)據(jù),采用高度可視化框架,從網(wǎng)絡(luò)、線路、車站、區(qū)間4個(gè)方面挖掘客流數(shù)據(jù)。
圖4 OD數(shù)據(jù)可視化系統(tǒng)((a) EvoFlows制作的難民遷移圖[38];(b)美國人口遷移的流圖可視分析[46];(c)自行車群體行為可視分析[10];(d)帶有地理標(biāo)記的社交媒體數(shù)據(jù)可視分析[49])
針對地理標(biāo)記的社交媒體稀疏采樣的運(yùn)動(dòng)數(shù)據(jù),CHEN等[48]的OD可視分析系統(tǒng)Movement Finder,強(qiáng)調(diào)了將具有地理標(biāo)簽的社交媒體數(shù)據(jù)應(yīng)用于OD信息的構(gòu)建。后來CHEN等[49]對該工作進(jìn)行了進(jìn)一步改進(jìn),結(jié)合人類的認(rèn)知能力和機(jī)器的計(jì)算能力,為語義模式的提取提供了一套交互式可視化工具,如圖4(d)所示。文獻(xiàn)[10]基于公共自行車數(shù)據(jù),定義群體移動(dòng)行為,設(shè)計(jì)了多視圖協(xié)同的可視分析系統(tǒng),支持從區(qū)域深入到確定地點(diǎn)的可視分析,如圖4(c)所示。表1對OD可視化系統(tǒng)進(jìn)行了總結(jié),說明了各個(gè)系統(tǒng)的主要貢獻(xiàn)和特色,還加入了是否支持中文提到的OD數(shù)據(jù)可視分析任務(wù)的指標(biāo)。
表1 OD數(shù)據(jù)可視化系統(tǒng)總結(jié)
注:√為支持OD數(shù)據(jù)可視分析;×為不支持OD數(shù)據(jù)可視分析
本節(jié)介紹OD數(shù)據(jù)可視化技術(shù)在城市交通管理、人口遷移、流動(dòng)性分析等領(lǐng)域的應(yīng)用。
ZHOU等[50]基于出租車數(shù)據(jù)對城市功能區(qū)進(jìn)行探索,采用矩陣分解對城市功能區(qū)進(jìn)行分類識別,結(jié)合力導(dǎo)向圖、時(shí)間線圖和雷達(dá)圖分析城市不同功能區(qū)人員流動(dòng)方式,如圖5(a)所示。文獻(xiàn)[40]針對公共自行車數(shù)據(jù)開發(fā)了4個(gè)視圖相互關(guān)聯(lián)的可視化系統(tǒng),說明了數(shù)據(jù)的時(shí)空變化、流起始點(diǎn)和終止點(diǎn)之間的關(guān)系和差異,以及影響自行車租賃的因素,有效地發(fā)現(xiàn)交通流模式,為交通研究者和城市規(guī)劃者提供服務(wù)。WIDYAWAN等[51]針對公交數(shù)據(jù)使用行程鏈?zhǔn)剿惴ㄉ蒓D矩陣,推斷上下車站地點(diǎn)及分析乘客行為模式。LIU等[52]以多維時(shí)空數(shù)據(jù)創(chuàng)建張量模型,提出張量分解算法,并將數(shù)據(jù)進(jìn)行均勻分區(qū),提取分區(qū)的潛在模式用于比較和可視化,分析不同模式下的交通情況。ENNEKES和CHEN[53]使用簡單視覺編碼提供數(shù)據(jù)整體交通流情況,使用過濾和顏色編碼提供改進(jìn),設(shè)計(jì)繪制的每條邊均為中途點(diǎn)到目的地,專注輸入流量,而輸出流量則在每個(gè)起點(diǎn)用一個(gè)小圓環(huán)表示,可以感知更多的信息。
在人口遷移和群體移動(dòng)等領(lǐng)域,文獻(xiàn)[22]根據(jù)地圖設(shè)計(jì)原則創(chuàng)建OD流布局來提高流圖可讀性,通過自定義界面和交互地圖探索美國各州之間的遷移,將其他州表示為圍繞選定州的圓形節(jié)點(diǎn)表示遷移流動(dòng)。文獻(xiàn)[38]使用實(shí)際地圖展示空間屬性,結(jié)堆棧圖展示不同空間尺度的時(shí)間維度屬性,系統(tǒng)對實(shí)際難民轉(zhuǎn)移數(shù)據(jù)進(jìn)行分析,說明了其實(shí)用性,如圖5(c)所示。文獻(xiàn)[46]針對人口遷移提出的框架包括層次化分區(qū)、流映射、多元聚類和交互式可視化方法,支持處理較大數(shù)據(jù),同時(shí)有效地發(fā)現(xiàn)主要的流結(jié)構(gòu)和多元關(guān)系。
WOOD等[54]使用3種自行車租賃和旅行模式的方法,將帶有方向的流向圖用于顯示全局概覽,保留地理關(guān)系的網(wǎng)格視圖探索站點(diǎn)在空間和時(shí)間上的狀態(tài),起止點(diǎn)地圖用OD矩陣提供視覺細(xì)節(jié)的要求。識別流動(dòng)行為在時(shí)間和空間上的變化,以幫助自行車站點(diǎn)科學(xué)高效部署。ZHU等[55]提出一種基于密度的流圖泛化方法,在不同地圖的比例尺和概括層次上發(fā)現(xiàn)紐約市出租車出行潛在和抽象的流模式,合理安排出租車,以滿足市民出行需求,如圖5(b)所示。
圖5 OD數(shù)據(jù)可視化應(yīng)用舉例((a)基于出租車時(shí)空OD數(shù)據(jù)的城市功能可視化[50];(b)曼哈頓早高峰的主要流量模式[55];(c)難民遷移的時(shí)空演化[38])
近十幾年來,起止點(diǎn)數(shù)據(jù)的可視化研究有了很大地發(fā)展,研究人員創(chuàng)造性地提出了解決痛點(diǎn)的可視化表達(dá),使得時(shí)空數(shù)據(jù)的可視化技術(shù)廣泛應(yīng)用在眾多領(lǐng)域。本文對OD數(shù)據(jù)的概念、屬性以及可視分析任務(wù)進(jìn)行了介紹,并針對OD數(shù)據(jù)的屬性而產(chǎn)生的各種可視化方法、交互方式以及可視化系統(tǒng)進(jìn)行了總結(jié)。最后對OD數(shù)據(jù)可視化應(yīng)用進(jìn)行案例分析。
隨著時(shí)空數(shù)據(jù)大量地涌現(xiàn)、社會(huì)和技術(shù)的高速發(fā)展,新的挑戰(zhàn)將不斷出現(xiàn)。
大量的OD數(shù)據(jù)會(huì)導(dǎo)致可視化元素之間遮擋,產(chǎn)生混淆。盡管已經(jīng)有了流向圖中的邊過濾、邊捆綁[56]、以及聚類[57]技術(shù)解決了部分視覺遮擋問題,但其均由舍棄了部分?jǐn)?shù)據(jù)換來的,這在一定程度破壞了數(shù)據(jù)的真實(shí)性。
OD數(shù)據(jù)的可視化不僅涉及到過濾移除部分信息,還要添加部分信息,信息論可以解釋可視化中信息變化的好處,因此如何使用不同類型的OD數(shù)據(jù)信息的修改來構(gòu)建新的設(shè)計(jì)空間[53]是一個(gè)挑戰(zhàn)。
OD數(shù)據(jù)的可視分析需要與應(yīng)用領(lǐng)域更好地結(jié)合起來才能解決各種實(shí)際問題。現(xiàn)可視分析均需領(lǐng)域內(nèi)的專業(yè)人員進(jìn)行參與,同時(shí)可視分析的研究人員要與領(lǐng)域?qū)<冶3纸涣鳌R虼素酱枰梢环N特定應(yīng)用領(lǐng)域的自動(dòng)可視分析方法,目前這方面的工作還很少。
隨著物聯(lián)網(wǎng)、大數(shù)據(jù)技術(shù)的飛速發(fā)展,未來采集和存儲(chǔ)的OD數(shù)據(jù)會(huì)越來越多,還會(huì)有更多領(lǐng)域的數(shù)據(jù),OD數(shù)據(jù)不僅僅可以代表軌跡的起始點(diǎn)和終止點(diǎn),而且可以是抽象意義上的起點(diǎn)和終點(diǎn)。除了應(yīng)用廣泛的領(lǐng)域,還有一些抽象OD數(shù)據(jù)的應(yīng)用領(lǐng)域,比如在網(wǎng)絡(luò)安全會(huì)話數(shù)據(jù)可視化中,將一個(gè)動(dòng)作編碼為一個(gè)城市,將用戶會(huì)話編碼為穿過城市的痕跡[58],這樣就轉(zhuǎn)換成了OD數(shù)據(jù)可視化。同樣的轉(zhuǎn)換還有,像文本可視化中的話題跳轉(zhuǎn),軟件可視化中的代碼引用等等。
[1] YUE Y, ZHUANG Y, LI Q Q, et al. Mining time-dependent attractive areas and movement patterns from taxi trajectory data[C]//2009 17th International Conference on Geoinformatics. New York: IEEE Press, 2009: 1-6.
[2] ZHANG W S, LI S J, PAN G. Mining the semantics of origin-destination flows using taxi traces[C]//2012 ACM Conference on Ubiquitous Computing. New York: ACM Press, 2012: 943-949.
[3] PAN G, QI G D, WU Z H, et al. Land-use classification using taxi GPS traces[J]. IEEE Transactions on Intelligent Transportation Systems, 2013, 14(1): 113-123.
[4] ANTONY J, GREBEL T. Technology flows between sectors and their impact on large-scale firms[J]. Applied Economics, 2012, 44(20): 2637-2651.
[5] SHNEIDERMAN B. The eyes have it: a task by data type Taxonomy for Information Visualizations-ScienceDirect[EB/OL]. [2021-04-15]. https://doi.org/10.1016/ 8978-155860915-0/50046-9.
[6] ANDRIENKO N, ANDRIENKO G. Exploratory analysis of spatial and temporal data: a systematic approach. Springer[EB/OL]. (2006-01-01) [2021-04-30]. https://link.springer.c-om/book/10.1007/3-540-31190-4.
[7] AMAR R A, EAGAN J R, STASKO J. Low-level components of analytic activity in information visualization[C]//IEEE Symposium on Information Visualization, 2005. New York: IEEE Press, 2005: 111-117.
[8] LEE B, PLAISANT C, PARR C S, et al. Task taxonomy for graph visualization[C]//2006 AVI workshop on Beyond time and errors novel evaluation methods for information visualization. New York: ACM Press, 2006: 82-86.
[9] 王祖超, 袁曉如. 軌跡數(shù)據(jù)可視分析研究[J]. 計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào), 2015, 27(1): 9-25.
WANG Z C, YUAN X R. Visual analysis of trajectory data[J]. Journal of Computer-Aided Design & Computer Graphics, 2015, 27(1): 9-25 (in Chinese).
[10] 黃文達(dá), 陶煜波, 屈珂, 等. 基于OD數(shù)據(jù)的群體行為可視分析[J]. 計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào), 2018, 30(6): 1023-1033.
HUANG W D, TAO Y B, QU K, et al. Visual analysis of group behavior based on origin-destination data[J]. Journal of Computer-Aided Design & Computer Graphics, 2018, 30(6): 1023-1033 (in Chinese).
[11] TOBLER W. Movement mapping[EB/OL]. (2009-05-08) [2021-04-17]. http://csiss.ncgia.ucsb.edu/clearinghouse/Flow- Mapper/MovementMapping.pdf.
[12] ZHU X, GUO D S. Mapping large spatial flow data with hierarchical clustering[J]. Transactions in GIS, 2014, 18(3): 421-435.
[13] GAO S, LIU Y, WANG Y, et al. Discovering spatial interaction communities from mobile phone data[J]. Transactions in GIS, 2013, 17(3): 463-481.
[14] PHAN D, LING X, YEH R, et al. Flow map layout[C]//IEEE Symposium on Information Visualization, 2005. New York: IEEE Press, 2005: 219-224.
[15] BUCHIN K, SPECKMANN B, VERBEEK K. Flow map layout via spiral trees[J]. IEEE Transactions on Visualization and Computer Graphics, 2011, 17(12): 2536-2544.
[16] ERSOY O, HURTER C, PAULOVICH F, et al. Skeleton-based edge bundling for graph visualization[J]. IEEE Transactions on Visualization and Computer Graphics, 2011, 17(12): 2364-2373.
[17] ANDRIENKO G, ANDRIENKO N, FUCHS G, et al. Revealing patterns and trends of mass mobility through spatial and temporal abstraction of origin-destination movement data[J]. IEEE Transactions on Visualization and Computer Graphics, 2016, 23(9): 2120-2136.
[18] ZHOU Z G, MENG L H, TANG C, et al. Visual abstraction of large scale geospatial origin-destination movement data[J]. IEEE Transactions on Visualization and Computer Graphics, 2018, 25(1): 43-53.
[19] XIANG Q, WU Q. Tree-based and optimum cut-based origin-destination flow clustering[J]. ISPRS International Journal of Geo-Information, 2019, 8(11): 477.
[20] SELASSIE D, HELLER B, HEER J. Divided edge bundling for directional network data[J]. IEEE Transactions on Visualization and Computer Graphics, 2011, 17(12): 2354-2363.
[21] ZENG W, SHEN Q, JIANG Y, et al. Route-aware edge bundling for visualizing origin-destination trails in urban traffic[J]. Computer Graphics Forum, 2019, 38(3): 581-593.
[22] STEPHEN D M, JENNY B. Automated layout of origin-destination flow maps: US county-to-county migration 2009-2013[J]. Journal of Maps, 2017, 13(1): 46-55.
[23] GUO D S, ZHU X. Origin-destination flow data smoothing and mapping[J]. IEEE Transactions on Visualization and Computer Graphics, 2014, 20(12): 2043-2052.
[24] ANDRIENKO G, ANDRIENKO N. Spatio-temporal aggregation for visual analysis of movements[C]//2008 IEEE Symposium on Visual Analytics Science and Technology. New York: IEEE Press, 2008: 51-58.
[25] WOOD J, DYKES J, SLINGSBY A. Visualisation of origins, destinations and flows with OD maps[J]. The Cartographic Journal, 2010, 47(2): 117-129.
[26] YANG Y L, DWYER T, GOODWIN S, et al. Many-to-many geographically-embedded flow visualisation: an evaluation[J]. IEEE Transactions on Visualization and Computer Graphics, 2016, 23(1): 411-420.
[27] SLINGSBY A, KELLY M, DYKES J, et al. OD maps for studying historical internal migration in ireland[C]//Poster Presented at the IEEE Conference on Information Visualization. New York: IEEE Press, 2012: 14-19.
[28] BOSTOCK M. Uber rides by neighborhood[EB/OL]. (2012-01-09) [2021-04-17]. http://bost.ocks.org/mike/uberdata/.
[29] SPECKMANN B, VERBEEK K. Necklace maps[J]. IEEE Transactions on Visualization and Computer Graphics, 2010, 16(6): 881-889.
[30] SHI X Y, LV F, SENG D, et al. Exploring the evolutionary patterns of urban activity areas based on origin-destination data[J]. IEEE Access, 2019, 7: 20416-7:20431.
[31] 馮濤, 艾廷華, 楊偉, 等. 基于Circos弦圖的居民出行模式可視分析[J]. 華中師范大學(xué)學(xué)報(bào): 自然科學(xué)版, 2016, 50(3): 471-480.
FENG T, AI T H, YANG W, et al. Visual analysis of residents travel pattern based on Circos Graph[J]. Journal of Central China Normal University: Natural Sciences, 2016, 50(3): 471-480 (in Chinese).
[32] YANG Y L, DWYER T, JENNY B, et al. Origin-destination flow maps in immersive environments[J]. IEEE Transactions on Visualization and Computer Graphics, 2018, 25(1): 693-703.
[33] BOYANDIN I, BERTINI E, LALANNE D. A qualitative study on the exploration of temporal changes in flow maps with animation and small-multiples[J]. Computer Graphics Forum, 2012, 31(3pt2): 1005-1014.
[34] ZENG W, FU C W, ARISONA S M, et al. Visualizing mobility of public transportation system[J]. IEEE Transactions on Visualization and Computer Graphics, 2014, 20(12): 1833-1842.
[35] LIU H, GAO Y, LU L, et al. Visual analysis of route diversity[C]//2011 IEEE Conference on Visual Analytics Science and Technology. New York: IEEE Press, 2011: 171-180.
[36] BOYANDIN I, BERTINI E, BAK P, et al. Flowstrates: an approach for visual exploration of temporal origin-destination data[J]. Computer Graphics Forum, 2011, 30(3): 971-980.
[37] PROULX P, KHAMISA A, HARPER R. Integrated visual analytics workflow with GeoTime and nSpace VAST 2010 mini challenge 1 award: Outstanding Analysis and Accuracy[C]//2010 IEEE Symposium on Visual Analytics Science and Technology. New York: IEEE Press, 2010: 273274.
[38] CUENCA E, ED ERIC DOCQUIER F, NIJSSEN S, et al. EvoFlows: an interactive approach for visualizing spatial and temporal trends in origin-destination data[EB/OL]. [2020-04-20]. https://info.ucl.ac.be/~pschaus/assets/publi/20- 20evoflows.pdf.
[39] ZENG W, FU C W, MüLLER ARISONA S, et al. Visualizing waypoints-constrained origin-destination patterns for massive transportation data[J]. Computer Graphics Forum, 2016, 35(8): 95-107.
[40] SHI X Y, YU Z H, CHEN J, et al. The visual analysis of flow pattern for public bicycle system[J]. Journal of Visual Languages & Computing, 2018, 45: 51-60.
[41] DING L F, MENG B L, YANG B J, et al. Interactive visual exploration and analysis of origin-destination data[J]. Proceedings of the ICA, 2018, 1: 1-5.
[42] YU L, WU W, LI X H, et al. iVizTRANS: interactive visual learning for home and work place detection from massive public transportation data[C]//2015 IEEE Conference on Visual Analytics Science and Technology. New York: IEEE Press, 2015: 49-56.
[43] LU M, LIANG J, WANG Z C, et al. Exploring OD patterns of interested region based on taxi trajectories[J]. Journal of Visualization, 2016, 19(4): 811-821.
[44] LU M, WANG Z C, LIANG J, et al. OD-Wheel: visual design to explore OD patterns of a central region[C]//2015 IEEE Pacific Visualization Symposium (PacificVis). New York: IEEE Press, 2015: 87-91.
[45] 姜曉睿, 鄭春益, 蔣莉, 等. 大規(guī)模出租車起止點(diǎn)數(shù)據(jù)可視分析[J]. 計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào), 2015, 27(10): 1907-1917.
JIANG X R, ZHENG C Y, JIANG L, et al. Visual analysis of large taxi origin-destination data[J]. Journal of Computer-Aided Design & Computer Graphics, 2015, 27(10): 1907-1917 (in Chinese).
[46] GUO D S. Flow mapping and multivariate visualization of large spatial interaction data[J]. IEEE Transactions on Visualization and Computer Graphics, 2009, 15(6): 1041-1048.
[47] HUANG Z Y, ZHANG L, XU R H, et al. Application of big data visualization in passenger flow analysis of Shanghai Metro network[C]//2017 2nd IEEE International Conference on Intelligent Transportation Engineering. New York: IEEE Press, 2017: 184-188.
[48] CHEN S M, GUO C, YUAN X R, et al. MovementFinder: visual analytics of origin-destination patterns from geo-tagged social media[C]//2014 IEEE Conference on Visual Analytics Science and Technology. New York: IEEE Press, 2014: 239-240.
[49] CHEN S M, YUAN X R, WANG Z H, et al. Interactive visual discovering of movement patterns from sparsely sampled geo-tagged social media data[J]. IEEE Transactions on Visualization and Computer Graphics, 2016, 22(1): 270-279.
[50] ZHOU Z G, YU J J, GUO Z Y, et al. Visual exploration of urban functions via spatio-temporal taxi OD data[J]. Journal of Visual Languages & Computing, 2018, 48: 169-177.
[51] WIDYAWAN, PRAKASA B, PUTRA D W, et al. Big data analytic for estimation of origin-destination matrix in Bus Rapid Transit system[C]//2017 3rd International Conference on Science and Technology - Computer. New York: IEEE Press, 2017: 165-170.
[52] LIU D Y, XU P P, REN L. TPFlow: progressive partition and multidimensional pattern extraction for large-scale spatio-temporal data analysis[J]. IEEE Transactions on Visualization and Computer Graphics, 2019, 25(1): 1-11.
[53] ENNEKES M, CHEN M. Design space of origin-destination data visualization[C]//Computer Graphics Forum. Chichester: John Wiley & Sons, Ltd, 2021: 323-334.
[54] WOOD J, SLINGSBY A, DYKES J. Visualizing the dynamics of london's bicycle-hire scheme[J]. Cartographica: the International Journal for Geographic Information and Geovisualization, 2011, 46(4): 239-251.
[55] ZHU X, GUO D, KOYLU C, et al. Density-based multi-scale flow mapping and generalization[EB/OL]. (2019-07-24) [2020-04-20]. https://www.researchgate.net/publication/334- 635204_Density-based_multiscale_flow_mapping_and_gen-eralization.
[56] YAN L, LIU X, CHEN H, et al. OD morphing: balancing simplicity with faithfulness for OD bundling[J]. IEEE Transactions on Visualization and Computer Graphics, 2020, 26(1): 811-821.
[57] GUO X G, XU Z J, ZHANG J Q, et al. An OD flow clustering method based on vector constraints: a case study for Beijing taxi origin-destination data[J]. ISPRS International Journal of Geo-Information, 2020, 9(2): 128.
[58] CHEN S M, CHEN S, ANDRIENKO N, et al. User behavior map: visual exploration for cyber security session data[C]//2018 IEEE Symposium on Visualization for Cyber Security. New York: IEEE Press, 2018: 1-4.
Visual analysis of origin-destination data
MA Xiao-dong1,2,3, REN Peng-kun1,2,3, ZHAO Fan1,3
(1. Xinjiang Technical Institute of Physics & Chemistry, Chinese Academy of Sciences, Urumqi Xinjiang 830011, China; 2. University of Chinese Academy of Sciences, Beijing 100049, China; 3. Xinjiang Laboratory of Minority Speech and Language Information Processing, Urumqi Xinjiang 830011, China)
Origin-destination data was a kind of trajectory data composed of start point, end point, time, and some other attributes. It was a typical spatio-temporal data, which was generated in such fields as urban transportation management, population migration, and social media. Visual analysis technology was widely employed to study the spatio-temporal pattern of large-scale origin-destination data, accomplishing the deep exploration of data. Firstly, we introduced the characteristics of origin-destination data and the tasks of visual analysis. Secondly, we reviewed the existing visualization methods, interaction technologies, and visualization systems of origin-destination data in recent years, and presented the application cases in different fields. Finally, we summarized the problems and challenges in relevant research, and envisioned the prospect of the research on visualization of origin-destination data, shedding new light on future research.
origin-destination data; spatio-temporal data; visual analysis
23 June,2021;
TP 391
10.11996/JG.j.2095-302X.2022010001
A
2095-302X(2022)01-0001-10
2021-06-23;
2021-09-10
10 September,2021
新疆維吾爾自治區(qū)重大專項(xiàng)(2020A03004-4)
Major Project of Xinjiang Uygur Autonomous Region (2020A03004-4)
馬小東(1996–),男,碩士研究生。主要研究方向?yàn)閿?shù)據(jù)可視化。E-mail:maxiaodong19@mails.ucas.ac.cn
MA Xiao-dong (1996–), master student. His main research interest covers data visualization. E-mail:maxiaodong19@mails.ucas.ac.cn
趙 凡(1980–),男,研究員,博士。主要研究方向?yàn)榇髷?shù)據(jù)分析及可視化。E-mail:zhaofan@ms.xjb.ac.cn
ZHAO Fan (1980–), researcher, Ph.D. His main research interests cover big data analysis and visualization. E-mail:zhaofan@ms.xjb.ac.cn