唐爐亮,戴 領(lǐng),任 暢,張 霞
1. 武漢大學(xué)測(cè)繪遙感信息工程國(guó)家重點(diǎn)實(shí)驗(yàn)室,湖北 武漢 430079; 2. 武漢大學(xué)城市設(shè)計(jì)學(xué)院,湖北 武漢 430070
城市活動(dòng)事件是指在城市中發(fā)生的計(jì)劃性事件或時(shí)空現(xiàn)象,如體育賽事、娛樂(lè)演出、游行集會(huì)等活動(dòng),是城市環(huán)境、人群和管理系統(tǒng)三者之間交互的產(chǎn)物[1],可預(yù)見(jiàn)性的人群聚集與長(zhǎng)時(shí)的演變過(guò)程是其主要特點(diǎn)。城市居民通過(guò)參與事件而獲得獨(dú)特的體驗(yàn),對(duì)一座城市而言,城市活動(dòng)事件是城市品牌化[2](City Branding)的重要手段之一,在促進(jìn)城市經(jīng)濟(jì)、文化、娛樂(lè)、體育等發(fā)展上具有重要意義。近年來(lái),城市活動(dòng)事件規(guī)模、影響力逐漸擴(kuò)大,報(bào)告顯示,北京2017年?duì)I業(yè)性演出場(chǎng)次多達(dá)24 557場(chǎng),觀眾人數(shù)共計(jì)1 075.8萬(wàn)人次[3]。
城市活動(dòng)事件的發(fā)生對(duì)城市的現(xiàn)實(shí)空間與賽博空間都會(huì)產(chǎn)生影響,易引起交通擁堵、局部資源緊缺、網(wǎng)絡(luò)通信不暢等城市問(wèn)題。因此,從現(xiàn)實(shí)空間與賽博空間對(duì)城市活動(dòng)事件的感知與表達(dá),分析城市活動(dòng)事件的時(shí)空變化過(guò)程,建立城市活動(dòng)事件時(shí)空模型,刻畫(huà)事件全過(guò)程中城市地理空間與行為空間的時(shí)空特征演變,對(duì)城市建設(shè)與管理具有重要的理論研究與應(yīng)用價(jià)值。
現(xiàn)有對(duì)城市活動(dòng)事件的研究大多立足于交通或社交媒體單一數(shù)據(jù)源,以事件發(fā)現(xiàn)為目標(biāo),采用交通異常檢測(cè)[4-12]、文本挖掘[12-15]等手段進(jìn)行事件的探測(cè),而忽視對(duì)事件的感知和刻畫(huà)。在以現(xiàn)實(shí)空間交通數(shù)據(jù)為核心的城市事件研究中,對(duì)事件的刻畫(huà)與表達(dá)常輔助于事件的探測(cè),如文獻(xiàn)[8]采用有向圖結(jié)構(gòu)表示交通異常,利用出租車軌跡、公共自行車租借數(shù)據(jù)計(jì)算交通流量作為圖的邊屬性,從而探測(cè)交通聚集事件;文獻(xiàn)[12]提出路段模式(routing pattern,RP)以描述道路交通流量的變化情況,并結(jié)合社交媒體數(shù)據(jù),對(duì)異常情況作出對(duì)應(yīng)的事件解釋;文獻(xiàn)[16]在基于數(shù)據(jù)立方的時(shí)空框架下刻畫(huà)并探測(cè)城市擁堵事件。以賽博空間社交媒體數(shù)據(jù)為核心的城市事件研究則側(cè)重于探究事件的發(fā)展與演變趨勢(shì)[15,17-19],如文獻(xiàn)[18]利用社交媒體數(shù)據(jù)提取事件脈絡(luò),采用圖結(jié)構(gòu)構(gòu)建事件模型,根據(jù)社交媒體數(shù)據(jù)的相似度和關(guān)聯(lián)度追蹤事件前后發(fā)展;文獻(xiàn)[19]基于社交媒體建立突發(fā)事件的應(yīng)急主題分類模型,探究暴雨、災(zāi)害等事件的時(shí)間趨勢(shì)和空間分布。從以上分析可知,從交通數(shù)據(jù)研究城市活動(dòng)事件,現(xiàn)多側(cè)重于異常探測(cè),忽視事件的全過(guò)程感知與分析,對(duì)事件的刻畫(huà)也局限在事件發(fā)生的場(chǎng)所周圍,缺乏從城市尺度來(lái)分析事件。從社交媒體數(shù)據(jù)中研究城市活動(dòng)事件,則存在分析方法單一、統(tǒng)計(jì)方法與時(shí)空信息分離等問(wèn)題。更重要的是采用現(xiàn)實(shí)空間交通數(shù)據(jù)或賽博空間社交媒體數(shù)據(jù)的單一數(shù)據(jù)源研究,導(dǎo)致城市活動(dòng)事件刻畫(huà)分析不夠全面,不能真實(shí)反映城市事件對(duì)城市地理空間和行為空間的影響。
筆者提出了一種結(jié)合現(xiàn)實(shí)空間交通數(shù)據(jù)集與賽博空間社交媒體數(shù)據(jù)集的城市活動(dòng)事件時(shí)空建模與分析方法,從事件進(jìn)行中的交通軌跡,探測(cè)識(shí)別與事件顯著相關(guān)的城市時(shí)空區(qū)域和交通流,分析現(xiàn)實(shí)空間事件熱度的時(shí)空變化;從事件發(fā)生全過(guò)程的社交媒體數(shù)據(jù)中,探測(cè)分析賽博空間事件熱度的時(shí)空變化;通過(guò)將現(xiàn)實(shí)空間和賽博空間數(shù)據(jù)集融合,建立城市活動(dòng)事件時(shí)空模型,刻畫(huà)事件全過(guò)程中城市地理空間與行為空間的時(shí)空特征演變。
城市活動(dòng)事件是一個(gè)長(zhǎng)時(shí)的連續(xù)過(guò)程。如圖1所示,本文將事件過(guò)程定義為3個(gè)階段,即事件前期(④)、事件中期(⑤)、事件后期(⑥)。事件前期是事件發(fā)展階段,開(kāi)始于某個(gè)事前時(shí)刻,終止于事件當(dāng)天活動(dòng)開(kāi)場(chǎng)前N小時(shí),包括事件信息發(fā)布、網(wǎng)絡(luò)售票、群眾討論等過(guò)程。在這一階段賽博空間社交媒體數(shù)據(jù)是感知事件的有效手段。事件中期是事件發(fā)生進(jìn)行階段,始于活動(dòng)開(kāi)始前N小時(shí),終于活動(dòng)結(jié)束后M小時(shí)。在這一階段,賽博空間社交媒體數(shù)據(jù)和現(xiàn)實(shí)空間交通軌跡均可反映事件的影響。事件后期是事件延伸階段,始于活動(dòng)結(jié)束后M小時(shí),終于某個(gè)事后時(shí)刻,包括新聞發(fā)布、群眾討論等過(guò)程。這一階段,賽博空間數(shù)據(jù)集將作為事件描述的主要手段。
圖1 事件過(guò)程定義Fig.1 The course of events
對(duì)整個(gè)城市劃分地理格網(wǎng),格網(wǎng)單元r是基本地理分析單元,基于格網(wǎng)的定義如下:
格網(wǎng)車流量υ:在時(shí)間間隔t內(nèi),格網(wǎng)r的車流量υ為經(jīng)過(guò)該格網(wǎng)區(qū)域的車輛數(shù)目。
格網(wǎng)ri到rj的交通流ei-j:在時(shí)間間隔t內(nèi),從格網(wǎng)ri駛向格網(wǎng)rj的車的數(shù)目,通過(guò)有向邊表示。其中,ri為ei-j的起始格網(wǎng),rj為ei-j的終止格網(wǎng),ri與rj在空間上相鄰。
事件格網(wǎng)Le:事件發(fā)生場(chǎng)所所在的格網(wǎng)單元。
從現(xiàn)實(shí)空間交通軌跡看,體育賽事、娛樂(lè)演出等城市活動(dòng)事件是一個(gè)事前交通聚集、事后交通分散的過(guò)程,因此,本文對(duì)事件在現(xiàn)實(shí)空間的表達(dá)從區(qū)域交通量和交通流兩方面進(jìn)行。
1.2.1 基于EBP模型的交通異常似然比檢驗(yàn)
文獻(xiàn)[11]指出,在一天中特定時(shí)間間隔內(nèi)沿格網(wǎng)i流向格網(wǎng)j的觀測(cè)交通流量近似滿足泊松分布。該文獻(xiàn)采用基于期望的泊松模型[20](expectation-based poisson,EBP)檢測(cè)交通異常,從而探測(cè)城市活動(dòng)事件的發(fā)生。其基本思想是假設(shè)Ce是在時(shí)間間隔t內(nèi)邊e上的觀測(cè)交通流量值,Be是在同一時(shí)間間隔內(nèi)的邊e上的基準(zhǔn)交通流,則進(jìn)行以下假設(shè)檢驗(yàn)。
原假設(shè)H0:Ce~P(Be);
備擇假設(shè)H1:Ce~P(qBe),q>1;
EBP檢驗(yàn)公式為
(1)
當(dāng)LLR(e)>0且在α水平上顯著時(shí),則認(rèn)為交通流e顯著異常,LLR(e)越大,異常程度越高。
本文在該方法基礎(chǔ)上,將交通異常拓展到格網(wǎng)交通量上,在城市尺度上刻畫(huà)城市活動(dòng)事件。在格網(wǎng)交通量的異常探測(cè)中,采用卡方檢驗(yàn)(chi-square test)檢驗(yàn)格網(wǎng)車流量υ的顯著性,該統(tǒng)計(jì)量服從期望值為相同時(shí)間間隔內(nèi)格網(wǎng)車流量均值的泊松分布。因此,對(duì)格網(wǎng)車流量υ的異常探測(cè)采用式(1)的計(jì)算方法,顯著性檢驗(yàn)采用p值(P-Value,Probability,Pr)檢驗(yàn)。LLR(v)在α水平上顯著的充分條件是1-Pr(X 1.2.2 事件地點(diǎn)已知的路徑搜索策略 本文通過(guò)連接鄰接交通流有向邊表征事件中人群的聚集、分散的路徑,從局部時(shí)間、局部區(qū)域刻畫(huà)城市活動(dòng)事件中人群的流動(dòng)過(guò)程。在文獻(xiàn)[11]基礎(chǔ)上將路徑的搜索由四方向拓展到八方向,由對(duì)車流聚集過(guò)程的路徑搜索拓展到聚集過(guò)程和分散過(guò)程。由于本研究側(cè)重對(duì)事件的表達(dá)而非探測(cè),因此采用一種事件位置已知的路徑搜索策略。 對(duì)一場(chǎng)城市活動(dòng)事件而言,在人群聚集過(guò)程中,人們由城市各個(gè)部分向事件發(fā)生地(體育場(chǎng)、演唱會(huì)場(chǎng)地等)行進(jìn),路徑搜索是尋找聚集路徑的過(guò)程。路徑由前后相鄰的交通流有向邊構(gòu)成,即S=〈e1,e2,…,en〉。考慮到交通流具有空間、時(shí)間連續(xù)性,故車流路徑的每一個(gè)子單元ek都必須是流量顯著異常的有向邊。對(duì)聚集過(guò)程采用的路徑搜索策略如下: (1) 設(shè)每個(gè)交通流有向邊與事件格網(wǎng)(Le)的距離d為該交通流的終止格網(wǎng)與Le的棋盤距離,以Le為中心,設(shè)置最大搜索范圍dmax和8個(gè)方向,分別為上(U)、右上(UR)、右(R)、右下(DR)、下(D)、左下(DL)、左(L)、左上(UL)。 (2) 對(duì)滿足{d≤dmax}的任意顯著交通流ek,首先判斷它位于Le的哪一個(gè)方向,根據(jù)方向獲取其下一個(gè)可行格網(wǎng),即ek+1的終止格網(wǎng),并驗(yàn)證該有向邊的流量是否顯著。如圖2,當(dāng)前格網(wǎng)為邊ek的終點(diǎn),當(dāng)分別在事件格網(wǎng)的UR、U和R方向時(shí),其下一個(gè)可行格網(wǎng)分別有3個(gè)、1個(gè)、1個(gè)。 (3) 從{d=dmax}中搜索滿足LLR(e)>0的顯著邊集合E1={e1,e2,…,ei,…,en},以ei為起點(diǎn)按步驟(2)的原則搜索下一條顯著的交通流有向邊,直至到達(dá)Le,存儲(chǔ)每一條路徑途經(jīng)的非重復(fù)格網(wǎng)編號(hào)G=distinct(id1,…,idm)。對(duì)路徑中的有向邊,采用圖3樹(shù)狀結(jié)構(gòu)進(jìn)行搜索,每個(gè)節(jié)點(diǎn)代表一個(gè)格網(wǎng),由前一個(gè)節(jié)點(diǎn)指向后一個(gè)節(jié)點(diǎn)的線段代表一條有向邊,除起始節(jié)點(diǎn)外,每一個(gè)節(jié)點(diǎn)存在一個(gè)父節(jié)點(diǎn)和至多三個(gè)子節(jié)點(diǎn)。 (4) 從{d (5) 對(duì)每一個(gè)初始有向邊e∈{E1,E2}的路徑搜索結(jié)構(gòu),其葉子節(jié)點(diǎn)都是事件格網(wǎng)Le且每一個(gè)節(jié)點(diǎn)只存在一個(gè)父節(jié)點(diǎn),因此從葉子節(jié)點(diǎn)開(kāi)始自下向上逆向搜索,存儲(chǔ)每一條路徑。 (6) 對(duì)每一條路徑S計(jì)算每一個(gè)組成交通流的似然比均值,作為路徑的得分值Ssc??紤]到有向邊為斜邊和直邊時(shí),其分值對(duì)路徑的影響不同,因此對(duì)路徑總分值的計(jì)算采用式(2),消除斜邊的距離影響 (2) 式中,ei表示直邊;ek表示斜邊;N為路徑S的構(gòu)成有向邊的總數(shù)。 對(duì)獲取到的每一條路徑,存在路徑高度相似的情況,因此本文根據(jù)路徑相似度對(duì)所有路徑進(jìn)行初步篩選。采用式(3)進(jìn)行相似度計(jì)算。當(dāng)sim(S1,S2)>80%時(shí),則認(rèn)為兩條路徑相似,并刪除S1、S2中分值較小的一條路徑,從而得到候選路徑集合 (3) 式中,L表示路徑的長(zhǎng)。 圖4 相似路徑Fig.4 Similar routes 最后對(duì)所有候選路徑的分值進(jìn)行排序,選取其中前N條路徑作為事件聚集路徑。 對(duì)分散過(guò)程的路徑追蹤,總體思路與聚集過(guò)程一致,主要差別體現(xiàn)在以下兩點(diǎn): (1) 搜索路徑的起點(diǎn)為事件格網(wǎng),終點(diǎn)為{d=dmax}的交通流或{d (2) 方向改變導(dǎo)致8個(gè)方向上的下一可行格網(wǎng)的變化,以U、UR和R方向?yàn)槔?,其可行格網(wǎng)如圖5所示。 實(shí)際上,根據(jù)事件發(fā)生場(chǎng)所的規(guī)模與格網(wǎng)大小,事件格網(wǎng)可能不止一個(gè),因此,可設(shè)置多個(gè)事件格網(wǎng),并對(duì)多組路徑進(jìn)行比較。 城市活動(dòng)事件的賽博空間熱度在城市尺度上的時(shí)空分布,是事件對(duì)城市賽博空間影響力的體現(xiàn),這種影響力反過(guò)來(lái)也可作為刻畫(huà)城市活動(dòng)事件的有效途徑,即將事件在社交媒體數(shù)據(jù)中的熱度分值及其時(shí)間和空間屬性作為事件在賽博空間的表達(dá)手段。 事件在社交媒體文本數(shù)據(jù)中通過(guò)關(guān)鍵詞表達(dá),事件關(guān)鍵詞熱度近似等于事件的熱度。因此本文根據(jù)社交媒體文本和位置數(shù)據(jù)構(gòu)建針對(duì)不同時(shí)間單元的關(guān)鍵詞集,每一個(gè)關(guān)鍵詞集中包含事件相關(guān)的關(guān)鍵詞。以目前國(guó)內(nèi)熱門社交媒體平臺(tái)新浪微博的線上數(shù)據(jù)為例,對(duì)每一個(gè)關(guān)鍵詞,采用TF-IDF[21](term frequency-inverse document frequency)的思想,計(jì)算關(guān)鍵詞在對(duì)應(yīng)的格網(wǎng)單元中的重要程度,從而表征事件的賽博空間熱度。 (4) 式中,wt(rk,tm)表示在時(shí)間間隔tm內(nèi)、格網(wǎng)rk中關(guān)鍵詞t的重要程度;n為該格網(wǎng)中關(guān)鍵詞t的出現(xiàn)次數(shù);Nt表示在所有格網(wǎng)中t的出現(xiàn)次數(shù);|D|為所有格網(wǎng)中包含微博數(shù)據(jù)的格網(wǎng)數(shù)目;{j:t∈dj}表示所有包含關(guān)鍵詞t的格網(wǎng)數(shù)目,為保證分母不等于0,對(duì)其加1處理。 事實(shí)上,單條微博可能包含多個(gè)關(guān)鍵詞,而每一條微博所表征的事件熱度又是相等的,因此本文從每條微博中選取在該時(shí)間段內(nèi)出現(xiàn)頻次最大的關(guān)鍵詞來(lái)表征這條微博。 對(duì)時(shí)間間隔tm內(nèi)的一個(gè)格網(wǎng)單元rk,其賽博空間熱度T為每個(gè)關(guān)鍵詞熱度的加和值 (5) 城市活動(dòng)事件在特定時(shí)間范圍內(nèi)對(duì)城市的地理空間和行為空間的影響,可描述為事件對(duì)城市的作用力,它同時(shí)體現(xiàn)在現(xiàn)實(shí)空間和賽博空間。以各個(gè)現(xiàn)實(shí)空間分量和賽博空間分量的乘積加和值Qijk表征特定事件對(duì)城市的特定時(shí)間和特定地理位置的作用力,以交通流的聚集與分散路徑來(lái)表達(dá)事件對(duì)城市行為空間的影響。其中 Qijk=(wm1*τijk+…+wmx*σijk)+ (wn1*ρijk+…+wny*φijk) (6) 式中,事件的作用力Qijk由x個(gè)現(xiàn)實(shí)空間分量和y個(gè)賽博空間分量構(gòu)成,每一個(gè)分量由權(quán)重和對(duì)應(yīng)分值構(gòu)成。如τijk可表示在k時(shí)刻,在格網(wǎng)(i,j)內(nèi)私家車交通量通過(guò)似然比檢驗(yàn)得到的異常分值,其對(duì)應(yīng)權(quán)重為wm1;ρijk可表示在k時(shí)刻,在格網(wǎng)(i,j)內(nèi)線上微博或微信數(shù)據(jù)的熱度分值,其對(duì)應(yīng)權(quán)重為wn1。 圖6 城市活動(dòng)事件的表達(dá)模型Fig.6 The expression model of city events 城市活動(dòng)事件刻畫(huà)模型如圖6,對(duì)事件的刻畫(huà)采用類似快照模型的方式,在時(shí)間軸上利用線狀要素和面狀要素表征事件的發(fā)展過(guò)程。其中,面狀要素中每個(gè)格網(wǎng)單元對(duì)應(yīng)了城市在特定時(shí)間特定位置受到的事件作用力的大小,線狀要素是通過(guò)基于現(xiàn)實(shí)空間交通流的路徑搜索策略提取得到的事件路徑,它從局部表達(dá)交通流的聚集過(guò)程和分散過(guò)程。二者對(duì)應(yīng)的表達(dá)式分別為式(7)和式(8) (7) 式中,I、J、K對(duì)應(yīng)坐標(biāo)軸中的空間和時(shí)間維度;Qijk表示在特定位置(i,j)和特定時(shí)間k下城市活動(dòng)事件A對(duì)城市的作用力。 (8) 式中,K對(duì)應(yīng)時(shí)間維度;Sn表示采用n條路徑刻畫(huà)事件的聚集和分散過(guò)程,在該城市活動(dòng)事件中,共有M個(gè)時(shí)刻考慮現(xiàn)實(shí)空間交通流的聚集或分散過(guò)程。 根據(jù)式(7)和式(8),本文對(duì)城市活動(dòng)事件的分析內(nèi)容和對(duì)應(yīng)方法見(jiàn)表1。 表1 城市活動(dòng)事件刻畫(huà)模型的時(shí)空分析方法 Tab.1 The spatio-temporal analytical method of city eventsmodel 分析內(nèi)容分析方法特征描述在事件發(fā)展過(guò)程中城市特定區(qū)域事件作用力隨時(shí)間的變化ΔQK=Qi,j,k1-Qi,j,k2空間固定,時(shí)間變化城市區(qū)域內(nèi)不同空間在同一時(shí)刻的事件作用力的差異ΔQIJ=Qi1,j1,k-Qi2,j2,k時(shí)間固定,空間變化城市活動(dòng)事件時(shí)空演變過(guò)程ΔQIJK=Qijk1I×J-Qijk2I×J —局部時(shí)間、局部區(qū)域內(nèi)城市活動(dòng)事件中人群的流動(dòng)過(guò)程ΔR=Snm1-Snm2?動(dòng)態(tài)過(guò)程 *式中“-”表示前后的差異度,而非減號(hào)運(yùn)算符。 事件發(fā)展是一個(gè)隨時(shí)間變化的過(guò)程,在事件發(fā)展的前、中和后期中包括多個(gè)事件階段。根據(jù)每個(gè)階段的時(shí)間特征、現(xiàn)實(shí)空間特征和賽博空間特征,劃分不同的分析子段,每個(gè)子段中的分析時(shí)間粒度、是否考慮交通軌跡、網(wǎng)絡(luò)關(guān)鍵詞個(gè)數(shù)等要素保持一致。如事件對(duì)交通流的可探測(cè)作用力只體現(xiàn)在距離事件發(fā)生時(shí)刻較近的時(shí)間范圍內(nèi),而不貫穿整個(gè)事件過(guò)程;且從整體上看,分析時(shí)間粒度隨著事件鄰近逐漸變小,隨著事件結(jié)束逐漸增大。 本文選取2015年5月9日“魔天倫2.0”世界巡回演唱會(huì)(武漢站)這一城市活動(dòng)事件作為試驗(yàn)分析對(duì)象。該演出的場(chǎng)地為武漢體育中心體育場(chǎng),觀演人數(shù)達(dá)6萬(wàn)人。在本文試驗(yàn)中,賽博空間數(shù)據(jù)集采用微博數(shù)據(jù),現(xiàn)實(shí)空間的交通量?jī)H采用出租車軌跡數(shù)據(jù)。試驗(yàn)采集的數(shù)據(jù)包括2015年5月1日—5月7日和2015年5月9日武漢市城區(qū)的出租車GPS軌跡數(shù)據(jù)、2015年5月1日—5月14日武漢市城區(qū)范圍內(nèi)的微博數(shù)據(jù)。其中,5月1日—5月7日的GPS軌跡數(shù)據(jù)作為計(jì)算基準(zhǔn)交通流和基準(zhǔn)格網(wǎng)車流量的歷史數(shù)據(jù)。 本文試驗(yàn)事件的微博關(guān)鍵詞可分為歌手稱呼、演出地點(diǎn)、演出時(shí)間、演唱會(huì)名稱、演出進(jìn)程、歌曲名稱、票務(wù)信息等類別,每個(gè)類別中包含若干詞匯,試驗(yàn)中依據(jù)事件階段進(jìn)行合理選取。 在空間尺度上,選取武漢市城區(qū)為研究的城市空間范圍,其總面積約832.709 km2。由于本文試驗(yàn)GPS軌跡數(shù)據(jù)的采樣間隔為60 s,以城市出租車平均行駛速度40 km/h計(jì)算,500 m×500 m格網(wǎng)大小能夠保證時(shí)間上相鄰的軌跡點(diǎn)在空間格網(wǎng)上呈相鄰分布,因此以500 m×500 m為空間尺度劃分地理格網(wǎng),共得到3328個(gè)城市子單元。 表2 試驗(yàn)數(shù)據(jù)量 在時(shí)間粒度上,根據(jù)事件3個(gè)階段劃分不同的分析時(shí)間粒度。對(duì)事件中期,采用最小時(shí)間粒度10 min,對(duì)距離演出較近的事件前期子段和事件后期子段,以30 min為分析時(shí)間單元,對(duì)距離演出較遠(yuǎn)的事件前期子段和后期子段,以1 d為分析時(shí)間單元。 表3 事件過(guò)程分析 2.2.1 權(quán)重討論 由于本文試驗(yàn)中僅采用微博數(shù)據(jù)和出租車軌跡數(shù)據(jù),因此式(6)可簡(jiǎn)化為 Q(rk,tm)=wT*T(rk,tm)+wv*LLR(v:rk,tm) (9) 式中,wT和wv分別為賽博空間微博數(shù)據(jù)和現(xiàn)實(shí)空間交通軌跡的權(quán)重;T(rk,tm)為時(shí)間間隔tm內(nèi)格網(wǎng)rk的賽博空間作用力分值;LLR(v:rk,tm)為時(shí)間間隔tm內(nèi)格網(wǎng)rk的交通量v的現(xiàn)實(shí)空間作用力分值。其中,現(xiàn)實(shí)空間作用力分值LLR(υ)和賽博空間作用力分值T(rk,tm)需要進(jìn)行標(biāo)準(zhǔn)化處理。本文試驗(yàn)采用z-score[22]計(jì)算法。對(duì)LLR(υ)和T(rk,tm)而言,其均值和標(biāo)準(zhǔn)差的計(jì)算數(shù)據(jù)集是事件全過(guò)程中對(duì)應(yīng)的時(shí)間粒度下的變量值的集合。 在事件前期與后期,事件對(duì)城市的出租車物理軌跡影響極低,因此,對(duì)該部分不考慮現(xiàn)實(shí)空間物理軌跡,式(9)中的wT和wv分別為1和0。對(duì)事件中期演出前這一階段,根據(jù)經(jīng)驗(yàn)判斷,賽博空間權(quán)重wv隨時(shí)間逐步上升,到達(dá)一定峰值后,隨著演出開(kāi)場(chǎng)時(shí)間逼近,wv逐步下降,直至演出開(kāi)始,wv達(dá)到0。同理,演出結(jié)束后,現(xiàn)實(shí)空間物理軌跡的權(quán)重逐步上升再下降。其中,對(duì)于現(xiàn)實(shí)空間權(quán)重的峰值點(diǎn),根據(jù)軌跡數(shù)據(jù)集和微博數(shù)據(jù)集的數(shù)據(jù)量演算得到。以演出當(dāng)天13:30—20:00的權(quán)重推算為例,首先,對(duì)該階段每個(gè)分析時(shí)間單元內(nèi)的出租車軌跡提取行程OD,計(jì)算到達(dá)場(chǎng)館周邊的OD數(shù)目Nrod與總OD數(shù)目NTOD的比值,選取比值最大的17:30—17:40時(shí)段作為峰值時(shí)間。當(dāng)Nrad/Nrod越大,說(shuō)明該時(shí)段的軌跡數(shù)據(jù)集與事件越相關(guān),從而對(duì)事件的刻畫(huà)越有效。接著,計(jì)算該時(shí)段的峰值權(quán)重,同時(shí)考慮該時(shí)段的軌跡數(shù)據(jù)集和微博數(shù)據(jù)集與事件的相關(guān)程度。從參與人數(shù)上看,一條微博的參與人數(shù)為1人,一段OD的參與人數(shù)為1—4人,因此,微博數(shù)據(jù)集與軌跡數(shù)據(jù)集之間存在1:n的關(guān)系。根據(jù)經(jīng)驗(yàn)判斷,本文試驗(yàn)中n取2,即認(rèn)為一輛出租車的平均載客人數(shù)為2人。對(duì)這兩個(gè)數(shù)據(jù)集,根據(jù)事件相關(guān)人數(shù)占總體越大,其個(gè)體表征作用越小,即重要程度越小的原則[23-26],對(duì)該時(shí)段的賽博空間權(quán)重與現(xiàn)實(shí)空間權(quán)重?fù)?jù)式(10)計(jì)算得到,并使二者加和為1。 (10) 式中,NTOD為該時(shí)段的總OD數(shù)目;Nrod為事件相關(guān)的OD數(shù)目;NTWB為總微博數(shù)目;Nrwb為事件相關(guān)的微博數(shù)目。OD是否與事件相關(guān)的判別依據(jù)是OD的終點(diǎn)是否在演唱會(huì)場(chǎng)館周邊,微博是否與事件相關(guān)的判別依據(jù)是是否包含事件相關(guān)關(guān)鍵詞。 根據(jù)權(quán)重的起始點(diǎn)和峰值點(diǎn)及其對(duì)應(yīng)的時(shí)間點(diǎn)構(gòu)建線性函數(shù),以每個(gè)時(shí)間單元中間時(shí)刻的權(quán)重作為該單元的權(quán)重,得到13:30—17:30每個(gè)時(shí)間單元的權(quán)重值。同理計(jì)算得到17:30—20:00和22:00—23:59的權(quán)重。最終2015-05-09 T13:30—23:59每隔10 min的賽博和現(xiàn)實(shí)空間權(quán)重如圖7。 2.2.2 演唱會(huì)事件的表達(dá)模型與可視化分析 根據(jù)式(9)計(jì)算各個(gè)時(shí)間間隔內(nèi)每個(gè)格網(wǎng)區(qū)域的事件作用力Q,按照表3的粒度劃分進(jìn)行可視化,每一個(gè)格網(wǎng)區(qū)域的高度代表Q值的大小。在該演唱會(huì)事件全過(guò)程中,任意時(shí)間、任意區(qū)域的事件作用力都有一個(gè)對(duì)應(yīng)的數(shù)值Q表示。在考慮交通流的事件階段,將交通聚集路徑和分散路徑疊加在城市面狀要素上,進(jìn)行車流聚集與分散過(guò)程的局部可視化。 圖8—圖11中,x、y軸正方向分別表示武漢市由西向東、由南向北的城市方向。該組圖展示了“魔天倫2.0”世界巡回演唱會(huì)(武漢站)的時(shí)空過(guò)程:①?gòu)? d的時(shí)間粒度看,事件前期,事件熱度在城市多區(qū)域發(fā)酵,在整個(gè)事件過(guò)程中,事件的作用力呈現(xiàn)先增大、后減少的趨勢(shì),在演唱會(huì)當(dāng)天達(dá)峰值,從空間上看,事件發(fā)生地的作用力大小為峰值;②在演唱會(huì)當(dāng)天,起初,事件熱度在空間上沒(méi)有明顯的分布規(guī)律,但隨著事件臨近,逐步向演唱會(huì)場(chǎng)所聚集,事后逐漸由事件中心向四周消散;③從交通流的變化上看,考慮到事件發(fā)生地位于城市西南方位,因此大量人群從東北方向聚集,其聚集過(guò)程形成較早,而西南方向的聚集路徑則在當(dāng)天17:30左右開(kāi)始形成。 2.2.3 與單一數(shù)據(jù)源事件模型的對(duì)比 為驗(yàn)證方法的有效性,將本文城市活動(dòng)事件表達(dá)模型與基于單一數(shù)據(jù)源的事件刻畫(huà)方法進(jìn)行對(duì)比。以演唱會(huì)事件發(fā)生當(dāng)天的19:00—19:50為例,對(duì)基于現(xiàn)實(shí)空間交通數(shù)據(jù)和基于賽博空間社交媒體數(shù)據(jù)的事件刻畫(huà)方法分別進(jìn)行可視化,時(shí)間粒度為10 min。由表4可知,在基于交通數(shù)據(jù)的刻畫(huà)方法中,隨著演唱會(huì)開(kāi)始時(shí)間的鄰近,事件作用力在逐漸減少,與事實(shí)不符,這主要是由于交通數(shù)據(jù)對(duì)事件的刻畫(huà)局限于人群的聚集和離散過(guò)程,對(duì)演唱會(huì)進(jìn)行過(guò)程中的賽博空間作用力無(wú)法實(shí)現(xiàn)有效刻畫(huà);基于社交媒體數(shù)據(jù)的刻畫(huà)方法則無(wú)法感知事件對(duì)現(xiàn)實(shí)地理空間的影響,事件作用力在城市賽博空間中呈現(xiàn)離散分布,在事件刻畫(huà)的全面性和有效性上略有欠缺。而本文方法中,隨著事件鄰近,事件作用力峰值逐漸向事件格網(wǎng)中心移動(dòng)、在事件格網(wǎng)周圍持續(xù)高漲,而在城市其他區(qū)域逐漸衰退。因此,本文方法中現(xiàn)實(shí)空間數(shù)據(jù)集和賽博空間數(shù)據(jù)集的相互補(bǔ)充,能夠有效地刻畫(huà)城市活動(dòng)事件的完整時(shí)空過(guò)程,并分析城市活動(dòng)事件對(duì)靜態(tài)地理空間和動(dòng)態(tài)行為空間的影響。 圖2 聚集過(guò)程中路徑的可行方向Fig.2 The feasible directions during gathering process 圖3 路徑的搜索結(jié)構(gòu)Fig.3 Searching structures of routes 圖5 分散過(guò)程中路徑的可行方向Fig.5 The feasible directions during dispersing process 圖7 現(xiàn)實(shí)空間和賽博空間權(quán)重分布Fig.7 Weights for cyberspace and real space 圖8 事件全過(guò)程(時(shí)間粒度1 d)Fig.8 The whole process of event (time granularity 1 d) 本文提出了一種城市活動(dòng)事件時(shí)空建模分析方法,該方法融合現(xiàn)實(shí)空間和賽博空間,實(shí)現(xiàn)對(duì)城市活動(dòng)事件的事件過(guò)程刻畫(huà)表達(dá),事件時(shí)空動(dòng)態(tài)建模,以及事件全過(guò)程的城市地理空間與動(dòng)態(tài)行為空間的時(shí)空特征演變分析。試驗(yàn)中以2015年5月9日武漢市“魔天倫2.0”世界巡回演唱會(huì)為例,采用2015年5月共8 d的軌跡數(shù)據(jù)和事件前后14 d的微博數(shù)據(jù),展現(xiàn)事件的時(shí)空發(fā)展過(guò)程,并與單一數(shù)據(jù)源的事件表達(dá)模型進(jìn)行了對(duì)比。結(jié)果顯示,本文方法在分析城市活動(dòng)事件的時(shí)空演變過(guò)程、構(gòu)建事件模型與可視化方面具有有效性和創(chuàng)新性。然而,由于本文在融合現(xiàn)實(shí)空間和賽博空間的事件模型中僅探討了兩類空間中的交通和社交媒體數(shù)據(jù)源的分量計(jì)算方法,數(shù)據(jù)采集的全面性和完整性將直接影響事件的刻畫(huà)與分析,在后續(xù)研究將進(jìn)一步提高數(shù)據(jù)的全面性和完整性,融合其他數(shù)據(jù)源一起刻畫(huà)城市活動(dòng)事件,提高對(duì)事件的時(shí)空分析與表達(dá)能力。 圖9 事件階段B和F(時(shí)間粒度 30 min)Fig.9 Event stage B and F(time granularity 30 min) 圖10 事件階段C(時(shí)間粒度 10 min)Fig.10 Event stage C(time granularity 10 min) 圖11 事件階段E(時(shí)間粒度10 min)Fig.11 Event stage E(time granularity 10 min) 城市活動(dòng)事件表達(dá)模型現(xiàn)實(shí)空間軌跡單一數(shù)據(jù)源的演唱會(huì)事件表達(dá)賽博空間微博單一數(shù)據(jù)源的演唱會(huì)事件表達(dá) 續(xù)表41.3 基于社交媒體數(shù)據(jù)的城市活動(dòng)事件賽博空間信息提取
1.4 融合現(xiàn)實(shí)空間和賽博空間的城市活動(dòng)事件一體化建模方法
2 試驗(yàn)與討論
2.1 城市活動(dòng)事件建模的空間尺度和時(shí)間粒度
2.2 演唱會(huì)事件的時(shí)空建模與分析
3 結(jié) 論