孫超,陸建*
(東南大學(xué),a.江蘇省城市智能交通重點實驗室;b.現(xiàn)代城市交通技術(shù)協(xié)同創(chuàng)新中心;c.交通學(xué)院,南京 211189)
近年來,共享單車已經(jīng)成為一種受歡迎的綠色交通工具,特別是在北京、紐約等大城市。共享單車出行是無污染的,除了生產(chǎn)車輛的過程外,幾乎不消耗自然資源;同時,共享單車有高度的靈活性,可以有效地解決出行“最后一公里”問題。共享單車的出現(xiàn)為居民出行提供了便利,但其在發(fā)展過程中也面臨著許多困難。如何有效挖掘出行特征以及土地利用與共享單車出行需求之間的關(guān)系,是共享單車規(guī)劃和管理中的難點。
目前,學(xué)者大多采用聚類[1]、回歸分析[2]、地理探測器[3]等在不同區(qū)位和天氣條件下挖掘出行模式,重點研究了與公共交通接駁的需求特征。例如,劉冰等[4]采用細粒度分析,建立了共享單車時空特征表達體系。另一方面,國內(nèi)外許多學(xué)者試圖挖掘共享單車出行的決定因素。例如,曾尤美[5]從交通行為的角度出發(fā),利用偏好模型探索共享單車與城市要素的關(guān)聯(lián)性;A.Faghih-Imani 等[6]使用多級統(tǒng)計建模方法,研究氣象數(shù)據(jù)、時間特征、自行車基礎(chǔ)設(shè)施、土地利用等對共享單車流量的影響;此外,街道連通性[7]、交通可達性[8]和工作崗位數(shù)[9]等因素都會對共享單車的出行產(chǎn)生影響??偟膩砜矗F(xiàn)有研究主要采用可視化的方法描述共享單車出行空間分布特征,更多關(guān)注共享單車使用時間和距離的異質(zhì)性[10]以及影響因素的異質(zhì)性[11],缺少定量且標(biāo)準(zhǔn)化的范式刻畫共享單車出行需求量自身的空間異質(zhì)性,特別是,共享單車出行需求的異質(zhì)性空間閾值還不明確;其次,往往止步于時空特征和相關(guān)性分析,缺少在不同方向上、不同范圍內(nèi)全面分析需求異質(zhì)性特征的驅(qū)動因素及其驅(qū)動力大??;很少對內(nèi)源性需求和外源性需求進行區(qū)分和量化,尤其是,復(fù)雜且難以定量描述的建成環(huán)境對共享單車出行需求異質(zhì)性的影響及其區(qū)域差異尚不完全清楚。本文旨在應(yīng)對上述挑戰(zhàn),應(yīng)用半變異函數(shù)和殘差分析模型,解決以下研究問題:如何用數(shù)學(xué)語言刻畫共享單車出行的空間異質(zhì)性特征?什么因素驅(qū)動了共享單車出行空間異質(zhì)性特征的形成?
通過回答以上問題,本文對現(xiàn)有方法和知識的貢獻主要包括:利用熱點探測模型進行空間采樣,將共享單車出行需求相對較大的區(qū)域作為主要研究區(qū)域,可以避免零堆積現(xiàn)象對回歸模型的干擾,獲取更具代表性的特征規(guī)律;給出了描述空間異質(zhì)性的最佳范式,確定空間異質(zhì)性的閾值是后續(xù)共享單車空間建模過程中確定空間權(quán)重的關(guān)鍵,具有重要的應(yīng)用價值;區(qū)分了內(nèi)源性因素和外源性因素。除減少空間回歸的誤差外,模型可以幫助后續(xù)進一步定義和挖掘由于建成環(huán)境影響而導(dǎo)致共享單車出行需求被削弱的瓶頸區(qū)域。
熱點探測模型為區(qū)域分割和數(shù)據(jù)采樣提供了良好的理論基礎(chǔ)。熱點通常被定義為大量發(fā)生一些類似事件的區(qū)域,并在地圖上給予地理參考。密度分析是基于空間關(guān)系將數(shù)據(jù)點散布到地球表面,形成密度場。本文采用核密度分析,該算法將研究區(qū)域柵格化,計算柵格中的密度,并構(gòu)建平滑表面。從離散對象轉(zhuǎn)換到連續(xù)場之后,目標(biāo)周圍的密度將被可視化。
利用核密度分析獲得連續(xù)的密度場以后,引入現(xiàn)有文獻中所述的熱點探測模型,精確識別出行需求相對顯著的空間位置[12]。將共享單車出行熱點設(shè)置為采樣點,熱力值作為共享單車出行發(fā)生量(Trip-generation of Bike-sharing,TGB)的表征。進一步,將采樣點導(dǎo)入地理數(shù)據(jù)庫,并在其周圍進行緩沖,建立采樣分析區(qū)。參考常規(guī)公共交通站點覆蓋率的評價方法,本文將具有公共交通屬性的共享單車所對應(yīng)的采樣分析區(qū)半徑r設(shè)定為500 m,如圖1所示。
圖1 采樣分析區(qū)的建立步驟Fig.1 Steps for setting up sample analysis area
半變異函數(shù)能夠刻畫TGB 的結(jié)構(gòu)性變化,也能描述其隨機性變化。本質(zhì)上可以理解為,模擬TGB變異值與數(shù)據(jù)點間距離的關(guān)系函數(shù),即
式中:γ(h)為半變異函數(shù);h為步長;N(h)為間隔為h的共享單車出行熱點的個數(shù);Z(xi)、Z(xi+h)分別為TGB在xi、xi+h處的觀測值。
半變異函數(shù)通常用變異曲線來表征,如圖2所示,它有3 個主要參數(shù):塊金值(C0),基臺值(C0+C),變程(A)。C0+C表示TGB 總的空間變異;C反映TGB 由空間結(jié)構(gòu)特征(土地利用+鄰域效應(yīng))引起的變異程度;C0反映TGB的隨機性變化部分,主要是其他不易觀測的環(huán)境隨機性引起的變異;A是TGB的空間自相關(guān)尺度,提供了研究共享單車出行需求相似范圍的一種測度。
圖2 變異曲線Fig.2 Variation curve
為了挖掘空間異質(zhì)性特征產(chǎn)生的原因,首先區(qū)分“土地利用+鄰域效應(yīng)”(廣義內(nèi)因,結(jié)構(gòu)性因素)和其他建成環(huán)境(外因,隨機性因素)。土地利用是指各種能夠直接產(chǎn)生出行需求的興趣點(小區(qū)、學(xué)校等),而其他建成環(huán)境是指不能直接產(chǎn)生但影響出行需求的要素,主要包括,交通建成環(huán)境(如自行車道長度,以及路網(wǎng)密度、交通可達性水平、擁堵水平等),自然地理環(huán)境(天氣、地形等)和社會環(huán)境(收入等)。具體的驅(qū)動力評估方法如下。
(1)趨勢分析法
TGB 的變化趨勢使用其空間序列的斜率來表示,即
式中:STGB為TGB與空間位置變量擬合的一元線性回歸方程的斜率;TGBi為第i個分析區(qū)內(nèi)的共享單車出行發(fā)生量;i為空間位置變量,即從1~n的采樣分析區(qū)序號;n為分析區(qū)域的總數(shù)。當(dāng)STGB>0,TGB 會隨著空間的變化而增加,斜率越大,TGB增加越明顯;相反,當(dāng)STGB<0 時,隨著空間的變化,TGB趨向減小。
(2)殘差分析法
鑒于環(huán)境的影響機理過于復(fù)雜,本文引入殘差分析法,利用實際值和預(yù)測值的殘差測度其驅(qū)動力大小。通過建立土地利用與TGB 的空間回歸模型,預(yù)測由土地利用決定的共享單車出行發(fā)生量。因此,本研究不需要獲取直接的建成環(huán)境相關(guān)數(shù)據(jù),而是用殘差值表示建成環(huán)境對TGB的影響,即
式中:TGBHA為共享單車出行發(fā)生量的殘差;TGBobs為發(fā)生量的實際值;TGBCC為發(fā)生量的預(yù)測值。如果殘差大于0,則其他建成環(huán)境能夠增加TGB;否則,TGB 會由于其他建成環(huán)境的影響而下降。
通常,變量考慮不足和自相關(guān)性是空間統(tǒng)計建模中的難點。前者主要源于不易觀測的環(huán)境隨機性差異,本文通過殘差值進行描述。因此,引入并改進空間滯后(Spatial-Lag,SL)方法,建立SL-Tobit模型,強調(diào)鄰域效應(yīng)的重要性,同時更加符合實際情況。另外,作為可行且簡單的方法,使用地理興趣點(Point of Interest,POI)表示土地利用是合理的。在TGB 空間回歸模型中,興趣點被劃分為12類,用于表示不同的土地利用。
式中:TGBCC(i)為第i個采樣分析區(qū)內(nèi),由廣義內(nèi)生因素所決定的TGB;為由鄰域效應(yīng)(Neighborhood Effect,NE)所決定的TGB(TGBNE);ρ為用來決定yi和之間空間自相關(guān)關(guān)系強度的系數(shù);為由土地利用(Land Use,LU)所決定的TGB(TGBLU);yi為空間回歸結(jié)果,亦即未受約束時的TGB預(yù)測值;Wij為n×n階空間權(quán)重矩陣的第(i,j)個元素;Q為興趣點的種類數(shù),取12;Xiq為空間自變量,其中變量的序號,依次取1~12;X1~X12依次為餐飲設(shè)施、景觀、公共設(shè)施、公司企業(yè)、教育設(shè)施、金融保險設(shè)施、賓館酒店、生活設(shè)施、體育設(shè)施、醫(yī)療設(shè)施、政府部門、住宅設(shè)施;βq為每個空間自變量對應(yīng)的回歸系數(shù);ε為常數(shù)項。式(4)的殘差計算結(jié)果為其他建成環(huán)境(Built Environment,BE)決定的TGB(TGBBE)。進一步,引入Xu等[13]提出的相對效應(yīng)模型,識別土地利用、其他建成環(huán)境、鄰域效應(yīng)各自在共享單車出行空間異質(zhì)性特征形成過程中的相對驅(qū)動力,如圖3所示。
圖3 相對效應(yīng)分析的建模思路Fig.3 Modeling ideas of relative effect analysis
本文使用TGB 預(yù)測值描述土地利用變化和鄰域效應(yīng)變化產(chǎn)生的影響,使用TGB 殘差描述其他建成環(huán)境變化所造成的影響。進而,將TGB 預(yù)測值和殘差值的趨勢與TGB 實際值的趨勢相結(jié)合,根據(jù)不同情景構(gòu)建不同方法,以評價不同因素的差異在TGB變化中的相對貢獻,如表1所示。
表1 相對效應(yīng)計算模型Table 1 Relative effect calculation model
本文以北京市為例,進行共享單車出行空間異質(zhì)性特征評估。以開放數(shù)據(jù)源①https://www.biendata.xyz/competition/mobike/data/提供的北京市城區(qū)內(nèi)1 周(2017年5月10~16日)共享單車軌跡作為研究數(shù)據(jù)。數(shù)據(jù)形式為csv 格式的文件,大小約為100 M,單日數(shù)據(jù)量約為250000條。數(shù)據(jù)的主要內(nèi)容包括用戶ID、時間、位置坐標(biāo)等,如表2所示。數(shù)據(jù)經(jīng)過預(yù)處理,使用ArcGIS分割等工具,獲得研究區(qū)內(nèi)共享單車OD數(shù)據(jù)。
表2 共享單車數(shù)據(jù)描述Table 2 Description of shared bike data
其次,利用爬蟲工具獲取研究區(qū)域內(nèi)所有POI數(shù)據(jù)表征土地利用類型,并將其分成12 類,如表3所示。POI 數(shù)據(jù)仍然為csv 格式文件,單個POI 類型對應(yīng)的文件大小為1~10 M不等,主要內(nèi)容包括,名稱、類型、地址和位置坐標(biāo)等,具體說明如表3所示。
表3 POI數(shù)據(jù)說明Table 3 Explanation about POI data
利用1.1 節(jié)所述的熱點探測模型,經(jīng)過窗口分析、代數(shù)做差、重分類、柵格轉(zhuǎn)面、要素轉(zhuǎn)點等步驟,獲取北京市共享單車出行的熱點,并以熱力值表征TGB。為了解釋空間異質(zhì)性特征,首先利用所有采樣點的熱力值計算全局空間自相關(guān)Moran指數(shù)I,并計算其檢驗的標(biāo)準(zhǔn)化統(tǒng)計量Z。其中,I=0.406954,Z=535.810289,顯著性P1=0,置信度為99%;在正態(tài)分布假設(shè)條件下,Moran指數(shù)I檢驗結(jié)果顯著。表明不同區(qū)域內(nèi)TGB 存在中等的、正的空間自相關(guān)。圖4 可視化了不同概率水平條件下共享單車出行的空間異質(zhì)性特征:①根據(jù)圖4(a)、(b)發(fā)現(xiàn),城市中心區(qū)域TGB 的聚集特征最為顯著,而邊緣地區(qū)的聚集特征顯著性水平相對較低,中間區(qū)域無顯著的聚集特征;②根據(jù)圖4(c)、(d)發(fā)現(xiàn),“高出行量-高出行量”的相關(guān)現(xiàn)象主要發(fā)生在市中心,“低出行量-低出行量”的相關(guān)現(xiàn)象主要發(fā)生在邊緣地區(qū);除去相關(guān)性不顯著的點外,其他正相關(guān)以及負相關(guān)(高出行量-低出行量)的點占比較少,數(shù)量僅為213和32。
圖4 空間異質(zhì)性特征的可視化Fig.4 Spatial aggregation feature
由于半變異函數(shù)的特殊性質(zhì),為了提高模型擬合準(zhǔn)確度,本文將所有熱力值在SPSS中進行轉(zhuǎn)換,使其符合正態(tài)分布。進而,根據(jù)式(2)模擬TGB 的實際空間異質(zhì)性特征。借助Matlab 和GS+進行擬合,結(jié)果如表4所示。指數(shù)模型擁有最好的擬合優(yōu)度,決定系數(shù)達到0.678。
表4 顯示,TGB 的塊金值與基臺值之比為0.38,在25%~75%之間,說明北京市共享單車出行具有中等的、正的空間自相關(guān)性,這與前述的莫蘭指數(shù)分析結(jié)果相一致。TGB 的空間變異屬于中等程度的變異,其既受到結(jié)構(gòu)性因素的影響又受到隨機性因素的影響。進一步,TGB的空間自相關(guān)尺度為1860 m,這意味著在0~1860 m 范圍內(nèi),北京市TGB 的半方差函數(shù)值隨著采樣點間隔距離的增大而增大(即TGB空間變異愈來愈大),TGB空間自相關(guān)性逐漸減小,如圖5所示,但增加至1860 m時,半方差函數(shù)值基本趨于穩(wěn)定且不再增加,TGB空間自相關(guān)性消失。換句話說,某區(qū)域的TGB 受鄰域效應(yīng)的影響程度隨著距離的增大而減小,到1860 m(衰減半徑)時達到最弱,而大于此距離的其他區(qū)域基本對其無影響。
圖5 各向同性下變異曲線Fig.5 Variation curve under isotropy
表4 半變異函數(shù)擬合結(jié)果Table 4 Results of semi-variogram fitting
北京市共享單車出行發(fā)生量的半變異函數(shù)模擬方程為
該模型能夠通過F檢驗,在足夠的顯著性水平下描述了共享單車出行的空間異質(zhì)性特征。
為分析TGB的各向異性,本文在4個方向上分別模擬半變異函數(shù),如圖6所示。顯然,變異曲線在不同方向上具有相對不同的變化趨勢,北京市TGB 的空間分布呈現(xiàn)一定的帶狀異向性,說明TGB 的分布在不同方向上具有不同的空間結(jié)構(gòu)特征。這說明,在不同的方向上,由于土地、環(huán)境條件不同,慢行交通的發(fā)展速度快慢以及共享單車出行的吸引力存在一定差異。
圖6 各向異性下變異曲線Fig.6 Variation curve under anisotropy
進一步,以熱點為中心構(gòu)建分析區(qū)(原理如圖1所示)。同時,根據(jù)到市中心(國家會議中心:緯度39.99855833,經(jīng)度116.39100556)的距離,將所有的分析區(qū)排序,從而獲得從內(nèi)到外的空間序列。經(jīng)過正態(tài)分布轉(zhuǎn)換后的分析區(qū)內(nèi)TGB 設(shè)為因變量,分析區(qū)內(nèi)各類POI的數(shù)量作為自變量,進行式(5)和式(6)的擬合。首先,基于距離構(gòu)造空間權(quán)重矩陣,將中心距離小于等于1860 m的兩個采樣分析區(qū)定義為鄰接;其次,所有的VIF(方差膨脹系數(shù))均小于10,滿足非共線性的研究要求,可以忽略;再者,對模型的整體有效性進行分析,此處模型檢驗的原假設(shè)為,無論是否放入解釋變量,模型質(zhì)量均相同。這里,整體顯著性p <0.01,因而拒絕原假設(shè),即說明放入的解釋變量有效,TGB預(yù)測模型的構(gòu)建有意義。表5為SL-Tobit最終的擬合結(jié)果。
表5 SL-Tobit模型擬合結(jié)果Table 5 Fitting results of SL-TOBIT model
根據(jù)表5可以判斷:TGB會對自身產(chǎn)生顯著的正向影響,回歸系數(shù)達到0.738;X1,X4,X5,X7,X10,X12會對TGB 產(chǎn)生顯著的正向影響,X6,X8對TGB 產(chǎn)生顯著的負向影響,其他變量并不會對TGB 產(chǎn)生顯著的影響。其中,對TGB 產(chǎn)生最大正向影響的POI類型是醫(yī)療設(shè)施,即該類型設(shè)施數(shù)量的增多將有助于提高區(qū)域內(nèi)共享單車出行的吸引力,其次是賓館酒店、餐飲設(shè)施等。在制定調(diào)度方案時,共享單車場站應(yīng)該靠近這些設(shè)施,并且在其附近適當(dāng)增加調(diào)度量。相反,由于產(chǎn)生了較大的負向影響,金融保險設(shè)施和生活設(shè)施的數(shù)量越多,反而越不利于提升區(qū)域內(nèi)共享單車出行的吸引力,應(yīng)當(dāng)將它們視為規(guī)劃管理策略中的消極因素。
進一步,根據(jù)距離市中心的空間距離將所有采樣區(qū)分成5 個區(qū)間(由市中心到外圍依次是第1~第5 區(qū)間),利用式(3)分別計算在各個區(qū)間內(nèi)TGB序列的空間變化趨勢,從而判斷共享單車出行空間異質(zhì)性特征的驅(qū)動因素。例如,在第1 區(qū)間,預(yù)測值TGBNE和TGBLU的斜率(Slope)分別為-0.011899和-0.075907,這表明,在靠近市中心的區(qū)域、由內(nèi)向外擴展的過程中,土地利用極大程度地導(dǎo)致TGB減少;然而,殘差值,即TGBBE的斜率(Slope)也達到了-0.23967,進一步表明,建成環(huán)境差異也是前述空間異質(zhì)性特征產(chǎn)生的重要原因,而且影響力更大。利用表1 中所述模型,計算所有區(qū)間內(nèi)3 種要素各自對于TGB 變化的相對驅(qū)動力,結(jié)果如表6所示。首先,由中心到邊緣地區(qū),土地開發(fā)強度的改變只是誘發(fā)共享單車出行吸引力下降的原因之一,其相對驅(qū)動力僅僅只在第1區(qū)間和第3區(qū)間超過了20%,平均值僅有15%;其次,鄰域效應(yīng)對于TGB變化的驅(qū)動力處于中間水平,其中,在第3和第4區(qū)間內(nèi)鄰域效應(yīng)的相對驅(qū)動力超過40%,而在其他區(qū)間內(nèi)的相對驅(qū)動力接近0,這可能與空間自相關(guān)性的變化有關(guān);最后,建成環(huán)境是更值得關(guān)注的要素,因為其在多數(shù)區(qū)間內(nèi)的相對驅(qū)動力均超過了50%,整個研究區(qū)域內(nèi)的平均水平也達到65%。既然建成環(huán)境是驅(qū)動共享單車出行發(fā)生量由內(nèi)到外減少、空間異質(zhì)性特征形成的最重要因素,那么在同樣的POI組合下,非機動車道與自行車專用道的建設(shè)不足、綠化水平低、公交可達性不足等所有不利于建成環(huán)境的因素都會使得共享單車出行的吸引力大幅度下降,而這種削弱能力甚至超過了共享單車出行內(nèi)因的影響力。這警示規(guī)劃管理者,在建設(shè)和優(yōu)化共享出行系統(tǒng)的過程中,要給予內(nèi)因和外因相同程度的重視。
表6 不同空間范圍的相對驅(qū)動力Table 6 Driving forces at different spatial scales
(1)北京市TGB 存在中等的、正的空間自相關(guān)性,“高出行量-高出行量”與“低出行量-低出行量”的自相關(guān)現(xiàn)象比例較高;指數(shù)模型對于空間異質(zhì)性特征的擬合最優(yōu),并且空間自相關(guān)的衰減半徑為1860 m,大于此距離時鄰域效應(yīng)消失;TGB 的分布呈現(xiàn)一定的帶狀異向性,不同方向上具有不同的空間結(jié)構(gòu)特征,慢行交通的發(fā)展速度快慢以及共享單車出行的吸引力在不同方向上存在一定差異。
(2)空間變化過程中,土地利用、鄰域效應(yīng)和建成環(huán)境都在驅(qū)動共享單車出行空間異質(zhì)性特征的形成。其中,建成環(huán)境的相對驅(qū)動力最大,在所有區(qū)間內(nèi)的平均值超過60%;鄰域效應(yīng)的相對驅(qū)動力處于中間水平;土地利用的相對驅(qū)動力最小,平均值僅為15%。在同樣的POI 組合下,增加專用道、提高綠化面積等優(yōu)化騎行環(huán)境的措施能夠提升共享單車出行的吸引力。
(3)增加醫(yī)療、賓館酒店、餐飲等設(shè)施的數(shù)量有利于提升區(qū)域內(nèi)共享單車出行的吸引力,共享單車場站應(yīng)該靠近這些設(shè)施,并且在其附近適當(dāng)增加共享單車投放量;金融保險、生活設(shè)施則相反,它們應(yīng)該被視為共享單車管理策略中的不利因素。