梁軍輝,林 堅,杜 洋(1.北京大學城市與環(huán)境學院,北京 100871;2.北京大學深圳研究生院,廣東·深圳 518055)
?
大數(shù)據(jù)條件下城市用地類型辨識研究?基于出租車GPS數(shù)據(jù)的動態(tài)感知
梁軍輝1,2,林 堅1*,杜 洋1,2
(1.北京大學城市與環(huán)境學院,北京 100871;2.北京大學深圳研究生院,廣東·深圳 518055)
摘 要:隨著大數(shù)據(jù)的廣泛應用以及城市規(guī)劃管理的智慧化、精細化轉(zhuǎn)變,土地管理需要豐富城市探查視角,開拓用地分類方式。傳統(tǒng)遙感影像分類具有時效性低、不能反映真實用地功能的弊端,而基于價值密度低、時效性高的GPS數(shù)據(jù)進行土地分類可以有效克服這一不足。本文以深圳市福田區(qū)為案例,通過海量出租車GPS數(shù)據(jù)的時空挖掘,在驗證居民活動、出租車上下車活動與城市用地類型之間相關關系的基礎上,利用SVM監(jiān)督分類算法和粒子群優(yōu)化方法得出的最優(yōu)參數(shù)對出租車GPS數(shù)據(jù)進行分類和準確率驗證。結(jié)果顯示:出租車GPS數(shù)據(jù)的分類結(jié)果與福田實際的土地利用類別匹配精確度高達97.16%,可以證明出租車GPS數(shù)據(jù)能夠?qū)崿F(xiàn)對城市土地利用類型實時、精確的動態(tài)感知。
關鍵詞:城市用地;類型辨識;大數(shù)據(jù)分析;SVM算法;動態(tài)感知
近年來,隨著信息革命的不斷推進和人本主義思想的傳播,城市管理向智慧化、精細化發(fā)展。土地利用管理領域也在積極轉(zhuǎn)變,改變過去單一依賴遙感影像識別,帶來的用地分類更新速度慢、僅反映地表物理光譜而不能反映真實的土地功能等弊端,試圖改變過去對城市空間的探查視角,通過對大數(shù)據(jù)的挖掘,一方面實現(xiàn)對城市土地快速、實時的監(jiān)控;另一方面,挖掘居民活動時空間特征,獲取反映土地功能的城市用地分類。
在此背景下,國內(nèi)外一些學者突破傳統(tǒng)的遙感影像識別方法,使用手機信令數(shù)據(jù)、出租車活動的GPS數(shù)據(jù)、WiFi熱點數(shù)據(jù)、地理位置標簽等居民數(shù)字足跡實現(xiàn)對土地利用類型的動態(tài)感知。劉瑜提出了“社會感知”的概念,每個個體在城市空間中扮演“傳感器”的作用,主張社會感知數(shù)據(jù)包含了空間互動與地方語義學的豐富信息,超出傳統(tǒng)遙測數(shù)據(jù)的范疇,并使用上海的出租車GPS數(shù)據(jù)驗證了理論的可行性[1];王靜遠在2014年BCL年會上提出“城市數(shù)據(jù)畫像”的概念,即大數(shù)據(jù)可以像“X光片”一樣穿透城市物理空間,探查城市空間與土地利用的真實狀況,并通過北京市微博數(shù)據(jù)反映居民對城市土地利用的強度?,F(xiàn)階段,已有學者基于大數(shù)據(jù)進行了一些針對用地分類的實證研究。Soto等利用CDR(call detail records)數(shù)據(jù),采用模糊C均值聚類算法和K均值聚類算法推斷土地利用類型[2,3],其與現(xiàn)實用地類型基本相符;Calebrese等基于麻省理工學院里3000多個WiFi接收器的時間序列數(shù)據(jù),借助特征分解方法,區(qū)分出宿舍、圖書館、教室等建筑物類型[4];J.Yuan等利用北京市POI數(shù)據(jù)點和出租車GPS數(shù)據(jù),對不同區(qū)域的城市用地類型進行聚類分析[5];Jameson等應用隨機森林分類算法對波士頓地區(qū)60多萬匿名手機用戶三周CDR數(shù)據(jù)進行分類,分析了其在居住用地、商業(yè)用地、工業(yè)用地、公園綠地以及其他用地上所表現(xiàn)的時序特征[6],以此推斷城市用地類型;Gang Pan等利用4000輛出租車數(shù)據(jù),采用改進的基于密度的空間聚類算法(DBSCAN),設計六個上下車的動態(tài)特征,利用SVM、KNN、LAD、BP四種分類方法進行比較,較好實現(xiàn)了城市土地利用類型的感知[7,8]。
不難看出,基于大數(shù)據(jù)對城市用地分類的理念和方法進行革新,已成為研究的重要方向。但是,總結(jié)已有研究,提高分類精度,實現(xiàn)時效性與分類精度二者之間的統(tǒng)一仍是現(xiàn)階段尚未克服的難點。本研究利用深圳市出租車GPS數(shù)據(jù),在研究居民活動特征、出租車上下車活動與城市用地類型關系的基礎上,定性分析出出租車起訖點與城市用地類型之間的相關關系,利用粒子群優(yōu)化方法和SVM監(jiān)督分類算法定量衡量出出租車起訖點對城市用地類型的感知精度,最終證明出租車起訖點數(shù)據(jù)能夠準確感知城市用地類型。
1.1 基于出租車GPS數(shù)據(jù)的居民活動特征與城市用地類型的關系分析
(1)居民活動、出租車上下車活動與活動場所及其用地類型的關系探討
居民在一天內(nèi)的活動包括一系列的工作活動和非工作活動,其往往沿時間順序排列,而且表現(xiàn)出社群層面的相對一致性,如:在工作日,前一晚上在家睡眠,早上離家去工作,下午下班前往超市購物或參加娛樂活動或直接回家[9,10]。這些活動的發(fā)生依賴于相應的活動場所,活動場所性質(zhì)的不同,在一天時間內(nèi)的不同時間段吸納的人流量也顯著不同,換言之,透過不同活動場所在一天內(nèi)的不同時段內(nèi)吸納人流量的差異特征,可以推演這一活動場所的用地性質(zhì)。
居民在一天中完成不同類型的活動,活動場所隨時間變化有一定的規(guī)律[11]。圖1表示了居民工作日的活動示意圖,橫軸表示活動時間,縱軸表示活動發(fā)生地點之間的相對距離。拐點A表示在居住用地內(nèi)活動結(jié)束,并開始產(chǎn)生交通行為;拐點B表示交通行為結(jié)束,并開始在工作地發(fā)生活動,A和B代表居民活動狀態(tài)變化的臨界點。
圖1 居民日常出行活動示意圖Fig.1 The spatio-temporal behavior pattern of residents’ daily activity
出租車作為城市重要的交通工具,一定程度上反映了居民的活動特征,通過對一個活動場所不同時間段的上車量和下車量之差異分析,可以反映該活動場所吸納人流量的狀況及時間分布特征?,F(xiàn)實中,出租車GPS記錄數(shù)據(jù)由7個字段構(gòu)成:車牌號、采集時間點、經(jīng)度、緯度、車輛狀態(tài)、車速、行車方向。其中,車輛狀態(tài)分為空載(即非打表)和重載(即打表),分別設定為0和1,從0變?yōu)?表示上車(起點),從1變?yōu)?表示下車(訖點)。無疑,上車代表在上車點區(qū)域內(nèi)居民活動量減少,下車剛好相反。進一步分析,采用出租車下車活動剩余量(式1),可以刻畫在某一個時間段內(nèi)在某一個活動場所的吸納人流量:
R=D-U(1)
式中,R為出租車下車剩余活動量;D為下車活動量;U為上車活動量。
為此,本文提出假設:將不同地塊范圍內(nèi)不同時間段內(nèi)出租車下車剩余活動量與城市用地類型進行關聯(lián),可以實現(xiàn)城市用地類型的感知。
(2)城市用地空間分布與出租車??奎c的聯(lián)系特征提取
為了利用出租車GPS數(shù)據(jù)實現(xiàn)對城市土地利用類型的感知,首先需提取出租車GPS記錄點中車輛行駛狀態(tài)發(fā)生變化的點,即起訖點(由0到1或1到0),然后將其與土地利用現(xiàn)狀圖在ArcGIS10.0平臺上進行疊加分析,根據(jù)距離臨近原則,賦予每個起訖點臨近地塊的地類圖斑屬性(將道路沿中心線切分,歸并到相鄰地類),最終確定每一個起訖點所處的用地范圍。對于每輛出租車一次出行產(chǎn)生的起訖點數(shù)據(jù),同時具備了時間、位置屬性以及賦予的,定義地類圖斑屬性(圖2)。
圖2 出租車坐標點賦予地類圖斑屬性示意圖Fig.2 Taxi coordinates point given to the land use attribute
1.2 應用出租車GPS數(shù)據(jù)對城市用地分類的感知方法試驗及精度檢測
(1)應用出租車GPS數(shù)據(jù)點對城市用地分類的感知方法:SVM監(jiān)督分類算法
支持向量機(Support Vector Machine,SVM)分類算法是1995年由Vapnik等人在統(tǒng)計學理論的基礎上首先提出的[12],它是一種基于VC維理論和結(jié)構(gòu)風險最小化準則的學習算法。SVM的優(yōu)點在于能夠通過定義核函數(shù)將低維空間的樣本點向高維空間轉(zhuǎn)變,然后在該空間中構(gòu)造最優(yōu)分類面,從而解決數(shù)據(jù)非線性可分的情況[13]。SVM主要包括有一對多法、一對一法、決策樹法三種[14,15]。在此,本文選擇根據(jù)一對一法設計的Libsvm多分類工具箱進行GPS數(shù)據(jù)點的分類,Libsvm是臺灣大學林智仁(Lin Chih-Jen)教授開發(fā)設計的一個簡單、易于使用和快速有效的SVM模式識別與回歸軟件包。采用工具箱默認的C-SVC模型[16],函數(shù)形式為:
式中,i表示支持向量的個數(shù);w代表支持向量的系數(shù);b是常數(shù);K(x,Xi)代表核函數(shù)(包括線性核函數(shù)、多項式核函數(shù)、高斯徑向基核函數(shù)和兩層感知器核函數(shù)等)。
在核函數(shù)K(x,Xi)類型選擇上,以往的研究表明,各參數(shù)一致的情況下高斯徑向基核函數(shù)作為映射函數(shù),分類精度相對較好,其函數(shù)形式如下:
式中,g是核函數(shù)參數(shù),為憑測試經(jīng)驗給定的常數(shù);X表示支持向量,是分類模型對已知用地類型樣本點進行學習訓練后產(chǎn)生的能夠?qū)⒉煌悇e數(shù)據(jù)分開的數(shù)據(jù)點;x表示待分類數(shù)據(jù)點。
(2)SVM監(jiān)督分類算法的關鍵參數(shù)優(yōu)化:粒子群優(yōu)化算法
在利用SVM進行數(shù)據(jù)分類時,有些情況下,在高維空間中仍然會存在一些離群點??紤]到函數(shù)的容錯性,在函數(shù)分類過程中引入懲罰因子C≥0(憑測試經(jīng)驗給定的常數(shù)),控制對錯分樣本的懲罰程度。懲罰因子C用于控制模型復雜度和逼近誤差,在確定的特征空間中調(diào)節(jié)SVM算法的置信范圍和經(jīng)驗風險的比例,其值越大,則數(shù)據(jù)的擬合精度越高。同時,g主要影響樣本數(shù)據(jù)在高維特征空間中分布的復雜程度,對模型的分類精度有著重要影響。因此,對SVM核函數(shù)參數(shù)g和懲罰因子C進行優(yōu)化具有重要意義。
粒子群優(yōu)化算法(PSO)由Kennedy和Eberhart于1995年提出,是計算機智能領域基于群體智能的優(yōu)化算法,它同遺傳算法類似,通過個體間的協(xié)作和競爭實現(xiàn)全局搜索[17]。該算法的優(yōu)勢在于簡單易行,求解速度快,目前已得到廣泛應用。為此,本文利用PSO算法對g和c進行優(yōu)化選擇。
(3)應用出租車GPS點數(shù)據(jù)對城市用地分類辨識方法的精度檢測
SVM結(jié)果的分類準確率檢測也是驗證方法可行性的重要環(huán)節(jié)。用地分類辨識過程結(jié)束后,將通過分類準確率予以驗證(式4)。
式中,A代表分類準確率,r代表正確分類個數(shù),f代表錯誤分類個數(shù)。
2.1 研究區(qū)域與研究數(shù)據(jù)
本文以深圳市福田區(qū)為研究區(qū)。福田區(qū)位于深圳特區(qū)中部,面積78.8km2,由24km2的中心城區(qū)和深南大道兩側(cè)帶狀經(jīng)濟開發(fā)區(qū)域及部分丘陵、山地、海灘組成,是深圳市重點開發(fā)建設的中心城區(qū)。選取該研究區(qū)域的原因在于:(1)土地利用類型豐富,各類用地在該區(qū)域均有體現(xiàn);(2)處于中心城區(qū),人口流動量大,可以提供海量的出租車GPS數(shù)據(jù)進行問題分析。
本文所使用的數(shù)據(jù)為深圳市2011年土地利用現(xiàn)狀數(shù)據(jù)和2011年4月18日至26日1億多條深圳市出租車GPS數(shù)據(jù)。其中,針對2011年土地利用現(xiàn)狀數(shù)據(jù),本文結(jié)合深圳市福田區(qū)用地特征,將其分為為綠地(包括園地、林地、草地等)、商服用地、工礦倉儲用地、住宅用地、公共管理與公共服務用地五大類(圖3)。
圖3 深圳福田區(qū)區(qū)位圖Fig.3 The location of Futian district in Shenzhen city
2.2 基于出租車GPS數(shù)據(jù)的居民活動特征與城市用地類型的關系分析
以五大類用地為居民活動特征數(shù)據(jù)統(tǒng)計和分類的基本單元。圖4顯示工作日和休息日里各地類范圍內(nèi)下車剩余活動量的時序特征分布??梢钥闯觯瑹o論在工作日還是休息日,居住用地范圍內(nèi)下車剩余活動量在早上7點會出現(xiàn)負峰值,而下午6點以后逐漸增加;與之相對應,在工作日時,商服用地在早上8點左右會出現(xiàn)一個峰值,而在下午7點以后活動剩余量迅速下降,在休息日時,商服用地的活動剩余量呈現(xiàn)規(guī)律與工作日相近,但峰值降低。除此之外,公共管理與公共服務用地、工礦倉儲用地、綠地等也分別呈現(xiàn)出不同的下車剩余活動量變化特征。
圖4 不同地類范圍內(nèi)出租車下車剩余活動量時序特征圖Fig.4 Temporal characteristics of residual activity of taxis in different categories
由于福田區(qū)各類用地面積以及從業(yè)人員數(shù)量的不同,導致地類內(nèi)的上下車活動剩余量在數(shù)量級上存在一定差別,如工業(yè)用地平均每天在9點左右的下車剩余活動量還不到100,而商服用地則達到了400左右。為了便于活動特征的比較,本文對出租車下車剩余活動量進行Z-score標準化處理,使不同地類相同時間段內(nèi)的居民活動特征變化在同一個數(shù)量級上(圖5)。結(jié)果表明,在工作日,居民從居住地出發(fā)分別到工業(yè)用地、商服用地以及公共服務用地工作,此時居住用地為一天活動的起始點,其下車剩余活動量則會出現(xiàn)波谷,而工礦倉儲用地、公共管理與公共服務用地、商服用地由于整體的上班機制和出行距離的不同,下車剩余活動量會在不同時間段依次出現(xiàn)波峰。比如商服用地上的活動強度在8:30左右達到波峰,而工業(yè)用地在9:00左右才達到,公共服務用地在7:00和9:00左右分別有一個波峰,但其活動強度相對工礦倉儲與商服用地弱;到晚上,居民陸續(xù)回到居住地休息,居住用地下車剩余活動量明顯增加,特別是在休息日7:00~9:00期間,該用地整體活動明顯比工礦倉儲和商服用地要活躍。
由以上分析可知,針對不同類型的城市用地,其出租車下車剩余活動量的時序特征在工作日、休息日有很強的規(guī)律性。通過出租車起訖點及其臨近地類、時間信息等,推算不同時間、地段的出租車下車活動剩余量時空特征,可以推演和感知相應的城市用地類型。
圖5 不同地類范圍內(nèi)出租車下車剩余活動量時序特征標準化圖Fig.5 The standard of the time series of the residual activity of the taxi in different categories
2.3 應用出租車GPS數(shù)據(jù)對城市用地分類的感知方法試驗與精度檢驗
為了較好地衡量出租車GPS數(shù)據(jù)點對用地類型的感知能力,本文利用粒子群優(yōu)化算法(PSO)來尋找C-SVC模型參數(shù)g和c的最優(yōu)值[18],g和c的尋優(yōu)范圍分別設定為[10-2,103]和[10-1,102],最大迭代次數(shù)設定為200,尋優(yōu)結(jié)果如圖6、圖7所示。
從圖6可以看出,測試樣本的預測分類大部分落在實際分類區(qū)間,最佳參數(shù)c和g則如圖7所示。此時c=77.2354,g=893.7747,最佳的樣本分類準確率達到90%以上。優(yōu)化參數(shù)后的C-SVC模型函數(shù)形式如式5。
圖6 實際分類與預測分類圖Fig.6 The actual classification and prediction classification
圖7 PSO參數(shù)尋優(yōu)準確率曲線Fig.7 The accuracy rate curve of PSO aprameter optimization
利用福田區(qū)不同用地類型的出租車起訖數(shù)據(jù)點對C-SVC模型進行學習訓練和準確率檢測,以確定GPS數(shù)據(jù)點對應的用地類型和最終的分類準確率。實驗發(fā)現(xiàn),隨著訓練集樣本的增多,分類準確率逐漸提高。本文利用全體數(shù)據(jù)的25%作為訓練集,利用剩余的75%的數(shù)據(jù)點作為測試集進行分類準確率驗證,結(jié)果表明整體準確率達到97.16%,其中,各地類分類準確率如表1所示。將分類后的數(shù)據(jù)點轉(zhuǎn)成柵格數(shù)據(jù)與用地現(xiàn)狀圖比較發(fā)現(xiàn),GPS數(shù)據(jù)所識別出的用地類型和位置與現(xiàn)狀圖具有較高的匹配度,如圖8所示。
表1 各地類分類準確率Table 1 Classification accuracy rate of each land use category
圖8 用地現(xiàn)狀圖(左)與GPS數(shù)據(jù)點分類圖(右)對比Fig.8 The comparison of land use category (L) and GPS data points classification (R)
進一步將分類后的GPS數(shù)據(jù)點與用地分布圖進行疊置,為便于觀察,本文將相同地類的GPS數(shù)據(jù)點與地類圖斑以不同顏色顯示(如圖9)。結(jié)果顯示,絕大部分數(shù)據(jù)點分類結(jié)果與地類圖斑是完全對應的。從右側(cè)局部圖可以看到,錯分點均出現(xiàn)在地類交接區(qū)域(即道路中心線附近),這種現(xiàn)象的產(chǎn)生一方面是因為出租車GPS點定位存在精度誤差,另一方面是由于分類模型對這種交錯地帶數(shù)據(jù)點分類能力不強,但這些極少數(shù)的錯分點并不影響GPS數(shù)據(jù)點對用地類型準確感知的能力。
圖9 GPS錯分數(shù)據(jù)點與用地現(xiàn)狀圖對比Fig.9 The comparison of GPS data points misclassification and land use category
本文是眾多大數(shù)據(jù)挖掘嘗試的一部分,主要探討居民出行產(chǎn)生的數(shù)字足跡在城市用地類型動態(tài)感知中的應用。針對深圳市福田區(qū)案例,通過分析不同用地類型出租車下車活動剩余量的時序特征,觀察到不同城市用地類型在不同時間段的出租車下車剩余活動量具有顯著的差異,并且符合居民活動和活動場所間的時空聯(lián)系規(guī)律,支持了應用出租車GPS數(shù)據(jù)開展用地動態(tài)感知研究的假設;在此基礎上,基于SVM監(jiān)督學習分類算法對樣本點進行分類,采用優(yōu)化的模型參數(shù)提高了分類精度,研究表明,采用C-SVC模型,應用出租車GPS數(shù)據(jù)對城市用地類型的感知精度高達97.16%,具有較好的可行性。
然而,本文分析發(fā)現(xiàn),SVM分類算法雖然獲得了非常好的分類效果,但由于數(shù)據(jù)量龐大、運算工具硬件要求高等限制,使得用地分類和辨識速度相對較慢,降低了SVM的分類運算優(yōu)勢。此外,出租車GPS數(shù)據(jù)只是居民出行產(chǎn)生的足跡之一,類似WiFi熱點數(shù)據(jù)、地理位置標簽數(shù)據(jù)、手機活動數(shù)據(jù)、私人汽車數(shù)據(jù)、POI數(shù)據(jù)等都值得加以利用,若在分析過程中能結(jié)合這些數(shù)據(jù),將有利于更精細化地感知出更為不同的城市用地類型,這也是值得探索的大數(shù)據(jù)挖掘工作。
參考文獻(References)
[1] Liu Y,Liu X,Gao S,et al.Social sensing:A new approach to understanding our socioeconomic environments[J].Annals of the Association of American Geographers,2015,(4):512-530.
[2] Soto V,Frias-Martinez E.Automated land use identification using cell-phone records[C]//Proceedings of the 3rd ACM international workshop on HotPlanet’11,Bethesda,Maryland,USA,2011.
[3] Soto V,Frias-Martinez E.Robust land use characterization of urban landscapes using cell phone data[C]//Pro-ceedings of the 1st workshop pervasive urban application pervasive,2011:1-8.
[4] Calabrese F,Reades J,Ratti C.Eigenplaces:Segmenting space through digital signatures[J].IEEE Pervasive Computing,2010,9(1):78-84.
[5] Yuan J,Zheng Y,Xie X.Discovering regions of different functions in a city using human mobility and POIs[C]//ACM KDD’12 Beijing,China,2012.
[6] Toole Jameson,Ulm Michael,González Marta,et al.Inferring land use from mobile phone activity[C]//Pro-ceedings of the ACM SIGKDD international workshop on urban computing,2012.
[7] Pan G,Qi G D,Wu Z H,et al.Land-use classification using taxi GPS traces[J].IEEE Transactions on Intelli-gent Transportation Systems,2013,14(1):113-123.
[8] 潘綱,李石堅,齊觀德,等.移動軌跡數(shù)據(jù)與智慧城市[J].中國計算機學會通訊,2012,8(5):31-37.Pan G,Li S J,Qi G D,et al.Mobile trajectory data and wisdom city[J].Communication of the China Com-puter Federation,2012,8(5):31-37.
[9] 趙一斌,石心怡,關志超.基于GIS支持的出行行為時間空間及序列特征研究[J].中山大學學報(自然科學版),2010,49(S1):43-47.Zhao Y B,Shi X Y,Guan Z C,et al.An analytical framework for travel-activity pattern analysis:A GIS ap-proach[J].Acta Scientiarum Naturalium Universitatis Sunyatseni,2010,49(S1):43-47.
[10] 申悅,柴彥威.基于GPS數(shù)據(jù)的北京市郊區(qū)巨型社區(qū)居民日?;顒涌臻g[J].地理學報,2013,68(4):506-516.Shen Y,Chai Y W.Daily activity space of suburban megacommunity residents in Beijing based on GPS da-ta[J].Acta Geographica Sinica,2013,68(4):506-516.
[11] 周素紅,鄧麗芳.基于T-GIS的廣州市居民日?;顒訒r空關系[J].地理學報,2010,65(12):1454-1463.Zhou S H,Deng L F.Spatio-temporal pattern of residents' daily activities based on T-GIS:A case study in Guangzhou,China[J].Acta Geographica Sinica,2010,65(12):1454-1463.
[12] Cortes C,Vapnik V.Support vector networks[J].Machine Learning,1995,20(3):273-297.
[13] 肖芳.支持向量機在數(shù)據(jù)挖掘中的應用[C]//第十二屆全國數(shù)學地質(zhì)與地學信息學術(shù)研討會,2013.Xiao F.Application of support vector machine in data mining[C]//The 11st national workshop on mathematical geosciences and geoiinformatics of China,2013.
[14] 孫德山.支持向量機分類與回歸方法研究[D].長沙:中南大學博士學位論文,2004.Sun D S.The research on support vector machine classification and regression methods[D].Doctoral disser-tation,Changsha:Central South University,2004.
[15] 焦春鵬.基于二分類SVM的多分類方法比較研究[D].西安電子科技大學碩士學位論文,2011.Jiao C P.Comparison study on multi-category classification with binary SVMs[D].Master's thesis,Xi'an:Xidian University,2011.
[16] Chang C C,Lin C J.LIBSVM:A library for support vector machines[Z].2009.
[17] 谷文成,柴寶仁,滕艷平.基于粒子群優(yōu)化算法的支持向量機研究[J].北京理工大學學報,2014,34(7):705-709.Gu W C,Chai B R,Teng Y P.Research on support vector machine based on particle swarm optiminzation[J].Transactions of Beijing Institute of Technology,2014,34(7):705-709.
[18] 王小川,史峰,郁磊,等.MATLAB神經(jīng)網(wǎng)絡43個案例分析[M].北京:北京航空航天大學出版社,2013.Wang X C,Shi F,Yu L,et al.The cases analysis of MATLAB neural network[M].Beijing:Beihang University Press,2013.
Research on the identification of urban land use under the big data condition:Dynamic awareness based on taxi GPS data
LIANG Jun-Hui1,2,LIN Jian1,DU Yang1,2
(1.College of Urban and Enνironmental Sciences,Peking Uniνersity,Beijing 100871,China;2.Shenzhen Graduate School,Peking Uniνersity,Guangdong Shenzhen 518055,China)
Abstract:This paper uses the Shenzhen Futian district as a case study,to mine the massive amounts of taxi GPS data through time and space,for testing the correlation between the activities of residents,on and off taxi,and the urban land use pattern.It classifies the taxi GPS data and verifies its accuracy using the SVM classification algorithm,while the optimal parameters are determined using the particle swarm optimization method.The results show that,the matching accuracy of the classification of the taxi GPS data and the actual land use pattern of Futian district can be as high as 97.16%,which proves that the taxi GPS data can be used for real-time,accurate,dynamic awareness on urban land use pattern.
Key words:urban land use;type identification;big data analysis;SVM algorithm;dynamic awareness
基金項目:國家自然科學基金項目(41371534)*通訊作者:林堅(教授/博導/北京大學城市與環(huán)境學院城市與區(qū)域規(guī)劃系主任):jlin@urban.pku.edu.cn.
作者簡介:梁軍輝(1989-),男,碩士生,主要研究方向為城市與區(qū)域規(guī)劃.
修訂日期:2015-02-04
收稿日期:2015-01-25
doi:10.3969/j.issn.2095-1329.2016.01.007
中圖分類號:F293.22
文獻標志碼:A
文章編號:2095-1329(2016)01-0028-05
電子郵箱:1175088379@qq.com
聯(lián)系電話:010-62751176