彭 玲,吳 同,3,李高盛,2,李 祥,2,胡 媛,2,尤承增,2
(1.中國科學院 遙感與數(shù)字地球研究所,北京 100094; 2.中國科學院大學,北京 100049 3.西安科技大學,陜西 西安 710600)
目前,隨著城市人口、工業(yè)、交通運輸業(yè)不斷擴張,由于城市的環(huán)境、資源和基礎設施難以適應城市的快速發(fā)展,使得交通擁堵、環(huán)境破壞、熱島效應、大氣污染等一系列城市問題日漸顯著。在此形勢下,準確把握城市發(fā)展規(guī)律,推動城市健康發(fā)展,成為智慧城市發(fā)展的必然趨勢。
由于遙感、物聯(lián)網(wǎng)、無人機等技術的快速發(fā)展,獲取得到的諸如遙感影像數(shù)據(jù)、傳感器數(shù)據(jù)、視頻監(jiān)控數(shù)據(jù)等的城市數(shù)據(jù)種類愈加繁多,這些數(shù)據(jù)具有大數(shù)據(jù)量、多空間尺度、多時間尺度、多用戶對象和多專題類型的特點,因此統(tǒng)稱為時空大數(shù)據(jù)[1-4]。數(shù)據(jù)科學家和城市管理者通過對這些多源時空大數(shù)據(jù)進行分析挖掘,探究潛藏在數(shù)據(jù)背后的脈動規(guī)律并將其應用于智慧城市的建設。如在智慧交通中,通過對行車軌跡進行數(shù)據(jù)挖掘,從而確定最佳的行車路徑;在智慧環(huán)保中,利用深度學習算法進行城鄉(xiāng)垃圾堆的自動提取,實現(xiàn)垃圾堆的智能識別和管理等。在智慧城市中,采用數(shù)據(jù)分析手段,挖掘多源時空數(shù)據(jù)的隱藏價值,分析城市脈動發(fā)展規(guī)律,對于精細化城市管理,現(xiàn)代“城市病”問題的研究以及人民生活品質的改善均起著不可替代的作用。
本文針對城市交通擁堵、垃圾堆放、熱島效應等城市病,依托智慧城市公共信息平臺所收集的多源時空數(shù)據(jù),采用深度學習、關聯(lián)規(guī)則挖掘等機器學習算法進行信息提取和時空數(shù)據(jù)分析,認知城市病發(fā)展過程中各項指標的脈動規(guī)律,從而對現(xiàn)代“城市病”問題的解決提出合理建議。
在城市化發(fā)展進程中,如果人口集中的規(guī)模超過了工業(yè)化和社會經(jīng)濟發(fā)展的水平,就可能產(chǎn)生諸如交通擁堵、生態(tài)破壞、垃圾堆放等一系列的城市問題,而“城市病”是城市的正常功能受到影響的一種形象化描述[2-5]。周加來[6]從城市發(fā)展的不同階段,對城市病的起因進行了系統(tǒng)的闡述。倪鵬飛[7]在對我國城市發(fā)展歷程進行總結的基礎上,將我國城市病的表現(xiàn)特征歸納為環(huán)境污染、交通擁堵、住房緊張、健康危害、城市災害及安全弱化等。梁麗[8]從人口、城市體制等幾個方面對城市病形成的原因進行了分析,同時提出了利用大數(shù)據(jù)進行城市病治理的對策建議。本文就環(huán)境破壞、交通擁堵以及社會頻發(fā)事件方面的城市病進行研究。
在環(huán)境領域,城鄉(xiāng)生活垃圾堆是目前最難得到處理、最具綜合性且最貼近生活的環(huán)境問題[9],隨著中國社會經(jīng)濟的不斷發(fā)展,我國生活垃圾的數(shù)量呈現(xiàn)出明顯的增長趨勢,我國城市每年垃圾的產(chǎn)生量以8%~10%的速度增長,2010年我國生活垃圾產(chǎn)生量為3.52億噸,居世界首位[10]。目前,城鄉(xiāng)生活垃圾的露天堆放、無人管理不僅造成了嚴重的大氣、水體和土壤污染,同時也對居民的身體健康產(chǎn)生了負面影響。
除生活垃圾堆問題外,城市熱島效應也已逐漸成為影響城市人居環(huán)境和居民生活健康的一個重要因素。城市熱島效應是指城市化發(fā)展過程中,由于城區(qū)下墊面性質的改變、溫室氣體以及人工廢熱的排放等因素所引起的城市地表和大氣溫度明顯高于城市周邊郊區(qū)的一種現(xiàn)象[11]。城市熱島的形成與發(fā)展與其所處的地理位置和幾何形狀有著密切的關系[12]。Oke[13]將城市中心區(qū)的溫度最高值與郊區(qū)溫度的差值定義為“熱島強度”,熱島強度與城市的發(fā)達程度密切相關,如北京、上海、廣州等幾個城市的熱島強度十分明顯,城市熱島問題嚴重。嚴重的城市熱島效應不僅形成了嚴重的大氣污染,也嚴重影響了人們的生活質量和制約著城市的發(fā)展進程。
在交通領域,隨著我國城鎮(zhèn)化進程的不斷加快,城市的交通問題也愈演愈烈,主要表現(xiàn)為交通擁堵及由此帶來的污染、安全等一系列的問題。近年來,我國私家車數(shù)量的日益增加使得城市交通擁堵問題日益嚴重[14],其中北京、上海等特大城市尤為嚴重,其他大城市和一些中小城市也陸續(xù)出現(xiàn)交通擁堵問題。交通擁堵直接影響著居民的工作、生活效率,同時抑制著人們的日常活動,使得城市活力大打折扣,居民的生活質量也隨之下降。
除了環(huán)境破壞、熱島效應和交通擁堵外,城市的不斷發(fā)展,人口的過度集中,也使得城市中道路破損、道路積水、路面塌陷等社會事件頻繁發(fā)生,大量的城市基礎設施、公共服務設施和社會公共事務等需要進行維護和管理,給城市管理部門的管理工作增加了難度。
因此,城市病的長期存在及惡化,已經(jīng)嚴重困擾了城市發(fā)展。本文在諸多學者研究基礎上,運用遙感手段和各類傳感器所獲取的城市數(shù)據(jù),結合當前主流深度學習算法和機器學習分析模型,對城市病進行多角度剖析,針對城市交通擁堵、城市垃圾堆放、城市熱島效應和城市監(jiān)管案件等典型城市病進行分析,取得階段性成果。
隨著遙感技術、無人機、物聯(lián)網(wǎng)以及互聯(lián)網(wǎng)+等技術的發(fā)展,多源時空數(shù)據(jù)的種類越來越多,主要包括遙感影像和無人機影像數(shù)據(jù)、各類傳感器數(shù)據(jù)、視頻監(jiān)控數(shù)據(jù)和微博簽到數(shù)據(jù)等。在城市智慧化、信息化建設和發(fā)展的浪潮下,由物聯(lián)網(wǎng)、社交網(wǎng)絡及城市基礎設施等產(chǎn)生的數(shù)據(jù)量已經(jīng)由GB(Gigabyte)、TB(Terabyte)級快速增長為PB(Petabyte)和EB(Exabyte)級。
在解決現(xiàn)代各個領域的城市病的研究中,多源時空數(shù)據(jù)是各項工作的基石。如利用高分辨率遙感影像數(shù)據(jù)對城鄉(xiāng)生活垃圾堆進行提取,從而統(tǒng)計分析其分布情況;利用遙感影像中的熱紅外波段數(shù)據(jù)進行溫度反演可以分析城市熱島效應的時空特征;利用無人機遙感數(shù)據(jù)進行城市的車輛提取判斷道路的擁堵情況,同時利用視頻監(jiān)控數(shù)據(jù)等時間序列的數(shù)據(jù)獲取車輛運動狀態(tài);利用傳感器手段、社交網(wǎng)絡的眾源數(shù)據(jù)獲取城市的社會事件類型及具體的空間坐標,以便進行城市基礎設施、社會公共事務的維護和管理。
綜上,多源時空大數(shù)據(jù)反映了城市的健康狀態(tài),同時也是城市病研究的基礎,利用多源時空數(shù)據(jù)進行脈動分析,對城市病的溯源和解決具有重要意義。
城市脈動分析是對城市各項指標特征變化規(guī)律的探索。它充分利用了數(shù)據(jù)挖掘技術從大量、有噪聲、模糊的數(shù)據(jù)中提取隱含在其中的、有價值的信息和知識。在城市病分析中,為了挖掘多源時空數(shù)據(jù)的隱藏價值,對城市脈動規(guī)律進行分析,常常需要綜合應用遙感信息提取、機器學習、空間分析等方法,并根據(jù)特定需求綜合選擇和使用相應數(shù)據(jù)挖掘理論、方法和工具,提高智能化程度[3-4]。
遙感信息提取技術是以遙感圖像為研究對象,在計算機系統(tǒng)支持下,綜合運用遙感圖像處理、GIS分析、人工智能等技術對地學專題信息進行智能化提取。由于不同波段、不同地物具有不同的波譜特征,通過對某種地物在各波段進行波譜曲線的分析,并將其特點進行增強處理,從而在遙感影像上識別并提取同類目標物[15]。如利用遙感信息提取技術可以快速、高效地對城鄉(xiāng)垃圾堆進行判別,從而為垃圾堆放這一城市病的研究提供數(shù)據(jù)支撐。
空間分析技術是對目標的位置和屬性數(shù)據(jù)進行分析的一系列技術[16]。利用空間分析技術可以對城市頻發(fā)事件、交通擁堵和熱島效應等城市病問題進行研究。通過對城市頻發(fā)事件進行空間分析,可以發(fā)現(xiàn)不同地區(qū)的主要社會事件,從而因地制宜地進行監(jiān)管;在交通擁堵方面,可以通過對不同地區(qū)車流量情況的分析,從而評價不同地區(qū)的繁華程度,為交通規(guī)劃、車輛管理提供指導;另外,通過遙感影像進行溫度反演,能夠分析城市熱島的空間變化規(guī)律,獲取城市熱島的區(qū)域特征,從而進一步分析不同地區(qū)熱島效應的產(chǎn)生原因并對其發(fā)展趨勢進行預測,最終為生態(tài)環(huán)境的保護、城市發(fā)展規(guī)劃提供指導。
機器學習主要是利用計算機理解并模擬人類的學習過程,針對不完全的信息進行自動規(guī)劃并用以獲取新的知識和技能,重新組織已有的知識結構使之不斷改善自身的性能。深度學習作為機器學習的一個分支,已廣泛地應用于圖像分類、自然語言的處理和人工智能等各個領域,并在目標檢測中也取得了前所未有的成果[17]。利用機器學習可以對車輛軌跡和不同地區(qū)的車流量情況等進行分析,從而應用于交通擁堵的研究之中。
本文從交通擁堵、城鄉(xiāng)垃圾堆、熱島效應和城市頻發(fā)社會事件4個方面的城市病出發(fā),利用數(shù)據(jù)挖掘方法、空間分析、深度學習算法等手段,基于多源時空數(shù)據(jù)開展典型的城市脈動分析,從而對城市病的研究提供途徑。
針對城市病中交通擁堵、環(huán)境破壞以及社會頻發(fā)事件等問題,利用我們在智慧城市建設中形成的空間信息公共平臺所匯聚的遙感影像、無人機數(shù)據(jù)和各類傳感器數(shù)據(jù)等多源時空數(shù)據(jù)對城市交通擁堵、城市垃圾堆放、城市熱島效應和城市監(jiān)管案件開展了脈動應用分析。
城市交通脈動分析包括城市車輛空間位置提取、城市公交車客流量狀況分析等方面。其中,隨著交通擁堵現(xiàn)象的愈發(fā)嚴重,對車輛空間位置的提取是交通管理和規(guī)劃的關鍵環(huán)節(jié)。傳統(tǒng)的車輛空間位置的提取都是基于地面的監(jiān)測設備,如雷達系統(tǒng)和視頻監(jiān)控[18-19]。然而這些設備的覆蓋面有限,難以有效監(jiān)測整個道路網(wǎng)絡的交通情況。由于遙感技術能夠進行大范圍、長時間地動態(tài)監(jiān)測,近年來利用遙感影像數(shù)據(jù)進行車輛空間位置的提取已然成為一個新興的研究方向。許多學者利用高空間分辨率遙感影像(如IKONOS, QuickBird,WorldView)來進行車輛檢測[20-23]。還有一些學者在車輛空間位置提取基礎上進行了進一步研究,他們利用QuickBird衛(wèi)星全色和多光譜傳感器拍攝時間的微小間隔來估計運動車輛車速[24]。
在城市車輛空間位置提取中,本文使用caffe框架實現(xiàn)Faster R-CNN模型,實驗數(shù)據(jù)為空間分辨率為0.13m的Google Earth影像中采集200張包含車輛大小為500×500像素的影像,其中的車輛樣本多達2 000個。選擇其中的100張圖片作為訓練集,50張圖片作為驗證集,另外50張圖片作為測試集。原始樣本數(shù)據(jù)如圖1所示。測試集上的檢測效果圖如圖2所示。
圖1 城市車輛原始樣本數(shù)據(jù)Fig.1 Original sample data of urban vehicles
圖2 測試集檢測效果圖Fig.2 Test results in test-set
在獲取了車輛分布的基礎上,本文分析了不同日期的某道路車流量的異常比,計算方式如公式(1),該特征反映了路網(wǎng)交通流的紊亂程度,通常擁堵情況將會導致該值居高不下或者極速攀升。
式中,Nanomaly為當前時段異常狀況的車輛數(shù),Ntotal為當前被估計的所有交通流狀況總數(shù)。日常情況下,城市交通路網(wǎng)異常狀況比例會維持在一個相對穩(wěn)定的較小值,當區(qū)域內(nèi)出現(xiàn)惡性突發(fā)事件(如車禍)時,路網(wǎng)交通流就會相對“紊亂”,異常狀況比例迅速攀升,如圖3所示,11月4日,交通擁堵導致路網(wǎng)受到較強烈的影響。
圖3 各時段交通流異常比情況Fig.3 Traきc flow abnormal ratio in time interval
通過對車輛提取和交通擁堵的監(jiān)測,了解城市各道路的交通流量狀況,并及時向有關部門反映和建議,有利于改善交通管理控制和路網(wǎng)的規(guī)劃,緩解交通擁堵現(xiàn)象。
城鄉(xiāng)垃圾堆的長期隨意堆放,給城鄉(xiāng)環(huán)境的改善和全面有效治理帶來很大的困難。目前,遙感技術應用于垃圾處理方面的研究有了一定的進展,但仍有大量關鍵性問題需要解決。WaiYeungYan等[25]基于Landsat影像檢測固體廢棄物的表面溫度,發(fā)現(xiàn)垃圾堆的地表溫度比周圍植被溫度高了4°到10°,為垃圾監(jiān)測提供了更多信息。Enrico Giuseppe Cadau等[26]用高分辨率遙感光學影像對垃圾堆進行二維監(jiān)測,用合成孔徑雷達(SAR)影像對垃圾堆進行三維檢測,并通過反演溫度,提出了一個垃圾堆監(jiān)測指數(shù)DDI(Dump Detection Index)。秦海春等[27]采用高分二號影像數(shù)據(jù),以決策樹分類為研究方法,建立了垃圾堆解譯標志,得出了在影像上垃圾堆顏色往往呈高亮白色、紋理結構明顯、表面凹凸不平等結論?,F(xiàn)有的研究并沒有充分利用機器學習和人工智能等自學習技術手段來減少人機交互。因此,本文利用遙感影像結合全自動的目標檢測技術智能化地提取露天垃圾堆從而為環(huán)境衛(wèi)生部門的管理提供幫助。
本文主要采用深度學習算法中的Faster R-CNN模型進行城鄉(xiāng)垃圾堆的提取,并對其分布特征進行空間分析。實驗中采用空間分辨率為0.13m的Google Earth影像,并裁剪200個500×500像素的包含城市垃圾堆的影像為樣本數(shù)據(jù)集。其中,選擇60張圖片作為訓練集,60張圖片作為驗證集,另外80張圖片作為測試集。原始樣本數(shù)據(jù)如圖4所示。
圖4 城鄉(xiāng)垃圾堆原始樣本數(shù)據(jù)Fig.4 Original sample data of urban and rural garbage heap
在Faster R-CNN模型中,不同的參數(shù)設置意味著系統(tǒng)整體性能的差異[28],通過交叉驗證將模型的參數(shù)進行如下設置:初始學習率設置為0.001,梯度更新權重為0.9,權重衰減項為0.001 2。首先采用均值為0,方差為0.01的高斯分布初始化模型的所有新層;然后使用ImageNet完成分類任務的預訓練,并使用預訓練好的模型初始化RPN網(wǎng)絡和Fast R-CNN檢測網(wǎng)絡;最后將樣本影像中的垃圾堆一一框選用于模型的訓練。
在進行caffe環(huán)境搭建的基礎上,利用Faster R-CNN進行模型的訓練,并選取某城市的遙感影像進行垃圾固廢的檢測,檢測效果如圖5所示。
圖5 在測試影像中對垃圾堆位置的判別Fig.5 Identification the location of the garbage in the test image
由圖6可以看出,該城市中垃圾堆集中分布在南部的城鄉(xiāng)結合地段。因此,通過對遙感影像中垃圾堆的提取及其空間位置分析,可以有效地圈定垃圾堆的分布地段,從而輔助環(huán)衛(wèi)部門進行針對性的治理,改善城市市容環(huán)境。
圖6 垃圾堆監(jiān)測結果的空間密度分析Fig.6 Spatial density analysis of garbage monitoring results
近年來,我國學者對城市熱島效應做了許多研究,任霞等人[29]在進行溫度反演的基礎上,對比分析了歸一化植被指數(shù)、歸一化建筑指數(shù)和歸一化水汽指數(shù)3種主要的地表特征參數(shù)在表達熱島效應方面的有效性。江樟焰等人[30]利用TM影像根據(jù)輻射傳輸方程進行北京地區(qū)地表溫度的反演,從而對熱島現(xiàn)象與土地覆蓋類型和植被指數(shù)的關系進行了研究。
本文在以往定性研究城市熱島的基礎上引入了定量分析手段,并結合剖面線分析方法,對天津生態(tài)城城市熱島效應的時空分布特征進行剖析。依據(jù)單窗算法所反演的溫度數(shù)據(jù),對生態(tài)城2013~2015年的熱島效應進行分析,包括熱島效應的年度變化、區(qū)域特征等。
從圖7中可以看出,2013年到2015年間生態(tài)城的次高溫、高溫、特高溫三區(qū)之和從42.3%增加到44.5%,可見近三年城市熱島效應呈逐年增強的態(tài)勢,說明隨著生態(tài)城的發(fā)展,居民活動日益增強。但是,生態(tài)城的特高溫區(qū)比例,從2013年的18.4%降低為2015年的0.1%,說明隨生態(tài)城的生態(tài)建設成果已經(jīng)初見成效。
圖7 2013-2015年生態(tài)城熱島效應各溫區(qū)比重圖Fig.7 The proportion of the temperature zone of Eco-city in 2013-2015
隨著城市的不斷擴張,人口過度聚集和交通擁擠等因素加劇了城市中車輛違章停放、露天垃圾或道路不潔等社會事件頻繁發(fā)生,城市管理部門每天都要對城市中的各類基礎設施、公共服務設施等市政內(nèi)容進行維護和管理。在管理過程中積累了大量的歷史數(shù)據(jù),通過對這些數(shù)據(jù)的脈動分析并將城市的運行現(xiàn)狀進行可視化展示,可以及時發(fā)現(xiàn)城市運行過程中存在的問題和監(jiān)管盲區(qū)。同時,揭示了城市基礎設施和服務運行的歷史規(guī)律,從而對城市的規(guī)劃和管理起到有效的輔助指導作用。以中新天津生態(tài)城為例,對城市監(jiān)管案件的字符云可視化展現(xiàn)如圖8所示。
圖8 生態(tài)城監(jiān)管案件字符云Fig.8 Eco-city supervision case character cloud
生態(tài)城監(jiān)管案件字符云圖展示了生態(tài)城歷史案件的內(nèi)容分布情況,其案件信息來源于生態(tài)城城市事件管理中的案件記錄,依據(jù)每個案件的類型和內(nèi)容進行凝練,按照關鍵詞出現(xiàn)頻率以及案件等級的高低進行排序,將頻發(fā)程度通過字符的大小進行可視化表現(xiàn)。由此突出重點案件和高頻案件,對城市運行的監(jiān)管方向提供建議。
本文利用在物聯(lián)網(wǎng)、遙感、無人機等技術蓬勃發(fā)展下所獲得的多源時空數(shù)據(jù),基于數(shù)據(jù)挖掘和深度學習等技術手段,對交通擁堵、城鄉(xiāng)垃圾堆、城市熱島和社會事件四方面的城市病問題進行探索性的分析研究,并科學地解釋了城市脈動結果的變化規(guī)律,為有關部門解決現(xiàn)代城市病提供了技術支撐。
同時,目前所進行的利用多源時空數(shù)據(jù)對城市脈動規(guī)律的分析探索仍屬冰山一角,仍有許多要完善和改進的地方?,F(xiàn)有城市脈動分析模式距離多源時空數(shù)據(jù)真正融合還有一段距離;因此在后續(xù)研究中,需要進一步實現(xiàn)天空地一體多源時空數(shù)據(jù)融合,更好地挖掘城市各類數(shù)據(jù)之間關聯(lián)性以輔助城市病深入研究。此外,需要進一步提高城市脈動分析準確性和高效性,進一步優(yōu)化脈動分析模型。在數(shù)據(jù)可視化方面,需要進一步增加面向用戶的更為人性化的可視化展示方式。