孟 超,張紹良,楊永均,付麗強,趙毅敏
(1.中國礦業(yè)大學公共管理學院,江蘇 徐州 221116;2.中國礦業(yè)大學環(huán)境與測繪學院,江蘇 徐州 221116;3.山西省自然資源廳信息中心,山西 太原 030024)
礦區(qū)地質(zhì)災害類型多且成因復雜,一直是我國地質(zhì)災害重點關(guān)注的領(lǐng)域之一,地質(zhì)災害風險智能監(jiān)測與信息精準發(fā)布是現(xiàn)代地災防治的關(guān)鍵技術(shù)。山西省是我國煤炭生產(chǎn)大省,黃土高原礦山地質(zhì)環(huán)境復雜,地質(zhì)災害頻發(fā),造成的經(jīng)濟損失巨大,地質(zhì)災害防治已成為山西省礦區(qū)綜合治理的重要任務之一[1]。山西省礦區(qū)地質(zhì)災害數(shù)據(jù)具有數(shù)據(jù)量大、數(shù)據(jù)類型復雜等特點[2],目前數(shù)據(jù)管理較混亂、分散、共享性差[3],數(shù)據(jù)應用受到很大限制,因此十分有必要整合礦區(qū)地質(zhì)災害信息,挖掘數(shù)據(jù)利用潛力,為礦區(qū)綜合治理提供基礎數(shù)據(jù)。
目前,礦山信息管理及地質(zhì)環(huán)境管理系統(tǒng)應用較為廣泛,打破了部門間信息孤島,完成了信息綜合管理[4],實現(xiàn)了文檔、圖件、多媒體調(diào)查數(shù)據(jù)的高效管理,系統(tǒng)集成多套評價算法,為礦山生態(tài)環(huán)境評價提供了平臺[5]。大數(shù)據(jù)時代為礦山地質(zhì)監(jiān)測帶來了新的發(fā)展[6],將大數(shù)據(jù)分析與GIS結(jié)合[7],融合多源數(shù)據(jù),實現(xiàn)自動化監(jiān)測預警[8]。但是,在礦山地質(zhì)災害信息智能分析與應用方面,還存在礦山地質(zhì)環(huán)境系統(tǒng)僅注重地質(zhì)監(jiān)測與預警方面的問題,礦山地質(zhì)災害地理影響分析還沒有利用大數(shù)據(jù)思維[6]。
礦山地質(zhì)災害數(shù)據(jù)類型各異、數(shù)據(jù)格式不同,可分為結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。數(shù)據(jù)量大、數(shù)據(jù)種類繁多,除了傳統(tǒng)的GIS矢量數(shù)據(jù)、關(guān)系型數(shù)據(jù)庫、空間數(shù)據(jù)庫、地質(zhì)報告、圖件、表格外,還儲存了大量圖片和視頻等格式的數(shù)據(jù),數(shù)據(jù)特點符合大數(shù)據(jù)特點,屬于時空大數(shù)據(jù)。山西省現(xiàn)有礦區(qū)地質(zhì)災害信息系統(tǒng)對時空數(shù)據(jù)的管理和應用存在如下問題:①礦山地質(zhì)環(huán)境數(shù)據(jù)可視性差,未實現(xiàn)點圖聯(lián)動;②屬性信息少,決策支持能力弱;③動態(tài)更新能力弱,地質(zhì)環(huán)境調(diào)查周期長,地質(zhì)災害點動態(tài)變化響應慢;④數(shù)據(jù)挖掘功能薄弱,缺少數(shù)據(jù)分析能力。因此,本文將礦區(qū)地質(zhì)災害與地理興趣點大數(shù)據(jù)相結(jié)合,采用最新的地理信息技術(shù),開發(fā)了礦區(qū)地災信息智能分析系統(tǒng),以解決礦區(qū)地質(zhì)災害信息集成、管理和應用中存在的問題。
系統(tǒng)開發(fā)的目標是實現(xiàn)采煤礦區(qū)地質(zhì)災害數(shù)據(jù)的信息化、網(wǎng)絡化和公眾化。一方面為信息的共享提供平臺,另一方面為礦區(qū)綜合治理提供基礎數(shù)據(jù)資料。本系統(tǒng)基于Web開發(fā)平臺,采用分布式數(shù)據(jù)庫以及B/S架構(gòu)實現(xiàn)系統(tǒng)網(wǎng)絡在線運行[9]。用戶只需通過瀏覽器訪問Web平臺,便可使用該系統(tǒng)。采用SQL Server系統(tǒng)結(jié)合ArcGIS for Server系統(tǒng)的開發(fā)方式,運用SQL Server系統(tǒng)實現(xiàn)數(shù)據(jù)的組織管理及其查詢和更新。運用ArcGIS for Server系統(tǒng)解決專題數(shù)據(jù)的空間化管理、空間分析、地圖服務以及可視化等。使用GIS Tool For Hadoop工具,在Hadoop平臺上對大量空間數(shù)據(jù)快速處理和實時分析。
采用Hadoop架構(gòu)設計礦區(qū)地災信息智能分析系統(tǒng),Hadoop架構(gòu)是大數(shù)據(jù)處理中常用的軟件框架,HDFS(Hadoop Distributed File System)分布式文件系統(tǒng)、Hadoop MapReduce分布式計算模型和HBase分布式數(shù)據(jù)庫是其三大核心技術(shù)。
對于傳統(tǒng)數(shù)據(jù)庫中的數(shù)據(jù)而言,利用Sqoop開源工具完成從傳統(tǒng)數(shù)據(jù)庫到Hadoop云端的數(shù)據(jù)傳遞,對于非結(jié)構(gòu)化或半結(jié)構(gòu)化的數(shù)據(jù),利用Avro開源工具完成從傳統(tǒng)數(shù)據(jù)庫到Hadoop云端的存儲和交換?;贖adoop架構(gòu)的礦區(qū)地災信息智能分析系統(tǒng)框架如圖1所示。
圖1 基于Hadoop架構(gòu)的礦區(qū)地災信息智能分析系Fig.1 Hadoop-based intelligent analysis systemframework for mine disaster information
基于分布式存儲技術(shù)開發(fā)該系統(tǒng),實現(xiàn)數(shù)據(jù)的檢索與可視化、數(shù)據(jù)統(tǒng)計分析、核密度分析以及地質(zhì)災害危險性分析與可視化等功能,并支持數(shù)據(jù)成果的導出。系統(tǒng)的主要功能模塊如圖2所示。
圖2 系統(tǒng)功能結(jié)構(gòu)圖Fig.2 System functional structure diagram
系統(tǒng)的數(shù)據(jù)檢索與可視化模塊可以實現(xiàn)礦區(qū)地質(zhì)災害信息數(shù)據(jù)的一站式管理與服務,實現(xiàn)礦區(qū)地質(zhì)環(huán)境所有相關(guān)的圖表、成果文檔等數(shù)據(jù)的檢索與顯示,全面提高數(shù)據(jù)庫與各類成果的管理效率與使用率。支持圖層控制顯示,設置圖層控制模塊以管理圖層,各類數(shù)據(jù)存儲于不同的圖層目錄下,地質(zhì)環(huán)境與圖層的綜合整治分別管理地質(zhì)災害點數(shù)據(jù)與生態(tài)修復基礎數(shù)據(jù)。同時,采用空間化數(shù)據(jù)存儲模式,即將數(shù)據(jù)的空間信息與屬性信息相關(guān)聯(lián),系統(tǒng)使用者可在可視化界面下實現(xiàn)數(shù)據(jù)的檢索,空間化數(shù)據(jù)存儲實現(xiàn)點圖聯(lián)動的數(shù)據(jù)顯示。數(shù)據(jù)檢索界面如圖3所示。
圖3 數(shù)據(jù)檢索與可視化Fig.3 Data retrieval and visualization
圖4為系統(tǒng)對地質(zhì)災害數(shù)據(jù)的分類統(tǒng)計,可以全面了解山西省地質(zhì)環(huán)境狀況,通過統(tǒng)計圖表為相關(guān)管理人員提供輔助決策分析。采煤活動是引發(fā)礦區(qū)地質(zhì)環(huán)境問題的主要因素,由于不同礦區(qū)的地形、植被覆蓋以及人口分布狀況不同,因此,為了探求礦區(qū)地質(zhì)災害發(fā)生的外部相關(guān)因素,采用相關(guān)性分析法分析礦區(qū)地質(zhì)環(huán)境問題的發(fā)育特征。結(jié)合相關(guān)數(shù)據(jù)分別進行山西省地質(zhì)環(huán)境問題分布與地形、植被覆蓋分布、人口分布的相關(guān)性分析。
核密度可以反映要素的空間分布狀況,基于礦山地質(zhì)災害強度、社會生態(tài)影響量、互聯(lián)網(wǎng)地圖POI數(shù)據(jù)、植被覆蓋度、人口、土地利用強度等數(shù)據(jù),采用GIS的核密度模型(KDE)對空間點進行計算,得到其空間分布,自動完成地質(zhì)災害點的核密度分析。
圖4 數(shù)據(jù)統(tǒng)計分析Fig.4 Statistical analysis of data
地質(zhì)災害的危險性通過分析地質(zhì)災害點對POI(Point of Interest)[10]造成的破壞程度來確定,進而依據(jù)地質(zhì)災害的危險性明確其綜合治理的迫切程度[11]。單獨的地質(zhì)災害信息并不能滿足當前綜合治理和地質(zhì)環(huán)境治理的工程設計、影響評價、監(jiān)督管理的需求。只有將災害點與社會數(shù)據(jù)結(jié)合起來,才能更好地支撐地質(zhì)災害信息的發(fā)布和地質(zhì)災害治理工程的推進。因此,本系統(tǒng)提出了一種結(jié)合POI大數(shù)據(jù)的地質(zhì)災害危險性分析方法[12]。通過計算各災害點的危險性指標來反映該區(qū)綜合治理的迫切程度,危險性越高的災害點,其迫切性越強。在空間上有很多災害點,且災害點的嚴重程度不同,同時空間上還有很多POI點,這些POI點的重要性也不同。在評估災害點的危險性時,不僅要考慮其嚴重程度,也要考慮災害點對POI的影響程度,距離越近,潛在影響越大。于是,定義U為第i個災害點的危險性,計算公式見式(1)。
(1)
式中:Pij為第i個災害點與第j個POI點的空間鄰近度;Si為第i個災害點的嚴重程度;Ij為第j個POI點的重要性程度。
空間鄰近度(Proximity)是指地理空間中兩個地物距離相近的程度。因此,當Ui越大,表明災害點的危險性越大,越需要優(yōu)先治理。而Pij設置為一個隨空間距離衰減的參數(shù);Si通過災害點面積、危害人員或程度等指標來確定;Ij根據(jù)不同類型的POI來賦值。根據(jù)POI的不同類型,考慮其對公共服務、社會、經(jīng)濟的影響,也將其進行重要性分類(表1),賦予相應的重要性得分,并進行歸一化處理。
表1 POI重要性分類表Table 1 POI importance classification table
根據(jù)地質(zhì)災害危害程度分級指標將所有災害點進行災害等級劃分(表2)。危害程度指標越大,危害越嚴重的災害點等級越高,其災害性得分也越高,最后對不同等級的災害點災害性得分進行歸一化處理。
表2 地質(zhì)災害危害程度分級表Table 2 Classification table of damage degree ofgeological disasters
將地質(zhì)災害數(shù)據(jù)與POI數(shù)據(jù)導入數(shù)據(jù)庫,系統(tǒng)自動根據(jù)地質(zhì)災害危險性評估模型計算各要素相應得分,最后匯總所有地質(zhì)災害點危險性指數(shù),并實現(xiàn)地質(zhì)災害點危險性統(tǒng)計表輸出與評估結(jié)果可視化顯示,系統(tǒng)以災害點顯示的大小反映其危險性大小,災害點危險性越大其在系統(tǒng)界面顯示越大。
圖5是系統(tǒng)自動生成的各類礦山地質(zhì)災害與高程相關(guān)圖。由圖5可知,地質(zhì)災害(崩塌、滑坡、地裂縫)的分布均隨著高程帶的變化呈現(xiàn)規(guī)律性分布。當海拔較低時,隨著海拔的升高地質(zhì)災害點的分布出現(xiàn)明顯上升的現(xiàn)象;當海拔達到一定高度,災害點的分布又隨之下降。但是,不同災害類型對高程變化呈現(xiàn)出不同的敏感性,以及災害點分布隨高程出現(xiàn)下降趨勢的閾值也不同。其中,滑坡災害對于高程的變化表現(xiàn)出最高的敏感性,崩塌和地裂縫災害的敏感性則相對較弱。隨著高程的增加,滑坡災害的分布也是最早出現(xiàn)下降趨勢的,這表明高程因素是影響滑坡災害的重要因素。
同時,系統(tǒng)還可以顯示地質(zhì)災害(崩塌、滑坡、地裂縫)的分布與植被覆蓋度變化之間的特征,當NDVI低于0.5時,地質(zhì)災害發(fā)生的頻數(shù)均處于較高水平,對于滑坡和地裂縫災害,該植被覆蓋度區(qū)間的災害點數(shù)量都處在最高水平,隨著植被覆蓋度的增加,各類地質(zhì)災害點數(shù)量總體呈現(xiàn)下降趨勢,雖然在某些區(qū)間出現(xiàn)小幅度上升,但并不能影響到植被覆蓋度對于減少災害發(fā)生的影響。由此可以看出,地表植被覆蓋度是影響地質(zhì)災害發(fā)育性的負指標,植被覆蓋度越高發(fā)生地質(zhì)災害的頻數(shù)越小,發(fā)生地質(zhì)災害的可能性也越小。因此,地表植被覆蓋是影響地質(zhì)災害點分布的重要因素之一。
此外,由圖5還可以看出,隨著人口密度的增加,雖然崩塌和地裂縫災害點的分布數(shù)量呈現(xiàn)下降趨勢,但是比較各人口密度段內(nèi)的災害點密度可以發(fā)現(xiàn),隨著人口密度的上升,各災害點的總體分布密度也是不斷增加的。由此可知,人類活動的影響會促進礦山地質(zhì)災害的發(fā)育。
圖5 地質(zhì)災害發(fā)育相關(guān)性分析Fig.5 Correlation analysis of geological disasters
該系統(tǒng)保存了山西省崩塌災害點696處,系統(tǒng)可自動分析不同崩塌災害點的風險大小。表3為系統(tǒng)自動計算和統(tǒng)計結(jié)果,其中,531處(76.3%)崩塌災害點的危險性處于平均危險性之下,有10處崩塌災害點的危險性為0,危險性系數(shù)大于1的共計28處。危險性最大的崩塌災害點位于太原市東山煤礦公司東山煤礦,其危險性為8.25,是崩塌災害點平均危險性的40倍。
系統(tǒng)還可以自動分析不同滑坡與地裂縫災害點的風險大小。系統(tǒng)識別到危險性大于1的災害點共計25處,在203處滑坡災害點中僅有5處災害點的危險性為0,所占比例為2.5%,這203處滑坡災害點危險性總和為111.31。2 294處地裂縫災害點中僅有少數(shù)幾個災害點有較大的危險性,地裂縫災害點的危險性分布與其他兩種災害呈現(xiàn)不同特征,在所有地裂縫災害點中地裂縫分布面積差異巨大,多數(shù)災害點僅在很小的范圍內(nèi)分布,其影響范圍以及所造成的危險均比較小,所以其平均危險性僅為0.001 8。圖6為礦山地質(zhì)災害點危險性示意圖。
表3 危險性前十位崩塌災害點Table 3 Top ten hazard disaster points
本系統(tǒng)的地質(zhì)災害危險性分析方法將地質(zhì)災害數(shù)據(jù)和社會數(shù)據(jù)結(jié)合起來,可以更加真實地反映出地質(zhì)災害對人類社會造成的實際影響,其評估結(jié)果具有較高的可靠性。同時,通過分析各個災害點的危險性可以為災害的治理提供有效依據(jù),對于危險性大的災害點應該優(yōu)先治理、加強防護。
本文在礦區(qū)時空大數(shù)據(jù)的基礎上,建立了礦區(qū)地質(zhì)災害基礎數(shù)據(jù)庫,基于Hadoop架構(gòu)技術(shù)開發(fā)了礦區(qū)地災信息智能分析系統(tǒng),系統(tǒng)具有礦區(qū)地質(zhì)災害信息的查詢檢索與可視化、地災信息統(tǒng)計以及地理分析分析功能,能夠完成地質(zhì)災害點發(fā)育特征、災害點空間分布格局以及災害點危險性分析,該系統(tǒng)具有操作簡潔化、分析自動化等特點,滿足了礦區(qū)地質(zhì)災害信息集成、管理和應用需求。
致謝本系統(tǒng)所需數(shù)據(jù)由山西省自然資源廳信息中心提供,在此表示衷心的感謝。