趙久彬,劉元雪,宋林波,劉佳鑫
(1.陸軍勤務(wù)學(xué)院 軍事設(shè)施系, 重慶 401331;2.巖土力學(xué)與地質(zhì)環(huán)境保護(hù)重慶市重點實驗室, 重慶 401331)
我國是山體滑坡災(zāi)害易發(fā)國家,西南、西北等一些山區(qū)、丘陵地貌的區(qū)域是滑坡高發(fā)區(qū)域。隨著我國現(xiàn)代化進(jìn)程的快速推進(jìn),加上施工工藝的提高,很多大型工程對山體自然特征進(jìn)行了破壞,人類的活動對滑坡災(zāi)害的影響作用也大大提高。根據(jù)國家有關(guān)地質(zhì)部門統(tǒng)計:2016年我國共發(fā)生了9 710起地質(zhì)災(zāi)害,造成直接經(jīng)濟(jì)損失31.7億元人民幣,共有370人死亡、35人失蹤、209人受傷。2017年6月24日,四川省阿壩州茂縣疊溪鎮(zhèn)新磨村連續(xù)降雨超過半個月,發(fā)生了大型高位山體滑坡,產(chǎn)生了1 800萬立方米的滑坡方量,造成 40余間房屋和100余人被滑坡體掩埋,并在3日后發(fā)生了二次垮塌,塌方量約200~300立方米。地質(zhì)災(zāi)害主要集中在滑坡、坍塌和泥石流等方面,近年來滑坡災(zāi)害發(fā)生數(shù)量增多,監(jiān)測預(yù)警是降低地質(zhì)災(zāi)害風(fēng)險的重要措施,具有廣闊的研究前景和應(yīng)用意義。
滑坡監(jiān)測的傳統(tǒng)方法主要是對滑坡易發(fā)地區(qū)設(shè)置水文、地質(zhì)和氣象等傳感器,數(shù)據(jù)傳送系統(tǒng)將傳感器采集的信號傳輸?shù)教幚碇行?,得出分析結(jié)論和預(yù)測結(jié)果。將災(zāi)害信息通知到部門群眾,做好預(yù)防工作[1-2]?;卤O(jiān)測需要監(jiān)測的對象有很多,比如有位移監(jiān)測、應(yīng)力監(jiān)測、氣象監(jiān)測等,采用的儀器設(shè)備也不同,產(chǎn)生的數(shù)據(jù)格式和參數(shù)各式各樣。監(jiān)測時間持續(xù)較長,采集次數(shù)多,產(chǎn)生了類型各異、數(shù)據(jù)量大的監(jiān)測數(shù)據(jù)。
滑坡監(jiān)測數(shù)據(jù)有著以下特點:工期較長、測點數(shù)量較多、測點類型較多、產(chǎn)生的數(shù)據(jù)量大、數(shù)據(jù)來源復(fù)雜多樣且多媒體化,包括了數(shù)、字、圖、表等數(shù)據(jù)類型[3]。這些數(shù)據(jù)不斷累積增長,而且要求在較短時間內(nèi)進(jìn)行實時處理,用傳統(tǒng)數(shù)據(jù)庫進(jìn)行處理面臨相當(dāng)大的挑戰(zhàn)??蓪⒋髷?shù)據(jù)技術(shù)與滑坡監(jiān)測預(yù)警技術(shù)結(jié)合起來進(jìn)行研究,運用大數(shù)據(jù)的理論、機(jī)制、模型和方法,采用統(tǒng)計學(xué)、機(jī)器學(xué)習(xí)等方法得出可靠性較高的預(yù)警信息。本文介紹了目前應(yīng)用廣泛的大數(shù)據(jù)技術(shù),并對滑坡監(jiān)測預(yù)警大數(shù)據(jù)系統(tǒng)進(jìn)行了架構(gòu)設(shè)計。
在地理信息系統(tǒng)、數(shù)據(jù)存儲技術(shù)及物聯(lián)網(wǎng)等技術(shù)高速發(fā)展的信息時代,工業(yè)、醫(yī)療、交通運輸、網(wǎng)絡(luò)社交等領(lǐng)域都產(chǎn)生了PB乃至EB級大數(shù)據(jù),這些數(shù)據(jù)影響著人們認(rèn)識社會、理解社會的方式,并推動社會發(fā)展,成為了信息社會的巨大財富[4]。大數(shù)據(jù)的特點可以總結(jié)為以下4個:體積巨大(volume)、類型繁多(variety)、生成快速(velocity)、價值巨大但密度很低(value)[5-8]。大數(shù)據(jù)的關(guān)鍵技術(shù)在于使設(shè)計成本可以接受的,可以通過快速采集、發(fā)現(xiàn)、分析等工具和方法的,從數(shù)據(jù)量大、類型多樣的數(shù)據(jù)集中發(fā)掘有用價值的體系架構(gòu)。
滑坡監(jiān)測預(yù)警大數(shù)據(jù)系統(tǒng)是滑坡災(zāi)害應(yīng)急中心實施會議召開、分析磋商、調(diào)度指揮的信息化平臺。圖1為滑坡監(jiān)測預(yù)警大數(shù)據(jù)系統(tǒng)的體系架構(gòu),主要采用分布式計算架構(gòu),結(jié)合并行數(shù)據(jù)庫技術(shù),有效搭載各類滑坡信息數(shù)據(jù),支持大數(shù)據(jù)的流處理和批處理模式,能夠?qū)崿F(xiàn)滑坡大數(shù)據(jù)的海量存儲與維護(hù)和跨層級分布式業(yè)務(wù)處理,為系統(tǒng)功能的柔性從組提供一個松耦合的集成框架。
基礎(chǔ)設(shè)施層是指硬件基礎(chǔ),包含計算機(jī)、網(wǎng)絡(luò)、中間件、虛擬服務(wù)器、數(shù)據(jù)庫及集群軟件,是滑坡監(jiān)測預(yù)警大數(shù)據(jù)系統(tǒng)所需的資源載體。數(shù)據(jù)源層為滑坡監(jiān)測大數(shù)據(jù)系統(tǒng)提供需要的數(shù)據(jù)源頭,并提供各類專業(yè)知識和參數(shù)等。數(shù)據(jù)接口層是對數(shù)據(jù)來源的特征開發(fā)設(shè)計轉(zhuǎn)換適配器,是根據(jù)行業(yè)規(guī)范,對數(shù)據(jù)進(jìn)行清洗、轉(zhuǎn)換、處理的轉(zhuǎn)換層。處理后的數(shù)據(jù)存入大數(shù)據(jù)存儲系統(tǒng)中。
大數(shù)據(jù)的平臺層是整個系統(tǒng)最重要的部分。Hypervisor/VMs的作用是連接物理設(shè)備層和虛擬軟件層,為服務(wù)器能夠在物理設(shè)備與虛擬軟件之間實現(xiàn)預(yù)定功能提供協(xié)調(diào)并得到實施。通過網(wǎng)絡(luò)層這個媒介連接存儲系統(tǒng)和處理系統(tǒng),并連接大數(shù)據(jù)系統(tǒng)的訪問框架。平臺采用HDFS作為底層數(shù)據(jù)存儲框架。大數(shù)據(jù)的訪問框架包括了Pig、Hive、Sqoop等系統(tǒng),其中:Pig是計算機(jī)編程語言,適合用于Hadoop和Map/Reduce平臺來查詢大型半結(jié)構(gòu)數(shù)據(jù)集;Hive是數(shù)據(jù)倉庫,通過HQL語言實現(xiàn)MapReduce的快速統(tǒng)計;Sqoop的作用是用來與關(guān)系型數(shù)據(jù)庫實現(xiàn)數(shù)據(jù)交換,如Mysql、Oracle等關(guān)系型數(shù)據(jù)庫。大數(shù)據(jù)的調(diào)度框架包括以下3個系統(tǒng):Hbase是列存儲非關(guān)系型數(shù)據(jù)庫,提供可靠性高并有分布式數(shù)據(jù)庫功能的作用;日志收集的系統(tǒng)Flum,其作用是收集各類數(shù)據(jù)發(fā)送方的相關(guān)資料日志,并收集數(shù)據(jù)集;分布式閉鎖組建Zookeeper,其作用是高效和可靠地協(xié)同工作系統(tǒng),提供分布式鎖之類的作用,用于構(gòu)建分布式應(yīng)用,減輕應(yīng)用程序所承擔(dān)的協(xié)調(diào)任務(wù)[9]。系統(tǒng)應(yīng)用層則是滑坡監(jiān)測預(yù)警大數(shù)據(jù)系統(tǒng)的功能實現(xiàn)系統(tǒng),具有穩(wěn)定性分析、智能決策、可視化交互等功能。
圖1 滑坡監(jiān)測預(yù)警大數(shù)據(jù)系統(tǒng)的系統(tǒng)架構(gòu)
目前的大數(shù)據(jù)時代,傳統(tǒng)的關(guān)系型數(shù)據(jù)庫在處理非關(guān)系型、數(shù)據(jù)量龐大、讀寫高發(fā)及海量存儲的數(shù)據(jù)集時已經(jīng)力不從心。于是產(chǎn)生了NoSQL非關(guān)系型數(shù)據(jù)庫。目前,大數(shù)據(jù)多數(shù)應(yīng)用都基于Apache開發(fā)的Hadoop(圖2)。Hadoop適應(yīng)了時代需求,其成本低廉,適合大型企業(yè)和小型企業(yè)采用,并有可靠、容錯率高的特征。Hadoop采用分布式對大數(shù)據(jù)集進(jìn)行處理的軟件框架。用戶利用Hadoop開源特性開發(fā)程序,可充分發(fā)揮計算機(jī)集群高速存儲與計算的優(yōu)勢,因此其越來越在各個領(lǐng)域得到廣泛應(yīng)用[10]。
圖2 平臺數(shù)據(jù)存儲技術(shù)結(jié)構(gòu)
支持傳統(tǒng)的滑坡監(jiān)測數(shù)據(jù)數(shù)據(jù)庫是大數(shù)據(jù)平臺儲存的基礎(chǔ)需求,因為日常監(jiān)測產(chǎn)生的數(shù)據(jù)都具有統(tǒng)一規(guī)范和格式,所以存儲在傳統(tǒng)關(guān)系型數(shù)據(jù)庫更有優(yōu)勢,另外一些數(shù)據(jù)無法或不適宜轉(zhuǎn)存到分布式存儲,本文采用了典型的關(guān)系型開源數(shù)據(jù)庫MYSQL作為底層存儲支持。對于一些文本、圖片、遙感照片和分析報告等數(shù)據(jù),需要存儲在NoSQL非關(guān)系型數(shù)據(jù)庫。平臺在開源的基礎(chǔ)上進(jìn)行二次開發(fā),采用HBASE作為技術(shù)支持,結(jié)合HDFS的特點,將HBASE部署于HDFS之上配置其運行環(huán)境[11],從而搭建了滑坡監(jiān)測數(shù)據(jù)非關(guān)系型數(shù)據(jù)庫,從而使大數(shù)據(jù)平臺存儲問題得以解決。
平臺數(shù)據(jù)存儲技術(shù)解決后,需要提供后端數(shù)據(jù)接口技術(shù)支持。平臺對關(guān)系型數(shù)據(jù)庫采用JDBC作為兼容大數(shù)據(jù)平臺技術(shù)。在此基礎(chǔ)上采用Thrift支持,為Java、C++Python等語言訪問非關(guān)系型數(shù)據(jù)庫提供接口。對于Hadoop和Spark生態(tài)圈,利用Hive、Yarn和Spark Stream提供數(shù)據(jù)接口引擎支持。
平臺后端開發(fā)的中心思想是以Java為邏輯主控,C++作為兼容型輔助開發(fā)工具,Python作為算法和計算的高級編程語言。在此基礎(chǔ)上,引入公用的算法計算庫。目前比較流行的有2個算法庫,即Hadoop生態(tài)圈的Mahout和Spark生態(tài)圈的Spark MLlib。Mahout是基于Hadoop的經(jīng)典機(jī)器學(xué)習(xí)算法合集,對這些算法進(jìn)行封裝和開發(fā),可以為平臺提供強(qiáng)大的機(jī)器學(xué)習(xí)計算分析能力;Spark MLlib是Spark計算框架的機(jī)器學(xué)習(xí)算法庫,包括分類、回歸、聚類、協(xié)同過濾、降維等部分。引入Python、Scala、Pig編程支持,從而為更多機(jī)器學(xué)習(xí)算法提供實現(xiàn)方案。
大數(shù)據(jù)時代核心需求是從紛繁復(fù)雜的各類異構(gòu)數(shù)據(jù)中,發(fā)掘出利于研究和開發(fā)的規(guī)律和價值。如何在Hadoop中實現(xiàn)基于滑坡數(shù)據(jù)的機(jī)器學(xué)習(xí)和智能判別預(yù)測目標(biāo),需要一些數(shù)據(jù)挖掘算法、統(tǒng)計分析和可視化等工具實現(xiàn)。
1.4.1 數(shù)據(jù)挖掘
數(shù)據(jù)挖掘的許多算法已經(jīng)在人工智能、模式識別、機(jī)器學(xué)習(xí)、統(tǒng)計與數(shù)據(jù)庫中得到應(yīng)用實現(xiàn)。目前國際上比較流行的數(shù)據(jù)挖掘方法有很多,包括SVM、C4.5、Apriori、k-means、PageRank、EM、KNN、AdaBoost、CART和樸素貝葉斯等,覆蓋了聚類、關(guān)聯(lián)、分類、統(tǒng)計與回歸等[12]。另外,一些先進(jìn)的算法如基因算法和神經(jīng)網(wǎng)絡(luò)算法等也被充分應(yīng)用到不同領(lǐng)域的數(shù)據(jù)挖掘中,取得了很好的效果。
1.4.2 統(tǒng)計分析
統(tǒng)計分析屬于應(yīng)用數(shù)學(xué)的一個分支領(lǐng)域,在統(tǒng)計理論中,事件的模糊性和隨機(jī)性都由概率統(tǒng)計理論計算。統(tǒng)計分析技術(shù)分為兩類:應(yīng)用描述性統(tǒng)計對數(shù)據(jù)集進(jìn)行描述;應(yīng)用推斷性統(tǒng)計對數(shù)據(jù)集統(tǒng)計分析后,得出推斷結(jié)論,并給出結(jié)論發(fā)生的概率。進(jìn)一步的多元統(tǒng)計分析還包括因子分析、多元回歸、判別和聚類等。
1.4.3 數(shù)據(jù)可視化
數(shù)據(jù)可視化以一目了然的圖像方式將信息傳遞給客戶,地圖和圖表可以用來幫助用戶快速理解知識信息?;驴梢暬刹捎脠D表、地圖和模擬動畫等方式展現(xiàn)。然而,當(dāng)數(shù)據(jù)量達(dá)到大數(shù)據(jù)級別時,傳統(tǒng)的電子表格技術(shù)已無法處理。大數(shù)據(jù)可視化技術(shù)可以采用HTIM5、Apache Zeppelin等技術(shù)開發(fā),Zeppelin由NFLAB開發(fā),可提供Web界面,類似于iPython的Notebook,可以用于數(shù)據(jù)分析和可視化,也可結(jié)合SAS、SPSS、R、Geph等工具進(jìn)行展示。
滑坡大數(shù)據(jù)來源于多源異構(gòu),種類多樣:有現(xiàn)場監(jiān)測儀器產(chǎn)生的數(shù)據(jù)(如GNSS設(shè)備、氣象監(jiān)測器、裂縫傳感器、應(yīng)力應(yīng)變計等監(jiān)測的數(shù)據(jù)),與國家和地方地質(zhì)數(shù)據(jù)進(jìn)行共享的地質(zhì)環(huán)境信息數(shù)據(jù)(如遙感圖像、地形地貌圖等),滑坡易發(fā)地區(qū)的歷史滑坡數(shù)據(jù)等。根據(jù)滑坡數(shù)據(jù)的來源,可歸為以下5類:地質(zhì)環(huán)境信息、各類歷史滑坡資料、地質(zhì)內(nèi)部數(shù)據(jù)、地質(zhì)外部數(shù)據(jù)、其他數(shù)據(jù)源(表1)[13]。以上這些數(shù)據(jù)為多源異構(gòu)型,需要進(jìn)行處理。首先進(jìn)行數(shù)據(jù)清洗和轉(zhuǎn)換,并對這些數(shù)據(jù)進(jìn)行統(tǒng)一的建模,存儲于大數(shù)據(jù)平臺的儲存框架中,為對數(shù)據(jù)進(jìn)行挖掘分析做好準(zhǔn)備,并允許跨平臺交互和共享。
表1 滑坡數(shù)據(jù)分類
影響滑坡災(zāi)害的因素很多,要預(yù)先獲得滑坡區(qū)域的地質(zhì)構(gòu)造情況數(shù)據(jù),并掌握滑坡體的力學(xué)模型先驗知識,實時采集各類監(jiān)測數(shù)據(jù)和外界影響因素(如人類活動),通過統(tǒng)計大量的、不同區(qū)域的、時間不同的歷史滑坡大數(shù)據(jù),采用統(tǒng)計學(xué)、信息原理分析的技術(shù)手段,篩選出其中的重要條件和因素(如地質(zhì)構(gòu)造相似度),按類比原則將海量滑坡數(shù)據(jù)分為地段性滑坡數(shù)據(jù)類,此類滑坡具有類似的易滑坡作用條件和影響因素。根據(jù)自然斜坡或是滑坡的地質(zhì)構(gòu)造情況,將其歸屬到相應(yīng)的地段性滑坡類中,在此滑坡類中,將大數(shù)據(jù)集的滑坡類數(shù)據(jù)分為訓(xùn)練集和驗證集,采用機(jī)器學(xué)習(xí)的數(shù)據(jù)挖掘技術(shù),發(fā)現(xiàn)潛在有用的規(guī)則,對待預(yù)測的此滑坡類的滑體進(jìn)行規(guī)則判定,預(yù)測其穩(wěn)定性。如:周科平等[14]利用數(shù)據(jù)挖掘的粗糙集技術(shù),分析了影響滑坡的穩(wěn)定性的主要影響因素;趙建華[15]利用決策樹數(shù)據(jù)挖掘算法,分析了多種影響因素對滑坡的作用,并得到了劃分評價滑坡危險區(qū)域的模型。
滑坡災(zāi)害空間預(yù)測指的是對于一定區(qū)域內(nèi)的滑坡體進(jìn)行穩(wěn)定性預(yù)測,保護(hù)人類空間活動的安全性,為國家和社會的土地資源利用提供科學(xué)指導(dǎo),防止生命財產(chǎn)受到威脅破壞。
在大數(shù)據(jù)系統(tǒng)提供滑坡災(zāi)害空間預(yù)測功能時,例如在對重慶某滑坡頻發(fā)的區(qū)縣地域進(jìn)行空間預(yù)測時,需要提供大樣本數(shù)據(jù)作為訓(xùn)練集。為了在下一步大數(shù)據(jù)平臺中設(shè)計數(shù)據(jù)挖掘方案,本文進(jìn)行了上機(jī)試驗,選取了重慶某縣區(qū)域20個露天120個礦巖質(zhì)邊坡數(shù)據(jù)資料,利用SQL Server軟件提供的Apriori算法,對數(shù)據(jù)進(jìn)行泛化處理,模型計算后,形成規(guī)則用于預(yù)測判斷。Apriori算法是一種最有影響的挖掘布爾關(guān)聯(lián)規(guī)則頻繁項集的算法。將滑坡數(shù)據(jù)庫中準(zhǔn)備好的數(shù)據(jù)集載入,輸入最小支持度閥值min-supp和最小置信度minconf,系統(tǒng)掃描數(shù)據(jù)庫,通過連接步和剪枝步產(chǎn)生頻繁項集。
產(chǎn)生的頻繁項集再通過最小置信度產(chǎn)生關(guān)聯(lián)規(guī)則,步驟如下:
1) 對于每個頻繁項集l,產(chǎn)生l的所有非空子集。
2) 對于l的每個非空子集s,如果下式條件成立:
則輸出規(guī)則“s?(l-s)”。
由表2、3可知:數(shù)據(jù)庫中考慮了10個影響破壞類型的因素,基本包含了影響滑坡發(fā)生的因素。在進(jìn)行數(shù)據(jù)挖掘的過程中,由用戶設(shè)置最小支持度minsupp和最小置信度minconf。當(dāng)發(fā)現(xiàn)規(guī)則過多或過少時,還需要重新調(diào)整設(shè)置值。本文設(shè)置了支持度8%和置信度99%,發(fā)現(xiàn)了117條規(guī)則,根據(jù)專家的經(jīng)驗進(jìn)行過濾后,得到了18條有用的規(guī)則,例如:巖石單軸抗壓強(qiáng)度取值為80~90 MPa,地下水為5 H,巖體結(jié)構(gòu)類型為塊狀,那么邊坡發(fā)生雙滑塊折線型破壞,并有支持度18%,置信度99%。這個結(jié)果與專家經(jīng)驗結(jié)論基本相符。
在下一步大數(shù)據(jù)集的訓(xùn)練樣本下,訓(xùn)練得到的知識規(guī)則將會有更高的可信度和置信度,所以用大數(shù)據(jù)進(jìn)行劃分和評價區(qū)域性滑坡時,將會取得更加有效的研究成果。
表2 用于挖掘的數(shù)據(jù)樣本
注:σb為巖石的單軸抗壓強(qiáng)度;α為結(jié)構(gòu)面傾角;A為結(jié)構(gòu)面與邊坡面的關(guān)系;B為地下水條件;C為巖體結(jié)構(gòu)類型;D為可能破壞的類型;c為內(nèi)摩擦角;h為邊坡高度;n為安全系數(shù);β為邊坡角。
表3 用于檢驗的樣本
注:F為巖體結(jié)構(gòu)類型(實際值);G為巖體結(jié)構(gòu)類型(預(yù)測值),其他符號同表1。
場地性滑坡監(jiān)測分析指對存在滑坡隱患災(zāi)害的邊坡進(jìn)行監(jiān)測預(yù)測工作,需要當(dāng)?shù)氐牡刭|(zhì)勘察資料,并結(jié)合實時監(jiān)測數(shù)據(jù)進(jìn)行。對于單個場地滑坡體的監(jiān)測工作,需要提供不同類型的測量設(shè)備,實現(xiàn)位移、應(yīng)力、地下水、降雨量、溫度場等實時監(jiān)測數(shù)據(jù),通過采集融合人工監(jiān)測數(shù)據(jù),半自動化、全自動化設(shè)備的數(shù)據(jù),用有線或無線的傳輸技術(shù),將監(jiān)測數(shù)據(jù)傳輸?shù)綌?shù)據(jù)處理中心,對其進(jìn)行去噪、清洗和轉(zhuǎn)換,最后把可用于大數(shù)據(jù)平臺數(shù)據(jù)挖掘的數(shù)據(jù)(數(shù)據(jù)倉庫)存儲在系統(tǒng)中。
在數(shù)據(jù)挖掘過程中,需要采用相關(guān)的理論分析方法作為基礎(chǔ),將數(shù)值計算方法作為手段,從數(shù)據(jù)集中找到某種規(guī)律,進(jìn)而建立數(shù)學(xué)模型。對于數(shù)據(jù)準(zhǔn)確完整、模型簡單的場地性滑坡穩(wěn)定性分析,可以結(jié)合較為完善的力學(xué)分析方法和數(shù)值模型方法驗算;對于影響因素多樣、數(shù)據(jù)不完整、結(jié)構(gòu)復(fù)雜的場地性滑坡,采用神經(jīng)網(wǎng)絡(luò)模型和灰色模型等方法。如周科平等[16]采用頻繁項集算法中的Apriori算法,利用滑坡現(xiàn)場得到的數(shù)據(jù),分析得到了某礦山滑場發(fā)生的影響因素,并有效預(yù)測了其穩(wěn)定性;張治強(qiáng)等[17]也采用了Apriori算法,把某采場的地形地貌、巖體性質(zhì)和外在影響因素進(jìn)行統(tǒng)一考慮,建立穩(wěn)定性評價模型。
通過建立的穩(wěn)定性分析模型,用以計算此滑坡在外界作用下的穩(wěn)定性系數(shù),或是利用可靠性分析模型預(yù)測此滑坡的破壞機(jī)率,為滑坡穩(wěn)定性分析提供定量依據(jù)。
為了在大數(shù)據(jù)平臺建立針對某場地的預(yù)測滑坡穩(wěn)定性模型,本文利用Matlab模糊工具箱提供的ANFIS函數(shù)進(jìn)行神經(jīng)網(wǎng)絡(luò)的參數(shù)學(xué)習(xí)算法上機(jī)試驗。模糊神經(jīng)網(wǎng)絡(luò)常將常規(guī)的RBF神經(jīng)網(wǎng)絡(luò)和Hopfied神經(jīng)網(wǎng)絡(luò)中模糊地進(jìn)行賦予輸入和權(quán)值,進(jìn)行參數(shù)學(xué)習(xí)。例如全反饋神經(jīng)網(wǎng)絡(luò):
(2)
其中:X=(X1,X2,…,Xn)為輸入樣本;Y=(Y1,Y2,…,Yn)為實際輸出;Wij為連接權(quán)值;θj控制閥值。通過3種方式調(diào)整輸入和權(quán)值:① 實數(shù)輸入,模糊權(quán)值;② 模糊輸入,實數(shù)權(quán)值;③ 模糊輸入,模糊權(quán)值。以此達(dá)到全局逼近的效果,參數(shù)學(xué)習(xí)的結(jié)果得到全局優(yōu)化。我們收集了某高邊坡工程2年的監(jiān)測數(shù)據(jù),利用Matlab軟件中的模糊神經(jīng)網(wǎng)絡(luò)工具箱,研究開挖、支護(hù)和外在因素對孔口位移的影響。表4為孔口位置相關(guān)監(jiān)測資料。
將前17組作為訓(xùn)練集,后5組作為檢驗集,得出預(yù)測位移與實測位移的對比關(guān)系,見表5,表內(nèi)的預(yù)測值和實測值誤差在20%以內(nèi)。通過實例分析,神經(jīng)網(wǎng)絡(luò)等機(jī)器學(xué)習(xí)方法用于研究滑坡位移、應(yīng)力、穩(wěn)定性分析等方面具有獨特的優(yōu)勢,采用大數(shù)據(jù)平臺大數(shù)據(jù)量、高運算速度的優(yōu)勢,可以有效、并在很短時間內(nèi)得到預(yù)測值,用于滑坡監(jiān)測預(yù)警前景可觀。
表4 某孔口位移監(jiān)測基本資料
表5 計算位移與實測位移對比
GIS系統(tǒng)的坐標(biāo)系采用了嚴(yán)格的地理坐標(biāo)系,以經(jīng)緯度存儲單位,并可以進(jìn)行坐標(biāo)投影與轉(zhuǎn)換,支持圖形和數(shù)據(jù)的雙向檢索,具有強(qiáng)大的數(shù)據(jù)庫分析功能,集成了GPS、CAD、RS技術(shù),將GIS技術(shù)結(jié)合大數(shù)據(jù)平臺進(jìn)行應(yīng)用,對于滑坡穩(wěn)定性分析和展示將會發(fā)揮獨特的優(yōu)勢。
該研究可集成國家和地區(qū)相關(guān)部門的滑坡災(zāi)害信息資料,利用地理信息系統(tǒng)(GIS)進(jìn)行相關(guān)信息管理和可視化動態(tài)展示,通過大數(shù)據(jù)平臺挖掘出來的結(jié)果用地理信息系統(tǒng)呈現(xiàn)出來,給客戶直觀地展示評價情況,這將成為大數(shù)據(jù)分析滑坡穩(wěn)定的一種趨勢。
由于滑坡的監(jiān)測預(yù)警工作涉及到海量數(shù)據(jù),傳統(tǒng)的監(jiān)測預(yù)警方法已不能滿足現(xiàn)代化監(jiān)測預(yù)警的需要。本文首先對大數(shù)據(jù)數(shù)據(jù)處理和數(shù)據(jù)挖掘等關(guān)鍵技術(shù)進(jìn)行了總結(jié),然后對滑坡監(jiān)測預(yù)警大數(shù)據(jù)系統(tǒng)的整體架構(gòu)、功能應(yīng)用及其應(yīng)用進(jìn)行了闡述。隨著大數(shù)據(jù)系統(tǒng)技術(shù)的發(fā)展,一些基于Hadoop平臺的開源運算框架如Apache Spark等得到較快的發(fā)展,大數(shù)據(jù)平臺的性能將得到大幅度提升,滑坡監(jiān)測預(yù)警大數(shù)據(jù)技術(shù)的應(yīng)用前景廣闊。
[1] 陳鐵軍,陳華方,胡楊超,等.基于CC2480的山體滑坡監(jiān)測系統(tǒng)[J].計算機(jī)工程與設(shè)計,2010,31(20):4512-4515.
[2] 劉東旗,劉新中,卜令俊,等.基于無線傳感器網(wǎng)絡(luò)的遠(yuǎn)程抄表系統(tǒng)信息智能傳輸?shù)膶崿F(xiàn)[J].電測與儀表,2009,46(12A):46-50.
[3] 唐亞明,張茂省,薛強(qiáng),等.滑坡監(jiān)測預(yù)警國內(nèi)外研究現(xiàn)狀及評述[J].地質(zhì)論評,2012,58(3):533-541.
[4] 郭宇棟,李生林.大數(shù)據(jù)關(guān)鍵技術(shù)在基建營房綜合管理系統(tǒng)中的運用[J].軍事物流,2016,35(5):169-175.
[5] WIKIPEDIA.BigData[EB/OL].(2013-08-05) [2013-09-08].http://zh.wikipedia.org/zh/%E5%A4%A7%E6%95%B0%E6%8D%AE.
[6] 孟小峰,慈祥.大數(shù)據(jù)管理:概念、技術(shù)與挑戰(zhàn)[J].計算機(jī)研究與發(fā)展,2013,50(1):146-169.
[7] 王樹良,丁剛毅,鐘鳴.大數(shù)據(jù)下的空間數(shù)據(jù)挖掘思考[J].中國電子科學(xué)研究研學(xué)報,2013,8(1):8-17.
[8] 鄭玲微.大步跨入大數(shù)據(jù)時代][J].信息化建設(shè),2013,173(1):11-13.
[9] 王逸飛,張行,何迪,等.基于大數(shù)據(jù)平臺的電網(wǎng)防災(zāi)調(diào)度系統(tǒng)功能設(shè)計與系統(tǒng)架構(gòu)[J].電網(wǎng)技術(shù),2016,40(10):3213-3219.
[10] 王浩,覃衛(wèi)民,焦玉勇.大數(shù)據(jù)時代的巖土工程監(jiān)測折與機(jī)遇[J].巖土力學(xué),2014,35(9):2634-2641.
[11] 李學(xué)龍,龔海剛.大數(shù)據(jù)系統(tǒng)綜述[J].中國科學(xué)(信息科學(xué)),2015,45(1):1-44.
[12] WU X,KUMAR V,QUINLAN J R,et al.Top 10 algorithms in data mining[J].Knowledge & Information Systems,2007,14(1):1-37.
[13] 殷坤龍.滑坡災(zāi)害預(yù)測預(yù)報分類[J].中國地質(zhì)災(zāi)害與防治學(xué)報,2003,14(4):12-18.
[14] 周科平,向仁軍.基于粗糙集理論的數(shù)據(jù)挖掘方法在邊坡穩(wěn)定性分析中的應(yīng)用[J].礦業(yè)研究與開發(fā),2003,23(6):11-14.
[15] 趙建華,陳漢林,楊樹鋒,等.基于決策樹算法的滑坡危險性區(qū)劃評價[J].浙江大學(xué)學(xué)報(理學(xué)版),2004,31(4):465-470.
[16] 周科平,羅周全,史秀志.基于數(shù)據(jù)挖掘的采場穩(wěn)定性的知識獲取與應(yīng)用[J].礦業(yè)研究與開發(fā),2002,22(5):1-4.
[17] 張治強(qiáng),蔡嗣經(jīng),馬平波.數(shù)據(jù)挖掘在巖質(zhì)邊坡穩(wěn)定性預(yù)測中的應(yīng)用[J].北京科技大學(xué)學(xué)報,2003,25(2):103-106.