摘要:滑坡災(zāi)害給人們的生命財產(chǎn)帶來嚴(yán)重威脅,加強對滑坡災(zāi)害的有效預(yù)報具有重要意義。以陜西省山陽縣研究區(qū)滑坡監(jiān)測點為例,提出一種基于主成分分析算法(Principal Component Analysis,PCA)和布谷鳥算法(Cuckoo Search,CS)優(yōu)化徑向基神經(jīng)網(wǎng)絡(luò)(Radial Basis Function,RBF)的滑坡概率預(yù)測模型。首先確定該地區(qū)的滑坡災(zāi)害發(fā)生的主要影響因素,利用PCA算法將滑坡影響因子進(jìn)行降維,避免數(shù)據(jù)維度過大,造成模型冗余的問題,將降維后的數(shù)據(jù)輸入到RBF神經(jīng)網(wǎng)絡(luò)中進(jìn)行滑坡概率預(yù)測;其次,利用改進(jìn)的布谷鳥算法進(jìn)行參數(shù)尋優(yōu),提高滑坡發(fā)生概率預(yù)測的準(zhǔn)確性。并采用BP(Back Propagation)、RBF、GA-RBF(Genetic Algorithm-RBF)、CS-RBF等多種模型與改進(jìn)CS-RBF模型進(jìn)行對比實驗,結(jié)果表明CS-RBF模型預(yù)測性能優(yōu)于其他幾種模型,其均方根誤差為0.017 56,平均絕對誤差為0.011 78,該模型可靠性更高,為滑坡預(yù)警的實際應(yīng)用提供有力的支持和保障。
關(guān)鍵詞:滑坡預(yù)報;PCA算法;RBF神經(jīng)網(wǎng)絡(luò);改進(jìn)CS-RBF
中圖分類號:TV698文獻(xiàn)標(biāo)識碼:A文章編號:1001-9235(2024)08-0001-09
Landslide Forecasting Model Based on PCA and Improved CS-RBF
WANG Lianxia,LI Limin,F(xiàn)ANG Zihao,REN Ruibin,F(xiàn)U Zhentao,CUI Chengtao
(School of Electronic Information,Xi′an Engineering University,Xi′an 710600,China)
Abstract:Landslide disasters pose a serious threat to human life and property,and strengthening effective forecasting of landslide disasters is of great significance.Taking the landslide monitoring points in ShanyangCounty,Shaanxi Province as an example,this study proposes a landslide probability forecasting model based on principal component analysis(PCA)and cuckoo search(CS)optimized radial basis function(RBF)neural network.Firstly,the main influencing factors of landslide disasters in the area are determined,and the PCA algorithm is used to reduce the dimensionality of landslide influencing factors to avoid the problem of model redundancy caused by excessively large data dimensions.The dimensionality-reduced data is then input into the RBF neural network for landslide probability forecasting.Secondly,an improved Cuckoo Search algorithm is used for parameter optimization to improve the accuracy of landslide probability forecasting.Various models including back propagation(BP),RBF,genetic algorithm-RBF(GA-RBF),CS-RBF,and others are compared with the improved CS-RBF model through experimental analysis.The results show that the predictive performance of the CS-RBF model is superior to the other models,with a root mean square error of 0.017 56 and an average absolute error of 0.011 78.This model exhibits higher reliability,providing strong support and guarantee for the practical application of landslide early warning.
Keywords:landslideforecasting;PCAalgorithm;RBF neural network;improved CS-RBF
滑坡災(zāi)害會造成嚴(yán)重的人員傷亡和財產(chǎn)損失。因此,精準(zhǔn)的進(jìn)行滑坡預(yù)報成為了防范和減輕地質(zhì)災(zāi)害影響的重要手段之一[1]。
近年來,眾多學(xué)者基于機器學(xué)習(xí)方法開展滑坡災(zāi)害預(yù)報。李明等[2]概述了可用于滑坡易發(fā)性研究的機器學(xué)習(xí)技術(shù),進(jìn)行了廣泛的分析和比較,并使用一系列標(biāo)準(zhǔn)評估他們的優(yōu)勢和局限性;郭衍昊等[3]提出一種基于優(yōu)化負(fù)樣本采樣策略的梯度提升決策樹與隨機森林對同震滑坡進(jìn)行易發(fā)性評價,結(jié)果表明在低易發(fā)區(qū)選擇滑坡負(fù)樣本可以明顯提高易發(fā)性精度;李沙等[4]提出基于差分干涉測量短基線集時序分析技術(shù)(Small Base line Subset In SAR,SBAS-InSAR)的大型滑坡變形分區(qū)及時序監(jiān)測,所得結(jié)果證明SBAS-InSAR技術(shù)可以對大型滑坡進(jìn)行時序監(jiān)測;Dao等[5]提出了一種空間顯式深度學(xué)習(xí)(Deep Learning,DL)神經(jīng)網(wǎng)絡(luò)的開發(fā)用于驗證滑坡敏感性預(yù)測模型,結(jié)果表明使用空間顯式DL模型對滑坡預(yù)測有顯著改進(jìn)。以上學(xué)者基于遙感分析、數(shù)值模擬、地質(zhì)分析等,采用機器學(xué)習(xí)方法對滑坡區(qū)域進(jìn)行風(fēng)險評估和管理,取得了一些成果。但是在其參數(shù)確定時往往依賴人工選擇,或是使用優(yōu)化算法過于陳舊,缺乏科學(xué)性和準(zhǔn)確性。
隨著多源數(shù)據(jù)驅(qū)動的迅速發(fā)展,其被廣泛應(yīng)用于滑坡災(zāi)害的預(yù)報中,魏文豪等[6]研究了信息量模型和支持向量機(Support Vector Machines,SVM)模型以及其耦合模型,3種模型在滑坡災(zāi)害易發(fā)性評價中的可靠性,結(jié)果表明I-SVM耦合模型能夠有效提高滑坡災(zāi)害易發(fā)性預(yù)測精度;牟家琦等[7]采用高程、坡度、坡向等16個因子,構(gòu)建滑坡易發(fā)性評價指標(biāo)體系,并采用深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Networks,DNN)模型進(jìn)行滑坡易發(fā)性評價,取得了良好的效果;任帥等[8]提出一種結(jié)合了二次移動平均法(Double Moving Average,DMA)、變分模態(tài)分解(Variational Mode Decomposition,VMD)、改進(jìn)灰狼優(yōu)化(Improve Grey Wolf Optimization,IGWO)算法與支持向量回歸(Support Vector Regression,SVR)的模型進(jìn)行滑坡位移預(yù)測;賈雨霏等[9]提出一種基于自組織映射(Self-Organizing Map,SOM)神經(jīng)網(wǎng)絡(luò)、信息量模型(Information,I)以及SVM進(jìn)行耦合的滑坡易發(fā)性評價方法,其結(jié)果說明SOM-I-SVM模型能有效提高滑坡易發(fā)性預(yù)測準(zhǔn)確率。但目前的研究也存在差異,未對滑坡因子進(jìn)行精準(zhǔn)分析和篩選,造成模型冗余、精度不足等問題。
針對以上問題,本文基于多源數(shù)據(jù)驅(qū)動和機器學(xué)習(xí)方法,提出一種基于主成分分析算法(Principal Component Analysis,PCA)和布谷鳥算法(Cuckoo Search,CS)優(yōu)化徑向基神經(jīng)網(wǎng)絡(luò)(Radial Basis Function,RBF)的滑坡概率預(yù)測模型,首先確定該地區(qū)的滑坡災(zāi)害發(fā)生的主要影響因素,避免數(shù)據(jù)維度過大,輸入到模型里造成模型冗余的問題,利用PCA算法將滑坡影響因子進(jìn)行降維,將降維后的數(shù)據(jù)輸入到RBF神經(jīng)網(wǎng)絡(luò)中進(jìn)行滑坡概率預(yù)測,利用改進(jìn)的布谷鳥算法進(jìn)行參數(shù)尋優(yōu),提高滑坡發(fā)生概率預(yù)測的準(zhǔn)確性,實現(xiàn)科學(xué)精準(zhǔn)的滑坡災(zāi)害預(yù)報。
1滑坡發(fā)生概率預(yù)測流程
傳統(tǒng)的滑坡預(yù)測方法往往通過閾值進(jìn)行判斷,但閾值很難確定,難以滿足實際應(yīng)用的需求[10]。而滑坡概率預(yù)測方法具有較高的準(zhǔn)確率和實時性,可以為滑坡預(yù)測提供有力的支持和保障。本文提出的滑坡發(fā)生概率預(yù)報的流程見圖1。
首先獲取滑坡數(shù)據(jù),為了避免滑坡影響因子輸入到模型中造成模型冗余、收斂速度過慢的問題,將降雨量、土壓力、土壤含水率等多種滑坡影響因素數(shù)據(jù)利用PCA算法進(jìn)行降維處理;其次,將降維后的數(shù)據(jù)進(jìn)行科學(xué)的樣本劃分,輸入到RBF神經(jīng)網(wǎng)絡(luò)中進(jìn)行滑坡概率預(yù)測,為進(jìn)一步提高模型預(yù)測精度,利用改進(jìn)CS算法進(jìn)行模型參數(shù)尋優(yōu),最后根據(jù)
模型輸出結(jié)果進(jìn)行準(zhǔn)確的滑坡概率預(yù)報。
2算法介紹
2.1 PCA算法
主成分分析是一種廣泛使用的數(shù)據(jù)降維算法。其核心思想是將原始數(shù)據(jù)的n維特征映射到一個全新的k維坐標(biāo)系上,并重新構(gòu)造出k個正交特征,也稱為主成分[11]。PCA算法是從原始數(shù)據(jù)中順序地找到一組相互正交的坐標(biāo)軸,以此獲得新的坐標(biāo)軸,具體計算步驟如下。
步驟一中心化數(shù)據(jù)。將原始數(shù)據(jù)按列組成n行m列矩陣X,對原始數(shù)據(jù)進(jìn)行中心化處理,即每個特征減去其均值,使得每個特征的平均值為0。
步驟二計算協(xié)方差矩陣。將中心化后的數(shù)據(jù)進(jìn)行矩陣乘法運算,得到一個協(xié)方差矩陣C,表示每個特征之間的相關(guān)性。
式中:X為原始數(shù)據(jù)矩陣;m為數(shù)據(jù)的維度。
步驟三計算特征值和特征向量。對協(xié)方差矩陣進(jìn)行特征值分解,得到特征值λ1、λ2、λ3…λn和對應(yīng)的特征向量v 1、v2、v3…v n。如向量v是矩陣C的特征向量,則滿足式(2)所示,其中λ是特征向量v對應(yīng)的特征值,特征向量表示每個特征在新的特征空間中的投影方向,根據(jù)計算出的特征值計算主成分影響因子,定義累計貢獻(xiàn)率大于等于85%為篩選出的b(b<m)個主成分因子[12]。
Cv=λv(2)
步驟四選取主成分。按照特征值從大到小的順序排序,選取前K個特征向量作為主成分矩陣P,K是新的特征空間的維度,也就是降維后的維數(shù)。
步驟五數(shù)據(jù)降維。將原始數(shù)據(jù)矩陣X和轉(zhuǎn)換矩陣P相乘得到降維后的矩陣Y。
Y=PX(3)
2.2 RBF神經(jīng)網(wǎng)絡(luò)預(yù)報模型
RBF神經(jīng)網(wǎng)絡(luò)是1種基于徑向基函數(shù)的神經(jīng)網(wǎng)絡(luò)模型。它由3層組成:輸入層、隱藏層(徑向基函數(shù)層)和輸出層[13],見圖2。
第一層是輸入層,輸入層節(jié)點的個數(shù)由輸入數(shù)據(jù)的維度決定,其輸入數(shù)據(jù)集為X={x1,x2,x3,?,xm},數(shù)據(jù)集中每個數(shù)據(jù)樣本為xi{x1(i),x2(i),x 3(i),?,xn(i)}。
第二層是隱藏層,隱藏層中的每個神經(jīng)元代表一個徑向基函數(shù)。每個神經(jīng)元具有以下屬性。①中心向量。徑向基函數(shù)的中心向量,表示在輸入空間中神經(jīng)元對應(yīng)的中心位置。在訓(xùn)練RBF神經(jīng)網(wǎng)絡(luò)之前,需要選擇一組合適的中心向量作為徑向基函數(shù)的中心位置。②寬度參數(shù)。控制徑向基函數(shù)的寬度,決定了函數(shù)的局部性和影響范圍。③權(quán)重。連接神經(jīng)元輸出到輸出層的權(quán)重,決定了神經(jīng)元對最終輸出的貢獻(xiàn)。
隱藏層的作用是對輸入數(shù)據(jù)進(jìn)行非線性變換。通過徑向基函數(shù)的輸出,隱藏層能夠?qū)⑤斎霐?shù)據(jù)映射到高維空間中,從而提取出數(shù)據(jù)的非線性特征。這種非線性變換使得RBF神經(jīng)網(wǎng)絡(luò)可以更好地處理具有復(fù)雜結(jié)構(gòu)和非線性關(guān)系的數(shù)據(jù)。
最后一層是輸出層,該層通常是一個全連接層,它接受徑向基函數(shù)層的輸出,并產(chǎn)生最終的預(yù)測結(jié)果。
徑向基函數(shù)是一種沿徑向?qū)ΨQ的標(biāo)量函數(shù)。它一般被定義為空間中任一點x到某一中心c之間歐氏距離的單調(diào)函數(shù),所有符合該特性的函數(shù)都可以被稱為徑向基函數(shù)。
?(x)=?(I x-c I)(4)
徑向基函數(shù)的取值取決于一個樣本點與一個中心點之間的距離,它的取值在樣本點越接近中心點時越大,在樣本點越遠(yuǎn)離中心點時越小。其中,徑向基函數(shù)的定義可以有多種形式,如高斯函數(shù)、多項式反函數(shù)、多維逆距離等。最常用的徑向基函數(shù)是高斯核函數(shù),見式(5),其中σ為徑向基函數(shù)的擴展常數(shù)(方差),其也是函數(shù)的寬度參數(shù),控制了函數(shù)的徑向作用范圍。σ越小,寬度越窄,函數(shù)越具有選擇性[14]。
Ix-c I2
?(I x-c I)=e 2σ2(5)
常見的徑向基函數(shù)還有多二次函數(shù)式(6)和反常S型函數(shù)式(7)等。
?(I x-c I)=(6)
?(I x-c I)=(7)
本文采用式(5)所示的高斯核函數(shù)作為徑向基函數(shù),因為高斯徑向基函數(shù)能夠適應(yīng)不同數(shù)據(jù)集所具有的不同數(shù)據(jù)分布特征。
2.3布谷鳥搜索算法
布谷鳥搜索算法是一種基于群體智能的全局優(yōu)化算法,其靈感源自于布谷鳥的生物特性。這種算法的思想是通過混合尋優(yōu)和隨機游走的方式搜索空間中的最優(yōu)解[15]。
2.3.1標(biāo)準(zhǔn)的布谷鳥算法
布谷鳥搜索算法是對布谷鳥尋巢孵蛋的行為進(jìn)行簡化、抽象、理想化。布谷鳥尋找新的鳥巢并成功使自己的后代被孵化然后長大,即類比為CS算法成功得到優(yōu)質(zhì)解的過程。
為了將這種自然現(xiàn)象與工程中解決最優(yōu)化問題聯(lián)系起來,首先抽象了以下3個基本假設(shè)。①每只鳥一次產(chǎn)下1個蛋,這代表了1個解決方案。②鳥將蛋丟棄在一個隨機的巢穴中,小部分有高質(zhì)量鳥蛋的鳥巢將傳給下一代。③鳥巢的數(shù)量是固定的,布谷鳥蛋被宿主鳥發(fā)現(xiàn)的概率為Pa∈[0,1]。如果布谷鳥的蛋被發(fā)現(xiàn),寄主就會破壞蛋或放棄巢穴[16]。
在布谷鳥搜索算法中,種群中的每個布谷鳥代表一個解,布谷鳥所產(chǎn)下的蛋可以看作是一種新的解,經(jīng)過多次迭代,最終會搜索到全局最優(yōu)解。
2.3.2萊維飛行
在布谷鳥搜索算法中,萊維飛行(Levy Flight)被用作一種隨機搜索策略,用于生成新的候選解。萊維飛行是由較長時間的短步長和較短時間的長步長組成,這與自然界中大多數(shù)動物的覓食方式類似,即在一片區(qū)域仔細(xì)地搜尋食物,如果沒有找到再換一片區(qū)域搜尋。
在布谷鳥搜索算法的優(yōu)化過程中,布谷鳥的位置更新是通過模仿萊維飛行的方式實現(xiàn)的。這種飛行方式幫助布谷鳥有效地避免陷入局部最優(yōu)解的困境,從而提高了搜索的全局優(yōu)化能力,通過萊維飛行的全局搜索過程由式(8)表示:
Xit+1=Xit+a⊙Le(β)(8)
式中:Xit為第i點在t刻的位置;a為系數(shù),即步長的增量范圍;⊙為點乘運算;Le(β)為萊維隨機路徑,服從Levy分布。
Levy分布要求大概率落在值比較小的地方,在而小概率落在值比較大的地方。即先在一小片區(qū)域長時間搜索有利于提高找到最優(yōu)解的概率,小概率落在值比較大的地方,即偶爾的大步長探索可以跳出當(dāng)前區(qū)域,避免求解最優(yōu)解的過程中陷入局部最優(yōu)。
由萊維分布公式:
levy(β)~u=t-β,(1≤β≤3)(9)
式中:經(jīng)驗值取β=1.5,Mantegna提出了近似滿足這種分布的隨機步長的計算式如下:
式中:u、v為根據(jù)這2個隨機變量的正態(tài)分布得出。
u~N(0,σu(2)),v~N(0,σv(2))(11)
式(11)中:
布谷鳥的鳥蛋會以一定概率被寄宿的鳥發(fā)現(xiàn)并將其拋棄,當(dāng)有布谷鳥蛋被拋棄時,需要尋找新的寄宿地點,而尋找新的寄宿地點的算法采用局部游走的方式,見式(15):
Xit+1=Xit+αs?H(Pa-r)?(Xc(t)-Xk(t))(15)
該式為躍遷函數(shù),取值為1或者0,r為[0,1]之間的隨機數(shù),Xc(t)和Xk(t)是t時刻任意選取的2個點。
在布谷鳥搜索算法中,每一個鳥巢的位置表示一個候選解,通過萊維飛行來生成新的候選解。萊維飛行的步長和方向被隨機采樣,然后用于更新當(dāng)前解的位置。通過不斷地進(jìn)行萊維飛行和更新,布谷鳥可以在搜索空間中進(jìn)行探索,并尋找到更優(yōu)的解。總結(jié)來說,萊維飛行在布谷鳥算法中是一種隨機搜索策略,用于生成新的候選解。它的特點是能夠進(jìn)行遠(yuǎn)距離的隨機移動,增加搜索的多樣性和全局探索能力,有助于算法找到更優(yōu)的解。
2.3.3布谷鳥算法的關(guān)鍵步驟
布谷鳥算法尋優(yōu)的具體流程見圖3,關(guān)鍵步驟如下。
步驟一初始化種群。首先需要確定適應(yīng)度函數(shù)f(x),適應(yīng)度函數(shù)用于評價個體的優(yōu)劣程度,適應(yīng)度越大個體越好,反之適應(yīng)度越小則個體越差;適應(yīng)度函數(shù)的選取直接影響布谷鳥搜索算法找到最優(yōu)解的速度,本文選取RBF神經(jīng)網(wǎng)絡(luò)的訓(xùn)練誤差作為目標(biāo)函數(shù)。然后確定鳥巢的數(shù)量n及其初始位置Xi0(i=1,2,3,?,n),還需要指定迭代次數(shù)和最大發(fā)現(xiàn)概率Pa,以確保算法能夠完成搜索過程;
步驟二得出當(dāng)前的最優(yōu)解。將每一個鳥巢的位置代入預(yù)先確定的適應(yīng)度函數(shù)f(x)中進(jìn)行計算,以評估當(dāng)前解的質(zhì)量,通過比較不同解的質(zhì)量,可以得到當(dāng)前的最優(yōu)解及位置Xbest。
步驟三生成新的解。將除當(dāng)前最優(yōu)估計位置Xbest以外的所有其他鳥巢的位置Xi0≠best(i=1,2,3,?,n)利用尋優(yōu)算法的位置更新以獲得新的位置,再將它們代入適應(yīng)度的函數(shù)f(x)以獲得新的解,然后評估這些解的質(zhì)量并和當(dāng)前的最優(yōu)解比較,以獲得新的最優(yōu)位置Xbest和最優(yōu)解。
步驟四隨機舍棄鳥巢的位置。生成一組隨機數(shù)r∈[0,1]與每一個鳥巢一一對應(yīng),并將其與預(yù)先設(shè)定的發(fā)現(xiàn)概率Pa進(jìn)行比較。如果r小于Pa,則表示該鳥巢被發(fā)現(xiàn),此時舍棄該鳥巢并隨機生成新的鳥巢,否則保持位置不變。
步驟五檢查終止條件。當(dāng)算法達(dá)到指定的迭代次數(shù)或誤差限度時,停止搜索并輸出最優(yōu)結(jié)果,否則重復(fù)步驟二到步驟四。
在以上步驟中,每個布谷鳥的主要作用是控制搜索過程并維護(hù)一個局部最優(yōu)解。不同于其他優(yōu)化算法,每個布谷鳥的搜索方向是完全隨機和獨立的,這種“混沌式”的搜索方法可以增加算法的多樣性,有更大的可能搜索到全局最優(yōu)解。此外,布谷鳥算法還可以通過調(diào)整搜索參數(shù)、實現(xiàn)多進(jìn)化策略等方式進(jìn)行改進(jìn),以達(dá)到更好的優(yōu)化效果。
布谷鳥搜索算法的優(yōu)點是具有高效的全局搜索能力和快速的收斂速度,能夠在各種實際問題中找到最優(yōu)解。但是,該算法也存在一些問題,例如易受到局部最優(yōu)解、受參數(shù)設(shè)置困擾等問題,需要結(jié)合具體問題進(jìn)行優(yōu)化和改進(jìn)。
2.4改進(jìn)的布谷鳥算法
在標(biāo)準(zhǔn)布谷鳥算法中,布谷鳥鳥蛋被發(fā)現(xiàn)并遺棄機率會隨機地影響算法的表現(xiàn)。因此,在使用CS算法時,合理地設(shè)定發(fā)現(xiàn)概率Pa的值將直接影響算法求解最優(yōu)解的速度和效果[17]。如果Pa設(shè)定過大,那么最優(yōu)解被遺棄的概率將會增加。如果Pa設(shè)定過小,則會延長算法的計算時間,因為較差質(zhì)量的解沒有及時被拋棄。鑒于以上這些問題,應(yīng)該在算法過程中動態(tài)地調(diào)整解被發(fā)現(xiàn)概率Pa的值,具體策略如下:如果發(fā)現(xiàn)當(dāng)前解的質(zhì)量高,就降低Pa的值來減少拋棄這個解的機率;如果發(fā)現(xiàn)當(dāng)前解的質(zhì)量低,就增加Pa的值來增加拋棄這個解的機率。這種動態(tài)調(diào)整策略能夠提高算法求解最優(yōu)解的速度,該策略改進(jìn)的Pa見式(16)。
Pi(t)=Pmin+(P max-Pmin)(1-)(16)
式中:Pi(t)為第t代種群中第i個個體被發(fā)現(xiàn)舍棄并生成新的位置的概率;Pmax、Pmin分別為Pi(t)的上、下限;fit、fbtest分別為第t代計算中第i個鳥巢和最優(yōu)鳥巢所在位置所對應(yīng)的解。
2.5模型評價指標(biāo)
均方根誤差(Root Mean Squared Error,RMSE)常被用來對于網(wǎng)絡(luò)模型預(yù)測值及實測值之間的差異的評價,均方根誤差的計算見式(17)。
式中:yi為真實值;yi'為預(yù)測值;I為樣本數(shù)量。均方根誤差越小,真實值與預(yù)測值更接近,模型效果預(yù)測更好。
平均絕對誤差(Mean Absolute Error,MAE),見式(18)。MAE用來描述數(shù)據(jù)離散程度,值越小,說明模型預(yù)測效果越好。
擬合優(yōu)度R2是指回歸直線對觀測值的擬合程度。R2越大,擬合效果越好,R2最優(yōu)為1。
式中:y i(-)為真實值的平均值。
3仿真驗證與結(jié)果分析
3.1研究區(qū)及數(shù)據(jù)來源介紹
陜西省商洛市山陽縣位于秦嶺山脈及商洛的東南部,地質(zhì)構(gòu)造復(fù)雜,山脈溝壑眾多且土質(zhì)松軟,該地區(qū)降水較多,雨水浸泡后極易造成滑坡災(zāi)害。除此之外,該地區(qū)礦物質(zhì)資源豐富,人類活動較為頻繁,這都會增加滑坡災(zāi)害的風(fēng)險,該地區(qū)成為滑坡災(zāi)害高發(fā)的區(qū)域之一。因此,本文選擇山陽縣作為研究區(qū)域,采用山陽縣地質(zhì)災(zāi)害監(jiān)測點的歷史監(jiān)測數(shù)據(jù)進(jìn)行滑坡災(zāi)害的研究,本文使用了監(jiān)測點500組滑坡災(zāi)害數(shù)據(jù),其中隨機選取了450組數(shù)據(jù)用于模型訓(xùn)練,剩下的50組數(shù)據(jù)用于驗證模型的預(yù)測效果。
3.2 PCA數(shù)據(jù)降維
為了避免滑坡影響因子輸入到模型中造成模型冗余、收斂速度過慢的問題,本文利用從山陽縣監(jiān)測點獲取的降雨量、土壤含水率、土壓力、裂縫位移、高程、斜坡傾角、坡體特征、岸坡水文地質(zhì)條件等滑坡數(shù)據(jù),利用PCA算法進(jìn)行降維處理,圖4是PCA提取變量。利用PCA算法進(jìn)行數(shù)據(jù)降維時,由圖4可知,前4個成分的累積貢獻(xiàn)率分別為44.68%、73.96%、83.92%、90.95%,根據(jù)主成分的定義選取標(biāo)準(zhǔn),前4個主成分的累計貢獻(xiàn)率已大于所定義主成分選取標(biāo)準(zhǔn)85%,能夠較為全面地反映初始8種影響因子所反映的信息。因此,本文將前4個主成分作為新的變量取代初始影響因子以作為RBF預(yù)測模型的輸入,通過PCA算法來降維,模型維度由初始的8維降低至4維,既降低了模型數(shù)據(jù)結(jié)構(gòu)的復(fù)雜度,又保證了數(shù)據(jù)在實際應(yīng)用中的相對合理性。
3.3改進(jìn)CS-RBF滑坡概率預(yù)測模型構(gòu)建
a)數(shù)據(jù)降維。將監(jiān)測點的數(shù)據(jù)利用式(2)即PCA算法進(jìn)行降維,降維至四維。
b)樣本劃分。通過多組樣本劃分,并試驗得到樣本劃分的最佳比例,將降維后的500組數(shù)據(jù)按照9∶1的比例劃分為訓(xùn)練樣本和測試樣本,隨機選取450組為訓(xùn)練樣本,50組為測試樣本。
c)改進(jìn)CS對RBF參數(shù)尋優(yōu)。選取RBF神經(jīng)網(wǎng)絡(luò)的訓(xùn)練誤差作為目標(biāo)函數(shù),將初始位置代入目標(biāo)函數(shù)計算得到每個位置的適應(yīng)度,對比得到最優(yōu)位置和最佳適應(yīng)度并保留,其次,將非最優(yōu)位置鳥巢的位置代入式(8)更新位置,重新代入適應(yīng)度函數(shù)計算,比較新得到的適應(yīng)度和上一代的最佳適應(yīng)度,選擇其中最佳的保留,利用式(16)對CS算法進(jìn)行改進(jìn)。
d)改進(jìn)CS-RBF模型訓(xùn)練與預(yù)測。將確定的最優(yōu)參數(shù)應(yīng)用到RBF模型中,其次將確定的450組訓(xùn)練集樣本輸入到改進(jìn)CS-RBF模型中進(jìn)行模型訓(xùn)練,將50組測試集樣本輸入到訓(xùn)練完成的改進(jìn)CS-RBF模型中,對模型進(jìn)行驗證,實現(xiàn)滑坡概率預(yù)報。
3.4 RBF模型預(yù)測結(jié)果分析
利用PCA降維后得到的500組數(shù)據(jù)隨機輸入到RBF神經(jīng)網(wǎng)絡(luò)中進(jìn)行滑坡災(zāi)害概率預(yù)測,其中450組數(shù)據(jù)用于模型訓(xùn)練,50組數(shù)據(jù)用于模型驗證。BP神經(jīng)網(wǎng)絡(luò)是一種基于誤差反向傳播算法的人工神經(jīng)網(wǎng)絡(luò),也是應(yīng)用最廣泛的神經(jīng)網(wǎng)絡(luò)之一。本文采用BP、RBF兩種模型分別預(yù)測滑坡發(fā)生概率,試驗結(jié)果見圖5,由圖可知,RBF模型的預(yù)測精度更高,其均方根誤差0.030 8,平均絕對誤差0.025 5,預(yù)測結(jié)果更接近真實值,RBF算法的優(yōu)越性主要是其具有良好的非線性逼近能力和高維空間數(shù)據(jù)的處理能力,相比之下,BP算法在數(shù)據(jù)集非線性分布和多維特征空間下的擬合效果較差。
3.5 CS優(yōu)化RBF模型預(yù)測結(jié)果分析
RBF模型預(yù)測滑坡概率時參數(shù)確定時往往依賴人工選擇,缺乏科學(xué)性和準(zhǔn)確性,故本文利用CS優(yōu)化算法對RBF模型進(jìn)行參數(shù)尋優(yōu),布谷鳥算法具有全局搜索和優(yōu)化能力。它通過模擬布谷鳥繁殖行為,將搜索空間中的解看作鳥巢,通過隨機漫步和信息交換等方式,尋找全局最優(yōu)解。RBF神經(jīng)網(wǎng)絡(luò)的參數(shù)優(yōu)化也是一個全局搜索問題,需要找到最優(yōu)的權(quán)重和中心點,布谷鳥算法能夠提供全局優(yōu)化的可能性,有助于尋找更好的RBF神經(jīng)網(wǎng)絡(luò)模型。為了突出CS算法有效性,采用遺傳算法(Genetic Algorithm,GA)優(yōu)化RBF模型進(jìn)行對比試驗,遺傳算法是一種最常見的優(yōu)化算法,GA算法是一種模擬自然界生物進(jìn)化過程的優(yōu)化算法,它借鑒了達(dá)爾文的進(jìn)化論理論,通過模擬生物的遺傳、變異、選擇和適應(yīng)度等概念,來尋找問題最優(yōu)解或近似最優(yōu)解。圖6是CS-RBF預(yù)測結(jié)果對比,由圖可知,經(jīng)布谷鳥算法優(yōu)化的RBF神經(jīng)網(wǎng)絡(luò)在滑坡發(fā)生概率預(yù)測方面的準(zhǔn)確率有明顯提升,利用CS算法優(yōu)化的RBF模型預(yù)測滑坡概率的效果優(yōu)于GA算法優(yōu)化的RBF模型,其均方根誤差0.022 26,平均絕對誤差0.013 23。
3.6改進(jìn)CS優(yōu)化RBF模型預(yù)測結(jié)果分析
為了進(jìn)一步提高模型預(yù)測滑坡概率的精度,對CS優(yōu)化算法進(jìn)行改進(jìn),改進(jìn)前后的CS-RBF神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)果見圖7,由圖可以看出,經(jīng)改進(jìn)后的布谷鳥算法優(yōu)化的RBF神經(jīng)網(wǎng)絡(luò)在滑坡發(fā)生概率預(yù)測中相比改進(jìn)前的預(yù)測精度有所提高,改進(jìn)后的布谷鳥算法可以幫助RBF神經(jīng)網(wǎng)絡(luò)更好地捕捉數(shù)據(jù)特征,提高模型的擬合精度。
改進(jìn)前后的布谷鳥算法優(yōu)化的RBF神經(jīng)網(wǎng)絡(luò)的結(jié)果評估見表1,RMSE、MAE以及R2是模型精度評價指標(biāo)。RMSE反映了模型中異常值偏離真實值的情況,反映了預(yù)測誤差的分布情況,其值越小模型精度越高;MAE是反映模型整體的誤差分布情況,其值越小,誤差越小,模型精度越高;擬合優(yōu)度R2是指回歸直線對觀測值的擬合程度。R2越大,擬合效果越好,表1結(jié)果可以看出,改進(jìn)后布谷鳥算法優(yōu)化的RBF神經(jīng)網(wǎng)絡(luò)模型在預(yù)測滑坡發(fā)生概率中的RMSE、MAE、R2值分別為0.017 56、0.011 78、0.983。改進(jìn)后的CS-RBF的RMSE和MAE值小于其他4種模型,R2高于其他4種模型,可以看出改進(jìn)后布谷鳥搜索算法對RBF神經(jīng)網(wǎng)絡(luò)優(yōu)化相比改進(jìn)之前在滑坡發(fā)生概率預(yù)測方面的準(zhǔn)確率有提升。分析結(jié)果可知在標(biāo)準(zhǔn)布谷鳥算法中,布谷鳥鳥蛋被發(fā)現(xiàn)并遺棄的機率影響到了算法的表現(xiàn),通過設(shè)置自適應(yīng)的發(fā)現(xiàn)概率Pa,布谷鳥算法求解最優(yōu)解的效果得到提升。
4結(jié)語
本文以山陽縣滑坡監(jiān)測點的災(zāi)害發(fā)生概率預(yù)測為研究對象,提出PCA-改進(jìn)CS-RBF滑坡預(yù)警模型。首先將監(jiān)測點的收集的數(shù)據(jù)利用PCA算法進(jìn)行數(shù)據(jù)降維,將降維后的4維數(shù)據(jù)輸入到BP、RBF中進(jìn)行對比試驗,試驗結(jié)果表明RBF預(yù)測效果更好;其次,利用CS優(yōu)化算法對RBF進(jìn)行參數(shù)尋優(yōu),并用遺傳算法優(yōu)化RBF模型進(jìn)行對比試驗,試驗結(jié)果表明CS優(yōu)化RBF神經(jīng)網(wǎng)絡(luò)效果更好,通過引入布谷鳥算法對RBF神經(jīng)網(wǎng)絡(luò)進(jìn)行基函數(shù)中心、權(quán)重等參數(shù)的優(yōu)化,成功地提高了模型預(yù)測的準(zhǔn)確性;為了進(jìn)一步提高滑坡發(fā)生概率預(yù)測的準(zhǔn)確性,對CS-RBF模型進(jìn)行改進(jìn),使用改進(jìn)后的布谷鳥算法優(yōu)化的RBF神經(jīng)網(wǎng)絡(luò)相比改進(jìn)前精度更高,效果更好,優(yōu)化后的RBF神經(jīng)網(wǎng)絡(luò)具有更高的預(yù)測準(zhǔn)確性和魯棒性,滑坡發(fā)生概率的預(yù)測更為準(zhǔn)確。因此,本文提出的模型對地質(zhì)災(zāi)害的預(yù)防和應(yīng)對具有重要的實際意義。
參考文獻(xiàn):
[1]陸泌鋒,張輝,謝配紅.基于UDEC的滑坡運動特征分析:以貴州省松桃縣甘龍鎮(zhèn)石板村滑坡為例[J].人民珠江,2023,44(1):87-92,108.
[2]李明,蔣委君,董佳慧,等.基于機器學(xué)習(xí)的滑坡災(zāi)害易發(fā)性評價:以三峽庫區(qū)為例[J].華南地質(zhì),2023,39(3):413-427.
[3]郭衍昊,竇杰,向子林,等.基于優(yōu)化負(fù)樣本采樣策略的梯度提升決策樹與隨機森林的汶川同震滑坡易發(fā)性評價[J].地質(zhì)科技通報,2024,43(3):251-265.
[4]李沙,張立舟,周成濤,等.基于SBAS-InSAR的大型滑坡變形分區(qū)及時序監(jiān)測研究[J].人民長江,2023,54(6):103-111.
[5]DAO D V,JAAFAR A,BAYAT M,et al.A spatially explicit deep learning neural network model for the prediction of landslide susceptibility[J].Catena,2020,188.DOI:10.1016/2019.104451.
[6]魏文豪,賈雨霏,盛逸凡,等.基于I、SVM、I-SVM的滑坡災(zāi)害易發(fā)性評價模型研究[J].安全與環(huán)境工程,2023,30(3):136-144.
[7]牟家琦,莊建琦,王世寶,等.基于深度神經(jīng)網(wǎng)絡(luò)模型的雅安市滑坡易發(fā)性評價[J].中國地質(zhì)災(zāi)害與防治學(xué)報,2023,34(3):157-168.
[8]任帥,紀(jì)元法,孫希延,等.基于改進(jìn)灰狼優(yōu)化與支持向量回歸的滑坡位移預(yù)測[J].計算機應(yīng)用,2024,44(3):972-982.
[9]賈雨霏,魏文豪,陳穩(wěn),等.基于SOM-I-SVM耦合模型的滑坡易發(fā)性評價[J].水文地質(zhì)工程地質(zhì),2023,50(3):125-137.
[10]ZENG T R,JIANG H W,LIU Q L,et al.Landslide displacement prediction based on Variational mode decomposition and MIC-GWO-LSTM model[J].Stochastic Environmental Research and Risk Assessment,2022,36:1353-1372.
[11]龐博文,李治軍.基于PCA-GA-XGBoost模型的吉林省水資源承載力評價[J].人民珠江,2024,45(4):98-106.
[12]SEKULARAC N,BUSHE W K,F(xiàn)ANG X.An a priori analysis on principal component analysis based conditional source-term estimation model for Sandia jet flames[J].Combustion and Flame,2024,260.DOI:10.1016/j.combustflame.2023.113274.
[13]ZHANG C,F(xiàn)U Z J,ZHANG Y M.A novel global RBF direct collocation method for solving partial differential equations with variable coefficients[J].Engineering Analysis with Boundary Elements,2024,160:14-27.
[14]ZHANG D,WANG H F,SHAN S L,et al.Dynamic surface adaptive RBF neural network control for a class of non‐linear uncertain systems[J].Electronics Letters,2023,59(23).DOI:10.1049/ell2.13055.
[15]CHEN S B,DU K,SHAN B M,et al.A hybrid variable selection method combining Fisher′s linear discriminant combined population analysis and an improved binary cuckoo search algorithm[J].Analytical Methods,2024(7):112-132.
[16]周瑞紅.基于群智能優(yōu)化理論的聚類改進(jìn)方法及應(yīng)用研究[D].長春:吉林大學(xué),2017.
[17]張崇興.基于預(yù)測和D-S證據(jù)理論的多傳感器數(shù)據(jù)融合研究[D].西安:電子科技大學(xué),2021.
(責(zé)任編輯:高天揚)