張童康,師 蕓,童 鋒,劉麗霞,閆倩倩
(1.中國(guó)煤炭地質(zhì)總局航測(cè)遙感局,陜西 西安 710199;2.西安科技大學(xué)測(cè)繪科學(xué)與技術(shù)學(xué)院,陜西 西安 710054;3.自然資源部煤炭資源勘查與綜合利用重點(diǎn)實(shí)驗(yàn)室,陜西 西安 710021)
長(zhǎng)期以來(lái),由于煤礦開采造成的地表塌陷、地裂縫等災(zāi)害,是煤礦采后環(huán)境治理急需解決的問(wèn)題。地下煤層開采會(huì)破壞周圍覆巖的應(yīng)力平衡,使巖層產(chǎn)生滑移,引起地表變形,隨著工作面的推進(jìn)巖層的變形情況越發(fā)嚴(yán)重[1]。為了更好地保護(hù)地表建筑物和基礎(chǔ)設(shè)施,有必要對(duì)開采造成的地表移動(dòng)進(jìn)行預(yù)計(jì)和保護(hù)。目前,概率積分法是應(yīng)用最廣泛的開采沉陷預(yù)計(jì)方法[2-4],其預(yù)計(jì)結(jié)果的好壞主要由預(yù)計(jì)參數(shù)的準(zhǔn)確性決定[5-7]。由于概率積分法預(yù)計(jì)參數(shù)受到復(fù)雜的地質(zhì)因素和采礦條件的影響,用簡(jiǎn)單的數(shù)學(xué)方法難以表達(dá)[8],通過(guò)建立地表移動(dòng)觀測(cè)站進(jìn)行實(shí)測(cè)求參數(shù)也容易受到多種條件的限制,難以滿足礦區(qū)安全生產(chǎn)的要求。 隨著計(jì)算機(jī)技術(shù)的發(fā)展,各種機(jī)器學(xué)習(xí)法被人們熟知并應(yīng)用,主要以神經(jīng)網(wǎng)絡(luò)模型[9]、支持向量機(jī)[10]為代表,已有大量實(shí)驗(yàn)證明,利用機(jī)器學(xué)習(xí)方法求取概率積分法參數(shù),具有精度高、易操作、實(shí)效性強(qiáng)等優(yōu)勢(shì)[11-13]。 目前,較為常用的機(jī)器學(xué)習(xí)參數(shù)預(yù)測(cè)法為BP(back propagation)神經(jīng)網(wǎng)絡(luò)算法,但BP神經(jīng)網(wǎng)絡(luò)易受到初始權(quán)值和閾值的不穩(wěn)定性影響,預(yù)測(cè)結(jié)果不夠精確,很多學(xué)者通過(guò)遺傳算法[14-15]、粒子群算法[16]對(duì)BP神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值進(jìn)行優(yōu)化,這些方法可以在一定程度上提高BP神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)精度,但仍然無(wú)法避免BP算法自身的缺陷。 灰狼優(yōu)化算法[17](grey wolf optimization,GWO)是一種種群智能優(yōu)化算法,主要有操作簡(jiǎn)單、參數(shù)少、易實(shí)現(xiàn)的特點(diǎn),但由于狼群在尋優(yōu)的過(guò)程中受到收斂因子和搜索方式的影響,導(dǎo)致灰狼優(yōu)化算法的收斂速度慢,且容易陷入局部最優(yōu)。因此,本文提出了一種改進(jìn)的灰狼優(yōu)化算法,該算法主要對(duì)收斂因子a和對(duì)灰狼位置更新方式進(jìn)行了改進(jìn),并利用改進(jìn)后的灰狼優(yōu)化算法對(duì)BP神經(jīng)網(wǎng)絡(luò)初始權(quán)值和閾值進(jìn)行優(yōu)化,構(gòu)建改進(jìn)的GWO-BP預(yù)測(cè)模型,對(duì)概率積分法的預(yù)計(jì)參數(shù)進(jìn)行預(yù)測(cè)。為了驗(yàn)證所提出算法的精度,將該算法的參數(shù)預(yù)測(cè)結(jié)果與支持向量機(jī)回歸算法(support vector regression,SVR)的預(yù)測(cè)結(jié)果以及偏最小二乘[18](partial least-square,PLS)算法的預(yù)測(cè)精度進(jìn)行對(duì)比驗(yàn)證和結(jié)果分析。
GWO優(yōu)化算法[19]是根據(jù)狼群搜索捕獵活動(dòng)所得到的一種種群智能優(yōu)化算法。狼群存在著嚴(yán)格的等級(jí)分配關(guān)系,一般將適應(yīng)度值最高的三個(gè)灰狼個(gè)體作為α狼、β狼和δ狼[20],在進(jìn)行狩獵時(shí)主要由這3只狼負(fù)責(zé),狩獵行為公式見式(1)和式(2)。
(1)
C=2r1
(2)
位置更新公式見式(3)~式(5)。
(3)
A=2ar2-a
(4)
a=2-2×t/T
(5)
式中:r2為均勻隨機(jī)數(shù);A為系數(shù)向量;a為從2到0線性遞減的收斂因子;t為當(dāng)前迭代次數(shù);T為最大迭代次數(shù)。
尋優(yōu)具體步驟見式(6)~式(12)。
(6)
(7)
(8)
(9)
(10)
(11)
(12)
式中,Dα、Dβ、Dδ分別為狼群個(gè)體的位置到α、β和δ狼所在位置的距離。
由于GWO優(yōu)化算法在尋優(yōu)過(guò)程中往往存在著收斂速度較慢且易陷入局部最優(yōu)的缺點(diǎn),造成這些缺點(diǎn)的主要原因有:①收斂因子a是線性遞減的,不能滿足算法的開發(fā)能力;②根據(jù)適應(yīng)度值最優(yōu)的3個(gè)灰狼的平均位置得到最優(yōu)解時(shí),更新策略不靈活,搜索不能滿足全局最優(yōu),在一些優(yōu)化算法中不能得到最優(yōu)解。
針對(duì)這些問(wèn)題,本文對(duì)灰狼優(yōu)化算法進(jìn)行了改進(jìn),改進(jìn)策略及分析如下所述。
1) 收斂因子a的改進(jìn)。從式(9)~式(11)可以看出,灰狼算法的搜索方式主要是由系數(shù)向量A所決定的。從式(4)可以看出,A的取值主要取決于收斂因子a的大小,在傳統(tǒng)的灰狼算法中,a值是隨著迭代次數(shù)的增加從2線性遞減到0,但是真正的灰狼在搜索過(guò)程中是一個(gè)非線性的變化過(guò)程,傳統(tǒng)的收斂因子計(jì)算方式存在一定缺陷,基于此,本文提出了一種非線性的收斂因子計(jì)算公式,見式(13)。
(13)
為了進(jìn)一步對(duì)比本文提出的收斂因子公式和傳統(tǒng)灰狼算法收斂因子公式的差異,繪制了收斂因子隨迭代次數(shù)增加的變化圖,如圖1所示。原始的灰狼算法采用的是線性收斂方式,收斂因子在前期和后期的變化率一致,因此不能滿足搜索過(guò)程要求先慢后快的變化方式。而改進(jìn)后的a曲線在前期的收斂速度較慢,可以滿足全局搜索的要求,在迭代后期收斂速度明顯加快,可以滿足局部精確搜索的要求。因此本文提出的收斂因子a的改進(jìn)方法更適用于狼群在尋優(yōu)中的搜索過(guò)程。
圖1 收斂曲線對(duì)比圖Fig.1 Contrast graph of convergence curve
2) 位置更新方法的改進(jìn)。粒子群算法具有良好的全局尋優(yōu)能力,將速度矢量考慮到粒子的更新過(guò)程中,可以得到最優(yōu)的位置信息。本文結(jié)合PSO算法中位置的更新公式[21]對(duì)灰狼的位置進(jìn)行更新,具體公式見式(14)。
(14)
式中:t為迭代次數(shù);Xi和Vi分別為第i個(gè)灰狼的位置和速度矢量。
Vi可用式(15)計(jì)算得到。
(15)
(16)
BP神經(jīng)網(wǎng)絡(luò)是一種信號(hào)前向傳遞、誤差反向傳遞的神經(jīng)網(wǎng)絡(luò)模型。模型能夠在非線性映射上取得很好的效果,并且還具備良好的自學(xué)習(xí)和自適應(yīng)能力[22]。圖3為BP神經(jīng)網(wǎng)絡(luò)的圖形結(jié)構(gòu),主要由數(shù)據(jù)層、隱含層和輸出層3層前饋網(wǎng)組成。
圖2 收斂速度對(duì)比圖Fig.2 Contrast graph of convergence speed
圖3 BP神經(jīng)三層網(wǎng)絡(luò)模型Fig.3 Back-propagation network three-layernetwork mode
網(wǎng)絡(luò)選用S型傳遞函數(shù)見式(17)。
(17)
通過(guò)整體擬合目標(biāo)誤差函數(shù),見式(18)。
(18)
BP神經(jīng)網(wǎng)絡(luò)主要通過(guò)有監(jiān)督學(xué)習(xí)的方式訓(xùn)練網(wǎng)絡(luò)模型,當(dāng)一對(duì)學(xué)習(xí)命令輸入到網(wǎng)絡(luò)后,可以將數(shù)據(jù)層的神經(jīng)元激活,然后向各隱含層傳播,最后經(jīng)過(guò)輸出層輸出對(duì)應(yīng)于輸入模式的網(wǎng)絡(luò)映射。 為了使期望的輸出結(jié)果和實(shí)際輸出結(jié)果的誤差最小,在訓(xùn)練的過(guò)程中從輸出層反向傳播到數(shù)據(jù)層時(shí)不斷對(duì)權(quán)值進(jìn)行改正,這種誤差修正主要依據(jù)誤差反向傳播算法。
概率積分法的預(yù)計(jì)參數(shù)主要有5個(gè),分別為下沉系數(shù)q、水平移動(dòng)系數(shù)b、主要影響正切角tanU、拐點(diǎn)偏移距s/H和開采傳播角θ。這些參數(shù)都受到了復(fù)雜地質(zhì)采礦條件的影響,主要的影響因素有覆巖巖性、松散層厚度、煤層采厚和采深等因素。文獻(xiàn)[23]給出了全國(guó)208個(gè)典型工作面的地質(zhì)采礦實(shí)測(cè)數(shù)據(jù),本文選取了其中40個(gè)工作面的實(shí)測(cè)數(shù)據(jù)作為訓(xùn)練樣本和測(cè)試樣本,其中,訓(xùn)練集為1~35號(hào)樣本數(shù)據(jù),測(cè)試集為36~40號(hào)樣本數(shù)據(jù),用于驗(yàn)證模型訓(xùn)練結(jié)果的精度。根據(jù)可定量原則,選取6種地質(zhì)采礦因素作為輸入層,分別為覆巖平均堅(jiān)固系數(shù)f、采厚M、采深H、松散層厚度W、煤層傾角∝和采動(dòng)程度n,具體數(shù)據(jù)見表1。
本文將采用多輸入層對(duì)應(yīng)單一輸出層,以6個(gè)地質(zhì)采礦因子作為輸入層,分別對(duì)應(yīng)五個(gè)單一的概率積分法參數(shù),建立五個(gè)獨(dú)立的網(wǎng)絡(luò)模型結(jié)構(gòu),每個(gè)網(wǎng)絡(luò)模型結(jié)構(gòu)中有6個(gè)輸入節(jié)點(diǎn)和1個(gè)輸出節(jié)點(diǎn),隱含層神經(jīng)元個(gè)數(shù)一般通過(guò)多次訓(xùn)練和結(jié)果對(duì)比得到。本文選取的各個(gè)模型隱含層神經(jīng)元節(jié)點(diǎn)數(shù)分別為:下沉系數(shù)15個(gè)、水平移動(dòng)系數(shù)13個(gè)、主要影響角正切21個(gè)、拐點(diǎn)偏移距19個(gè)、開采影響傳播角7個(gè)。
表1 學(xué)習(xí)訓(xùn)練和測(cè)試樣本Table 1 Training and testing samples
續(xù)表1
改進(jìn)的GWO-BP算法流程圖見圖4,具體實(shí)施步驟如下所述。
圖4 改進(jìn)的GWO-BP算法流程圖Fig.4 Improved GWO-BP algorithm flow chart
1) 輸入數(shù)據(jù),劃分訓(xùn)練集和測(cè)試集。并對(duì)數(shù)據(jù)進(jìn)行歸一化處理,見式(19)。
(19)
式中:x為輸入數(shù)據(jù);y為歸一化后數(shù)據(jù)。
2) 確定灰狼的種群規(guī)模為20頭狼、最大迭代次數(shù)為100次和參數(shù)取值上下界(ub,lb)。
3) 確定神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu),對(duì)狼群進(jìn)行隨機(jī)初始化,初始化公式見式(20)。
Xi=r0(ub-lb)+lb
(20)
式中:Xi為初始種群;r0為[0,1]間的隨機(jī)數(shù)。
4) 計(jì)算灰狼個(gè)體的適應(yīng)度值,并將最優(yōu)的3個(gè)適應(yīng)度值的灰狼的位置記為Xα、Xβ和Xδ。
5) 根據(jù)式(2)、式(4)、式(13)更新參數(shù)C、A、a,根據(jù)更新的參數(shù)和式(14)和式(15)對(duì)灰狼的位置進(jìn)行更新,根據(jù)式(16)得到獵物的最終位置。
6) 判斷是否達(dá)到最大迭代次數(shù),若達(dá)到則輸出最優(yōu)的權(quán)值和閾值,否則返回步驟4)繼續(xù)迭代。
7) 設(shè)置BP神經(jīng)網(wǎng)絡(luò)的最大迭代次數(shù)為500次、學(xué)習(xí)率為0.1和目標(biāo)誤差為5~10,將步驟6)得到的最優(yōu)權(quán)值和閾值作為BP神經(jīng)網(wǎng)絡(luò)的初始權(quán)值和閾值進(jìn)行訓(xùn)練和預(yù)測(cè)。
8) 輸出概率積分法預(yù)計(jì)參數(shù)。
9) 利用平均絕對(duì)百分比誤差(MAPE)作為評(píng)價(jià)計(jì)算結(jié)果的指標(biāo)。利用Willmott的一致性指數(shù)(WIA)對(duì)模型的泛化性能進(jìn)行評(píng)價(jià)。MAPE是相對(duì)誤差的一個(gè)指標(biāo),WIA在0~1之間變化,WIA值是各種回歸模型誤差程度的標(biāo)準(zhǔn)化度量,其定義見式(21)和式(22)。
(21)
(22)
本文提出的改進(jìn)GWO-BP算法擁有良好的全局尋優(yōu)能力可以使模型采用最優(yōu)的初始權(quán)值和閾值進(jìn)行訓(xùn)練和預(yù)測(cè),從而使模型更快收斂,預(yù)測(cè)精度更高。為了驗(yàn)證IGWO-BP算法對(duì)概率積分法參數(shù)預(yù)測(cè)的準(zhǔn)確性,將其與支持向量機(jī)回歸法的預(yù)測(cè)結(jié)果以及偏最小二乘法采用RBF核函數(shù)進(jìn)行訓(xùn)練,采用交叉驗(yàn)證進(jìn)行參數(shù)尋優(yōu)。結(jié)果見表2~表4。
將3種方法的預(yù)測(cè)值分別與地表移動(dòng)觀測(cè)實(shí)測(cè)值的計(jì)算結(jié)果進(jìn)行對(duì)比,分析其平均絕對(duì)百分比誤差和一致性指數(shù),見表5。
由表5可知,分別用最大相對(duì)誤差、平均絕對(duì)百分比誤和一致性指數(shù)作為評(píng)價(jià)指標(biāo)對(duì)3種預(yù)測(cè)方法的預(yù)測(cè)精度進(jìn)行分析。從結(jié)果可以看出,IGWO-BP的最大相對(duì)誤差和平均絕對(duì)百分比誤差整體都小于PLS算法和SVR算法的預(yù)測(cè)精度。從一致性指數(shù)來(lái)分析,一致性指數(shù)接近于1代表預(yù)測(cè)模型的泛化性能越好,從表5中可以看出,IGWO-BP模型的一致性指數(shù)最高,其次是SVR模型,PLS模型的一致性指數(shù)最低, 這與其模型的尺度單一有關(guān)[19], 說(shuō)明IGWO-BP模型的泛化性能要優(yōu)于SVR模型和PLS模型。為了能更清晰地對(duì)比3種預(yù)測(cè)模型的精度,特用3種模型的預(yù)測(cè)結(jié)果對(duì)實(shí)測(cè)結(jié)果進(jìn)行擬合,擬合結(jié)果如圖5所示。
表2 PLS預(yù)測(cè)結(jié)果分析Table 2 Analysis of prediction results of PLS
表3 SVR預(yù)測(cè)結(jié)果分析Table 3 Analysis of prediction results of SVR
表4 IGWO-BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)結(jié)果分析Table 4 Analysis of prediction results of improvedGWO-BP neural network
表5 三種預(yù)測(cè)算法精度對(duì)比分析Table 5 Comparison and analysis of the accuracy ofthree prediction algorithms
圖5 三種預(yù)測(cè)方法與實(shí)測(cè)值擬合對(duì)比圖Fig.5 Comparison between three prediction methods and actual measured values
從圖5的擬合效果來(lái)看,IGWO-BP模型的整體擬合效果最好,進(jìn)一步說(shuō)明利用改進(jìn)后GWO-BP模型預(yù)測(cè)結(jié)果明顯優(yōu)于一致性指數(shù)模型預(yù)測(cè)結(jié)果和PLS模型預(yù)測(cè)結(jié)果,可以在求取概率積分法預(yù)計(jì)參數(shù)的實(shí)際工程中得以應(yīng)用。
針對(duì)概率積分法預(yù)計(jì)參數(shù)難以求取的現(xiàn)狀,本文提出了一種改進(jìn)的灰狼優(yōu)化算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值,從而對(duì)概率積分法預(yù)計(jì)參數(shù)進(jìn)行求取的方法,并得到了以下結(jié)論。
1) 通過(guò)對(duì)灰狼優(yōu)化算法的收斂因子a的改進(jìn),發(fā)現(xiàn)在收斂性能上,本文提出的收斂因子計(jì)算方法更符合算法的局部開發(fā)和全局搜索能力。
2) 通過(guò)對(duì)灰狼位置更新方式的改進(jìn),使得狼群在尋優(yōu)的過(guò)程中可以保持頭狼的全局最優(yōu)位置,從而更好帶領(lǐng)群狼搜索到獵物,收斂速度更快。
3) 對(duì)PLS模型、SVR模型和IGWO-BP模型的預(yù)測(cè)結(jié)果進(jìn)行對(duì)比分析發(fā)現(xiàn),IGWO-BP模型的預(yù)測(cè)結(jié)果精度最高,其次是SVR模型,PLS模型的預(yù)測(cè)精度最差。
4) 本文提出的IGWO-BP預(yù)測(cè)算法在回歸和預(yù)測(cè)上都有較好的性能,該算法所得到的預(yù)測(cè)結(jié)果與實(shí)測(cè)結(jié)果的誤差較小,符合工程要求,也能為缺少地表實(shí)測(cè)數(shù)據(jù)的礦區(qū)提供新的概率積分法預(yù)計(jì)參數(shù)求取方法,對(duì)該類礦區(qū)的開采沉陷預(yù)計(jì)以及防災(zāi)減災(zāi)工作都有重要的指導(dǎo)意義。