杜宇 潘遙
(1、中國地質(zhì)大學(xué)(武漢)工程學(xué)院,湖北 武漢430074 2、中南財(cái)經(jīng)政法大學(xué)財(cái)政稅務(wù)學(xué)院,湖北 武漢430073)
巖石可鉆性指的是巖石抵抗鉆鑿破碎的能力, 是探礦鉆井工程不可或缺的一個(gè)指標(biāo),具有重要的價(jià)值意義。對(duì)于巖石可鉆性的評(píng)價(jià)方法也受到學(xué)者越來越多的關(guān)注。目前對(duì)于巖石可鉆性的研究方法主要有三類: 微鉆實(shí)驗(yàn)法、Dc 指數(shù)法和利用測井參數(shù)預(yù)測法[4]。其中前兩種方法都為鉆后評(píng)價(jià)法,脫離了巖心所處的真實(shí)的高溫高壓環(huán)境,鉆取的巖心不具有代表性等缺點(diǎn)。利用測井資料評(píng)價(jià)法既能較好的反應(yīng)地層實(shí)際的環(huán)境, 又能全面的反應(yīng)一個(gè)地區(qū)(某口井)的可鉆性性質(zhì),還具有經(jīng)濟(jì)環(huán)保等優(yōu)點(diǎn)。在可鉆性預(yù)測模型研究里,有一種通過利用測井資料建立神經(jīng)網(wǎng)絡(luò)模型來對(duì)巖石可鉆性進(jìn)行預(yù)測的方法, 這樣既能反應(yīng)巖石地層巖石實(shí)時(shí)鉆進(jìn)環(huán)境, 又能更加方便快捷的建立可鉆性與巖石所處環(huán)境的之間的聯(lián)系。
人工神經(jīng)網(wǎng)絡(luò)是一種運(yùn)算模型,它在解決非線性、多參數(shù)的擬合問題有較好的效果。而BP 神經(jīng)網(wǎng)絡(luò)作為常見的神經(jīng)網(wǎng)絡(luò),它常被研究者用于地層可鉆性的預(yù)測研究中。夏宏泉等人基于BP 神經(jīng)網(wǎng)絡(luò)利用測井資料建立巖石可鉆性預(yù)測模型,為鉆頭選型提供了較好的依據(jù)[3]。沙林秀等人提出基于自適應(yīng)雙鏈量子遺傳算法優(yōu)化BP 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的巖石可鉆性提取建模方法[10]。周啟成等人把測井?dāng)?shù)據(jù)作為輸入?yún)?shù), 可鉆性極值作為輸出參數(shù),利用BP 神經(jīng)網(wǎng)絡(luò)建立涪陵頁巖氣區(qū)塊輸入?yún)?shù)與輸出參數(shù)之間的映射關(guān)系[8]。董青青等人提出了基于粒子群算法優(yōu)化的BP 神經(jīng)網(wǎng)絡(luò)巖層可鉆性預(yù)測模型,具有較高的精度[7]。
BP 網(wǎng)絡(luò)模型具有良好的自適應(yīng)性、自學(xué)習(xí)性和極強(qiáng)的非線性逼近、容錯(cuò)能力等優(yōu)點(diǎn)。但是在用于網(wǎng)絡(luò)的初始權(quán)值和閾值都是隨機(jī)生成的,就可能會(huì)導(dǎo)致結(jié)果陷入局部最優(yōu)。因此本文提出一種基于遺傳算法優(yōu)化的BP 神經(jīng)網(wǎng)絡(luò)巖石可鉆性預(yù)測模型,以地層的測井資料作為網(wǎng)絡(luò)的輸入?yún)?shù), 地層可鉆性級(jí)值作為輸出建立BP 神經(jīng)網(wǎng)絡(luò),然后利用遺傳算法BP 神經(jīng)網(wǎng)絡(luò)的初始權(quán)值和閾值進(jìn)行優(yōu)化,提高了模型的收斂速度和預(yù)測精度。
遺傳算法(Genetic Algorithms,GA)在1962 年由美國人提出,它是通過模擬遺傳學(xué)的機(jī)理和達(dá)爾文生物進(jìn)化論而形成的一種并行隨機(jī)搜索最優(yōu)化方法。與自然界中“優(yōu)勝略汰,適者生存”的生物進(jìn)化原理相似, 遺傳算法就是將需要優(yōu)化的參數(shù)進(jìn)行編碼成染色體并入種群群體中,選擇合適的適應(yīng)度函數(shù),對(duì)種群中的個(gè)體進(jìn)行選擇、交叉和變異操作,保留適應(yīng)度值好的個(gè)體,適應(yīng)度差的個(gè)體被淘汰。這樣反復(fù)循環(huán)操作,直至滿足所需要的條件。
首先先對(duì)參數(shù)進(jìn)行編碼, 將需要優(yōu)化的參數(shù)編碼含有N 個(gè)個(gè)體的種群X={X1,X2,…,Xn},其中Xi是種群個(gè)體的基因值也即是需要的參數(shù)值。然后就是確定一個(gè)適應(yīng)度函數(shù)為種群大小,來評(píng)價(jià)參數(shù)優(yōu)化后的,預(yù)測精度。
BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)是用誤差逆向傳播算法(Error Back Propagation)進(jìn)行訓(xùn)練的,是一種多層前饋神經(jīng)網(wǎng)絡(luò)。結(jié)構(gòu)主要包括三個(gè)部分,輸入層、輸出層和若干個(gè)隱含層,處于同一層的神經(jīng)元是相互獨(dú)立的,它們之間沒有信息傳遞,不同層之間的神經(jīng)元?jiǎng)t是通過神經(jīng)網(wǎng)絡(luò)網(wǎng)絡(luò)參數(shù)(權(quán)值和閾值)相互連接?;綛P 算法包括信息前向傳播過程和誤差反向傳播過程。正向傳播時(shí), 輸入信號(hào)由輸入層向前傳遞到隱含層再到輸出層得到輸出信號(hào),得到的輸出信號(hào)與期望輸出不符,則計(jì)算它們之間的誤差,轉(zhuǎn)入誤差的反向傳播過程。誤差反向傳播則是將得到的誤差反向作用于各層神經(jīng)元的網(wǎng)絡(luò)參數(shù)。如此循環(huán)反復(fù)學(xué)習(xí)訓(xùn)練,直到實(shí)際輸出與期望輸出達(dá)到要求的精度為止,訓(xùn)練即告停止。
遺傳算法優(yōu)化BP 神經(jīng)網(wǎng)絡(luò)模型分為3 個(gè)部分, 分別為BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)確定、GA 優(yōu)化權(quán)值與閾值和BP 神經(jīng)網(wǎng)絡(luò)預(yù)測。由文獻(xiàn)[3~5]可知影響巖層的可鉆性級(jí)別的因素主要包括聲波時(shí)差Δt、地層密度ρ、電阻率Rt以及泥質(zhì)質(zhì)量分?jǐn)?shù)Vsh等。我們將與地層可鉆性密切相關(guān)的參數(shù)(聲波時(shí)差、地層密度、泥質(zhì)質(zhì)量分?jǐn)?shù)、電阻率)作為網(wǎng)絡(luò)的輸入量,以地層可鉆性級(jí)別Kd作為網(wǎng)絡(luò)的輸出,建立巖石可鉆性預(yù)測模型如圖1 所示。
圖1 可鉆性預(yù)測模型
BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)是一種采用誤差反向傳播算法(Error Back Propagation)的前饋神經(jīng)網(wǎng)絡(luò)模型,實(shí)質(zhì)上就是求誤差最小問題, 通過模式順傳播和誤差傳播反復(fù)進(jìn)行網(wǎng)絡(luò)記憶訓(xùn)練直到收斂。我們可以采用均誤差MSE(Mean Squared Error)來作為網(wǎng)絡(luò)的擬合函數(shù):
式中:Fi表示神經(jīng)網(wǎng)絡(luò)的預(yù)測值(i=1,2, …,n);Yi表示目標(biāo)值(期望結(jié)果)。
基于GA 優(yōu)化的BP 神經(jīng)網(wǎng)絡(luò)是對(duì)初始值和閾值進(jìn)行優(yōu)化得到的預(yù)測模型。我們利用文獻(xiàn)[3]數(shù)據(jù)中的地層參數(shù),作為BP神經(jīng)網(wǎng)絡(luò)的輸入數(shù)據(jù)和輸出數(shù)據(jù),然后使用MATLAB 軟件先構(gòu)建不同節(jié)點(diǎn)數(shù)的BP 神經(jīng)網(wǎng)絡(luò),采用默認(rèn)初始值各模擬5000 次,計(jì)算得到每個(gè)神經(jīng)網(wǎng)絡(luò)的誤差MSN,如圖2 所示。從圖中可以看出在隱含層為7 時(shí)樣本誤差MSE 值最小,并且誤差比較穩(wěn)定,所以選擇7 個(gè)節(jié)點(diǎn)最優(yōu),因此BP 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)為n-7-1,n 為輸入層節(jié)點(diǎn)數(shù)(對(duì)應(yīng)地層的各個(gè)參數(shù)),7 為隱含層個(gè)數(shù),輸出層個(gè)數(shù)為1(表示可鉆性級(jí)值)。
圖2 不同隱含層的對(duì)應(yīng)的MSE 值
基于遺傳算法和BP 神經(jīng)網(wǎng)絡(luò)理論,在MATLAB 中實(shí)現(xiàn)基于GA 優(yōu)化的BP 神經(jīng)網(wǎng)絡(luò)巖石可鉆性預(yù)測模型。遺傳算法中的參數(shù)設(shè)置: 種群規(guī)模設(shè)為100, 進(jìn)化次數(shù)設(shè)為200 次, 交叉概率為0.4,變異概率為0.2。進(jìn)化次數(shù)在50 次左右適應(yīng)度就已接近平緩了,為了保守起見將進(jìn)化代數(shù)設(shè)置為200。模型的網(wǎng)絡(luò)結(jié)構(gòu)一共有有4 個(gè)輸入?yún)?shù)、1 個(gè)輸出參數(shù), 所以設(shè)置的BP 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)為4-7-1,即輸入層有4 個(gè)節(jié)點(diǎn),隱含層7 個(gè)節(jié)點(diǎn),輸出層1 個(gè)節(jié)點(diǎn),網(wǎng)絡(luò)結(jié)構(gòu)中共有4×7+7×1=35 個(gè)權(quán)值,7+1=8 個(gè)閾值。可以確定遺傳算法個(gè)體的編碼長度為35+8=43。
將優(yōu)化好的初始權(quán)值和閾值對(duì)所建好的模型進(jìn)行訓(xùn)練,并將文獻(xiàn)中的后10 組數(shù)據(jù)進(jìn)行回判預(yù)測,再將文獻(xiàn)[1]中預(yù)測數(shù)據(jù)進(jìn)行對(duì)比分析,得到回判結(jié)果,將所得結(jié)果繪制成曲線如圖3 所示。由圖3 可看出基于GA 優(yōu)化的BP 神經(jīng)網(wǎng)絡(luò)對(duì)地層可鉆性的預(yù)測誤差不超過1%,比未經(jīng)優(yōu)化的BP 神經(jīng)網(wǎng)絡(luò)擬合效果更好,而且誤差波動(dòng)較小。
圖3 三種預(yù)測地層可鉆性模型的曲線對(duì)比
4.1 通過預(yù)測值對(duì)比結(jié)果分析可以看出,GA-BP 的相對(duì)誤差的平均值為0.17,BP 的相對(duì)誤差的平均值為3.26。GA-BP 模型預(yù)測精度比BP 模型要高,克服了BP 網(wǎng)絡(luò)容易陷入極小值的缺點(diǎn),為可鉆性級(jí)值預(yù)測提供了一種高精度的模型。
4.2 利用已鉆的測井資料建立訓(xùn)練模型,然后利用未鉆區(qū)域的測井資料輸入模型中即可預(yù)測未鉆區(qū)域的可鉆性級(jí)值, 為地層巖石可鉆性評(píng)價(jià)提供了一種新的方案,具有適用性廣的特點(diǎn)。