李昌華,張學(xué)齡,杜小蕓,郭志陽
(1.長江大學(xué)石油工程學(xué)院,武漢 430100;2.中石化石油工程設(shè)計有限公司,山東東營 257026;3.油氣鉆采工程湖北省重點實驗室,武漢 430100)
井漏一直是鉆井研究的主題,事故一旦發(fā)生,不僅影響勘探開發(fā)的進程,還可能導(dǎo)致井眼報廢,甚至造成嚴重的人員傷亡事故,處理井漏的最好辦法就是人為抑制發(fā)生,但目前預(yù)測方法仍不成熟。
常規(guī)判斷井漏的測井技術(shù)有自然伽馬測井、自然電位測井、井徑測井、井溫測井、成像測井等。井漏位置計算的主要方法有正反循環(huán)測試法、井漏前后泵壓變化測試法、注低密度鉆井液找漏層位置、循環(huán)時差法等。分析井漏發(fā)生的條件可以歸納為:鉆井液性能、漏失壓差和漏失通道的性質(zhì)。范翔宇等[1]對DN氣田的漏失層位進行確定時發(fā)現(xiàn),在鉆井液性能發(fā)生變化時,僅依靠鉆井不能準確確定漏失層段,還需要依靠測井手段來解決問題。陳鋼花等[2]利用改進立壓變化法計算井漏層位。改進的方法需要鉆井液以及井眼的相關(guān)參數(shù),達到較高的準確率,但鉆井液參數(shù)測量分辨率較低,使得計算結(jié)果誤差很大,難以在現(xiàn)場推廣應(yīng)用。昌犇[3]利用電阻率、井溫等多條測井曲線以及成像測井法對紅河油田進行分析,可判斷正在漏失和漏失時間不長的層位,確定漏失層段;成像測井在此基礎(chǔ)上可確定漏層的特征和漏失通道的性質(zhì)。傳統(tǒng)確定漏失層位的方法依賴專家經(jīng)驗,技術(shù)可復(fù)制性差,難以避免地造成鉆井液的損失和油層的污染。同時,分析過程所需數(shù)據(jù)資料多,計算復(fù)雜,難以及時有效地確定漏失層位,無法滿足深井復(fù)雜地層的鉆探安全需求[4-5]。
隨著機器學(xué)習(xí)在油氣領(lǐng)域的進一步發(fā)展,信息化、智能化成為油田企業(yè)新的建設(shè)方向。深度學(xué)習(xí)作為機器學(xué)習(xí)中最重要的一個分支,對數(shù)據(jù)處理具有獨特的優(yōu)勢,從業(yè)者已在油氣各領(lǐng)域展開了研究[6-8]。涂曦予等[9]以錄井觀測日志為數(shù)據(jù)支撐,利用自然語言處理方法,基于Xgbost 算法建立了井漏事故預(yù)警模型;王雷雯[10]選用生物地理算法結(jié)合BP神經(jīng)網(wǎng)絡(luò)建立漏失層預(yù)測模型,通過該算法得到網(wǎng)絡(luò)初始權(quán)重和閾值來訓(xùn)練神經(jīng)網(wǎng)絡(luò),得到了較為準確的預(yù)測結(jié)果。Arehart[11]利用神經(jīng)網(wǎng)絡(luò)開展鉆頭故障的研究,Ben等[12]利用隨機森林算法等混合模型實現(xiàn)鉆井狀態(tài)的實時識別。卷積神經(jīng)網(wǎng)絡(luò)是受生物視覺機制啟發(fā)而來的一種高效信息識別模式,具有局部區(qū)域連接、權(quán)值共享、降采樣等特點,在一些領(lǐng)域已經(jīng)開展了豐富的應(yīng)用,但運用該方法預(yù)測井漏問題的案例較少。
本文建立卷積神經(jīng)網(wǎng)絡(luò)預(yù)測井漏模型,利用圖像識別對數(shù)據(jù)進行分析;對數(shù)據(jù)進行預(yù)處理,增加有效數(shù)據(jù);將特征物理數(shù)值轉(zhuǎn)化為數(shù)字圖片,直觀了解漏失圖像;結(jié)合現(xiàn)場數(shù)據(jù)將傳統(tǒng)思路與本文方法進行對比,表明本模型的合理性與可靠性。
本數(shù)據(jù)來自某油田A 區(qū)塊,該油田為奧陶系碳酸鹽裂縫-洞穴型油藏,儲層埋藏深度超7 km。該地區(qū)地質(zhì)結(jié)構(gòu)復(fù)雜,受斷裂運動影響,易發(fā)生垮塌漏失事故,部分井甚至還發(fā)生過嚴重的連續(xù)漏失事故。通過對測井數(shù)據(jù)進行統(tǒng)計,本文選取解釋井漏所需的特征值,同時所有井中共有的特征量制作數(shù)據(jù)集。包括伽馬值、自然電位、泥漿電阻率、聲波時差、鉆時、井溫、井徑等特征量。漏失記錄中,詳細記錄的有效數(shù)據(jù)有57處。通過研究井史資料,現(xiàn)場平均每天鉆深30 m,因此統(tǒng)計漏失前30 m數(shù)據(jù)作為預(yù)警數(shù)據(jù),綜合分析下方地層的漏失風(fēng)險,共計54 處有效樣本,其余視為正常數(shù)據(jù)。數(shù)據(jù)處理過程如下:
(1)歸一化。為消除原始數(shù)據(jù)中量綱和取值范圍對結(jié)果的影響,使網(wǎng)絡(luò)能正常響應(yīng)不同的輸入信號,為便于綜合分析,利用線性函數(shù)對輸入數(shù)據(jù)進行歸一化處理,將其轉(zhuǎn)換到[0,1]的范圍。此外,歸一化還能加快網(wǎng)絡(luò)的學(xué)習(xí)速度。選用最小-最大歸一化函數(shù)
式中:X為原始數(shù)據(jù);Xnorm、Xmin和Xmax分別為歸一化后的數(shù)據(jù)、數(shù)據(jù)集中的最小和最大值。
(2)數(shù)據(jù)增廣。根據(jù)統(tǒng)計,有54 處漏失前的有效樣本,不利于神經(jīng)網(wǎng)絡(luò)訓(xùn)練出足夠好的參數(shù)。為增加有效數(shù)據(jù),通過對數(shù)據(jù)進行翻轉(zhuǎn)處理增加偽樣本數(shù)量。其他則為測井數(shù)據(jù)中篩選得到的正常數(shù)據(jù)。按照3.5∶1合理劃分訓(xùn)練集與測試集的數(shù)據(jù)量,共計900 例。數(shù)據(jù)集制作結(jié)果見表1。
表1 數(shù)據(jù)集組成
(3)數(shù)字圖像化。為方便觀察井漏特征,將特征量轉(zhuǎn)化為數(shù)字圖像。圖像在計算機中是由矩陣排列的多個像素點組成,每個像素點有一對應(yīng)的數(shù)值表示該像素點的亮度,這些像素點陣的數(shù)值構(gòu)成了一個離散函數(shù):
式中:i取值范圍為[1,N];j為[1,M]。
以該區(qū)塊中A-1 井為例,該井有效數(shù)據(jù)深度910~9 396 m,多次發(fā)生漏失,將歸一化后的測井數(shù)據(jù)轉(zhuǎn)化為數(shù)字圖像如圖1 所示。該井漏失圖像與預(yù)警圖像如圖1(a)所示,由于漏失3、4,漏失6、7 處深度相距較近,將包含兩處漏失的前30 m數(shù)據(jù)區(qū)間并為一處。每個小圖片對應(yīng)300 ×7 的數(shù)據(jù)段,逐個把數(shù)據(jù)段轉(zhuǎn)化為單個圖片后,拼接得到單井數(shù)字圖像如圖1(b)所示。
圖1 測井數(shù)字圖像
卷積神經(jīng)網(wǎng)絡(luò)中,卷積核參數(shù)被輸入層數(shù)據(jù)共享,大大減少了權(quán)重的數(shù)量,降低了網(wǎng)絡(luò)的復(fù)雜度。卷積核類似于窗口,以固定的大小、步幅按照數(shù)據(jù)的軸向順序依次滑動,持續(xù)計算。利用數(shù)據(jù)間的局部相關(guān)性,卷積核不斷提取數(shù)據(jù)的有效信息。測井數(shù)據(jù)的卷積過程如圖2、3 所示。
圖2 數(shù)字圖像卷積過程
1.2.1 CNN結(jié)構(gòu)
卷積神經(jīng)網(wǎng)絡(luò)中卷積層擁有多個小型濾波器,它們在加深網(wǎng)絡(luò)的同時,分析鄰近及相距較遠的數(shù)據(jù)之間的關(guān)聯(lián),更好地利用數(shù)據(jù)的隱藏信息,得到輸入數(shù)據(jù)或圖像的多個特征,池化層進一步提取圖像重要信息。原本復(fù)雜的曲線數(shù)據(jù)通過CNN處理,避免了人工提取特征的過程。卷積過程擴大了神經(jīng)元處理數(shù)據(jù)的范圍,提高模型的容錯性。建立的卷積神經(jīng)網(wǎng)絡(luò)構(gòu)成如圖3、4 所示。
圖3 卷積計算圖
圖4 卷積神經(jīng)網(wǎng)絡(luò)
全連接層(Affine)對輸入數(shù)據(jù)進行了抽象處理,通過特征數(shù)據(jù)的線性組合去判斷提取到的信息是否正確;神經(jīng)網(wǎng)絡(luò)計算得到的數(shù)值,相當于對特征關(guān)系強弱的描述,即數(shù)據(jù)間的相對聯(lián)系。根據(jù)傳入數(shù)據(jù)的形狀,將相鄰神經(jīng)元連接在一起,決定模型輸出的格式:
式中:wij(l)為該神經(jīng)元的權(quán)重;xj(l-1)為上一層神經(jīng)元的輸出;bi(l)為偏置。
全連接層中隱藏層節(jié)點數(shù)為
式中:mi為輸入層節(jié)點數(shù);mj為輸出層節(jié)點數(shù)。經(jīng)分析與嘗試,本次隱藏層取55 層。
損失函數(shù)選擇交叉熵誤差函數(shù),N個數(shù)據(jù)的交叉熵誤差[13](損失函數(shù)總和),即
式中:ti,k為正確解標簽;yi,k為神經(jīng)網(wǎng)絡(luò)的輸出。
1.2.2 參數(shù)的優(yōu)化
(1)參數(shù)優(yōu)選。由于損失函數(shù)復(fù)雜,參數(shù)空間龐大,為同時保證模型準確率和加速模型的收斂速度,需要得到最優(yōu)參數(shù)搭配。為使梯度下降到全局最優(yōu),優(yōu)化器使用由動量梯度下降法和RMS算法結(jié)合的Adam優(yōu)化算法。
卷積層激活函數(shù)使用ReLU 函數(shù),權(quán)重初始值使用He初始值分布,即標準差為0.01 的高斯分布。通過構(gòu)建多個神經(jīng)網(wǎng)絡(luò)模型發(fā)現(xiàn),增加神經(jīng)元層數(shù)要比增加神經(jīng)元數(shù)量可得到更快的收斂速度,最終參數(shù)取值見表2。
表2 網(wǎng)絡(luò)參數(shù)表
(2)抑制過擬合以提高模型的泛化能力。很多情況下權(quán)重參數(shù)取值過大導(dǎo)致過擬合的發(fā)生,在本模型中,為損失函數(shù)加權(quán)重的平方范數(shù)(L2范數(shù))來抑制權(quán)重過大,防止過擬合的發(fā)生。則L2范數(shù)
式中,wi為權(quán)重值。
隨著網(wǎng)絡(luò)的復(fù)雜度增加,僅用權(quán)值衰減難以達到理想的訓(xùn)練結(jié)果。Dropout可有效地加快訓(xùn)練進程,初步訓(xùn)練趨勢如圖5 所示。圖中橫坐標為全部數(shù)據(jù)集完成一次前向和后向傳播的次數(shù),縱坐標為準確率。隨著訓(xùn)練次數(shù)的增加,訓(xùn)練集和測試集的準確率持續(xù)上升且無過擬合情況。經(jīng)過300 次迭代的初步學(xué)習(xí),訓(xùn)練集和測試集的準確率如圖5 所示,分別達到60%、50%以上。
圖5 正則化后訓(xùn)練過程
測井記錄每0.1 或0.125 m 采樣一次,最終每口井均包含數(shù)萬行的記錄數(shù)據(jù)。井漏的發(fā)生,都有一些與之響應(yīng)的先兆,利用現(xiàn)代工程技術(shù)實時監(jiān)測采集這些信息,可歸納為:泥漿池液面下降;鉆井液密度增大;鉆時明顯減小等。分析圖6 發(fā)現(xiàn),在左圖測井曲線中:自然電位、聲波時差等數(shù)據(jù)變化異常,電阻率、鉆時出現(xiàn)增大趨勢,通過數(shù)據(jù)分析、專家研判后得到漏失深度位于4 169 m處。傳統(tǒng)方法只能在漏失發(fā)生后進行研判,費時且工程損失較大。
圖6 漏失段數(shù)據(jù)圖
卷積核在降低數(shù)據(jù)維度的過程中,對區(qū)間井深的特征數(shù)據(jù)進行了綜合計算。本模型以30 m 深度數(shù)據(jù)量作為單個輸入數(shù)據(jù)對漏失事故進行預(yù)測,相比單行數(shù)據(jù),神經(jīng)網(wǎng)絡(luò)提取到關(guān)于該區(qū)域內(nèi)更綜合的工程信息,同時使模型的預(yù)測結(jié)果具有更高的容錯力。以測試集中A08 井2 次漏失,A14、A19 井各一次漏失(均未參與訓(xùn)練)為例,在施工過程中,模型實時根據(jù)當前深度至上方30 m 區(qū)間測井數(shù)據(jù)分析下方地層狀態(tài)。在到達事故地層前,模型發(fā)出警告信息。
由測井數(shù)據(jù)轉(zhuǎn)換為圖像后,從另一角度體現(xiàn)特征量的變化情況,將測試集中的部分發(fā)出預(yù)警的數(shù)據(jù)段可視化后得到預(yù)警圖像見表3。預(yù)測對比測井曲線與對應(yīng)預(yù)警圖像發(fā)現(xiàn),不同深度所對應(yīng)的圖像中主色彩存在差異。漏失前30 m 所處的深度區(qū)間中的特征量數(shù)值波動時,預(yù)警圖片在對應(yīng)高度上的色彩出現(xiàn)了分層漸變的現(xiàn)象。針對這類數(shù)據(jù),卷積神經(jīng)網(wǎng)絡(luò)可快速地分析特征變化,通過模型的前向與反向傳播,在訓(xùn)練過程中逐步強化對特征值的響應(yīng),從而識別到正確的漏前特征。
表3 測井曲線與預(yù)警圖像對比
如圖7 所示,訓(xùn)練過程中,對訓(xùn)練集全部數(shù)據(jù)迭代一輪后,利用測試集數(shù)據(jù)計算模型的準確率。經(jīng)過多輪訓(xùn)練,模型對下方地層情況的判別能力逐步提升,訓(xùn)練集準確率達到90%以上。將未參與訓(xùn)練的測試集傳入訓(xùn)練好的模型發(fā)現(xiàn),測試集的平均準確率達到了91.5%。
圖7 CNN模型訓(xùn)練結(jié)果圖
最終識別情況見表4。訓(xùn)練結(jié)果表明,模型可根據(jù)當前30 m特征數(shù)據(jù)對下方地層及時發(fā)出預(yù)警信息,對漏失情況進行準確判斷。
表4 模型對不同工況識別準確率
(1)設(shè)計了一套適合神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)處理方法,選取預(yù)測所需的地質(zhì)、工程、流體相關(guān)的7 個特征量,對數(shù)據(jù)進行增廣后解決了樣本偏少的問題,模型的表現(xiàn)說明了參數(shù)選取與處理方法的可靠性。
(2)使用圖像處理的方法,將測井數(shù)據(jù)可視化,以圖片形式理解數(shù)據(jù)的變化,了解數(shù)據(jù)處理情況和卷積核的特征計算流程。圖像特征與數(shù)據(jù)變化相對應(yīng),對數(shù)據(jù)分析增加了新的角度。
(3)使用多口不同深度的井漏失數(shù)據(jù)對模型進行訓(xùn)練,模型可對不同情況下的風(fēng)險識別具有較好的泛化能力;通過現(xiàn)場數(shù)據(jù)測試,模型對不同工況下測井數(shù)據(jù)預(yù)測的平均準確率為91.5%,可綜合當前30 m的數(shù)據(jù)信息對下方井漏風(fēng)險進行實時監(jiān)測。本方法得到的結(jié)果與實際情況基本相符,具有一定的可行性,對工程中應(yīng)對井漏事故具有一定的輔助決策意義。