甘 超,曹衛(wèi)華*,王魯朝,吳 敏
(1.中國地質(zhì)大學(xué)(武漢)自動化學(xué)院,湖北 武漢 430074;2.復(fù)雜系統(tǒng)先進(jìn)控制與智能自動化湖北省重點實驗室,湖北 武漢 430074;3.地球探測智能化技術(shù)教育部工程研究中心,湖北 武漢 430074;4.山東省第三地質(zhì)礦產(chǎn)勘查院,山東 煙臺 264000)
深部地質(zhì)鉆探鉆進(jìn)過程中遇到的地層層位多、壓力體系復(fù)雜,具有高地溫、高地應(yīng)力、高陡構(gòu)造和鉆進(jìn)擾動的復(fù)雜地質(zhì)力學(xué)環(huán)境[1-5]。受地層環(huán)境、鉆進(jìn)工藝、傳感元件等多種因素綜合影響,在深部地質(zhì)鉆探鉆進(jìn)過程中采集的各類數(shù)據(jù)常具有尖峰和毛刺等噪聲[6-9]、數(shù)據(jù)價值密度低,給進(jìn)一步分析和利用數(shù)據(jù)提升深部地質(zhì)鉆探的安全性和效率帶來較大困難。因此,深入地分析與預(yù)處理深部地質(zhì)鉆探鉆進(jìn)過程的流式大數(shù)據(jù)對提升數(shù)據(jù)質(zhì)量、實現(xiàn)安全高效深部鉆探具有重要的科學(xué)與工程意義。
通常,分析與預(yù)處理深部地質(zhì)鉆探鉆進(jìn)過程數(shù)據(jù)的方法可以分為2 類。一類是將過程數(shù)據(jù)收集齊后再統(tǒng)一分析與預(yù)處理的靜態(tài)法;另一類則是在鉆進(jìn)過程中“邊鉆邊分析與預(yù)處理”的動態(tài)法。本文主要基于后一類方法開展研究。
許多學(xué)者運用靜態(tài)法對鉆進(jìn)過程數(shù)據(jù)展開了大量研究[10-13],在分析數(shù)據(jù)分布特征、去除數(shù)據(jù)噪聲等方面取得一定成效。作者[8]整理了湖北省神農(nóng)架林區(qū)某口地?zé)峋你@進(jìn)過程數(shù)據(jù),首先通過頻譜分析和互信息分析方法,確定了數(shù)據(jù)存在尖峰與毛刺、以及高低頻噪聲并存等特點;然后使用小波濾波方法有效提升了鉆進(jìn)過程數(shù)據(jù)質(zhì)量。伊朗阿米爾卡比爾理工大學(xué)Ashrafi 等[10]收集了伊朗西南部馬倫油田一口直井的1000 組鉆進(jìn)過程數(shù)據(jù),并采用Savitzky Golay(SG)濾波方法有效降低數(shù)據(jù)噪聲。此外,成都理工大學(xué)李謙等[13]對中國南海10 口井的鉆進(jìn)過程數(shù)據(jù)進(jìn)行了分析和處理,通過數(shù)據(jù)清洗、缺失值補充、錯誤值刪除等方法,確定了20000 多組有效的鉆進(jìn)過程數(shù)據(jù)。這類方法是對鉆進(jìn)過程數(shù)據(jù)開展的鉆后分析與處理,雖然能夠為分析數(shù)據(jù)分布和去除數(shù)據(jù)噪聲提供參考,但是無法直接運用于鉆中對動態(tài)流式大數(shù)據(jù)進(jìn)行分析與處理。
為克服靜態(tài)法在處理動態(tài)流式鉆進(jìn)過程數(shù)據(jù)時的不足,部分學(xué)者開展了動態(tài)法的研究,并應(yīng)用于實際鉆進(jìn)過程。范海鵬等[2]綜合運用限幅濾波和滑動窗口策略,有效去除了鉆進(jìn)過程數(shù)據(jù)中的離群值,為后續(xù)開展鉆進(jìn)過程的建模與優(yōu)化控制研究奠定了良好的數(shù)據(jù)質(zhì)量基礎(chǔ),工程應(yīng)用結(jié)果證明了所提方法的有效性。韓國科學(xué)技術(shù)聯(lián)合大學(xué)院大學(xué)DIAZ等[14]采集了一口4000 m 地?zé)峋@進(jìn)過程數(shù)據(jù)并模擬在線鉆進(jìn)過程,先后運用快速傅里葉變換和滑動窗口策略實現(xiàn)了鉆速等鉆進(jìn)過程數(shù)據(jù)的在線預(yù)處理。動態(tài)法常將各類濾波方法與滑動窗口策略等流式大數(shù)據(jù)處理方法相結(jié)合,從而實現(xiàn)鉆進(jìn)過程流式大數(shù)據(jù)的分析與預(yù)處理。但是深部地質(zhì)鉆探鉆進(jìn)過程地層情況復(fù)雜,過程數(shù)據(jù)噪聲大,如何有效地分析與預(yù)處理深部地質(zhì)鉆探鉆進(jìn)過程流式大數(shù)據(jù)仍是亟待解決的難題。
針對上述難點,本文提出了一種深部地質(zhì)鉆探鉆進(jìn)過程流式大數(shù)據(jù)分析與動態(tài)預(yù)處理方法,優(yōu)勢之處在于:
(1)針對深部地質(zhì)鉆探鉆進(jìn)過程數(shù)據(jù)突變明顯、高低頻噪聲并存等特點,綜合運用限幅濾波、滑動窗口策略、SG 濾波方法,有效去除了鉆進(jìn)過程流式大數(shù)據(jù)中存在的尖峰與毛刺;
(2)相比其他鉆進(jìn)過程數(shù)據(jù)分析與靜態(tài)處理方法,本文方法運算速度快、能在線運行,滿足實際工程需要;
(3)本文方法極大地提高了深部地質(zhì)鉆探鉆進(jìn)過程數(shù)據(jù)質(zhì)量,為進(jìn)一步利用數(shù)據(jù)實現(xiàn)深部地質(zhì)鉆探鉆進(jìn)過程建模與優(yōu)化控制奠定了重要基礎(chǔ)。
深部地質(zhì)鉆探鉆進(jìn)過程流式大數(shù)據(jù)分析與預(yù)處理框架如圖1 所示??蚣馨? 層,分別是基礎(chǔ)自動化層和深部地質(zhì)鉆探鉆進(jìn)過程流式大數(shù)據(jù)分析與預(yù)處理層。2 層結(jié)構(gòu)可以各自完成相應(yīng)功能,并實現(xiàn)雙向通訊。
圖1 深部地質(zhì)鉆探鉆進(jìn)過程流式大數(shù)據(jù)分析與預(yù)處理框架Fig.1 Framework of streaming big data analysis and pre-processing in deep geological drilling process
基礎(chǔ)自動化層主要完成回轉(zhuǎn)控制系統(tǒng)、進(jìn)給控制系統(tǒng)和循環(huán)控制系統(tǒng)等的過程參數(shù)采集和變頻控制,從而實現(xiàn)旋轉(zhuǎn)鉆進(jìn)、起下鉆等基本功能。深部地質(zhì)鉆探鉆進(jìn)過程流式大數(shù)據(jù)分析與預(yù)處理層是在已有基礎(chǔ)自動化層的基礎(chǔ)之上開發(fā)的一套軟硬件系統(tǒng)(圖2),它是由中國地質(zhì)大學(xué)(武漢)自動化學(xué)院研究團隊開發(fā)的復(fù)雜地質(zhì)鉆進(jìn)過程智能控制系統(tǒng)的一套子系統(tǒng)。系統(tǒng)軟件指深部地質(zhì)鉆探鉆進(jìn)過程流式大數(shù)據(jù)分析與預(yù)處理軟件,首先通過限幅濾波去除掉鉆進(jìn)過程數(shù)據(jù)中的離群值,接著采用滑動窗口策略將過程數(shù)據(jù)裝載入動態(tài)滑動的窗口,然后對窗口中的過程數(shù)據(jù)進(jìn)行SG 濾波處理,最終實現(xiàn)了深部地質(zhì)鉆探鉆進(jìn)過程流式大數(shù)據(jù)的分析與動態(tài)預(yù)處理。系統(tǒng)硬件主要包括:工業(yè)控制計算機(工控機)、觸摸屏、專用通訊接口和線纜;工控機及其搭載的深部地質(zhì)鉆探鉆進(jìn)過程流式大數(shù)據(jù)分析與預(yù)處理軟件放置在電控房內(nèi),它通過用于過程控制的對象鏈接和嵌入OPC(OLE for Process Control)協(xié)議與基礎(chǔ)自動化層的可編程邏輯控制器(Programmable Logic Controller,PLC)進(jìn)行通訊,獲取鉆進(jìn)過程數(shù)據(jù)并將經(jīng)過分析與預(yù)處理后,再進(jìn)一步將計算得到的最優(yōu)鉆進(jìn)操作參數(shù)下發(fā)給基礎(chǔ)自動化層進(jìn)行跟蹤控制。司鉆房中的觸摸屏與電控房中的工控機相連,主要用于顯示處理前后的鉆進(jìn)過程參數(shù)和最優(yōu)鉆進(jìn)操作參數(shù)供司鉆人員參考,且具有最優(yōu)鉆進(jìn)操作參數(shù)設(shè)定的功能。
圖2 深部地質(zhì)鉆探鉆進(jìn)過程流式大數(shù)據(jù)分析與預(yù)處理系統(tǒng)與工程現(xiàn)場情況Fig.2 System of streaming big data analysis and pre-processing in deep geological drilling process,and drilling site situation
基于圖1 的框架結(jié)構(gòu),深部地質(zhì)鉆探鉆進(jìn)過程流式大數(shù)據(jù)分析與預(yù)處理方法包括3 部分內(nèi)容。
深部地質(zhì)鉆探鉆進(jìn)過程采集的數(shù)據(jù)受地層、工藝、傳感器等多因素影響,存在大量離群值。如果不能有效處理這些離群值,則不利于后續(xù)開展鉆進(jìn)過程建模與優(yōu)化控制研究。通常,在實際工程中一般會結(jié)合過程數(shù)據(jù)分布特征、司鉆/機長人工操作經(jīng)驗來確定限幅濾波閾值。
在深部地質(zhì)鉆探鉆進(jìn)過程中會采集鉆壓、鉤載、鉆速、轉(zhuǎn)速、扭矩等核心參數(shù),這些參數(shù)的采樣頻率一般是1 Hz。以一口3000 m 的深部地質(zhì)鉆探工程來看,工程周期往往長達(dá)數(shù)月甚至超過1 年,在這過程中會采集上千萬組的鉆進(jìn)過程流式大數(shù)據(jù)。如果采用傳統(tǒng)靜態(tài)法或動態(tài)累積式方法進(jìn)行分析與預(yù)處理,會使得計算時間隨著數(shù)據(jù)的積累越來越長,不適用于對實時采集的流式大數(shù)據(jù)進(jìn)行分析與預(yù)處理。采用滑動窗口策略則可以將采集的過程數(shù)據(jù)放入數(shù)據(jù)窗口,在窗口中對有限的過程數(shù)據(jù)進(jìn)行分析與處理,加快處理速度適應(yīng)實時計算需求,并通過窗口滑動的形式實現(xiàn)動態(tài)流式大數(shù)據(jù)的迭代計算?;瑒哟翱诓呗灾谢瑒哟翱趯挾群突瑒泳嚯x對處理效果有一定影響,需要具體分析后確定。
SG 濾 波[15]是1964 年 由Savitzky 和Golay 提 出的時域內(nèi)基于多項式最小二乘擬合的濾波方法,該方法可以提高數(shù)據(jù)平滑性、降低數(shù)據(jù)噪聲的干擾。SG 濾波中有2 個核心參數(shù),影響著濾波的效果,分別是多項式的階數(shù)與滑動窗口的寬度。多項式階數(shù)越大時,擬合精度越高,但是泛化性能越低,反之亦然;滑動窗口寬度越小時,濾波前后數(shù)據(jù)相差的數(shù)值越小,反之亦然。
上述方法中限幅濾波閾值、滑動窗口寬度、滑動距離、多項式階數(shù)等核心參數(shù)的合理選擇,直接關(guān)系到深部地質(zhì)鉆探鉆進(jìn)過程流式大數(shù)據(jù)分析與預(yù)處理方法的表現(xiàn)。因此,需要開展仿真實驗,對實驗結(jié)果進(jìn)行分析,并確定上述核心參數(shù),然后在此基礎(chǔ)上再開展工程應(yīng)用實踐。
首先采集來自遼寧丹東3000 m 科學(xué)鉆探工程的鉆進(jìn)過程數(shù)據(jù),開展仿真實驗分析,確定第2 章中相關(guān)方法的核心參數(shù);然后再將本文方法應(yīng)用于遼寧丹東3000 m 科學(xué)鉆探工程(圖2),具體情況如下。
本節(jié)選取從遼寧丹東3000 m 科學(xué)鉆探工程采集得到的80 萬組五維(鉆壓、鉤載、鉆速、轉(zhuǎn)速、扭矩)鉆進(jìn)過程原始數(shù)據(jù)進(jìn)行仿真實驗。部分原始數(shù)據(jù)的最大值、最小值、平均值和標(biāo)準(zhǔn)差統(tǒng)計如表1所示。
表1 遼寧丹東3000 m 科學(xué)鉆探工程部分原始數(shù)據(jù)統(tǒng)計Table 1 Some raw data of 3000m scientific drilling project in Dandong,Liaoning province
根據(jù)表1 數(shù)據(jù)分析可知,深部地質(zhì)鉆探鉆進(jìn)過程數(shù)據(jù)存在大量離群值,運用核密度估計法對上述數(shù)據(jù)的分布情況進(jìn)行計算,得到如圖3 所示的遼寧丹東3000 m 科學(xué)鉆探工程部分原始數(shù)據(jù)概率密度估計??梢钥闯鰯?shù)據(jù)呈非高斯分布,數(shù)據(jù)分布離散,對應(yīng)的數(shù)據(jù)概率密度估計值低。
圖3 遼寧丹東3000 m 科學(xué)鉆探工程部分原始數(shù)據(jù)概率密度估計Fig.3 Density estimation of some raw data of 3000m scientific drilling project in Dandong,Liaoning province
運用本文方法對圖3 中的原始數(shù)據(jù)進(jìn)行處理,結(jié)合過程數(shù)據(jù)分布特征、司鉆/機長人工操作經(jīng)驗以及試湊法得到本文方法中的核心參數(shù)取值,獲得處理后的遼寧丹東3000 m 科學(xué)鉆探工程部分?jǐn)?shù)據(jù)概率密度統(tǒng)計如圖4 所示??梢悦黠@看出,經(jīng)過本文方法分析與預(yù)處理后的過程數(shù)據(jù)分布更加集中,去除了數(shù)據(jù)中存在的尖峰和毛刺,處理后數(shù)據(jù)的概率密度估計值相比原始數(shù)據(jù)要大許多,且近似符合高斯分布,提升了深部地質(zhì)鉆探鉆進(jìn)過程數(shù)據(jù)質(zhì)量,為本文方法的工程應(yīng)用奠定了重要基礎(chǔ)。
圖4 遼寧丹東3000 m 科學(xué)鉆探工程部分處理后數(shù)據(jù)概率密度估計Fig.4 Density estimation of pre-processed data of 3000m scientific drilling project in Dandong,Liaoning province
當(dāng)深部地質(zhì)鉆探鉆進(jìn)過程流式大數(shù)據(jù)分析與動態(tài)預(yù)處理系統(tǒng)在現(xiàn)場穩(wěn)定運行一段時間,并征得領(lǐng)導(dǎo)專家和現(xiàn)場工程技術(shù)人員的同意后,我們自2021年10 月9 日起對系統(tǒng)進(jìn)行了工程應(yīng)用(圖2),并已在遼寧丹東3000 m 科學(xué)鉆探工程現(xiàn)場穩(wěn)定工作超半年時間。
將本文方法與限幅濾波結(jié)合滑動窗口的方法對比,得到如圖5 所示的部分工程應(yīng)用結(jié)果。圖5 是某一時刻數(shù)據(jù)窗口中濾波效果的對比,可以分析得知本文方法進(jìn)一步去除了深部地質(zhì)鉆探鉆進(jìn)過程數(shù)據(jù)的噪聲,提升了過程數(shù)據(jù)質(zhì)量。特別的是,本文方法在對相對變化幅度較大的鉆速和扭矩的處理方面,表現(xiàn)出明顯優(yōu)勢。
圖5 部分工程應(yīng)用結(jié)果Fig.5 Some results of industrial application
鉆速作為表征鉆進(jìn)過程效率的關(guān)鍵指標(biāo),由于受到地層條件、鉆進(jìn)工藝等不同因素影響,它在工程應(yīng)用井段具體表現(xiàn)為在0~4 cm/min 之間跳變,如果不能很好地對鉆速數(shù)據(jù)進(jìn)行分析與預(yù)處理,將不利于高精度預(yù)測鉆速進(jìn)而實現(xiàn)鉆速優(yōu)化[7-8]。在圖5中的鉆速子圖里,紅色曲線是運用本文所提方法的工程應(yīng)用結(jié)果,可以看出所提方法有效地去除了鉆速數(shù)據(jù)中的尖峰與毛刺。此外,扭矩是鉆進(jìn)過程的另一個核心參數(shù),主要反映過程的安全性。它在工程應(yīng)用井段具體表現(xiàn)為在500~2000 N·m 之間變化。通過圖5 扭矩子圖的紅色曲線,可以看出本文所提方法能夠很好地抑制扭矩數(shù)據(jù)的異常突變。工程應(yīng)用結(jié)果表明,本文所提方法有效提升了深部地質(zhì)鉆探鉆進(jìn)過程數(shù)據(jù)的價值密度。
針對深部地質(zhì)鉆探鉆進(jìn)過程地層條件復(fù)雜、數(shù)據(jù)價值密度低,傳統(tǒng)數(shù)據(jù)分析與預(yù)處理方法難以在保證噪聲濾波效果的同時兼顧實時計算速度的問題。本文提出了一種深部地質(zhì)鉆探鉆進(jìn)過程流式大數(shù)據(jù)分析與動態(tài)預(yù)處理方法,并成功應(yīng)用于遼寧丹東3000 m 科學(xué)鉆探工程。本文方法能夠在線處理深部地質(zhì)鉆探鉆進(jìn)過程流式大數(shù)據(jù),去除數(shù)據(jù)中的尖峰與毛刺。方法的工程適用性和有效性在仿真實驗和工程應(yīng)用中都得到了驗證。
將來,深部地質(zhì)鉆探鉆進(jìn)過程流式大數(shù)據(jù)分析與動態(tài)預(yù)處理方法會在工程實踐中不斷更新與完善。