龐淼,雷銀,盧杭,黃琦,何仕鵬
1.中國(guó)石油西南油氣田分公司 工程技術(shù)研究院(四川 成都610017)2.中國(guó)石油西南油氣田分公司 開(kāi)發(fā)事業(yè)部(四川 成都610017)
井控安全是石油鉆井施工安全的重要保證,實(shí)踐證明在鉆完井作業(yè)過(guò)程中發(fā)生的井控風(fēng)險(xiǎn),多數(shù)是由于監(jiān)測(cè)手段不足和處理不及時(shí)造成。所以及時(shí)發(fā)現(xiàn)早期溢流是有效控制井噴保障井控安全的直接途徑[1]。
隨著大數(shù)據(jù)時(shí)代的到來(lái),企業(yè)關(guān)注的重點(diǎn)轉(zhuǎn)向數(shù)據(jù),從追求計(jì)算速度轉(zhuǎn)變?yōu)殛P(guān)注大數(shù)據(jù)處理能力,軟件也從編程為主轉(zhuǎn)變?yōu)橐詳?shù)據(jù)處理為主[2]。伴隨著大量數(shù)據(jù)的采集、傳輸、處理和應(yīng)用的技術(shù)發(fā)展,傳統(tǒng)產(chǎn)業(yè)使用非傳統(tǒng)工具來(lái)處理大量結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),從而獲得分析和預(yù)測(cè)結(jié)果的一系列數(shù)據(jù)處理技術(shù)。溢流智能化工程預(yù)警是將人工經(jīng)驗(yàn)判斷發(fā)現(xiàn)溢流轉(zhuǎn)變?yōu)橥ㄟ^(guò)數(shù)據(jù)分析預(yù)測(cè)早期溢流的一項(xiàng)技術(shù),而溢流智能化工程預(yù)警較高的誤報(bào)率,是該領(lǐng)域內(nèi)急待解決的問(wèn)題。
早期施工現(xiàn)場(chǎng),一般是通過(guò)監(jiān)測(cè)鉆井液池體積變化判斷溢流是否發(fā)生,必須有專人坐崗監(jiān)控鉆井液液位。但此方法受限于現(xiàn)場(chǎng)液面監(jiān)測(cè)儀因環(huán)境因素產(chǎn)生的誤報(bào)和錯(cuò)報(bào),因倒灌泥漿、啟停泵時(shí)的呼吸效應(yīng)等工序產(chǎn)生液面波動(dòng),起下鉆時(shí)監(jiān)測(cè)精度速度缺乏,局限于鉆井液池體積變化達(dá)到一定高度時(shí),實(shí)際溢流已經(jīng)十分嚴(yán)重,不能對(duì)微小和潛在溢流和漏失進(jìn)行預(yù)警或預(yù)警滯后。但此方法操作簡(jiǎn)單,對(duì)溢漏量相對(duì)大的情況實(shí)用性較強(qiáng)[3]。
現(xiàn)階段研究方向更多樣化,其中地面監(jiān)測(cè)方式,著重于直接監(jiān)測(cè)進(jìn)出口鉆井液流量、泵壓或立壓、出口壓力、井底壓力、錄井?dāng)?shù)據(jù)等參數(shù)微小變化,經(jīng)過(guò)軟件自動(dòng)計(jì)算判別發(fā)現(xiàn)溢流和漏失并進(jìn)行分級(jí)報(bào)警[4]。井下監(jiān)測(cè)方式,著重于直接監(jiān)測(cè)井筒內(nèi)鉆井液在溢流發(fā)生后的物理參數(shù)變化。例如聲波氣侵檢測(cè)技術(shù)[5]、隨鉆井下壓力測(cè)量技術(shù)、井筒內(nèi)鉆井液介電性監(jiān)測(cè)技術(shù)[6](圖1)、RAT井筒內(nèi)溫度監(jiān)測(cè)等[7]。探索不同的技術(shù)手段判斷和發(fā)現(xiàn)早期溢流,但此類技術(shù)在判斷溢流類型、準(zhǔn)確率以及定量測(cè)量溢流量上還不夠完善。
圖1 某介電性監(jiān)測(cè)溢流技術(shù)掃頻測(cè)量原理
隨著計(jì)算機(jī)技術(shù)、大數(shù)據(jù)處理技術(shù)高速發(fā)展,提出了智能化工程預(yù)警,其原理是將各類傳統(tǒng)或新型的檢測(cè)診斷方法融合機(jī)器學(xué)習(xí)方法,將判斷識(shí)別溢漏的單項(xiàng)或多項(xiàng)參數(shù),建立在貝葉斯模型預(yù)測(cè)(圖2)、卷積神經(jīng)網(wǎng)絡(luò)、KNN算法、回歸預(yù)測(cè)、聚類分析等機(jī)器學(xué)習(xí)算法上,以計(jì)算溢漏發(fā)生概率,提高監(jiān)測(cè)準(zhǔn)確度。此類方法是融合多學(xué)科進(jìn)一步提高監(jiān)測(cè)準(zhǔn)確度,但也有其缺點(diǎn)。比如KNN算法,需要學(xué)習(xí)分析多口鄰井,或者需要樣本質(zhì)量較高,才能在后續(xù)鉆井中發(fā)揮較好作用。若區(qū)塊地質(zhì)特征變化較大,樣本數(shù)量不多、質(zhì)量不高,算法中參考K值會(huì)不準(zhǔn)確,導(dǎo)致溢流判斷概率不準(zhǔn)確,而鄰井資料較少、地質(zhì)條件相對(duì)較復(fù)雜、投資成本較大的探井更需要高準(zhǔn)確度的溢流智能化工程預(yù)警。
圖2 一般技術(shù)中貝葉斯數(shù)學(xué)模型現(xiàn)場(chǎng)應(yīng)用原理
地層流體進(jìn)入井眼必定是地層壓力大于井底壓力,同時(shí)地層具有一定滲透性,而引發(fā)溢流一般有以下幾種情況[8]:①鉆遇異常高壓地層,地層壓力大于液柱壓力,地層流體侵入井筒引發(fā)溢流。②設(shè)計(jì)的地層壓力過(guò)低鉆井液密度過(guò)低,施工時(shí)引發(fā)地層破裂。③在井底壓力近平衡狀態(tài)時(shí)停泵,環(huán)空壓耗消失,地層流體侵入井筒引發(fā)溢流。④起下鉆時(shí),抽汲作用引發(fā)溢流。⑤起鉆時(shí)未按規(guī)定灌入鉆井液,使液面下降地層流體侵入井筒引發(fā)溢流。⑥井漏時(shí)液柱壓力失衡,地層流體侵入井筒,引發(fā)溢流。⑦鄰井實(shí)施注水開(kāi)發(fā),導(dǎo)致地層流體侵入本井。⑧其他原因。中途測(cè)試控制不好,鉆到鄰井中;以過(guò)快的速度鉆穿含氣的砂巖層,射孔時(shí)控制不住,固井時(shí)水泥失重等都可能造成井內(nèi)的靜液柱壓力不足以平衡或超過(guò)地層壓力,引發(fā)溢流。
所以有效降低溢流智能化工程預(yù)警誤報(bào)率,必須借鑒新技術(shù),運(yùn)用合適的技術(shù)監(jiān)測(cè)手段,減少技術(shù)本身局限性所帶來(lái)的誤差率,更要符合現(xiàn)場(chǎng)實(shí)際及成本控制的情況,以較小的裝備和技術(shù)升級(jí)達(dá)到盡可能大的效果。
在運(yùn)用溢流智能化工程預(yù)警中,常會(huì)發(fā)現(xiàn)各種監(jiān)測(cè)手段都可能出現(xiàn)誤報(bào)、漏報(bào)的情況,而數(shù)據(jù)來(lái)源的不準(zhǔn)確和精度差是重要原因之一。地面監(jiān)測(cè)方式、井筒內(nèi)監(jiān)測(cè)方式、智能化模型監(jiān)測(cè)方式都是通過(guò)部分鉆井參數(shù)變化或者物性變化進(jìn)行分析和深度挖掘,產(chǎn)生可靠性指標(biāo)進(jìn)行預(yù)警判斷。如果鉆井參數(shù)或者物性出現(xiàn)一些變化,最后導(dǎo)致了溢流、高套壓等情況,那么下次遇到類似情況,通過(guò)經(jīng)驗(yàn)就可以判斷是否會(huì)出現(xiàn)異常。但是如果某次經(jīng)驗(yàn)中出現(xiàn)的鉆井參數(shù)或物性變化,并不是真實(shí)的變化,而是設(shè)備儀器不真實(shí)的反映,或者人為的不知情調(diào)整,那通過(guò)經(jīng)驗(yàn)去判斷下次異常就不準(zhǔn)確了。
其次,考慮到井筒內(nèi)監(jiān)測(cè)運(yùn)用新的技術(shù)手段采集表征數(shù)據(jù),其技術(shù)實(shí)現(xiàn)難度較大、監(jiān)測(cè)成本較高、對(duì)使用其新技術(shù)維護(hù)、調(diào)校等現(xiàn)場(chǎng)專業(yè)技術(shù)人員要求也較高[9]。特別在國(guó)內(nèi)超深鉆井作業(yè)中,高溫高壓環(huán)境下井筒內(nèi)監(jiān)測(cè)方式中設(shè)備采集參數(shù)容易畸變,導(dǎo)致判斷標(biāo)準(zhǔn)偏離,誤差率提高。所以根據(jù)現(xiàn)場(chǎng)實(shí)際,合適地進(jìn)行裝備或軟硬件部分升級(jí),將地面監(jiān)測(cè)手段與人工智能數(shù)據(jù)分析結(jié)合,才符合實(shí)際行業(yè)發(fā)展的方向。
2.1.1 地面監(jiān)測(cè)數(shù)據(jù)采集流程原理
現(xiàn)階段現(xiàn)場(chǎng)錄井?dāng)?shù)據(jù)采集流程是通過(guò)傳感器的各自測(cè)量原理轉(zhuǎn)化成電信號(hào)變化,由總線傳送至綜合錄井儀器房,經(jīng)由錄井采集機(jī)100~200 ms掃描數(shù)據(jù),再由綜合錄井儀進(jìn)行數(shù)據(jù)處理,形成以井深、時(shí)間等觸發(fā)條件可調(diào)整輸出間隔的原始數(shù)據(jù)進(jìn)行存儲(chǔ),如整米數(shù)據(jù)庫(kù)、dbf時(shí)間庫(kù)等,然后通過(guò)其他傳輸渠道將數(shù)據(jù)成庫(kù)傳至指揮中心形成井筒數(shù)據(jù)。
而指揮中心收到的各種溢流、H2S漏失等異常預(yù)警的實(shí)時(shí)數(shù)據(jù)直接由現(xiàn)場(chǎng)數(shù)據(jù)以2~6 s間隔傳回指揮中心(圖3),通過(guò)軟件內(nèi)置判斷程序進(jìn)行分析判斷顯示異常預(yù)警。
圖3 工程預(yù)警實(shí)時(shí)數(shù)據(jù)傳輸間隔
2.1.2 提高傳感器精度及改進(jìn)數(shù)據(jù)采集流程
提高傳感器精度要用到的幾個(gè)原理。第一個(gè)原理是關(guān)于進(jìn)出口流量監(jiān)測(cè)的。溢流在鉆井參數(shù)表征明顯的是井筒鉆井液體積的增加,導(dǎo)致總池體積增加,然后關(guān)井起壓。所以現(xiàn)階段很多研究和實(shí)驗(yàn)也是針對(duì)進(jìn)出口流量計(jì)算的,其目的是利用流量守恒原理精確計(jì)算井筒內(nèi)介質(zhì)的質(zhì)量、密度變化,判斷是否有地層流體進(jìn)入井筒。所以現(xiàn)階段將獵裝的靶式流量計(jì)換裝成流量監(jiān)測(cè)法或者改進(jìn)流量監(jiān)測(cè)法的各類進(jìn)出口流量計(jì)去計(jì)算流量差,在控制成本、廣泛適用、抗干擾的前提下,將定性監(jiān)測(cè)轉(zhuǎn)化為定量監(jiān)測(cè)是提升精確度降低誤報(bào)率的手段之一。以更換高精度流量計(jì)監(jiān)測(cè)流量差為例,引出需要提高現(xiàn)場(chǎng)傳感器精度,而溢流的表征鉆井參數(shù)不止進(jìn)出口流量差,更多、更高精度的傳感器的架設(shè)是未來(lái)工業(yè)化和信息化深度融合的趨勢(shì)。
當(dāng)應(yīng)用高精度的定量監(jiān)測(cè)手段時(shí),必定會(huì)帶來(lái)數(shù)據(jù)體量增加、計(jì)算量增加的問(wèn)題。這要用到關(guān)于數(shù)據(jù)傳輸?shù)脑怼,F(xiàn)場(chǎng)數(shù)據(jù)通過(guò)WITS標(biāo)準(zhǔn)傳輸格式、WindowsSockets、TCPIP通訊協(xié)議等方式實(shí)現(xiàn)遠(yuǎn)程傳輸[10]?,F(xiàn)場(chǎng)傳回指揮中心的數(shù)據(jù)不僅包含實(shí)時(shí)鉆井參數(shù)、靜態(tài)數(shù)據(jù)庫(kù)還包括視頻等,當(dāng)傳感器精度成倍數(shù)性增長(zhǎng)的時(shí)候,傳回?cái)?shù)據(jù)的體量就會(huì)成指數(shù)性增長(zhǎng),所以現(xiàn)行2~6 s數(shù)據(jù)接收是不夠的。同時(shí)要用到大緩存,而當(dāng)數(shù)據(jù)量增加并傳回指揮中心時(shí),各種智能化計(jì)算和數(shù)學(xué)模型的分析量將大幅度增加,這樣大體量高算力的數(shù)據(jù)分析計(jì)算持續(xù)不斷實(shí)時(shí)進(jìn)行。所以在信息化進(jìn)程中,指揮中心是否要建設(shè)一個(gè)高算力的超算中心以支持現(xiàn)場(chǎng)鉆井各項(xiàng)表征參數(shù)的計(jì)算分析(包括智能化工程預(yù)警),或者也可以將算力分?jǐn)偟矫總€(gè)施工現(xiàn)場(chǎng),在現(xiàn)場(chǎng)布置一臺(tái)足夠算力的計(jì)算平臺(tái)。同時(shí)整合綜合錄井儀采集的不同數(shù)據(jù)制式,將現(xiàn)場(chǎng)直接計(jì)算分析出的結(jié)果進(jìn)行預(yù)警判斷傳回指揮中心(圖4)。
圖4 現(xiàn)行數(shù)據(jù)來(lái)源及提高準(zhǔn)確度后可行的數(shù)據(jù)采集流程
而現(xiàn)階段現(xiàn)場(chǎng)應(yīng)用的綜合錄井儀大部分是較老的工業(yè)計(jì)算機(jī),如果換裝高精度傳感器,其計(jì)算能力遠(yuǎn)遠(yuǎn)不夠。這也是現(xiàn)階段雖然指揮中心有比較先進(jìn)計(jì)算能力的集群,但現(xiàn)場(chǎng)因采集機(jī)較老,數(shù)據(jù)量一旦過(guò)大容易卡頓死機(jī),無(wú)法實(shí)時(shí)傳回靜態(tài)、動(dòng)態(tài)及視頻數(shù)據(jù),只能降低傳輸要求保證數(shù)據(jù)傳輸基本正常。
機(jī)器學(xué)習(xí)算法,是溢流智能化工程預(yù)警的核心,智能化預(yù)警是建立在通過(guò)鉆井表征參數(shù)在各種算法上取得較為準(zhǔn)確預(yù)測(cè)判斷結(jié)果。其各類檢測(cè)手段和數(shù)據(jù)分析方法的融合運(yùn)用數(shù)學(xué)方法進(jìn)行篩選判斷,保證結(jié)果的準(zhǔn)確性,所以使用貝葉斯預(yù)測(cè)、Logistic回歸、深度學(xué)習(xí)卷積神經(jīng)、模糊聚類、趨勢(shì)擬合等統(tǒng)計(jì)分析方法,從理論上都有提高準(zhǔn)確率的效果。如何不斷提高準(zhǔn)確率的方法是選擇合適的算法。
2.2.1 幾種機(jī)器學(xué)習(xí)算法概念及優(yōu)缺點(diǎn)
機(jī)器學(xué)習(xí)算法有很多種,在人工神經(jīng)網(wǎng)絡(luò)機(jī)器算法中就有幾百種分支算法,這里僅列出幾種算法優(yōu)缺點(diǎn)(表1),以體現(xiàn)算法可以針對(duì)的不同類型。
表1 部分機(jī)器學(xué)習(xí)算法優(yōu)缺點(diǎn)
貝葉斯算法,原理是利用各個(gè)類別的先驗(yàn)概率,再利用貝葉斯公式及獨(dú)立性假設(shè)計(jì)算出屬性的類別概率以及對(duì)象的后驗(yàn)概率,即該對(duì)象屬于某一類的概率,選擇具有最大后驗(yàn)概率的類作為該對(duì)象所屬的類別。
KNN鄰近算法,又稱K最近鄰分類算法是數(shù)據(jù)挖掘分類技術(shù)中最簡(jiǎn)單的方法之一。其原理是通過(guò)選取樣本值,將新數(shù)據(jù)與樣本值進(jìn)行比較找最佳匹配,即計(jì)算新數(shù)據(jù)與類別中心的距離。其具有精度高、對(duì)異常值不敏感、無(wú)數(shù)據(jù)輸入假定、簡(jiǎn)單有效的特點(diǎn),適合小量且精度要求不高的數(shù)據(jù)(圖5)。
圖5 KNN算法概圖
隨機(jī)森林算法,是一個(gè)包含多個(gè)決策樹(shù)的分類啟發(fā)式算法,以每個(gè)節(jié)點(diǎn)的特征增益準(zhǔn)則來(lái)選取特征,進(jìn)而遞歸地構(gòu)造決策樹(shù),輸出判斷的類別是由個(gè)別樹(shù)輸出的類別的眾數(shù)而定,代表的是對(duì)象屬性與對(duì)象值之間的一種映射關(guān)系,是一種易于理解、對(duì)中間值缺失不敏感、可以處理不相關(guān)特征數(shù)據(jù)的算法(圖6)。
圖6 隨機(jī)森林算法概圖
人工神經(jīng)網(wǎng)絡(luò)算法,是模擬生物神經(jīng)網(wǎng)絡(luò),解決分類和回歸問(wèn)題,是由大量的節(jié)點(diǎn)聯(lián)接構(gòu)成,每個(gè)節(jié)點(diǎn)代表一種特定的輸出函數(shù)。通過(guò)類神經(jīng)元的加權(quán)互連并行運(yùn)算出結(jié)果,它具有對(duì)噪聲和不完整的數(shù)據(jù)很高的耐受性(圖7)。
圖7 人工神經(jīng)網(wǎng)絡(luò)算法概圖
2.2.2 算法選擇和特征選擇
溢流智能化工程預(yù)警,目的是能在最短的時(shí)間內(nèi)發(fā)現(xiàn)早期溢流,所以在選擇算法上,其計(jì)算的時(shí)間不宜過(guò)長(zhǎng)??紤]到樣本的質(zhì)量、數(shù)量以及算法的泛化性問(wèn)題,部分算法只需要少量樣本,另一些則需要大量樣本,而某些算法只能處理特定類型的數(shù)據(jù),比如樸素貝葉斯算法與分類數(shù)據(jù)就很合適,而對(duì)缺失的數(shù)據(jù)不敏感。而樹(shù)模型對(duì)異常值的存在不太敏感,但是回歸模型或任何嘗試使用等式的模型會(huì)受到異常值的影響。同時(shí)選擇某算法要考慮泛化性、范圍和地質(zhì)條件以及受限的因素。比如水平井和超深井井型的不同是否會(huì)影響算法提取的鉆井特征參數(shù),導(dǎo)致算法判斷精度下降,都是算法選擇上要考慮的問(wèn)題。
在算法選擇后,就是對(duì)相應(yīng)鉆井參數(shù)的提取形成特征,最后形成目標(biāo)函數(shù),現(xiàn)階段在綜合錄井儀上直接采集測(cè)量的約22個(gè)參數(shù),通過(guò)相關(guān)計(jì)算間接測(cè)量得到100多個(gè)參數(shù),而工程異常表征較明顯的鉆井參數(shù)12個(gè)左右。如果只依靠一個(gè)準(zhǔn)確的表征參數(shù)進(jìn)行分析判斷其中一種工程異常,也有可能得到實(shí)踐證明較為準(zhǔn)確的預(yù)測(cè)結(jié)果。異常分類原理是在鉆井施工過(guò)程中鉆井參數(shù)的變化反映井下施工情況,但異常出現(xiàn)后由鉆井參數(shù)反映出來(lái)的時(shí)間不同,所以有慢漂型故障(如鉆頭泥包、井漏、井涌、井眼狀況惡化等)[11]。而另一些工程異??赡転槊}沖型故障(如鉆具突然斷裂或刺漏,井壁坍塌、鉆頭牙輪突然卡死等)。對(duì)慢漂型故障,一般不能由短時(shí)間內(nèi)的鉆井表征參數(shù)代入算法判斷,需要對(duì)一定時(shí)間段內(nèi)的鉆井參數(shù)或者間接計(jì)算出的參數(shù)進(jìn)行分析,代入算法確定其變化趨勢(shì)和參數(shù)特征,才能判斷是否發(fā)生工程異常。而對(duì)脈沖型故障,鉆井參數(shù)一般反應(yīng)比較劇烈,提取的參數(shù)特征時(shí)間段不能過(guò)長(zhǎng),不然不能及時(shí)預(yù)警已發(fā)生的工程異常。對(duì)脈沖型異常需要機(jī)器算法對(duì)特征變化比較敏感,而對(duì)慢漂型的異常需要注意算法不能過(guò)擬合[12]。比如溢流發(fā)生時(shí),有些鉆井參數(shù)特征表現(xiàn)趨勢(shì)可能不是絕對(duì)向量,比如泵壓、黏度、出口返漿。
正確選擇數(shù)據(jù)的特征,需要將不同的工程異常類型所需要的鉆井參數(shù),提取不一樣的特征代入不同的異常機(jī)器算法中進(jìn)行數(shù)據(jù)處理。立壓參數(shù)在不同工程異常類型比如微井漏和斷鉆具上反應(yīng)特征不一樣,就提取不同的特征代入不同的機(jī)器算法中進(jìn)行處理。因?yàn)檫x取某項(xiàng)或幾項(xiàng)鉆井參數(shù)去預(yù)測(cè)工程異常時(shí),選取的鉆井參數(shù)特征是形成目標(biāo)函數(shù)的來(lái)源,描述了想要預(yù)測(cè)或識(shí)別的現(xiàn)象的某些方面。
因此有效地提高智能化工程預(yù)警異常的準(zhǔn)確率,在算法選擇和特征選擇上,需要明確要取得的目標(biāo)函數(shù)是由哪些鉆井參數(shù)計(jì)算出的。只依靠數(shù)據(jù)分析處理師和軟件編程師,將已有的某些高級(jí)機(jī)器學(xué)習(xí)算法代入到智能化預(yù)警中,利用某些樣本測(cè)試準(zhǔn)確度證明其可以應(yīng)用到某區(qū)域是不科學(xué)的,需要專業(yè)的工程技術(shù)人員和數(shù)據(jù)分析處理師在建模時(shí)加強(qiáng)交流,量身為區(qū)塊打造合適的監(jiān)測(cè)判斷模型,將多因數(shù)考慮其中,并在清洗數(shù)據(jù)階段將異常數(shù)據(jù)識(shí)別、缺失數(shù)據(jù)修復(fù)或者影響程度的解決辦法都考量進(jìn)去,才形成精準(zhǔn)的數(shù)據(jù)流,然后通過(guò)類似AdaBoost迭代優(yōu)化算法,將不同算法形成的輸出結(jié)果再次進(jìn)行加權(quán)分類計(jì)算,形成精確的輸出結(jié)果。
影響溢流智能化工程預(yù)警準(zhǔn)確率的另一個(gè)重要因素是工況誤差。溢流可能發(fā)生于各種工況下,而其鉆井參數(shù)的波動(dòng)和變化不一樣,所以在運(yùn)用機(jī)器學(xué)習(xí)算法提取鉆井參數(shù)特征時(shí),工況引起的部分特征失真不能忽視。例如,正常鉆進(jìn)時(shí)發(fā)生微溢流恰巧在倒罐,此時(shí)如果選取池體積變化作為參數(shù)組合出特征代入算法,將導(dǎo)致算法偏移出現(xiàn)誤報(bào)漏報(bào)。所以工況帶來(lái)誤差并不像區(qū)域地質(zhì)變化導(dǎo)致的算法偏差,可以減小區(qū)域應(yīng)用范圍,降低算法泛化性,在地質(zhì)變化較大的領(lǐng)近區(qū)域調(diào)整算法權(quán)重或部分節(jié)點(diǎn)值進(jìn)行修正。要盡可能接近真實(shí)工況,減少不準(zhǔn)確工況帶來(lái)的參數(shù)特征失真而導(dǎo)致算法輸出結(jié)果偏差。
準(zhǔn)確識(shí)別鉆井工況,除了人工判斷修正數(shù)據(jù)外,也有相關(guān)研究提出的純數(shù)據(jù)驅(qū)動(dòng)方法,利用支持向量機(jī)識(shí)別鉆井工況[13-14],在允許有一定的波動(dòng)情況下,消除人員對(duì)鉆井工況識(shí)別的影響,通過(guò)優(yōu)選和交叉驗(yàn)證逐步優(yōu)化工況識(shí)別準(zhǔn)確度。
國(guó)內(nèi)外運(yùn)用大數(shù)據(jù)和機(jī)器學(xué)習(xí)對(duì)鉆井故障及溢流監(jiān)測(cè)研究,取得一定應(yīng)用效果,分析總結(jié)實(shí)際生產(chǎn)中降低溢流智能化工程預(yù)警誤報(bào)率可行方法如下:
1)從現(xiàn)場(chǎng)實(shí)際情況出發(fā),在考慮成本和廣泛性應(yīng)用前提下,建議在井下監(jiān)測(cè)和地面監(jiān)測(cè)手段中加強(qiáng)地面監(jiān)測(cè)手段,更換更高精度的傳感器。
2)建設(shè)一個(gè)高算力的超算中心以支持現(xiàn)場(chǎng)采集到的大體量鉆井參數(shù)的算法并行計(jì)算、數(shù)據(jù)清洗以及大緩存等,或者在每個(gè)現(xiàn)場(chǎng)布置一臺(tái)有足夠運(yùn)算能力的分布式計(jì)算平臺(tái);同時(shí)整合綜合錄井儀采集的不同數(shù)據(jù)傳輸制式,形成分布式處理技術(shù)匯集指揮中心。
3)將已有的某些高級(jí)機(jī)器學(xué)習(xí)算法代入到智能化預(yù)警中,利用某些樣本測(cè)試準(zhǔn)確度證明其可行性。同時(shí)建立從算法建模初期到數(shù)據(jù)清洗階段,將異常數(shù)據(jù)識(shí)別、缺失數(shù)據(jù)修復(fù)或者影響因素、影響程度的解決辦法與算法原理結(jié)合考量;工程技術(shù)人員與數(shù)據(jù)分析處理師量身為區(qū)塊打造合適的監(jiān)測(cè)判斷模型,通過(guò)已知的迭代優(yōu)化算法不斷調(diào)整,達(dá)到預(yù)期精確度。
4)在算法選擇和參數(shù)特征選取上需考慮工程技術(shù)過(guò)程以及算法本身原理的受限性,建議針對(duì)單個(gè)工程異常并行多個(gè)特征算法提高精確度。
5)用智能化或其他辦法在數(shù)據(jù)特征代入模型前,識(shí)別還原真實(shí)工況,減少工況帶來(lái)的參數(shù)特征失真而導(dǎo)致的算法輸出結(jié)果偏差。