中圖分類號(hào):TE933文獻(xiàn)標(biāo)識(shí)碼:ADOI:10.12473/CPM.202405015
Jiang Minzheng,Zhang Qi,Wang Xinmin,et al.Pump detection period prediction of pumping well using blending ensemble model [J].China Petroleum Machinery,2025,53(5):10-17.
Pump Detection Period Prediction of Pumping Well Using Blending Ensemble Model
Jiang Minzheng'Zhang Qi1Wang Xinmin2Meng Bo'Zhou Yufeng1Dong Kangxing' (1.SchlofMechnicalScienceandEnginering,NorthstPetroemUniersity;aqngOilfeldProductionTecholoIsiute)
Abstract:A single model for predicting the pump detection period of pumping well is low in stability and accuracy.For improved prediction accuracy,a Blending ensemble model was proposed by efectively combining RF, GBDT,XGBoost and LightGBM algorithms.The LOF isolation detection method and normalization were used to preprocess the historical pump detection data from a block of Daqing Oilfield.A tree model based feature fusion screening method was used to screen out the main influencing parameters,and each of the above-mentioned four algorithms was compared with the Blending ensemble model forthe prediction accuracy.Finally,15O sets of new pump detection data were used to verify the prediction accuracy and generalization performance of the Blending ensemble model.The results show that the Blending ensemble model yields a greatly improved performance,with a goodness offit determination coefficient of 0.954.The model verificationusing 15O sets of new pump detection data demonstrates the goodnessof fit determination coeffcient of 0.947.Thus,the Blending ensemble method is verified effective and feasible.The research results provide reference for the production and management of oilfields.
Keywords:pump detection period prediction;Blending ensemble model; normalization;parameter optimization;field verification
0引言
有桿泵開采是目前世界上使用最普遍的一種采油方式,在中國使用有桿泵開采的井約占總井?dāng)?shù)的90%[1] 。抽油機(jī)在運(yùn)行過程中,由于受到負(fù)載、腐蝕、井下工作環(huán)境等多種因素的影響,會(huì)出現(xiàn)偏磨、卡泵和疲勞破壞等現(xiàn)象。檢泵周期的合理預(yù)測(cè)可以減小抽油機(jī)井的故障發(fā)生率,提高油田生產(chǎn)效率[2-6] O
周平等分別創(chuàng)建了在偏磨情況下沖次、沖程、每日的產(chǎn)液量、含水體積分?jǐn)?shù)的變化和檢泵周期的一元回歸方程,并創(chuàng)建了在這幾個(gè)因素同時(shí)作用下檢泵周期變化的多元回歸表達(dá)式。張戰(zhàn)敏[8]使用檢泵周期可靠性預(yù)測(cè)模型,構(gòu)建了抽油機(jī)桿管泵系統(tǒng)失效的風(fēng)險(xiǎn)系數(shù),由此可以判斷不同區(qū)域的檢泵風(fēng)險(xiǎn)級(jí)別,但無法確定抽油機(jī)井的檢泵周期。孟令凱通過靜力平衡理論、能量磨損理論建立桿管磨損量的計(jì)算模型,實(shí)現(xiàn)聚驅(qū)井桿柱螺旋屈曲狀態(tài)和桿管接觸壓力的仿真計(jì)算,分析各影響因素對(duì)法向力的作用,實(shí)現(xiàn)聚驅(qū)井桿管偏磨壽命的預(yù)測(cè),但未考慮水驅(qū)、三元驅(qū)情況下桿管偏磨情況。封海兵[10]選擇了擴(kuò)展Kalman算法和神經(jīng)網(wǎng)絡(luò)相結(jié)合的方法,采用有序加權(quán)平均算法,建立了基于OWA算子的Pareto決策模型,以確定抽油機(jī)井生產(chǎn)參數(shù)最優(yōu)解,獲得最優(yōu)方案,但模型需要大量的數(shù)據(jù)提供支持,無法適用于小樣本數(shù)據(jù)。趙巖龍等[11]選用機(jī)器學(xué)習(xí)中的長短時(shí)記憶網(wǎng)絡(luò)(LongShort-TermMemory,LSTM),根據(jù)油田提供的數(shù)據(jù),篩選出導(dǎo)致抽油桿腐蝕的15個(gè)主控因素,構(gòu)建基于LSTM的抽油桿剩余使用壽命預(yù)測(cè)模型,再通過模型參數(shù)優(yōu)化,實(shí)現(xiàn)檢泵周期的預(yù)測(cè),但模型只適合抽油桿,并未考慮抽油泵、油管等情況。張曉東等[2使用一種基于特征融合抽油機(jī)井檢泵周期預(yù)測(cè)方法,引入多模態(tài)壓縮雙線池化對(duì)靜態(tài)特征和動(dòng)態(tài)特征進(jìn)行融合,利用判別模型訓(xùn)練融合特征實(shí)現(xiàn)檢泵周期的準(zhǔn)確預(yù)測(cè),但模型參數(shù)并未優(yōu)化,精度亟待提高。目前,利用回歸分析方法來預(yù)測(cè)抽油機(jī)井檢泵周期是一種基于數(shù)學(xué)原理的方法,需要理論依據(jù)來支持這一過程,且預(yù)測(cè)精度較低。通過單一的機(jī)器學(xué)習(xí)模型預(yù)測(cè),例如SVR、RF、神經(jīng)網(wǎng)絡(luò)等方法,預(yù)測(cè)精度較低,預(yù)測(cè)精度亟待提高。
基于上述問題,筆者將RF算法、GBDT算法、XGBoost算法及LightGBM算法有效結(jié)合,提出一種基于Blending集成算法。首先,基于大慶某油田的歷史檢泵數(shù)據(jù),利用LOF孤立程度檢測(cè)方法和歸一化對(duì)數(shù)據(jù)進(jìn)行預(yù)處理;其次,采用基于樹模型特征融合篩選的方法,篩選出主要影響參數(shù);最后,對(duì)比4種單一機(jī)器學(xué)習(xí)模型與Blending集成模型對(duì)檢泵周期的預(yù)測(cè)精度,并采用新的150組檢泵數(shù)據(jù)驗(yàn)證該模型的預(yù)測(cè)精度和泛化性能。結(jié)果表明,Blending集成模型在檢泵周期預(yù)測(cè)方面有良好的預(yù)測(cè)效果。
1數(shù)據(jù)預(yù)處理
1. 1 數(shù)據(jù)收集
抽油機(jī)井檢泵的生產(chǎn)數(shù)據(jù)來自大慶油田某采油廠實(shí)時(shí)記錄的檢泵作業(yè)數(shù)據(jù)。主要包括泵徑、動(dòng)液面、沉沒度、桿徑、含水體積分?jǐn)?shù)、泵深、最大載荷、最小載荷、井斜角、油壓、套壓、靜壓、沖程、沖次、日產(chǎn)油量、日產(chǎn)液量、采出液黏度、采出液質(zhì)量分?jǐn)?shù)、滲透率等。由于上述數(shù)據(jù)存在缺失值、異常值等情況,所以需要對(duì)數(shù)據(jù)進(jìn)行預(yù)處理。
1.2 數(shù)據(jù)預(yù)處理
1. 2.1 缺失值處理
解決缺失值的方法共2種:第1種是刪除帶有缺失值的樣本數(shù)據(jù)來獲得一個(gè)完整的數(shù)據(jù)樣本;第2種方法是將缺失的數(shù)據(jù)進(jìn)行填補(bǔ),一般都使用平均數(shù)和眾數(shù)進(jìn)行填補(bǔ)。雖然第1種方法操作簡(jiǎn)單,但會(huì)造成大量數(shù)據(jù)浪費(fèi),使模型的預(yù)測(cè)精度較低。經(jīng)過對(duì)比分析,選擇平均值對(duì)缺失值進(jìn)行填補(bǔ)。
1. 2.2 異常值處理
由于在日常的生產(chǎn)中需要人工記錄數(shù)據(jù),人工記錄就會(huì)導(dǎo)致數(shù)據(jù)出現(xiàn)偏差,就會(huì)有異?;蚬铝⒌臄?shù)據(jù)的出現(xiàn)。該數(shù)據(jù)會(huì)對(duì)抽油機(jī)井檢泵周期預(yù)測(cè)模型產(chǎn)生干擾,使模型的擬合效果變差,預(yù)測(cè)準(zhǔn)確度降低。這里選擇LOF孤立程度檢測(cè)方法,它屬于無監(jiān)督孤立程度檢測(cè)方法。LOF的基本思想是比較一個(gè)點(diǎn)的局部密度與其鄰近點(diǎn)的局部密度,如果一個(gè)點(diǎn)的局部密度明顯低于其鄰近點(diǎn)的局部密度,那么這個(gè)點(diǎn)就被認(rèn)為是異常值。流程圖如圖1所示。
LOF算法關(guān)鍵步驟如下。
(1)計(jì)算每個(gè)數(shù)據(jù)點(diǎn) p 和 σo 的距離即為 ,對(duì)于點(diǎn) p 的第 k(k=1,2,…,N) 個(gè)距離 dk(p) 即為
,有除點(diǎn) p 在內(nèi)的 k 個(gè)點(diǎn) ?′ 滿足
0
(2)以點(diǎn) p 為圓心, k 臨近距離 為半徑畫圓,圓的范圍即為點(diǎn) p 的 k 距離領(lǐng)域 Nk(p) ,則有:
(3)點(diǎn) p 到點(diǎn) σo 的第 k 可達(dá)距離為:
式中: 為點(diǎn) σo 的 k 臨近距離。
(4)對(duì)于數(shù)據(jù)點(diǎn) p ,計(jì)算其局部可達(dá)密度 Ld
(5)計(jì)算數(shù)據(jù)點(diǎn) p 的局部離群因子 L(p) :
式中: 為點(diǎn) σo 的局部可達(dá)密度, Ld(p) 為 p 點(diǎn)的可達(dá)密度。
如果 L(p) 的值顯著大于1,表示該點(diǎn)的局部密度遠(yuǎn)低于其鄰近點(diǎn)的局部密度,即可判定該點(diǎn)為異常值點(diǎn)。圖2為檢泵周期數(shù)據(jù)的分布圖。圖2中紅色表示檢泵周期數(shù)據(jù)異常,藍(lán)色表示檢泵周期數(shù)據(jù)正常。通過編程軟件 python中的 sklearn方法完成LOF的處理,去除了原始數(shù)據(jù)中的異常數(shù)據(jù)
1. 2.3 歸一化處理
歸一化(Normalization)是機(jī)器學(xué)習(xí)中常用的一種數(shù)據(jù)預(yù)處理方法,目的是將數(shù)據(jù)縮放到一個(gè)特定的范圍,以便模型能夠更好地學(xué)習(xí)和理解數(shù)據(jù)。歸一化可以幫助模型提高收斂速度,提高模型的精度,并且減少模型對(duì)特征尺度的敏感性。歸一化處理如下式:
式中: Xnorm 為歸一化后的數(shù)據(jù)集, X 為歸一化前的原本數(shù)據(jù)集, Xmax 和 Xmin 分別是數(shù)據(jù)集中的最大值和最小值。
通過歸一化處理后,所有的特征值都被縮放到0\~1之間。
2 特征篩選
不同的抽油機(jī)井檢泵參數(shù)對(duì)模型的預(yù)測(cè)效果產(chǎn)生不同程度的影響,若將所有檢泵參數(shù)放入模型中會(huì)增加計(jì)算負(fù)擔(dān)及模型的復(fù)雜程度,降低模型的預(yù)測(cè)準(zhǔn)確率,因此需要在原始數(shù)據(jù)中提取關(guān)鍵特征以供模型使用。目前,單一的特征篩選方法無法保障篩選的精度,提供給模型的特征不佳,致使模型預(yù)測(cè)效果不穩(wěn)定,準(zhǔn)確率較低。為此,這里綜合了樹模型的3種方法,它們分別是GBDT、RF和XG-Boost。首先,分別用這3種方法對(duì)所有特征進(jìn)行排名計(jì)算;其次,將3種方法的篩選結(jié)果賦予同樣的權(quán)重系數(shù);最后,選擇綜合排名前8的特征作為模型的輸入?yún)?shù),分別是沖次、井斜角、采出液質(zhì)量分?jǐn)?shù)、沖程、泵深、含水體積分?jǐn)?shù)、日產(chǎn)液量及最大載荷。特征重要性排序如圖3所示。
3 Blending集成學(xué)習(xí)機(jī)制的檢泵周期預(yù)測(cè)模型
3.1 Blending集成算法
集成學(xué)習(xí)能夠解決單一的機(jī)器學(xué)習(xí)算法在預(yù)測(cè)中出現(xiàn)預(yù)測(cè)精度低的問題,減小其不確定性,從而提高模型預(yù)測(cè)精度[13]。Stacking集成學(xué)習(xí)是目前常用的一種集成學(xué)習(xí)方法[14-15],其優(yōu)點(diǎn)是有效減少過擬合問題,增強(qiáng)模型的泛化性能和預(yù)測(cè)能力;其缺點(diǎn)是模型在交叉驗(yàn)證過程中易發(fā)生數(shù)據(jù)泄露,導(dǎo)致整個(gè)模型性能降低。而Blending集成學(xué)習(xí)在訓(xùn)練過程中會(huì)建立留出集用于第2層的訓(xùn)練,可以有效減少信息泄露問題。因此,這里選用以RF模型、GBDT模型、XGBoost模型、LightGBM模型為基模型,Adaboost為元模型的Blending集成算法,流程圖如圖4所示。
(1)將清洗后的檢泵數(shù)據(jù)劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集。訓(xùn)練集和測(cè)試集按照 8:2 劃分,再將得到的訓(xùn)練集按照 7:3 劃分為訓(xùn)練集 DT 和驗(yàn)證集 D?A 。得到最后的檢泵訓(xùn)練集數(shù)據(jù)1288組、驗(yàn)證集數(shù)據(jù)552組和測(cè)試集數(shù)據(jù)460組。
(2)構(gòu)建 RF、GDBT、XGBoost及LightGBM這4個(gè)基模型。將 DT 放入4個(gè)基模型中訓(xùn)練,再將 DA 放入已經(jīng)訓(xùn)練好的基模型中進(jìn)行預(yù)測(cè)。
(3)選用Adaboost作為元模型,將 D?A 的預(yù)測(cè)結(jié)果序列視為新特征建輸入元模型,確定元模型(Adaboost)的權(quán)重參數(shù),完成元模型的訓(xùn)練。
(4)用訓(xùn)練好的4個(gè)基模型對(duì)測(cè)試集 T 進(jìn)行預(yù)測(cè),將預(yù)測(cè)結(jié)果的集合序列視為新特征 A 和新特征 B 并輸入到訓(xùn)練好的元模型中,完成Blending集成模型的預(yù)測(cè)。
3.2 基模型的選擇
3.2.1 RF模型
RF算法的基本思想是通過結(jié)合多個(gè)決策樹的預(yù)測(cè)結(jié)果來提高模型的性能[16-17]。首先從原始數(shù)據(jù)集中隨機(jī)抽取多個(gè)樣本,每次抽取都是有放回的,形成多個(gè)子數(shù)據(jù)集;對(duì)于每個(gè)數(shù)據(jù)集,構(gòu)建一個(gè)決策樹。在每次節(jié)點(diǎn)分裂時(shí),會(huì)隨機(jī)選擇一部分特征,從中挑選最佳的特征來進(jìn)行分裂。對(duì)于回歸問題,每一個(gè)決策樹會(huì)給出一個(gè)預(yù)測(cè)值,隨機(jī)森林的最終結(jié)果是所有決策樹觀測(cè)值的平均值" T ",其計(jì)算如下:
式中: N 為決策樹的數(shù)量, Ti ( x )為第 i 個(gè)決策樹對(duì)輸人特征 x 的觀測(cè)值。
模型原理圖如圖5所示。
3.2.2 LightGBM模型
LightGBM算法是一種梯度提升算法,其通過迭代構(gòu)建決策樹來最小化目標(biāo)函數(shù)[18]。原理圖如圖6所示。
具體來說,LightGBM算法初始化一個(gè)基模型,通常為一個(gè)常數(shù)值;然后在每次迭代中增加一個(gè)新的樹來改進(jìn)當(dāng)前模型。目標(biāo)函數(shù)一般包括2個(gè)方面:一是損失函數(shù),二是正則化項(xiàng)。訓(xùn)練集數(shù)據(jù)集為 ,其中 xi 是特征向量, yi 是對(duì)應(yīng)的真實(shí)標(biāo)簽值, N 是樣本數(shù)量。LightGBM迭代構(gòu)建M 棵樹,每棵樹對(duì)應(yīng)一個(gè)函數(shù) fm(x) ,最終模型的預(yù)測(cè)值為所有樹的加和
,其計(jì)算式為:
在第 m 次迭代中, fm(xi) 最小化。目標(biāo)函數(shù)如下:
式中: L(m) 為第 ?m 次迭代的目標(biāo)函數(shù); l 為損失函數(shù); 為前 m-1 棵樹的預(yù)測(cè)值之和;
為第m 棵樹的正則化項(xiàng),用于懲罰模型的復(fù)雜度。
3.2.3 XGBoost模型
XGBoost的核心思想是逐步構(gòu)建弱分類器,將它們組合成一個(gè)強(qiáng)分類器,在每一輪迭代中,XG-Boost會(huì)添加一個(gè)新的樹,試圖糾正前一輪的預(yù)測(cè)誤差[19]。與LightFBM提升方法不同,XGBoost在目標(biāo)函數(shù)中引入了 L1 和 L2 共2個(gè)正則化項(xiàng),用于控制模型的復(fù)雜度,從而有效避免過擬合。XG-Boost需要通過加法模型來學(xué)習(xí)系列函數(shù) ,每個(gè)函數(shù)對(duì)應(yīng)一個(gè)決策樹,以使模型的預(yù)測(cè)值
能逼近真實(shí)林簽值 yi ,則有:
式中: ΨtΨt 為迭代的輪數(shù), xi 為特征向量。
XGBoost優(yōu)化的目標(biāo)函數(shù)為:
式中: l 為損失函數(shù),用于衡量預(yù)測(cè)值 和真實(shí)標(biāo)簽值 yi 之間的差距。
正則化項(xiàng)的定義如下:
式中: γ 為 L1 正則化系數(shù); A 為樹中葉子結(jié)點(diǎn)的數(shù)量; λ 為 L2 正則化系數(shù); 為葉子節(jié)點(diǎn)權(quán)重的向量。
3.2.4 GBDT模型
梯度提升決策樹(Gradient BoostingDecisionTrees,GBDT)是一種集成學(xué)習(xí)算法,其通過串行訓(xùn)練決策樹來減小殘差,以逐步提升模型的準(zhǔn)確性[20-21]。GBDT通過迭代訓(xùn)練決策樹模型,每一棵樹都在之前所有樹的殘差上進(jìn)行訓(xùn)練,最終將所有樹的預(yù)測(cè)結(jié)果相加得到最終的預(yù)測(cè)結(jié)果。模型原理圖如圖7所示。
在回歸問題中,損失函數(shù)通常選擇平方損失函數(shù) ,即:
式中: y 為數(shù)據(jù)真實(shí)值, F(x) 為模型的預(yù)測(cè)值。
在每一次迭代中,需要計(jì)算負(fù)梯度即殘差 rit
其計(jì)算式為:
式中: Ft(xi) 為當(dāng)前模型對(duì)第 i 個(gè)樣本 χt 輪迭代后的預(yù)測(cè)值。
每一輪迭代中,需要訓(xùn)練一個(gè)新的決策樹來擬合殘差 rit ,然后將這棵樹的預(yù)測(cè)結(jié)果加到之前所有樹的預(yù)測(cè)結(jié)果上,則可得:
Fδt(δx)=Fδt-1(δx)δ+Chδt(δx)
式中: Ft-1(x) 為 t-1 輪迭代后的預(yù)測(cè)值, C 為學(xué)習(xí)率, hι(x) 為第 Φt 棵決策樹的預(yù)測(cè)結(jié)果
最終,GBDT的預(yù)測(cè)結(jié)果為所有樹的預(yù)測(cè)結(jié)果之和:
式中: T 為決策樹總數(shù)量。
3.3 模型參數(shù)優(yōu)化
麻雀搜索算法(SSA)是由薛建凱等于2020年提出的一種全新的智能優(yōu)化算法[22]。其靈感主要來自麻雀覓食和躲避獵食者時(shí)的策略,在解決極為復(fù)雜的優(yōu)化問題時(shí)展現(xiàn)出強(qiáng)大優(yōu)勢(shì),尤其在處理多個(gè)局部最優(yōu)解的情況下顯示出強(qiáng)大的全局搜索能力。麻雀搜索算法的參數(shù)設(shè)置如下,初始化種群數(shù)量80,最大迭代次數(shù)40,預(yù)警值0.6,適應(yīng)度函數(shù)選用MAE。優(yōu)化后的各模型參數(shù)如表1所示。
表1參數(shù)尋優(yōu)結(jié)果
3.4 模型評(píng)估與討論
本文通過均方根誤差 ERMS (Root Mean SquaredError,RMSE)、平均絕對(duì)誤差 EM (Mean AbsoluteError,MAE)、擬合優(yōu)度決定系數(shù) R2 (R-squared)這3個(gè)指標(biāo)來衡量模型預(yù)測(cè)結(jié)果與真實(shí)值之間的差異,進(jìn)而評(píng)估RF、XGboost、GDBT、LightGBM、Blending這5種模型的預(yù)測(cè)性能。
平均絕對(duì)誤差 EM 計(jì)算如下:
均方根誤差 ERMS 計(jì)算如下:
R2 計(jì)算如下式所示:
式中: 為真實(shí)值的平均值; n 為樣本數(shù)量。
當(dāng) Eu 、 ERMS 值越接近0, R2 的值越接近1時(shí),預(yù)測(cè)效果越好。
各模型的預(yù)測(cè)效果如圖8\~圖12所示。
圖8\~圖12中的橫坐標(biāo)是檢泵周期的真實(shí)數(shù)據(jù),縱坐標(biāo)是各模型預(yù)測(cè)得到的檢泵周期數(shù)據(jù),中間的紅線是擬合直線,藍(lán)色的數(shù)據(jù)點(diǎn)到紅線的距離越短表明該模型的擬合優(yōu)度越好,預(yù)測(cè)精度越高。對(duì)比圖8\~圖12可以看出,Blending集成模型預(yù)測(cè)的擬合效果最好。
圖13是Blending模型預(yù)測(cè)結(jié)果的對(duì)比及殘差分布效果圖。模型評(píng)估結(jié)果如表2所示。
從表2可知,Blending模型相對(duì)其余4個(gè)基模型的擬合效果更好,預(yù)測(cè)精度更高。
3.5 現(xiàn)場(chǎng)驗(yàn)證
為了驗(yàn)證基于RF、GBDT、XGBoost及LightG-BM模型融合的Blending集成學(xué)習(xí)模型的預(yù)測(cè)性能及普適性,采用150組新的現(xiàn)場(chǎng)檢泵數(shù)據(jù)對(duì)模型進(jìn)行驗(yàn)證,預(yù)測(cè)效果如圖14所示
此時(shí) R2=0.947 , ERMS=46.108 ,預(yù)測(cè)的檢泵周期與實(shí)際的檢泵周期擬合度高,驗(yàn)證了Blending集成方法在檢泵周期預(yù)測(cè)方面的有效性和可行性。
4結(jié)論
(1)利用樹模型特征融合篩選方法進(jìn)行了主控因素分析,結(jié)果表明沖次對(duì)檢泵周期的影響最大,井斜角、采出液質(zhì)量分?jǐn)?shù)、沖程、泵深、含水體積分?jǐn)?shù)、日產(chǎn)液量、最大載荷次之,與實(shí)際工程經(jīng)驗(yàn)接近,證明該篩選方法的合理性和可靠性。
(2)提出一種基于Blending集成模型預(yù)測(cè)抽油機(jī)井檢泵周期的方法,針對(duì)大慶某油田的歷史檢泵數(shù)據(jù)進(jìn)行預(yù)測(cè)。與其他4種基模型相比,該模型預(yù)測(cè)精度最高,擬合效果最好。此時(shí) R2=0.954 ,ERMS=45.254 。
(3)使用一組全新的現(xiàn)場(chǎng)數(shù)據(jù)驗(yàn)證Blending集成模型的預(yù)測(cè)精度,結(jié)果為 R2=0.947 , ERMS= 46.108,說明模型具有較強(qiáng)的合理性和良好的預(yù)測(cè)精度,可以為大慶某油田抽油機(jī)井檢泵周期預(yù)測(cè)提供參考。
參考文獻(xiàn)
[1] 姜民政,段天玉,劉金堂,等.有桿泵同井注采系 統(tǒng)技術(shù)應(yīng)用及節(jié)點(diǎn)力學(xué)分析[J].石油機(jī)械, 2017,45(7):97-100. JIANG MZ,DUANTY,LIUJT,et al.Application and node mechanics analysis of sucker rod pump injection-production system [J].China Petroleum Machin[J].化學(xué)工程與裝備,2020(11):110-111.WANG H X. Analysis of reasons for oil well pumpcheck and measures to extend pump check cycle [J].Chemical Engineering and Equipment,2020(11):110-111.
[3] 高海紅.延長桿式抽油泵檢泵周期技術(shù)研究應(yīng)用[J].石化技術(shù),2021,28(12):62-63.GAO H H. Research and application of extending pumpinspection period of rod oil well pump [J]. Petrochem-ical Industry Technology,2021,28(12):62-63.
[4] 劉剛.油井檢泵原因及延長檢泵周期的措施[J].化學(xué)工程與裝備,2021(1):115-116.LIU G.Reasons for oil well pump checking and meas-ures to extend pump checking cycle [J]. Chemical En-gineering and Equipment,2021(1):115-116.
[5]孫家暉.油井檢泵原因分析及延長檢泵周期措施探討[J].化工管理,2017(9):23.SUN JH.Analysis of the reasons for oil well pump-checking and discussion of measures to extend the pumpchecking cycle [J]. Chemical Enterprise Management,2017 (9): 23.
[6]張帆,紀(jì)海霞,韓亮.延長檢泵周期的2種措施應(yīng)用與分析[J].遼寧化工,2015,44(10):1210-1212.ZHANG F,JI HX,HAN L. Application and analysisof two kinds of measures to prolong pump inspection cy-cle[J].Liaoning Chemical Industry,2015,44(10):1210-1212.
[7] 周平,單長吉,劉麗丹,等.抽油機(jī)井管桿偏磨檢泵周期與其影響因素回歸分析[J].東北電力大學(xué)學(xué)報(bào)(自然科學(xué)版),2008,28(4):11-17.ZHOU P,SHAN CJ,LIU L D,et al.The regressionanalysis for wearing and parting of sucker rod and tubingin drive pumping well period and its influencing factor[J].Journal of Northeast Power University(NaturalScience Edition),2008,28(4):11-17.
[8] 張戰(zhàn)敏.抽油機(jī)井檢泵周期可靠性預(yù)測(cè)模型與實(shí)際應(yīng)用[J].價(jià)值工程,2015,34(8):31-32.ZHANG Z M. Reliability forecast model of oil pumpingwells checking period and actual application [J]. Val-ue Engineering,2015,34(8):31-32.
[9] 孟令凱.聚驅(qū)抽油機(jī)井桿管偏磨壽命預(yù)測(cè)方法研究[D].秦皇島:燕山大學(xué),2016.MENG L K. Research on the prediction method of rodand tube deflection wear life of polydrive pumping rigwells [D].Qinhuangdao:Yanshan University,2016.
[10]封海兵.基于數(shù)據(jù)挖掘的抽油機(jī)井實(shí)時(shí)優(yōu)化系統(tǒng)研究與應(yīng)用「D].青島:中國石油大學(xué)(華東),2020:001098.FENG H B.Research and application of real-timepumping well optimisation system based on data mining[D].Qingdao:China University of Petroleum (EastChina),2020:001098.
[11] 趙巖龍,方正魁,邱子瑤,等.基于長短時(shí)記憶網(wǎng)絡(luò)的腐蝕工況下抽油桿剩余使用壽命預(yù)測(cè)[J].科學(xué)技術(shù)與工程,2021,21(36):15429-15433.ZHAO Y L,F(xiàn)ANG Z K,QIU Z Y,et al. Remaininguseful life prediction of sucker rod under corrosion con-dition based on long short-term memory network [J].Science TechnologyandEngineering,2021,21(36):15429-15433.
[12] 張曉東,王栩穎,秦子軒.基于特征融合的抽油機(jī)井檢泵周期預(yù)測(cè)[J].計(jì)算機(jī)與現(xiàn)代化,2022(12): 60-66.ZHANG XD,WANG X Y,QIN Z X. Pump detectionperiod predicting of pump well based on feature fusion[J].Computer and Modernization,2022 (12):60-66.
[13] 李聰,彭小圣,王皓懷,等.基于SDAE深度學(xué)習(xí)與多重集成的風(fēng)電集群短期功率預(yù)測(cè)[J].高電壓技術(shù),2022,48(2):504-512.LI C,PENG X S,WANG H H,et al.Short-termpower prediction of wind power cluster based on SDAEdeep learning and multiple integration[J]. HighVoltage Engineering,2022,48(2): 504-512.
[14] 史鵬宇,徐思慧,馮加明,等.基于改進(jìn) Stacking算法的致密砂巖儲(chǔ)層測(cè)井流體識(shí)別[J].地球物理學(xué)進(jìn)展,2024,39(1):280-290.SHI PY,XUSH,F(xiàn)ENGJM,et al. Log identifi-cation of fluid types in tight sandstone reservoirs usingan improved Stacking algorithm [J]. Progress in Geo-physics,2024,39(1):280-290.
[15] 田輝,樊志彬,王倩,等.基于GA算法優(yōu)化 Stac-king 集成學(xué)習(xí)的金屬材料大氣腐蝕速率研究[J].山東電力技術(shù),2023,50(10):43-49.TIAN H,F(xiàn)AN Z B,WANG Q,et al. Study of at-mospheric corrosion rate of metal materials based onGA-optimized stacking integrated ensemble learning[J].Shandong Electric Power,2023,50(10):43-49.
[16] BREIMAN L. Random forests [J]. Machine Learn-ing,2001,45(1):5-32.
[17] WANG W,LIL N,GU HJ,et al.Random forest-based prediction of acute respiratory distress syndromein patients undergoing cardiac surgery [J]. The HeartSurgerv Forum.2022.25(6):E854-E859.
[18」 唐朝飛,努爾布力,艾壯.基于LightGBM的網(wǎng)絡(luò)入侵檢測(cè)研究[J].計(jì)算機(jī)應(yīng)用與軟件,2022,39(8):298-303,311.TANG C F,NURBOL,AI Z. Research on networkintrusion detection based on LightGBM [J]. Comput-er Applications and Software,2022,39(8):298-303,311.
[19] 錢宇,何益豐,謝斌鑫,等.基于特征工程的 XG-boost風(fēng)速短期預(yù)測(cè)[J].武漢大學(xué)學(xué)報(bào)(工學(xué)版),2022,55(10):1057-1064.QIAN Y,HEYF,XIE BX,et al.Short-term XG-boost wind speed prediction based on feature engineer-ing[J]. Engineering Journal of Wuhan University,2022,55(10):1057-1064.
[20] 沈斌,楊勝來.基于PSO-GBDT 的 CO2 -原油最小混相壓力預(yù)測(cè)模型[J].科學(xué)技術(shù)與工程,2022,22 (18): 7866-7872.SHEN B,YANG S L. Prediction model of minimummiscible pressure of CO2 -crude oil based on PSO-GB-DT[J]. Science Technologyand Engineering,2022,22 (18) : 7866-7872.
[21] 畢云帆,橄奧洋,張智晟,等.基于模糊 Bagging-GBDT的短期負(fù)荷預(yù)測(cè)模型研究[J].電力系統(tǒng)及其自動(dòng)化學(xué)報(bào),2019,31(7):51-56.BIY F,HAN A Y,ZHANG Z S,et al. Study onshort-term load forecasting model based on fuzzy Bag-ging-GBDT[J]. Proceedings of the CSU-EPSA,2019,31(7):51-56.
[22] 馬晨佩,李明輝,鞏強(qiáng)令,等.基于麻雀搜索算法優(yōu)化支持向量機(jī)的滾動(dòng)軸承故障診斷[J].科學(xué)技術(shù)與工程,2021,21(10):4025-4029.MA C P,LI M H,GONG Q L,et al. Fault diagno-sis of rolling bearing based on sparrow search algorithmoptimized support vector machine [J]. Science Tech-nology and Engineering,2021,21(10):4025-4029.
第一作者簡(jiǎn)介:姜民政,教授,博士生導(dǎo)師,生于1964年,2003年畢業(yè)于哈爾濱工程大學(xué)固體力學(xué)專業(yè),獲博士學(xué)位,現(xiàn)從事機(jī)械采油系統(tǒng)工程理論及節(jié)能技術(shù)研究工作。地址:(163318)黑龍江省大慶市。電話:(0459)6503338。email: jmz1964@126.com。通信作者:董康興,副教授,博士生導(dǎo)師。電話:(0459) 6503256。email: dongkangxing1964@ 163. com。