關(guān)鍵詞:抽油機;示功圖;特征提??;故障識別;閥門
中圖分類號:TE933 DOI: 10. 16579/j. issn. 1001. 9669. 2025. 01. 002
0引言
石油是我國重要的戰(zhàn)略資源,抽油機井在石油開采中具有重要地位。準確了解油井采油狀況對于抽油機工況診斷和油田整體經(jīng)濟效益的提升具有重要意義[1-4]。示功圖是判斷抽油機工作狀況的主要依據(jù),如若不能準確及時識別抽油機故障類型,就會影響油田的安全高效生產(chǎn),甚至造成生產(chǎn)安全事故[5]。因此,亟需對抽油機工況進行特征提取和全域故障識別。
不同抽油機故障導致不同形狀的示功圖,而每個故障的示功圖都具有獨有的特征。具體表現(xiàn)為閥門開閉點位置變化、油桿的運動狀況、載荷的變化等。對于示功圖的診斷識別方法研究,主要有人工診斷識別方法和計算機智能診斷識別方法兩種。人工診斷識別方法是根據(jù)油田專業(yè)技術(shù)人員多年的經(jīng)驗,通過對實測示功圖的判斷和識別,從而判別抽油機的故障類型。計算機智能診斷識別方法[6]主要是通過提取圖形特征作為分類器的分類依據(jù)來判斷工況類別。示功圖特征提取的方法主要包括傅里葉變換[7]343-355[8]、差分曲線法[9]96-98、網(wǎng)格法[10]1265-1268、Freeman鏈碼法[11]4788-4796[12-13]、神經(jīng)網(wǎng)絡(luò)算法[14]2559-2573[15-18]等。LI等[ 7]343-355將示功圖的傅里葉描述子作為特征與圖形特征進行融合,增強了診斷模型的有效性;于泳澎[9]96-98提出了一種結(jié)合幾何參數(shù)法、差分曲線法和生產(chǎn)參數(shù)的方法,用于抽油機井故障的診斷;許廣繁等[10]1265-1268將網(wǎng)格法和灰色理論相結(jié)合,建立了示功圖的6個特征值用來識別抽油機的工況種類;周斌等[11]4788-4796使用八方向鏈碼來提取示功圖的輪廓特征,精確識別了閥門的開閉點;YE等[14]2559-2573將卷積神經(jīng)網(wǎng)絡(luò)算法改進和簡化,使得示功圖判斷及時準確。以上方法都是從圖形的角度出發(fā),沒有與抽油機的工作原理相結(jié)合,未能直接反映出在抽油機工作過程中閥門、抽油泵、抽油桿等之間的關(guān)系,因此只能對某一部分故障有效識別,對全域故障沒有普適性。
為解決上述問題,在示功圖上獲取能夠真實反映工況的特征。本文首次提出通過機制方式提取特征,先對抽油桿進行工作原理和受力分析,并加入增載、卸載和上下沖程階段閥門開合對載荷的影響,確定了閥門開合過程中載荷特征和變化趨勢;然后對圖形處理獲取閥門開合位置和各階段載荷變化,獲取到全新的54個特征,建立全域故障特征庫;最后利用決策樹、Logistic回歸和支持向量機驗證提取特征的準確性和有效性,并評估不同故障的工況特征指標。
1機制描述
1. 1抽油機工作原理
抽油機抽油泵的工作過程如圖1所示。在上沖程階段(A→C 段),柱塞和液柱在抽油桿的作用下向上運動,抽油桿受力沿軸線方向向上,抽油桿彈性伸長,載荷增加,固定閥打開,到達上死點后關(guān)閉,對應圖2的C點(上死點),AB段為抽油桿彈性伸長階段,BC段為柱塞上行程階段;在下沖程階段(C→A 段),除了抽油桿的自重之外,其他力都朝著軸線方向向上。因此,上部分的桿柱受拉力,而下部分的桿柱受壓力。在這個過程中,抽油桿會發(fā)生彈性收縮,從而導致載荷降低。同時,游動閥會打開,然后在達到下死點后關(guān)閉,對應圖2的A 點(下死點),CD段為抽油桿彈性收縮階段,DA段為柱塞下行程階段,如此周期運行。示功圖是了解油井工作狀況的主要方法,通過定量分析可以促進抽油機的故障診斷和特征分類識別。由圖2可以看出,示功圖的圖形表現(xiàn)為一標準的平行四邊形,但實際現(xiàn)場工作過程中,由于作業(yè)地理環(huán)境等的因素十分復雜,固定閥、游動閥受到水、蠟、砂、氣和慣性、振動、沖擊載荷等的影響,其打開和關(guān)閉的時間會出現(xiàn)差錯、程度也會受到影響,此時B、D點的位置就會發(fā)生變化,加之抽油桿在上下運動中又會受到摩擦力的作用,就會出現(xiàn)各種各樣的異常情況,BC段和DA段會出現(xiàn)不同程度的波動。最終,桿的影響因素、泵故障以及原油因素等多種影響因素耦合起來聯(lián)合反饋到懸點載荷中。
開運算可以去除示功圖中由于載荷波動而形成的孤立小點和毛刺,閉運算可以填補示功圖中的小孔并彌合裂縫。本文選用形狀分別為3×3、5×5和7×7的正方形作為結(jié)構(gòu)元素,以正方形的中點作為結(jié)構(gòu)元素的中心,用3種不同大小的結(jié)構(gòu)元素分別對示功圖進行開運算和閉運算操作。利用式(6)、式(7),以上沖程為例,使用3種不同大小的結(jié)構(gòu)元素進行開運算和閉運算處理,得到最終處理后的圖形,處理結(jié)果可分別去除阻力和流速、波動以及振動影響,如圖3所示。
2. 2閥門屬性特征的獲取
閥門屬性特征的獲取首先要找出B、D 點,在進行B、D點獲取之前要給出理論密度和實際密度的定義。如圖4所示,以最左點和最右點形成的直線作為最上層,最低點所在的縱坐標為最下層,得出理論密度;以原始圖形的曲線作為最上層,最低點所在的縱坐標為最下層,得出實際密度。
分別對3種不同結(jié)構(gòu)元素消除載荷影響后的圖形進行如下操作,如圖5所示(以上沖程為例)。
通過圖5的方式將最右點載荷作為最上基準,最低點作為最下基準對下沖程的圖形進行處理,可以得到D 點。A 點和C 點機制上對應示功圖最左端和最右端的點,最終我們可以獲得A、B、C、D點的具體數(shù)據(jù)信息。圖6是得到A、B、C、D 四點的示功圖圖形(以3種類型示功圖為例)。
2. 3載荷變化屬性特征的獲取
針對AB、BC、CD、DA 段之間的線段進行微小載荷波動過濾處理,步驟與第2. 1節(jié)相同,對獲取的線段進行如下處理:
步驟一:對A、B、C、D形成的4段線中每段按點的順序依次計算相鄰兩點之間的斜率[式(8)]和斜率的增量[式(9)]。
步驟二:根據(jù)相鄰點斜率和相鄰斜率增量的各自比較,以15°為界,對線段進行分類和比較,定義出9種曲線類型(表1)。
步驟三:每段線內(nèi)從第一個數(shù)據(jù)開始,按照步驟一的方法計算斜率和斜率增量,按照步驟二的方法判斷線型,并且記錄每段線的長度、起始點、方向以及線型。
步驟四:對每段線的數(shù)據(jù)進行如下操作。
1)過濾。將所有長高比大于5的曲線重新定義為直線。
2)合并。若直線與直線斜率之差小于0. 3,重新合并為一條直線;若直線長度與曲線長度之差小于0. 1,則重新合并為一條曲線。
3)重復。將相鄰線依次進行合并,直至每段的最后一條線。
步驟五:將AB、BC、CD、DA每段線總的線條數(shù)合并為3個,若線型的數(shù)量超過3個,將最短那條線取消,直至數(shù)量為3;如不夠3條,在此段線的最后補數(shù)據(jù)均為0的線型,直至補齊3個。圖7所示為經(jīng)過線條合并后所得到的圖形(以3種類型示功圖為例)。
2. 4抽油機工況特征庫的建立
由于抽油機在工作過程中作業(yè)環(huán)境的復雜,閥門打開和關(guān)閉的時間會受到影響,B、D 點的位置也會發(fā)生變化,加之抽油桿在上下運動中又會受到摩擦力的作用,就會出現(xiàn)各種各樣的異常情況,這些都會反映在位移-載荷圖像中。依據(jù)第2. 1~2. 3節(jié)中所得到的A、B、C、D 四點在機制上對應載荷的最大點和最小點,閥門打開和關(guān)閉的點,這四點不同的位置可以形成不同的四邊形,并且在相同的四邊形中邊長、角度也會有所不同,可以得到不同的信息;相鄰的每3個點可構(gòu)成對應邊長、角度大小不一的角,不同故障所形成角的大小、邊長都有所不同,AB 反映增載情況,CD 反映卸載情況,BC、DA 反映抽油桿在運動過程中的力學特征對應軌跡,角度的大小反映了閥門的打開程度,不同故障對應的角度具有不同的屬性;相鄰每兩點之間形成的線型包含了抽油桿波動的影響,經(jīng)過第2. 1節(jié)的操作可以獲得最真實的加載和卸載特征,這3類信息可以描述出抽油機采油過程中所有變化的屬性特征(圖8)。
根據(jù)屬性特征,從定性和定量兩個角度分析,最終建立全域故障的所有特征(54個全新特征),如圖9所示。
3屬性特征的有效性驗證
3. 1屬性數(shù)據(jù)獲取
本文使用來自新疆克拉瑪依油田的兩個采油區(qū)塊約120口井2019年3月底到2020年3月底的示功圖以及由示功圖分析所對應工況類型作為數(shù)據(jù)來源,其包含的工況主要有正常示功圖、上碰泵、供液不足、下碰泵、氣體影響、固定凡爾漏失、出砂、游動凡爾漏失、油稠、油井結(jié)蠟,雙凡爾漏失等11種。原始示功圖成圖數(shù)據(jù)按日期存放于單獨的文件中,每條數(shù)據(jù)均由120個坐標點構(gòu)成。每條數(shù)據(jù)都經(jīng)過第2. 1、2. 2和2. 3節(jié)算法的處理,最終形成圖9所對應特征庫里的每條特征數(shù)值。
針對上述11種工況,通過Logistic回歸、決策樹和支持向量機對每種工況進行二分類,驗證本文建立屬性特征的全局意義和有效性,并評判每種工況不同特征在故障識別過程中的權(quán)重。將數(shù)據(jù)的70%作為訓練集樣本,得到二分法模型,并利用訓練得到的結(jié)果對30%測試集樣本進行二分類,驗證特征的有效性以及分類的精確度。具體流程如圖10所示。
3. 2實驗驗證及結(jié)果
3. 2. 1分類模型
1)將連續(xù)數(shù)據(jù)采用ordinal編碼離散化,用分位數(shù)把所表現(xiàn)的特征進行四等分,每個特征中每個箱內(nèi)的樣本數(shù)量都相同。
2)決策樹開始時根節(jié)點包含數(shù)據(jù)集中的所有樣例數(shù)據(jù),計算每個特征信息熵,計算數(shù)據(jù)集中每個特征的信息增益,確定模型的根節(jié)點。根據(jù)根節(jié)點的劃分,再依次計算每個決策屬性的信息增益,選擇最佳節(jié)點和最佳的分枝方法,對每一個分枝進行進一步的劃分。根據(jù)對數(shù)據(jù)集各特征屬性信息熵的計算,生成故障二分類識別的決策樹模型。
3)Logistic回歸由線性回歸衍生而來,可以解決離散數(shù)據(jù)的分類問題,其中引入了Sigmoid激活函數(shù)將所有計算結(jié)果映射到[0,1],以0. 5為界,實現(xiàn)對故障的二分類。
4)支持向量機將特征映射到一個更高維的空間里找到樣本數(shù)據(jù)之間最優(yōu)的劃分超平面,完成對故障的二分類。
3. 2. 3不同故障模型性能評估
利用第3. 1節(jié)所得到的屬性數(shù)據(jù)集在3種算法模型上的評估結(jié)果如表2所示。
由表2可知,在分別對11種不同的故障數(shù)據(jù)集進行測試時,所確定出的特征屬性在3種算法運行后都有較高精度指數(shù),實驗結(jié)果證明,本文建立的全域特征庫具有合理性和正確性。
3. 2. 4工況私有規(guī)則庫的建立
通過3種算法對本文第2章所述方法建立的全域特征庫進行特征重要性計算及特征選擇,分別建立屬于上述11種故障的私有規(guī)則庫。以供液不足故障為例,經(jīng)過多次實驗分析,從全域特征庫54個特征中選擇了14個特征建立供液不足私有規(guī)則庫的特征公共集,具體特征重要性如圖11所示。
4結(jié)論
針對抽油機故障特征分類難且故障識別率低的問題,基于抽油機工況建立了示功圖全域故障識別特征集,通過應用機器學習算法,對不同特征在不同故障類型中的影響差異進行了深入的對比分析,得出以下結(jié)論:
1)抽油機的每一種故障對全域特征集中的某些特征具有較高敏感度,通過對特征重要性的展示和特征的選擇,可以建立針對每種故障的私有規(guī)則庫。
2)通過抽油機工況建立的示功圖全域故障識別特征集,可為實際生產(chǎn)提供通用的抽油機故障識別工具,且具有較高的準確性。
3)該特征集可有效地為抽油機各類故障識別提供有效特征,為抽油機生產(chǎn)運行和維護提供了重要的參考依據(jù)。