, ,
(中國(guó)石油大學(xué)(北京)地球物理與信息工程學(xué)院,北京 102249)
石油在能源結(jié)構(gòu)中占據(jù)至關(guān)重要的地位,采油是石油生產(chǎn)過(guò)程中最基礎(chǔ)和重要的環(huán)節(jié)。目前常用的采油方法中,有桿泵采油法是應(yīng)用最為廣泛的[1]。因此,有效地監(jiān)測(cè)抽油機(jī)井的工作狀態(tài),快速準(zhǔn)確地識(shí)別油井故障并采取合理有效的措施,對(duì)提高采油效率,增進(jìn)油田效益有著舉足輕重的作用。
油井實(shí)時(shí)示功圖是油井工況的一個(gè)重要表征,它能夠直觀地反映出抽油機(jī)在采油過(guò)程中發(fā)生的各種異常狀況,同時(shí)聯(lián)系地質(zhì)情況及井下技術(shù)狀況等因素,可以識(shí)別出井下泵發(fā)生的故障類(lèi)型。根據(jù)示功圖進(jìn)行工況分析的主要方法有“五指式動(dòng)力儀”分析法、地面示功圖分析法和井下泵示功圖診斷法。相比于其它方法,地面示功圖分析法具有更直觀便捷,簡(jiǎn)單易行的優(yōu)點(diǎn)。因此,根據(jù)油井示功圖判斷油井的工況是目前被廣泛應(yīng)用的方法[2]。
在使用示功圖進(jìn)行工況診斷的過(guò)程中,如何準(zhǔn)確地對(duì)示功圖進(jìn)行特征提取,直接關(guān)系到能否精確地對(duì)油井存在的故障做出判斷,因此,必須要選取恰當(dāng)?shù)奶卣魈崛》椒╗3]。目前,用于油井工況分析的示功圖特征提取的方法主要有基于幾何不變矩的矩特征向量分析法、基于網(wǎng)格法的灰度矩陣統(tǒng)計(jì)量法和基于DFT的傅里葉描述子法[4-6]。相比于其它方法,傅里葉描述子法具有計(jì)算方法簡(jiǎn)潔高效、計(jì)算量小、冗余信息少的優(yōu)勢(shì),可以比較準(zhǔn)確地提取出示功圖的圖像特征。
在傳統(tǒng)的傅里葉描述子法中,只提取了示功圖數(shù)據(jù)經(jīng)DFT得到的各次諧波的幅度譜,并沒(méi)有對(duì)各次諧波的相位譜進(jìn)行整合,相當(dāng)于只提取了圖像波動(dòng)的幅度情況,并沒(méi)有提取圖像波動(dòng)的位置信息,從而丟失了示功圖曲線形狀的凸起或凹陷這類(lèi)代表位置的有用信息,對(duì)圖像識(shí)別的準(zhǔn)確性有較大的影響。本文提出了一種融合信號(hào)DFT的幅值與相位信息的特征提取方法,更加完整地提取了示功圖的特征信息,并構(gòu)造出能在極大程度上反映示功圖圖形特征的特征向量。此外,相對(duì)于現(xiàn)在被廣泛應(yīng)用的二分類(lèi)支持向量機(jī),本文采用一種基于多分類(lèi)向量機(jī)的分類(lèi)識(shí)別方法[7-8],并優(yōu)選了核函數(shù),進(jìn)一步提高了示功圖診斷的準(zhǔn)確率。
示功圖是指在一個(gè)采油沖程過(guò)程中,以抽油機(jī)相對(duì)下死點(diǎn)的位移S為橫軸,以抽油機(jī)的懸點(diǎn)載荷P為縱軸,繪制出一條關(guān)于P-S的曲線,它是一個(gè)封閉曲線[1]。
理論示功圖是指只考慮懸點(diǎn)所承受的靜載荷及由其引起抽油機(jī)桿柱及有關(guān)柱的彈性變形,而不考慮其它因素影響時(shí),所得到的示功圖曲線。典型示功圖是在理論示功圖的基礎(chǔ)上,只考慮某單一因素影響的載荷隨位移的變化關(guān)系曲線。
圖1為抽油機(jī)井常見(jiàn)工況的典型示功圖圖例[9]。由圖可見(jiàn),正常示功圖近似于平行四邊形(理論示功圖),上下邊出現(xiàn)輕微的震蕩波浪線;各類(lèi)典型故障的示功圖圖形均存在一定的凸起或凹陷,且凸起或凹陷的位置不同。
圖1 典型示功圖圖例
在油田現(xiàn)場(chǎng),由示功儀所采集的示功圖一般是由下死點(diǎn)(圖1(a)中A點(diǎn))開(kāi)始,經(jīng)過(guò)一段時(shí)間達(dá)到加載終止點(diǎn)(圖1(a)中B點(diǎn)),該過(guò)程中得到的曲線稱(chēng)為增載線(圖1(a)中AB段);保持一定時(shí)間后又由上死點(diǎn)(圖1(a)中C點(diǎn))開(kāi)始,經(jīng)過(guò)一段時(shí)間達(dá)到卸載終止點(diǎn)(圖1(a)中D點(diǎn)),該過(guò)程中得到的曲線稱(chēng)為卸載線(圖1(a)中CD段)。
結(jié)合各類(lèi)故障示功圖的形成因素,對(duì)圖1中各圖進(jìn)行分析可知,各類(lèi)典型故障的示功圖圖形的特征主要表現(xiàn)為:
1)氣鎖:增載線和卸載線均有一定弧度。
2)氣體影響:增載線、卸載線均都比較平緩,但增載線相對(duì)于卸載線更陡一些。
3)供液不足:增載線和卸載線相互平行,且均比較陡直。
4)固定閥漏失:卸載線比增載線平緩,示功圖的左下角為圓弧。
5)游動(dòng)閥漏失:增載線比卸載線平緩,示功圖的右上角為圓弧。
6)雙凡爾漏失:增載線和卸載線都比較平緩,形狀呈水平橢圓形。
7)游動(dòng)閥關(guān)閉遲緩:加載線延長(zhǎng)且形狀較陡直,示功圖的左上方有缺失。
8)柱塞脫出工作筒:增載線正常,卸載線不太明顯,圖形右下角有波浪曲線。
9)上碰泵:圖形右上角有一個(gè)環(huán)狀凸出。
10)下碰泵:圖形左下角有一個(gè)環(huán)狀凸出。
在油田現(xiàn)場(chǎng),在一個(gè)沖程內(nèi),由示功儀所采集的實(shí)測(cè)示功圖數(shù)據(jù)通常為200或250個(gè)點(diǎn)的位移與載荷數(shù)據(jù),從而可以得到一組序列值(sn,pn),n=0,1,…,N-1,其中sn為位移,pn為載荷。將位移sn和載荷pn組合成如下一維復(fù)數(shù)序列:
zn=sn+jpn
n=(0,1,…,N-1)
(1)
對(duì)于封閉的曲線,該序列是以點(diǎn)數(shù)N為周期的周期序列。對(duì)其做DFT,得到:
k=0,1,…,N-1;n=0,1,…,N-1
(2)
Zk的模|Zk|稱(chēng)為DFT的幅值,反映的是示功圖序列波動(dòng)的各次諧波的大小,其相角h(k)稱(chēng)為DFT的相位,包含著其波動(dòng)的位置信息。
圖2為對(duì)各個(gè)典型示功圖曲線作250點(diǎn)DFT得到的幅值譜|Zk|的曲線。由于幅度譜反映的是示功圖波動(dòng)的大小情況,因此幅度譜分析結(jié)果與前文所述的各類(lèi)典型故障的示功圖圖形均存在一定的凸起或凹陷相對(duì)應(yīng)。
根據(jù)圖2可知,某些圖形特征相似的故障類(lèi)型的示功圖,如“氣體影響”與“供液量不足”、“游動(dòng)閥關(guān)閉遲緩”與“柱塞脫出工作筒”均存在較大的面積缺失現(xiàn)象;再如“上碰泵””與“下碰泵”均存在環(huán)狀凸出現(xiàn)象等,它們兩兩之間的DFT幅度譜差異并不大,因此,難以對(duì)這些故障種類(lèi)的示功圖進(jìn)行準(zhǔn)確地區(qū)分。
圖2 典型故障示功圖的DFT幅值信息
圖3為分別對(duì)各個(gè)典型示功圖的上行數(shù)據(jù)(增載線)和下行數(shù)據(jù)(卸載線)作250點(diǎn)DFT得到的相位譜h(k)的曲線。由于相位譜反映的是示功圖波動(dòng)的位置情況,因此相位譜分析結(jié)果與前文所述的各類(lèi)典型故障的示功圖圖形的凸起或凹陷位置不同相對(duì)應(yīng)。
根據(jù)圖3可知,對(duì)于前文所述的DFT幅度譜差異不大的故障類(lèi)型的示功圖,如“氣體影響”與“供液量不足”、“游動(dòng)閥關(guān)閉遲緩”與“柱塞脫出工作筒”、“上碰泵”與“下碰泵”,它們兩兩之間的相位譜則有明顯的差異,可以較好地分析出示功圖特征的位置,從而較好地對(duì)這些故障種類(lèi)的示功圖進(jìn)行準(zhǔn)確地區(qū)分。
圖3 典型故障示功圖的DFT相位信息
為了克服傳統(tǒng)傅里葉描述子方法在用于示功圖識(shí)別的缺陷,本文將示功圖序列的DFT幅度譜與相位譜進(jìn)行融合,構(gòu)造了能夠充分反映出示功圖圖形的形狀輪廓特征、細(xì)節(jié)波動(dòng)與凹凸位置信息的特征向量。同時(shí),根據(jù)DFT的定義可知,此特征向量的各個(gè)分量之間均線性無(wú)關(guān)并且相互正交,從而最大程度地獲取了示功圖在其特征空間的信息,因而有效地提高示功圖類(lèi)型識(shí)別的準(zhǔn)確率。由歐拉變換可知,
Zk=|Zk|ejh(k)=|Zk|cos(h(k))+j|Zk|sin(h(k))
(3)
公式(3)中的實(shí)部和虛部均同時(shí)包含了DFT的幅度信息和相位信息,因此,為了簡(jiǎn)化計(jì)算,僅選取實(shí)部來(lái)構(gòu)造特征向量。又由于信號(hào)的主要能量集中在其低次諧波分量上,因此,在兼顧精度及計(jì)算量的前提下,選取DFT的直流項(xiàng)及前9次諧波來(lái)構(gòu)造特征向量,則最終構(gòu)造的融合了幅度與相位信息的示功圖特征向量如(4)式所示:
(4)
這樣,對(duì)每一個(gè)示功圖都可以構(gòu)造出一個(gè)線性無(wú)關(guān)的特征向量,以此特征向量作為該示功圖的特征,輸入到由訓(xùn)練樣本訓(xùn)練得到的分類(lèi)判別器中,進(jìn)行人工智能判別,從而對(duì)示功圖進(jìn)行正確的分類(lèi)識(shí)別,得到油井的實(shí)際工況。
支持向量機(jī)(SVM)是Corinna Cortes和Vapnik等人于20世紀(jì)90年代提出的一種機(jī)器學(xué)習(xí)方法,它主要應(yīng)用于模式識(shí)別領(lǐng)域,是一種結(jié)合了統(tǒng)計(jì)學(xué)理論的VC維理論以及結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則的模式識(shí)別方法,在有限的訓(xùn)練樣本中尋求學(xué)習(xí)能力與模型復(fù)雜度融合后的最佳折中結(jié)果,從而得到最小誤差分類(lèi)器。
支持向量機(jī)的基本思想是:首先,判斷樣本數(shù)據(jù)是否線性可分:1)若樣本為線性可分,則直接尋找最優(yōu)分類(lèi)面進(jìn)行分類(lèi);2)若樣本為線性不可分,則引入兩個(gè)變量(松弛系數(shù)和懲罰分量)進(jìn)行輔助分析,通過(guò)非線性映射將樣本映射到高維特征空間中,在高維空間中尋找最優(yōu)分類(lèi)面對(duì)樣本進(jìn)行分類(lèi)[10];同時(shí),它通過(guò)使用結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理,也在一定程度上對(duì)分類(lèi)器實(shí)現(xiàn)全局的最優(yōu)效果進(jìn)行了保障。
SVM只用于兩類(lèi)問(wèn)題的分類(lèi),解決多分類(lèi)問(wèn)題時(shí)通常是利用若干個(gè)兩分類(lèi)決策器解決多分類(lèi)問(wèn)題,具體實(shí)現(xiàn)方法大致可分為以下幾種:
1)一對(duì)一分類(lèi)方法(one-versus-one):該方法將多分類(lèi)問(wèn)題轉(zhuǎn)化為若干個(gè)子分類(lèi)問(wèn)題,任意兩類(lèi)構(gòu)造一個(gè)兩分類(lèi)分類(lèi)器,對(duì)所有的兩分類(lèi)分類(lèi)器都進(jìn)行判斷,最終的結(jié)果為所占比重最大的類(lèi),如圖4所示。當(dāng)子分類(lèi)的數(shù)量過(guò)多時(shí),計(jì)算量很大,會(huì)大幅度的降低訓(xùn)練與測(cè)試的速度。分類(lèi)結(jié)果可能會(huì)出現(xiàn)分類(lèi)重疊現(xiàn)象。
圖4 一對(duì)一分類(lèi)方式示意圖
2)一對(duì)多分類(lèi)方法(one-versus-rest):該方法將問(wèn)題轉(zhuǎn)化為多個(gè)兩分類(lèi)問(wèn)題,將某類(lèi)看作兩分類(lèi)問(wèn)題中的一類(lèi),將其余的所有類(lèi)看作另一類(lèi)進(jìn)行判別分類(lèi),依次循環(huán),最終結(jié)果為分類(lèi)函數(shù)值最大的類(lèi),如圖5所示。若訓(xùn)練樣本數(shù)目過(guò)大,會(huì)導(dǎo)致訓(xùn)練過(guò)程耗時(shí)很長(zhǎng)。分類(lèi)結(jié)果可能會(huì)出現(xiàn)分類(lèi)重疊現(xiàn)象或不可分類(lèi)現(xiàn)象。
圖5 一對(duì)多分類(lèi)方法示意圖
3)二叉樹(shù)分類(lèi)方法(Binary Tree):該方法是將樣本數(shù)據(jù)分為兩大類(lèi),然后繼續(xù)劃分每個(gè)大類(lèi)為兩個(gè)類(lèi),直至所有類(lèi)不能再劃分為止,如圖6所示(圖中示例n=4)。在訓(xùn)練學(xué)習(xí)的過(guò)程中,存在錯(cuò)誤向下累積現(xiàn)象。
圖6 二叉樹(shù)方法示意圖
4)DDAG算法(Decision Directed Acyclic Graph):該算法以有向無(wú)環(huán)圖為理論基礎(chǔ),將所有分類(lèi)器構(gòu)成有向無(wú)環(huán)圖,每次參與分類(lèi)的兩個(gè)類(lèi)別可無(wú)重復(fù)的任意選取,如圖7所示(圖中示例n=4)。在訓(xùn)練的過(guò)程中,同樣存在錯(cuò)誤向下累積現(xiàn)象,而且訓(xùn)練過(guò)程的時(shí)間通常較長(zhǎng)。
圖7 有向無(wú)環(huán)方法示意圖
針對(duì)經(jīng)典SVM的不足之處,許多研究人員對(duì)SVM進(jìn)行了更為深入地研究,他們?cè)趯⒐阶冃魏笱芯砍鰬?yīng)用范圍更具體且具有某些特定優(yōu)勢(shì)的變形算法。其中,由臺(tái)灣大學(xué)林智仁博士等[11-12]于2001年開(kāi)發(fā)設(shè)計(jì)的LIBSVM算法融合了收縮和緩存技術(shù),
具有程序小,運(yùn)用靈活;輸入?yún)?shù)少,操作簡(jiǎn)單;是開(kāi)源的,方便改進(jìn)、易于擴(kuò)展等特點(diǎn),同時(shí),具有較好性能又適用于Windows、Unix等多種操作系統(tǒng),因此,目前被許多國(guó)際著名研究機(jī)構(gòu)所采用作為訓(xùn)練算法。
LIBSVM作為通用的SVM軟件包,該軟件對(duì)SVM所涉及的參數(shù)調(diào)節(jié)相對(duì)比較少,提供了很多默認(rèn)的參數(shù)設(shè)置,利用這些默認(rèn)參數(shù)可以有效地解決包括分類(lèi)問(wèn)題在內(nèi)的多種類(lèi)型的問(wèn)題。同時(shí),它還有了交互檢驗(yàn)的功能,利用所提供的多種常用核函數(shù)可以將交叉驗(yàn)證的參數(shù)選擇變得更為精準(zhǔn)。該軟件可以解決C-SVM、ν-SVM、ε-SVR和ν-SVR等問(wèn)題,包括基于一對(duì)一算法的多類(lèi)模式識(shí)別問(wèn)題。
所以,本文選用了LIBSVM支持向量機(jī)分類(lèi)器,它能夠?qū)⒅С窒蛄繖C(jī)、分布估計(jì)與回歸完整結(jié)合在一起,從而對(duì)不同類(lèi)型的示功圖進(jìn)行判別與診斷。LIBSVM分類(lèi)器的設(shè)計(jì)與應(yīng)用步驟如圖8所示。
圖8 LIBSVM分類(lèi)器的設(shè)計(jì)與應(yīng)用步驟
本論文研究的是一種對(duì)油井實(shí)測(cè)示功圖進(jìn)行分類(lèi)識(shí)別的方法,該方法的實(shí)驗(yàn)過(guò)程分為圖像預(yù)處理、訓(xùn)練和測(cè)試3個(gè)階段。整體實(shí)驗(yàn)過(guò)程的流程如圖9所示。
圖9 實(shí)驗(yàn)過(guò)程流程圖
圖像預(yù)處理階段主要是消除圖像中的無(wú)關(guān)信息,增強(qiáng)有用信息的可檢測(cè)性,同時(shí)最大限度地簡(jiǎn)化數(shù)據(jù),從而提高特征提取及匹配識(shí)別的準(zhǔn)確性。主要包括歸一化處理、形態(tài)學(xué)處理和坐標(biāo)數(shù)字化處理。
訓(xùn)練階段是根據(jù)已知故障類(lèi)型的示功圖的面積特征,將故障示功圖粗略分為若干個(gè)集合,然后分別在各集合中對(duì)由訓(xùn)練樣本構(gòu)造的特征向量進(jìn)行訓(xùn)練,最終得到多分類(lèi)判別器。
測(cè)試階段是根據(jù)待識(shí)別故障類(lèi)型的示功圖的面積特征來(lái)確定其所屬集合,然后將由其構(gòu)造的特征向量輸入到相應(yīng)的多分類(lèi)判別器中,從而實(shí)現(xiàn)示功圖的分類(lèi)判別。
訓(xùn)練階段和測(cè)試階段在構(gòu)造特征向量時(shí)均采用利用前文介紹的方法,在得到融合DFT幅度譜與相位譜各特征成分的特征向量后,均采用匹配高斯徑向基核函數(shù)的支持向量機(jī)對(duì)示功圖進(jìn)行訓(xùn)練和測(cè)試。
本實(shí)驗(yàn)在Matlab仿真平臺(tái)上進(jìn)行仿真驗(yàn)證。由于LIBSVM算法的準(zhǔn)確率主要與訓(xùn)練和測(cè)試時(shí)所選取的核函數(shù)種類(lèi)有關(guān),而核函數(shù)的正確選取依賴(lài)于產(chǎn)生分類(lèi)問(wèn)題的實(shí)際問(wèn)題的特點(diǎn),不同的實(shí)際問(wèn)題對(duì)相似程度有著不同的度量,因此,選擇正確的核函數(shù)有助于提高分類(lèi)準(zhǔn)確率。
核函數(shù)的種類(lèi)由參數(shù)t決定。t=0時(shí)為線性核;t=1為多項(xiàng)式核;t=2時(shí)為高斯徑向基函數(shù);t=3時(shí)為Sigmod核函數(shù);t=4為自己定制的任意一種的核函數(shù)。表1為采用不同核函數(shù)時(shí)識(shí)別準(zhǔn)確率的對(duì)比。對(duì)表1中數(shù)據(jù)進(jìn)行對(duì)比分析可知:
1)對(duì)于相同的數(shù)據(jù),不同核函數(shù)的識(shí)別準(zhǔn)確率不同;
2)當(dāng)樣本數(shù)據(jù)量較少時(shí),高斯徑向基核函數(shù)識(shí)別準(zhǔn)確率更高。
表1 不同核函數(shù)時(shí)識(shí)別準(zhǔn)確率對(duì)比 %
因此,考慮到實(shí)際采集到的示功圖樣本數(shù)量較少的情況,本實(shí)驗(yàn)在訓(xùn)練階段和測(cè)試階段支持向量機(jī)的核函數(shù)均選取高斯徑向基核函數(shù)。
本實(shí)驗(yàn)選取了氣鎖、氣體影響、供液不足、固定閥漏失、游動(dòng)閥漏失、雙爾凡漏失游動(dòng)閥關(guān)閉遲緩、柱塞脫出工作筒、上碰泵和下碰泵,共10 種油田實(shí)際生產(chǎn)中易出現(xiàn)的故障類(lèi)型的共275組示功圖數(shù)據(jù)進(jìn)行分析研究。利用現(xiàn)場(chǎng)采集的實(shí)測(cè)示功圖建立樣本庫(kù),并根據(jù)面積特征劃分為若干個(gè)集合,在各集合中根據(jù)每類(lèi)典型故障示功圖樣本的數(shù)量情況,適當(dāng)選取其中一部分作為訓(xùn)練樣本,其余部分劃歸為測(cè)試樣本。在構(gòu)造特征向量時(shí),分別采取僅使用幅值信息和融合幅值信息與相位信息兩種方法,對(duì)相同的樣本分別進(jìn)行訓(xùn)練和測(cè)試,測(cè)試結(jié)果如表2所示。
表2 不同特征向量構(gòu)造方法的識(shí)別準(zhǔn)確率對(duì)比
其中,方法一為僅利用DFT幅度譜構(gòu)造特征向量;方法二為融合DFT幅度譜與相位譜構(gòu)造特征向量。
結(jié)合前文對(duì)各類(lèi)典型故障的示功圖圖形的理論分析和DFT分析結(jié)果,對(duì)表2中數(shù)據(jù)進(jìn)行對(duì)比分析可知:
1)本文提出的方法二的識(shí)別準(zhǔn)確率的平均值較方法一的識(shí)別準(zhǔn)確率的平均值有明顯提高;
2)方法一識(shí)別準(zhǔn)確率較高的均為示功圖圖形特征明顯且與其他故障類(lèi)型的圖形相似度較低的故障類(lèi)型,如氣鎖、雙凡爾漏失等,對(duì)于這些故障類(lèi)型的示功圖,本文提出的方法二可將方法一的識(shí)別準(zhǔn)確率繼續(xù)保持;
3)方法一識(shí)別準(zhǔn)確率較低的故障類(lèi)型多為圖形特征不明顯或與其他故障類(lèi)型的圖形相似度較高的故障類(lèi)型,如氣體影響、供液不足、固定閥漏失、游動(dòng)閥關(guān)閉遲緩、柱塞脫出工作筒、下碰泵等,對(duì)于這些故障類(lèi)型的示功圖,本文提出的方法二的識(shí)別準(zhǔn)確率相較于方法一的識(shí)別準(zhǔn)確率則有大幅提高。
1)提出了一種融合DFT幅值與相位信息的示功圖特征提取方法,相較于傳統(tǒng)的傅里葉方法,本文方法不僅可以反映示功圖曲線的波動(dòng)特征,而且可以反映示功圖曲線凹凸的位置特征,能夠更加全面和準(zhǔn)確地表達(dá)出示功圖所包含的特征信息。
2)相對(duì)于現(xiàn)在被廣泛應(yīng)用的二分類(lèi)支持向量機(jī),本文采用一種基于多分類(lèi)向量機(jī)的分類(lèi)識(shí)別方法,并選取高斯徑向基核函數(shù),進(jìn)一步提高了示功圖診斷的準(zhǔn)確率。
3)實(shí)測(cè)表明,本文提出的示功圖識(shí)別方法對(duì)油井示功圖故障類(lèi)型的診斷更加準(zhǔn)確有效,可為油井生產(chǎn)的實(shí)時(shí)分析與優(yōu)化控制提供技術(shù)支撐。