劉廣孚, 杜玉龍, 郭 亮, 石二勇, 王 震, 鄢志丹
(1.中國石油大學(xué)(華東)控制科學(xué)與工程學(xué)院,山東青島 266580; 2.中國石油大學(xué)(華東)海洋與空間信息學(xué)院, 山東青島 266580; 3.中國石化勝利油田分公司河口采油廠,山東東營 257200)
超過90%的生產(chǎn)油井需要某種形式的人工舉升來進(jìn)行油氣開采[1]。潛油電機(jī)和電動潛油離心泵組成的潛油電泵機(jī)組因?yàn)槠滹@著優(yōu)點(diǎn)廣泛應(yīng)用于高產(chǎn)井、含水井及斜井中,是各油田重要的采油設(shè)備[2]。但是由于潛油電泵機(jī)組結(jié)構(gòu)復(fù)雜,關(guān)聯(lián)性強(qiáng),再加上復(fù)雜多變的地質(zhì)結(jié)構(gòu)和井況條件,導(dǎo)致潛油電泵機(jī)組的故障率較高[3],且故障類型復(fù)雜多樣。一直以來,國內(nèi)外對于潛油電泵機(jī)組的故障或工況診斷研究從未間斷過[4]。潛油電機(jī)是一種三相異步電動機(jī),在電網(wǎng)電壓一定時(shí),其電磁轉(zhuǎn)矩與電機(jī)電流具有特定的非線性關(guān)系,即電機(jī)電流的變化可以反映負(fù)載轉(zhuǎn)矩的變化。所以,傳統(tǒng)的工況診斷方法主要為電流卡片[5-8],但電流卡片記錄的信息量有限,且時(shí)效性較低,逐漸被油田淘汰。在“數(shù)字化”油田時(shí)代,國內(nèi)外學(xué)者針對潛油電泵機(jī)組不同類型的故障或工況,分析其對應(yīng)的相關(guān)參數(shù)數(shù)據(jù),實(shí)現(xiàn)對故障及工況的識別。Li等[9]通過分析9種不同工況下氣體產(chǎn)量、液體產(chǎn)量、油氣比、電壓、電流和油壓參數(shù)的變化情況,區(qū)別不同類型的工況或故障。Gupta[10]提出了一種數(shù)據(jù)驅(qū)動的分析解決方案,使用多變量統(tǒng)計(jì)方法來主動監(jiān)控與潛油電泵性能相關(guān)的壽命統(tǒng)計(jì)數(shù)據(jù),通過降維和模式識別實(shí)現(xiàn)對故障的預(yù)警和診斷。上述兩種方法是建立在統(tǒng)計(jì)數(shù)據(jù)的基礎(chǔ)上的,但實(shí)際生產(chǎn)中故障數(shù)據(jù)缺乏,在實(shí)際應(yīng)用中受到一定的限制。國內(nèi)各大油田也在積極開展?jié)撚碗姳脵C(jī)組異常工況分析,力求降低故障率[11-12],但更多的是基于現(xiàn)場處置經(jīng)驗(yàn),數(shù)據(jù)的科學(xué)性不足。潛油電泵機(jī)組運(yùn)行狀態(tài)監(jiān)測及故障預(yù)警對油田生產(chǎn)具有重要的意義。但由于油田數(shù)字化建設(shè)時(shí)間較短,而且正常運(yùn)行數(shù)據(jù)量遠(yuǎn)高于故障數(shù)據(jù)量,并且潛油電泵工況及故障類型復(fù)雜多樣,所收集的不同故障類型的樣本數(shù)據(jù)難以達(dá)到深度學(xué)習(xí)訓(xùn)練及驗(yàn)證的要求。筆者僅依托潛油電泵井正常運(yùn)行數(shù)據(jù)建立單分類支持向量機(jī)模型,通過對電流數(shù)據(jù)進(jìn)行清洗、篩選、分析及特征提取,訓(xùn)練單分類支持向量機(jī)模型獲得區(qū)分潛油電泵井正常運(yùn)行狀態(tài)和異常運(yùn)行狀態(tài)的能力,實(shí)現(xiàn)對潛油電泵井異常工況的判別及預(yù)警。
支持向量機(jī)(support vector machine, SVM)[13-14]是針對二分類問題提出的,需要用兩種數(shù)量相對均衡的樣本建立訓(xùn)練數(shù)據(jù)集。但是在工業(yè)生產(chǎn)中,面臨一個(gè)較為普遍的問題,即正常狀態(tài)數(shù)據(jù)多,異常狀態(tài)數(shù)據(jù)少,甚至沒有數(shù)據(jù)樣本,對工業(yè)故障診斷造成一定困擾。當(dāng)遇到只有一種類型的數(shù)據(jù)即單分類問題時(shí),SVM演變出了基于單分類的支持向量機(jī)[15-17]。單分類支持向量機(jī)(one-class support vector machine, OCSVM)是基于支持向量機(jī)的一種單類分類算法[18],與傳統(tǒng)支持向量機(jī)思想類似,將數(shù)據(jù)映射到與內(nèi)核相對應(yīng)的特征空間,在特征空間中求解最優(yōu)超平面(圖1),最大化樣本與原點(diǎn)之間的間隔[19]。
圖1 單分類支持向量機(jī)的最優(yōu)超平面Fig.1 Optimal hyperplane of one-class support vector machine
(1)
利用對偶算法的思想,求得上述問題的最優(yōu)解。對于式(1),構(gòu)造上述模型的拉格朗日方程,得到原優(yōu)化問題的對偶問題:
(2)
其中
Qij=K(xi,xj)=φ(xi)φ(xj).
式中,K(xi,xj)為核函數(shù)。普遍使用的核函數(shù)是高斯徑向基核函數(shù)(radial basis function,RBF),其函數(shù)表達(dá)式[21-22]為
(3)
式中,σ為核寬度系數(shù)。由式(2)求解出α,得到?jīng)Q策函數(shù)為
(4)
針對電泵井實(shí)際生產(chǎn)中所面臨的正常狀態(tài)數(shù)據(jù)多、異常狀態(tài)數(shù)據(jù)少而無法完成模型訓(xùn)練及驗(yàn)證的問題,本文中將單分類支持向量機(jī)模型引入到潛油電泵工況及故障診斷中,利用單分類支持向量機(jī)的特殊優(yōu)勢,僅依靠潛油電泵在正常狀態(tài)下的電流數(shù)據(jù)就可以識別異常狀態(tài),實(shí)現(xiàn)對潛油電泵故障及異常工況的精準(zhǔn)識別。
圖2 潛油電泵工況及故障診斷流程Fig.2 Operating condition and fault diagnosis flow chart of electric submersible pump
本文中所有數(shù)據(jù)均采集于中國石化勝利油田下屬某采油廠,該采油廠信息化程度較高,生產(chǎn)指揮系統(tǒng)平臺可實(shí)時(shí)獲取潛油電泵機(jī)組的三相電壓、三相電流、油壓、井口溫度、瞬時(shí)流量等工作參數(shù)及環(huán)境參數(shù),采集間隔為1 min。選取50口電泵井(1~50號電泵井)在正常狀態(tài)下的三相歷史電流數(shù)據(jù)構(gòu)建訓(xùn)練集,每口井選擇106min的三相電流數(shù)據(jù),并且將每500 min的三相時(shí)序電流數(shù)據(jù)劃分為3個(gè)數(shù)據(jù)樣本,即A相、B相、C相分別構(gòu)成一個(gè)樣本。A相電流選取2 000個(gè)訓(xùn)練樣本,B相電流選取2 000個(gè)訓(xùn)練樣本,C相電流選取2 000個(gè)訓(xùn)練樣本,每口井共選取6 000個(gè)訓(xùn)練樣本,故訓(xùn)練集中共包含3×105個(gè)樣本。另外選擇2口含故障數(shù)據(jù)的潛油電泵井(51號和52號電泵井),將其故障期間的A相電流數(shù)據(jù)作為測試集,每口井選取2 500 min的A相電流數(shù)據(jù),以500 min為時(shí)間窗口、1 min為滑動步長劃分測試樣本,每口井選取2 000個(gè)測試樣本。圖3為訓(xùn)練樣本中4口不同電泵井在正常狀態(tài)下的運(yùn)行電流數(shù)據(jù)樣本。從圖中可以看出,此時(shí)運(yùn)行電流平穩(wěn),波動幅度小。
利用OCSVM模型構(gòu)建潛油電泵工況及故障診斷模型,通過學(xué)習(xí)正常狀態(tài)數(shù)據(jù)樣本,獲得區(qū)分異常樣本的能力。構(gòu)建工況及故障診斷模型主要包括3部分。
2.3.1 特征提取
首先對潛油電泵井正常狀態(tài)下的電流數(shù)據(jù)進(jìn)行特征提取,假設(shè)其中某一正常狀態(tài)下的時(shí)序電流數(shù)據(jù)為L={l1,l2,l3,…,lt},其中本文中t取500。提取以下6個(gè)特征值,構(gòu)建特征集。
(1)t分鐘內(nèi)的波動幅度(A)為
A=maxL-minL.
(5)
(2)t分鐘內(nèi)的變化斜率(G)為
(6)
(3)標(biāo)準(zhǔn)差(S)為
(7)
(4)最大值和最小值的差值占均值的百分比(D)為
(8)
(5)兩點(diǎn)間正、負(fù)斜率樣本數(shù)各占總樣本的比例。假設(shè)電流數(shù)據(jù)L中每兩點(diǎn)間的斜率集合為M={m1,m2,m3,…,mt-1},統(tǒng)計(jì)M中正斜率樣本數(shù)(mi>0.1)和負(fù)斜率樣本數(shù)(mi<-0.1)各占斜率樣本總數(shù)的比例,以此表現(xiàn)電流數(shù)據(jù)的波動性。以下面兩段電流數(shù)據(jù)樣本為例,正常工況下相鄰兩點(diǎn)電流間正、負(fù)斜率樣本數(shù)各占斜率樣本4%(圖4);而氣干擾工況下兩者的比例分別為47.29%、49.5%(圖5)。因此該特征可以很好地表現(xiàn)電流數(shù)據(jù)的波動性。
為了提高模型精度和收斂速度,在將數(shù)據(jù)樣本送入網(wǎng)絡(luò)之前,需要對數(shù)據(jù)進(jìn)行歸一化處理,將數(shù)據(jù)映射到[0,1]之間。
圖3 不同電泵井正常狀態(tài)下三相電流數(shù)據(jù)樣本Fig.3 Three-phase current data samples of different electric pump wells under normal conditions
圖4 正常工況下相鄰兩點(diǎn)電流間斜率分布Fig.4 Distribution of slope of two adjacent current values under normal conditions
2.3.2 建立OVSVM模型
選取高斯徑向基核函數(shù)建立OCSVM分類模型,其誤差懲罰系數(shù)設(shè)置為0.1。利用提取的特征值進(jìn)行模型的訓(xùn)練及優(yōu)化,保存最優(yōu)模型。最后,將潛油電泵機(jī)組測試數(shù)據(jù)樣本提取相應(yīng)特征值后,輸入OCSVM模型中進(jìn)行正常狀態(tài)和異常狀態(tài)的判斷。通過利用OCSVM模型,可以準(zhǔn)確識別異常狀態(tài)數(shù)據(jù),也包括未知的異常狀態(tài)類型。
圖5 氣干擾工況下相鄰兩點(diǎn)電流間斜率分布Fig.5 Distribution of slope of two adjacent current values under interference conditions
2.3.3 模型評估
為了更好地評估模型的分類效果,采用精確率(P)和召回率(R)兩個(gè)分類指標(biāo)。其定義為
(9)
(10)
式中,NTP為正類數(shù)據(jù)被識別為正類的樣本數(shù);NFP為正類數(shù)據(jù)被識別為負(fù)類的樣本數(shù);NFN為負(fù)類數(shù)據(jù)被識別為正類的樣本數(shù)。
利用OCSVM模型對另外50口潛油電泵井(51~100號電泵井)近兩年的運(yùn)行狀態(tài)進(jìn)行了判別,并進(jìn)行了結(jié)果驗(yàn)證。針對不同運(yùn)行狀態(tài),本文中選取了其中較典型的2口潛油電泵井分別進(jìn)行詳細(xì)分析。結(jié)果表明,故障識別準(zhǔn)確度較高,誤差較低。
以51號潛油電泵井為例,該井在2019年12月19日4時(shí)8分因?yàn)楫愇锟ū迷斐蓾撚碗姳脵C(jī)組負(fù)載增大,11時(shí)49分過載停機(jī),選擇該井?dāng)?shù)據(jù)進(jìn)行運(yùn)行狀態(tài)識別及驗(yàn)證試驗(yàn),運(yùn)行電流如圖6(a)所示。將圖6(a)測試數(shù)據(jù)以500 min為時(shí)間窗口進(jìn)行數(shù)據(jù)劃分及特征提取,輸入模型中進(jìn)行狀態(tài)識別。在4時(shí)10分,潛油電泵井電流上升幅度達(dá)到4.7 A,斜率為0.008 8,標(biāo)準(zhǔn)差為25.16, 最大值和最小值的差值占均值的百分比為17.9%,超出正常狀態(tài)范圍,OCSVM模型判別此時(shí)潛油電泵井進(jìn)入異常狀態(tài);并且故障發(fā)生后,電流兩點(diǎn)間正、負(fù)斜率樣本數(shù)各占總樣本的比例分別從20%、21%變?yōu)?2%、48%,更加確定潛油電泵井運(yùn)行狀態(tài)異常。但按照之前的閾值報(bào)警模式,該狀況并不會觸發(fā)預(yù)警系統(tǒng)或停機(jī)動作,導(dǎo)致潛油電泵井故障運(yùn)行,從而造成機(jī)組損壞嚴(yán)重。通過此模型,可以在第一時(shí)間監(jiān)測到潛油電泵井的異常狀態(tài),提前采取停井作業(yè)等措施可以降低機(jī)組的損壞程度,降低維修成本,實(shí)現(xiàn)故障預(yù)警功能。
圖6 51號潛油電泵井運(yùn)行電流及識別結(jié)果Fig.6 Operating current and identification results of No.51 electric submersible pump well
以52號潛油電泵井為例,該井在2019年6月29日7時(shí)2分因負(fù)載增大造成電流增大,6月30日0時(shí)48分潛油電泵過載停機(jī)且泵軸斷裂,故障停機(jī)前期的運(yùn)行電流如圖7(a)所示,選取其為測試樣本。從電流數(shù)據(jù)變化中可以看出,在泵軸斷裂前期,有比較明顯的故障特征,長達(dá)1 000 min,如果能夠及時(shí)監(jiān)測到異常狀態(tài),可以避免發(fā)生泵軸斷等嚴(yán)重?fù)p壞設(shè)備的現(xiàn)象。
在6月29日7時(shí)10分,電流上升幅度達(dá)到1.3 A,斜率從0增大為0.001 2,標(biāo)準(zhǔn)差從0變?yōu)?,并持續(xù)增大,D從0變?yōu)?.5%,故障發(fā)生后電流兩點(diǎn)間正、負(fù)斜率樣本數(shù)各占總樣本的比例分別從0變?yōu)?0%、29%,所以認(rèn)為潛油電泵井進(jìn)入異常運(yùn)行狀態(tài)。由圖7(b)可以看出,OCSVM模型可以比較精準(zhǔn)地識別異常狀態(tài),從而發(fā)出預(yù)警信息,避免潛油電泵在故障下持續(xù)運(yùn)行,可以提前采取停井檢修等措施,避免泵軸發(fā)生斷裂。
圖7 52號潛油電泵井運(yùn)行電流及識別結(jié)果Fig.7 Operating current and identification results of No.52 electric submersible pump well
表1 51號和52號潛油電泵井識別準(zhǔn)確度
提出利用OCSVM模型代替原有的閾值報(bào)警模式,通過借助大量正常數(shù)據(jù)樣本區(qū)分多樣化的異常數(shù)據(jù),其中也包括未知的故障類型,提升了針對異常數(shù)據(jù)的識別能力,解決了油田生產(chǎn)中故障樣本少難以實(shí)現(xiàn)故障精準(zhǔn)識別的問題,對油田生產(chǎn)具有一定的實(shí)際應(yīng)用意義。利用OCSVM模型對潛油電泵井近兩年的電流數(shù)據(jù)進(jìn)行了測試和驗(yàn)證,通過試驗(yàn)證明,判別準(zhǔn)確度比較高,誤差在可控范圍內(nèi),泛化能力強(qiáng),可以實(shí)現(xiàn)精準(zhǔn)報(bào)警。通過提前采取預(yù)防措施,可以避免更嚴(yán)重故障的發(fā)生。同時(shí),針對工業(yè)故障診斷中異常狀態(tài)數(shù)據(jù)缺乏的問題提供了理論思路。