李翔宇,高憲文,李琨,侯延彬(東北大學(xué)信息科學(xué)與工程學(xué)院,遼寧 沈陽(yáng) 089;渤海大學(xué)工學(xué)院,遼寧 錦州 03)
?
基于多源信息特征融合的抽油井動(dòng)液面集成軟測(cè)量建模
李翔宇1,高憲文1,李琨2,侯延彬1
(1東北大學(xué)信息科學(xué)與工程學(xué)院,遼寧 沈陽(yáng) 110819;2渤海大學(xué)工學(xué)院,遼寧 錦州 121013)
摘要:針對(duì)傳統(tǒng)抽油井動(dòng)液面(DLL)檢測(cè)只能依靠人工操作回聲儀測(cè)試,無(wú)法實(shí)時(shí)在線檢測(cè)的問(wèn)題,提出基于多源信息特征融合的抽油井動(dòng)液面集成軟測(cè)量新方法。采用快速傅里葉變換(FFT)將抽油機(jī)懸點(diǎn)載荷及振動(dòng)時(shí)域信號(hào)轉(zhuǎn)換成頻域信號(hào);采用核主元分析(KPCA)提取懸點(diǎn)載荷及振動(dòng)頻譜和電功率、井口油、套壓時(shí)域信號(hào)非線性特征;利用改進(jìn)的模糊交互式自組織數(shù)據(jù)分析聚類(ISODATA)和高斯過(guò)程回歸(GPR)融合時(shí)頻信息特征,建立多個(gè)動(dòng)態(tài)子模型;利用權(quán)重優(yōu)化證據(jù)理論(D-S)構(gòu)造的概率分配函數(shù)作為權(quán)值因子,對(duì)子模型輸出進(jìn)行集成以得到最終的DLL預(yù)測(cè)值。油田現(xiàn)場(chǎng)應(yīng)用證明了該方法的有效性。
關(guān)鍵詞:信息融合;動(dòng)液面;高斯過(guò)程回歸;預(yù)測(cè);石油;動(dòng)態(tài)建模
2015-11-06收到初稿,2016-03-14收到修改稿。
聯(lián)系人:高憲文。第一作者:李翔宇(1982—),男,博士研究生。
Received date: 2015-11-06.
Foundation item: supported by the National Natural Science Foundation of China (61573088, 61403040, 61433004).
游梁式抽油機(jī)井有桿泵采油(簡(jiǎn)稱有桿抽油系統(tǒng)或有桿泵抽油井)是國(guó)內(nèi)外油田普遍采用的機(jī)械采油方式,是油田開采工藝流程的主要能耗、物耗單元,如何實(shí)現(xiàn)其優(yōu)化運(yùn)行,提高機(jī)采系統(tǒng)效率,一直是該領(lǐng)域研究重點(diǎn)[1-3]。實(shí)時(shí)在線檢測(cè)井下動(dòng)液面位置(dynamic liquid level,DLL)對(duì)實(shí)現(xiàn)采油過(guò)程優(yōu)化運(yùn)行和油田節(jié)能降耗減排意義重大[4-5]。
在實(shí)際生產(chǎn)中,一般是在停機(jī)狀態(tài)下人工操作回聲儀探測(cè)井下動(dòng)液面,該測(cè)試方法工作強(qiáng)度大、成本高、效率低,無(wú)法實(shí)時(shí)在線檢測(cè),并存在一定安全隱患[6-7]。文獻(xiàn)[6-7]以地面示功圖、油井產(chǎn)量、井口油、套管壓力等易測(cè)關(guān)鍵生產(chǎn)參數(shù)為輔助變量,分別采用最小二乘支持向量機(jī)(LSSVM)[8]和高斯過(guò)程回歸(GPR)[9-11]建立了井下動(dòng)液面單一軟測(cè)量模型。但采油過(guò)程作為典型的連續(xù)生產(chǎn)工業(yè)過(guò)程,過(guò)程對(duì)象具有機(jī)理復(fù)雜、多變量、強(qiáng)耦合、非線性、時(shí)變性、大時(shí)滯和隨機(jī)干擾大等特性[12-13],且采集到的數(shù)據(jù)存在多工況,其擾動(dòng)幅度和對(duì)象特性均不同,導(dǎo)致單一軟測(cè)量模型存在模型學(xué)習(xí)時(shí)間過(guò)長(zhǎng)、過(guò)程特性匹配不佳、信息融合不充分、泛化性差、精度低等問(wèn)題[13-15]。研究表明,多模型集成軟測(cè)量建模方法能夠有效提高模型精度、泛化能力、有效性及可信度[16-19]。在多模型軟測(cè)量建模中,通常采用k-均值、模糊C均值等聚類方法對(duì)樣本集進(jìn)行聚類,但上述聚類方法需要事先確定聚類中心和數(shù)目,算法對(duì)初始值的選取較敏感,計(jì)算過(guò)程易陷入局部最優(yōu)[19-21]。針對(duì)回歸問(wèn)題,常用的多模型集成方法有簡(jiǎn)單平均集成、基于切換策略的集成、基于多元線性回歸的集成、基于加權(quán)策略的集成等方法,樣本劃分不精確及聚類結(jié)果不佳等因素都會(huì)導(dǎo)致多模型集成輸出精度降低、融合能力和預(yù)測(cè)效果不理想[17-18]。此外,文獻(xiàn)[22]指出,動(dòng)液面等井下工況參數(shù)與抽油機(jī)懸點(diǎn)載荷、振動(dòng)信號(hào)頻譜強(qiáng)相關(guān),且頻域特征明顯,但文獻(xiàn)[6-7]并未提取載荷、振動(dòng)的頻域信息。然而,頻譜數(shù)據(jù)卻存在超高維和共線性問(wèn)題,不利于構(gòu)建有效的軟測(cè)量模型[18-19]。
工業(yè)過(guò)程一般都是動(dòng)態(tài)的,但大多數(shù)軟測(cè)量建模方法是基于過(guò)程的靜態(tài)假設(shè),即認(rèn)為生產(chǎn)過(guò)程運(yùn)行比較平穩(wěn),建模使用的樣本是與時(shí)間無(wú)關(guān)的離散數(shù)據(jù),但當(dāng)系統(tǒng)的動(dòng)態(tài)變化比較明顯時(shí),靜態(tài)軟測(cè)量模型無(wú)法反映工業(yè)過(guò)程的動(dòng)態(tài)信息和全局特性,造成模型的適應(yīng)性差,預(yù)測(cè)精度大大下降,甚至造成模型失效[17,23]。文獻(xiàn)[7]采用具有外部輸入自回歸滑動(dòng)平均模型(ARMA)結(jié)構(gòu)的GPR軟測(cè)量模型來(lái)提高對(duì)井下動(dòng)液面動(dòng)態(tài)響應(yīng)特性的預(yù)測(cè)能力,但單一模型結(jié)構(gòu)仍然導(dǎo)致動(dòng)液面預(yù)測(cè)效果不佳。文獻(xiàn)[17]采用差分自回歸滑動(dòng)平均(ARIMA)模型對(duì)靜態(tài)條件下LSSVM多模型輸出進(jìn)行動(dòng)態(tài)校正,以提高模型的動(dòng)態(tài)響應(yīng)特性,但由于該軟測(cè)量模型的訓(xùn)練樣本和輸入變量中不包含過(guò)去時(shí)刻的信息,因而本質(zhì)上仍屬靜態(tài)模型。
針對(duì)上述問(wèn)題,本文提出基于多源信息特征融合和多模型集成的抽油井動(dòng)液面軟測(cè)量建模新方法。首先利用核主元分析(KPCA)方法[23-28]非線性提取懸點(diǎn)載荷及振動(dòng)頻譜、電動(dòng)機(jī)輸入功率、井口油、套管壓力時(shí)域信號(hào)特征,消除數(shù)據(jù)相關(guān)性,降低樣本的維數(shù),從而降低模型的復(fù)雜性,提高其泛化能力。在不事先確定聚類數(shù)目和中心的前提下,采用改進(jìn)的模糊ISODATA算法[29]將特征提取后的樣本集快速、有效地自適應(yīng)融合拆分為多個(gè)與對(duì)象特征更加吻合的樣本子集。利用GPR處理高維數(shù)、小樣本、非線性等復(fù)雜問(wèn)題具有很好的適應(yīng)性,且泛化能力強(qiáng),與神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)相比,具有容易實(shí)現(xiàn)、超參數(shù)自適應(yīng)獲取、非參數(shù)推斷靈活以及輸出具有概率意義的優(yōu)點(diǎn)[10],進(jìn)行多模型動(dòng)態(tài)軟測(cè)量建模。最后結(jié)合權(quán)重優(yōu)化D-S證據(jù)融合方法[30],針對(duì)證據(jù)間的沖突問(wèn)題,采用基于加權(quán)平均修正法的證據(jù)體修改方法,將修正后的概率分配函數(shù)作為權(quán)值因子對(duì)子模型的輸出進(jìn)行有效集成,以提高模型的預(yù)測(cè)精度和泛化能力。
有桿泵采油是一個(gè)典型的具有非線性、機(jī)電液強(qiáng)耦合等綜合復(fù)雜特性的物理過(guò)程,其原理如圖1所示。油田常用的CYJ10-3-53HB型抽油機(jī)沖程3 m,沖次5 min?1時(shí),懸點(diǎn)運(yùn)動(dòng)規(guī)律如圖2所示。上沖程時(shí),掛在驢頭上的懸繩器通過(guò)井下數(shù)百至數(shù)千米長(zhǎng)、重達(dá)數(shù)噸的抽油桿柱帶動(dòng)深井泵柱塞上行,柱塞上的游動(dòng)閥受油管內(nèi)液柱壓力而關(guān)閉,泵內(nèi)壓力降低,固定閥在油、套管環(huán)型空間內(nèi)氣、液柱壓力(通常稱為沉沒(méi)壓力或泵口壓力,主要取決于動(dòng)液面位置)的作用下被打開,泵內(nèi)吸入液體。此時(shí),考慮沉沒(méi)壓力影響后的液柱載荷逐漸作用于抽油桿柱,完成加載過(guò)程。下沖程時(shí),抽油桿柱和柱塞在其自重和懸繩器的約束下下行,泵內(nèi)壓力升高,固定閥關(guān)閉,游動(dòng)閥被頂開,泵向油管內(nèi)排液。此時(shí),液柱載荷逐漸作用于油管柱,完成卸載過(guò)程。此外,考慮到驢頭變速運(yùn)動(dòng)和周期性作用于抽油桿柱的液柱載荷的激勵(lì),抽油桿柱產(chǎn)生的彈性振動(dòng)載荷、抽油桿柱和液柱的慣性載荷以及井下摩擦載荷亦作用于懸點(diǎn),因此,抽油機(jī)懸點(diǎn)載荷存在周期性大幅度波動(dòng)。油田實(shí)測(cè)載荷、扭矩波形如圖3所示。
圖1 有桿泵采油工藝及動(dòng)液面軟測(cè)量策略Fig.1 Rod pumping process and soft sensor strategy for DLL
圖2 抽油機(jī)懸點(diǎn)運(yùn)動(dòng)規(guī)律Fig.2 Polished rod motion law of beam pumping units
圖3 有桿抽油系統(tǒng)負(fù)荷/扭矩曲線Fig.3 Load and torque curves of rod pumping systems
抽油井動(dòng)液面是指油井正常生產(chǎn)時(shí)的油套環(huán)空液面,是采油過(guò)程中油氣從地層向井筒滲流與深井泵向地面排液相互作用的宏觀表征。動(dòng)液面深度越大,油井生產(chǎn)壓差越大,油井產(chǎn)量越高,井內(nèi)液體的有效舉升高度越大,抽油機(jī)做功越多,電動(dòng)機(jī)平均輸入功率也越大,反之亦然。在微觀層面上,動(dòng)液面位置直接影響流體進(jìn)泵運(yùn)動(dòng)規(guī)律,從而影響懸點(diǎn)載荷、泵的充滿程度和泵效,并在示功圖形狀特征上有所反映。上沖程中,在沉沒(méi)壓力的作用下,井內(nèi)液體克服固定閥阻力進(jìn)入泵內(nèi),作用在柱塞底部而產(chǎn)生向上的載荷,其大小與動(dòng)液面位置強(qiáng)相關(guān),是上沖程懸點(diǎn)靜載荷的重要組成部分,直接影響懸點(diǎn)振動(dòng)特性和動(dòng)載荷。當(dāng)動(dòng)液面深度過(guò)大時(shí),泵的沉沒(méi)度過(guò)小,沉沒(méi)壓力過(guò)小,加之由于井底流動(dòng)壓力降低造成原油中所溶解的天然氣大量析出,井液中游離氣含量增大,導(dǎo)致泵的充滿程度不足,泵效低,懸點(diǎn)示功圖通常呈如圖4所示“刀把”形狀[7],其中,圖4(a)、(b)分別為深井泵處于輕度和嚴(yán)重充滿程度不足工況時(shí)的實(shí)測(cè)示功圖。此外,動(dòng)液面位置影響油套環(huán)空的物質(zhì)平衡,直接反映于井口套壓,并最終影響井口油壓。
圖4 有桿抽油系統(tǒng)懸點(diǎn)示功圖Fig.4 Surface dynamometer cards of rod pumping systems
結(jié)合油田普遍采用的有桿泵抽油井,提出由時(shí)頻轉(zhuǎn)換、非線性特征提取、樣本聚類、軟測(cè)量建模、多模型集成這5個(gè)部分組成的井下動(dòng)液面軟測(cè)量策略如圖1所示。時(shí)頻轉(zhuǎn)換模塊求得懸點(diǎn)載荷及振動(dòng)信號(hào)的頻譜,非線性特征提取模塊提取懸點(diǎn)載荷/振動(dòng)頻域信號(hào)和電功率、井口油/套管壓力時(shí)域信號(hào)的非線性特征,樣本聚類模塊將樣本集融合分成多個(gè)樣本子簇,軟測(cè)量模型建立特征變量與動(dòng)液面間的函數(shù)關(guān)系,多模型集成模塊則融合子模型預(yù)測(cè)輸出,獲得最終動(dòng)液面估計(jì)值。
動(dòng)液面參數(shù)、抽油機(jī)懸點(diǎn)載荷、振動(dòng)、電動(dòng)機(jī)輸入功率以及井口油、套管壓力信號(hào)間的關(guān)系為
式中,Ld表示動(dòng)液面深度;AP、fP、Av、fv分別表示懸點(diǎn)載荷、振動(dòng)頻域信號(hào)的幅值和頻率;Pm表示電動(dòng)機(jī)瞬時(shí)輸入功率時(shí)域信號(hào);pc表示井口套壓時(shí)域信號(hào);pt表示井口油壓時(shí)域信號(hào);?V表示為建模動(dòng)態(tài)項(xiàng)。
KPCA算法對(duì)非線性系統(tǒng)具有更好的特征提取能力[24],通過(guò)求解核矩陣的特征值與特征向量,避免了特征空間中求解特征向量的復(fù)雜問(wèn)題[31]。采用非線性映射φ(?),將數(shù)量為N的輸入樣本集X={ xi,i = 1,2, L ,N }映射到一個(gè)高維特征空間,φ( xi)協(xié)方差矩陣C由式(2)計(jì)算[24-28,31]
式中,xi為X的第i行向量。通過(guò)解特征值實(shí)現(xiàn)主成分計(jì)算,找到滿足式(3)的特征值與特征向量。
v可由映射到特征空間的所有樣本線性表示為
式中,iα為方程系數(shù)。
定義一個(gè)N×N的矩陣Kij
求解式(4)特征向量v的問(wèn)題可轉(zhuǎn)變?yōu)榍缶仃嘖ij的特征向量α的問(wèn)題。
式中,α為iα所組成的列向量。
歸一化特征向量v,此時(shí)樣本φ( X )在v上的投影為
式中,h(X)為非線性主成分分量;特征值λi小成分hi,通常情況下可視為是噪聲引起的;比值表示分量hi在整體方差中的貢獻(xiàn)程度。主成分按式(8)選取
式中,Z為選取的主成分?jǐn)?shù)量,E為選取閾值。
以上推導(dǎo)假設(shè)∑φ(xi)=0,而實(shí)際情況不一定成立,因此,將式(5)中Kij中 心化處理為
式中,L為N×N單位矩陣。
模糊ISODATA(interactive self-organizing data analysis technique algorithm)是一種無(wú)監(jiān)督聚類算法,能自動(dòng)根據(jù)樣本的特征進(jìn)行聚類中心的修正,但仍存在高維數(shù)據(jù)距離計(jì)算不準(zhǔn)確、容易陷入局部最優(yōu)解以及需要設(shè)定聚類數(shù)目等缺點(diǎn),針對(duì)上述問(wèn)題,采用基于Hsim函數(shù)的距離度量、模擬退火算法(SA)的全局尋優(yōu),引入ISODATA算法中的“合并”和“分裂”機(jī)制實(shí)現(xiàn)聚類過(guò)程中聚類數(shù)目的自動(dòng)修正,改進(jìn)后算法具體步驟如下[29-30]。
(1)設(shè)定初始參數(shù),包括期望得到的聚類數(shù)c、每一類中允許的最小類別數(shù)目Mm、類內(nèi)樣本分布標(biāo)準(zhǔn)差SD、兩分類間最小距離Dm、每次迭代允許合并的最大聚類對(duì)數(shù)L、允許的最大迭代次數(shù)Ml、初始溫度和每個(gè)溫度下迭代的次數(shù)R。
隨機(jī)產(chǎn)生初始分類矩陣(2≤c≤N),有
采用Chebyshev距離計(jì)算初始聚類中心
給定一個(gè)足夠大的初始溫度T0,初始最優(yōu)解表示為:計(jì)算初始解對(duì)應(yīng)的目標(biāo)函數(shù)值J(S(0)),在每個(gè)溫度值T需要的迭代次數(shù)為R。令s =0。
(2)進(jìn)行聚類的“分裂”與“合并”,它們的執(zhí)行次數(shù)不超過(guò)允許的最大迭代次數(shù)。
其中,1≤h≤c,1≤i≤N。
隨機(jī)更新兩分類間最小距離(Dm)值,搜索范圍為(0,1]。此時(shí)新解為:計(jì)算新解所對(duì)應(yīng)的目標(biāo)函數(shù)值f(S(s))。
本文采用Xie-Beni聚類有效性指標(biāo),定義如下
式中,vi是第i類的中心,uik是數(shù)據(jù)xk屬于類i的模糊隸屬度,XB(U, c)越小說(shuō)明數(shù)據(jù)的聚類效果越好。
(4)計(jì)算差值?XB= XB(S(s+1))?XB(S(s))。若?XB≤0,則接受新解為當(dāng)前解;若?XB>0,則以概率P接受新解。
當(dāng)e= random[0, 1]<P,則接受新解S(s)作為當(dāng)前解,否則采用前解。
(5)對(duì)當(dāng)前溫度T降溫,將步驟(2)~步驟(4)迭代L次。
(6)當(dāng)滿足循環(huán)終止條件時(shí),算法輸出當(dāng)前解為最優(yōu)解,結(jié)束算法;當(dāng)循環(huán)不滿足終止條件時(shí),按照退火方式降低溫度,轉(zhuǎn)到步驟(2),令s= s +1,繼續(xù)迭代。本文采用的退火方式為
式中,t為步長(zhǎng),α為常數(shù),取值0.5~0.99,T0為初始溫度。
式中,y=[y1, … , yn]T為訓(xùn)練樣本輸出構(gòu)成的向量;k(x?)=[C(xi,x?)]N×1為測(cè)試輸入和訓(xùn)練樣本輸入間的協(xié)方差向量;為訓(xùn)練樣本輸入間的N×N協(xié)方差矩陣;C(x?, x?)為測(cè)試輸入與其自身的協(xié)方差。式(17)和式(18)表明,GPR利用指定的協(xié)方差函數(shù)和訓(xùn)練樣本信息實(shí)現(xiàn)對(duì)測(cè)試樣本的預(yù)測(cè),給出包含均值和方差的預(yù)測(cè)統(tǒng)計(jì)學(xué)特性,這是GPR區(qū)別于ANN、SVM等方法非常突出的優(yōu)點(diǎn)[9]。
協(xié)方差函數(shù)的確定是建立高斯過(guò)程模型的關(guān)鍵步驟,它包含了對(duì)期望函數(shù)特性的假設(shè)。對(duì)任意一組輸入,協(xié)方差函數(shù)應(yīng)滿足其產(chǎn)生的協(xié)方差矩陣為對(duì)稱半正定??紤]到系統(tǒng)的平穩(wěn)性,下列徑向基函數(shù)是最常用的一類協(xié)方差函數(shù)
式中,υ0表示服從高斯分布的噪聲方差;υ1表示局部相關(guān)性的程度;ωd為模型的測(cè)度參數(shù);δij是Kronecker算子。
當(dāng)上述協(xié)方差函數(shù)類型確定后,通常使用極大似然、交叉驗(yàn)證和馬爾可夫鏈蒙特卡羅3種方法對(duì)其超參數(shù)進(jìn)行調(diào)整,本文通過(guò)極大化對(duì)數(shù)似然函數(shù)的方法求得
優(yōu)化過(guò)程中,要計(jì)算對(duì)數(shù)似然函數(shù)對(duì)各參數(shù)的導(dǎo)數(shù)
GPR除了可用于建立靜態(tài)非線性映射,基于具有外部輸入自回歸模型結(jié)構(gòu)的GPR還可用于動(dòng)態(tài)系統(tǒng)建模[32],系統(tǒng)輸出y(k)與過(guò)去n個(gè)輸出和過(guò)去n個(gè)輸入服從如下非線性關(guān)系
式中,f()?為非線性函數(shù),本文利用GPR對(duì)其進(jìn)行擬合;ε(k )為白噪聲。
6.1權(quán)重優(yōu)化D-S證據(jù)融合方法
將聚類所得c個(gè)子模型作為D-S證據(jù)理論中的辨識(shí)框架,則可將任一子模型視為焦元Aj( j= 1,2, L ,c )。對(duì)于N個(gè)樣本數(shù)據(jù)X={ xi}分別求出其對(duì)應(yīng)于第j個(gè)子模型(也即第1個(gè)焦元A1)的模糊隸屬度,根據(jù)D-S證據(jù)合成規(guī)則對(duì)上述N個(gè)概率分配函數(shù)進(jìn)行融合,將融合后的結(jié)果作為第j個(gè)子模型的基本概率分配函數(shù)[17,30]
D-S證據(jù)理論的主要缺陷是不能有效處理沖突證據(jù)之間的組合問(wèn)題,為了避免這種情況出現(xiàn),本文采用基于加權(quán)平均修正法的證據(jù)體修改方法。為了進(jìn)一步降低沖突,本文采用一種證據(jù)間支持度的計(jì)算方法,并由其計(jì)算證據(jù)的可信度,但是還存在沖突度高的問(wèn)題;采用證據(jù)體不確定度函數(shù)AM衡量,并利用負(fù)指數(shù)函數(shù)來(lái)抑制不確定度,使證據(jù)變得清晰。由證據(jù)的可信度和不確定度計(jì)算各條證據(jù)的權(quán)重,根據(jù)Dempster組合規(guī)則進(jìn)行合成。為了避免產(chǎn)生可信度小而證據(jù)權(quán)重大的情況,采用PSO算法選擇合理的支持度維數(shù)和不確定度抑制因子,削弱證據(jù)合成的沖突度,保證證據(jù)合成的合理性。具體修正步驟如下[30]。
定義設(shè)有辨識(shí)框架Θ={A1, A2, L , Ac},X為2Θ上的一個(gè)子集,有N個(gè)證據(jù)體mi( i= 1,2, L ,N ),m(·)為Θ上給定的基本概率分配函數(shù),給出單個(gè)焦元Y∈Θ的pignistic概率分布如下
其中,|X|為子集X中焦元的個(gè)數(shù)。那么,兩個(gè)證據(jù)的支持度可以定義為
(1)計(jì)算證據(jù)體的可信度Credp(mi)為
(2)采用負(fù)指數(shù)函數(shù)形式計(jì)算證據(jù)體mi的不確定度Unceα(mi)
式中,AM(mi)表示證據(jù)體不確定度函數(shù),其定義為
(3)由證據(jù)的可信度和不確定度求取每條證據(jù)所對(duì)應(yīng)的權(quán)重為
(4)以各證據(jù)間沖突程度最小為目標(biāo),采用PSO算法優(yōu)化支持度維數(shù)p和不確定度抑制因子α。
(5)修正后的概率分配函數(shù)值可表示為
6.2多模型集成輸出
將式(30)得到的c個(gè)證據(jù)概率分配函數(shù)作為子模型的權(quán)值因子,對(duì)子模型進(jìn)行集成,得到的多模型輸出為
以如圖5所示的某油田J13-21井生產(chǎn)過(guò)程為例,按實(shí)驗(yàn)設(shè)計(jì)方案逐漸調(diào)整抽油機(jī)沖次,記錄整個(gè)過(guò)程的關(guān)鍵生產(chǎn)參數(shù)信號(hào),某一樣本的懸點(diǎn)載荷/位移/振動(dòng)、井口油/套壓和電機(jī)電流/功率信號(hào)波形如圖6~圖8所示。具體的建模步驟如下。
圖5 智能油井網(wǎng)絡(luò)診斷控制系統(tǒng)Fig.5 Diagnosis and control system of internet-based intelligent oil wells
(1)數(shù)據(jù)處理。對(duì)現(xiàn)場(chǎng)采集到的數(shù)據(jù),采用基于穩(wěn)健位置估計(jì)的方法[27]剔除離群點(diǎn),將其中360組數(shù)據(jù)樣本隨機(jī)分成兩組,260組數(shù)據(jù)作為訓(xùn)練樣本,100組用于檢驗(yàn)?zāi)P偷挠行?。將懸點(diǎn)載荷、加速度時(shí)域信號(hào)通過(guò)FFT轉(zhuǎn)化為頻域信號(hào),如圖9所示,標(biāo)準(zhǔn)化處理后進(jìn)行主元分析。
圖6 懸點(diǎn)載荷/位移/振動(dòng)信號(hào)波形Fig.6 Load, position and vibration signals of polished rod
圖7 井口油/套壓Fig.7 Tubing/casing pressure of wellhead
圖8 電機(jī)瞬時(shí)電流/功率波形Fig.8 Instantaneous input current/power of motor
圖9 懸點(diǎn)載荷/振動(dòng)信號(hào)頻域波形Fig.9 Frequency domain curves of load and vibration signals of polished rod
(2)采用KPCA對(duì)時(shí)/頻信號(hào)進(jìn)行非線性特征提取。本文選擇徑向基函數(shù)K=exp[? (x? xi)2/2 σ2]作為KPCA核函數(shù),E =85%,分析結(jié)果如表1所示。
表1 主元分析結(jié)果Table 1 Results of principal component analysis
(3)利用改進(jìn)的模糊ISODATA對(duì)訓(xùn)練樣本進(jìn)行聚類。設(shè)定初始參數(shù),期望得到的聚類數(shù)目c =4,每一類中允許的最小類別數(shù)目Mm=5,類內(nèi)樣本分布標(biāo)準(zhǔn)差Ms= 0.1×10?3,兩分類間最小距離Md= 0.3,每次迭代允許合并的最大聚類對(duì)數(shù)L =1,允許的最大迭代次數(shù)Ml= 1000。最終聚類數(shù)目c =6。
(4)動(dòng)態(tài)GPR子模型建立。利用GPR方法對(duì)6個(gè)樣本子集進(jìn)行訓(xùn)練學(xué)習(xí),建立6個(gè)動(dòng)態(tài)子模型。協(xié)方差函數(shù)超參數(shù)θ中w1~w9的初始值均為1,1υ 和0υ分別取1和0.001,即假設(shè)每個(gè)輔助變量對(duì)輸出預(yù)測(cè)的貢獻(xiàn)相同[9],使用共軛梯度法,通過(guò)式(21)搜索得到與輸入對(duì)應(yīng)的6個(gè)子模型超參數(shù)最優(yōu)值。根據(jù)對(duì)采油過(guò)程中動(dòng)液面變化規(guī)律的觀察和油田采油工藝專家經(jīng)驗(yàn),提取油井前一天關(guān)鍵生產(chǎn)參數(shù)特征作為軟測(cè)量模型的輸入,即式(22)中取n =1。
(5)權(quán)重優(yōu)化D-S子模型集成輸出。按照式(24)~式(30)計(jì)算得到各個(gè)子模型所對(duì)應(yīng)的權(quán)重,然后利用式(31)對(duì)各子模型的輸出進(jìn)行證據(jù)融合,得到多模型集成輸出。
為驗(yàn)證本文方法的有效性,與另外5種不同軟測(cè)量方法作比較,模型訓(xùn)練和測(cè)試結(jié)果如圖10和圖11所示,誤差分析如表2和表3所示。GPR、KPCA-GPR方法采用單一靜態(tài)模型,GPR中輔助變量采用機(jī)理分析結(jié)合人工經(jīng)驗(yàn)獲取,KPCA-GPR中采用多源信息融合KPCA特征提取獲取輔助變量,上述兩種方法由于模型過(guò)于單一導(dǎo)致預(yù)測(cè)精度不高。KPCA-FKCM-GPR和KPCA-ISODATA-DGPR方法采用多模型結(jié)構(gòu),使用加權(quán)策略集成多模型輸出,后者使用動(dòng)態(tài)建模方法,但聚類隸屬度的準(zhǔn)確性對(duì)權(quán)值因子影響較大,使得上述兩種模型擬合效果仍不十分理想。ILDGPR是文獻(xiàn)[7]所建增量學(xué)習(xí)動(dòng)態(tài)GPR動(dòng)液面軟測(cè)量方法。圖12為現(xiàn)場(chǎng)應(yīng)用過(guò)程中15組動(dòng)液面明顯變化時(shí)軟測(cè)量值與實(shí)際值的比較,表4為預(yù)測(cè)誤差分析。
圖10 軟測(cè)量模型訓(xùn)練結(jié)果比較Fig.10 Comparison of model training results
圖11 軟測(cè)量模型測(cè)試結(jié)果比較Fig.11 Comparison of model test results
圖12 軟測(cè)量模型預(yù)測(cè)結(jié)果比較Fig.12 Comparison of model prediction results
表2 訓(xùn)練誤差分析Table 2 Training error analysis
表3 測(cè)試誤差分析Table 3 Test error analysis
表4 預(yù)測(cè)誤差分析Table 4 Prediction error analysis
由上述結(jié)果可知,在使用KPCA對(duì)采油過(guò)程關(guān)鍵生產(chǎn)參數(shù)時(shí)/頻特征進(jìn)行非線性提取的基礎(chǔ)上,基于改進(jìn)的模糊ISODATA和權(quán)重優(yōu)化D-S的GPR動(dòng)態(tài)集成建模與傳統(tǒng)的單模型及多模型方法相比,預(yù)測(cè)精度和泛化能力有了較大改善。本文方法不但充分考慮了懸點(diǎn)載荷、振動(dòng)、電機(jī)瞬時(shí)功率等過(guò)程參數(shù)與井下動(dòng)液面間存在相關(guān)性、互補(bǔ)性和冗余性的現(xiàn)象,而且采用改進(jìn)的模糊ISODATA動(dòng)態(tài)聚類算法,在不預(yù)先確定聚類數(shù)目的前提下,實(shí)現(xiàn)對(duì)訓(xùn)練樣本的自動(dòng)聚類劃分,利用權(quán)重優(yōu)化D-S證據(jù)融合方法,加權(quán)平均修正相應(yīng)焦元下各證據(jù)體的基本概率分配值,對(duì)多模型輸出進(jìn)行有效集成,動(dòng)態(tài)GPR建模改善系統(tǒng)的動(dòng)態(tài)響應(yīng)特性,因而,在對(duì)抽油井動(dòng)液面的軟測(cè)量建模中取得了較好的擬合效果。
本文針對(duì)采油過(guò)程機(jī)電液耦合非線性機(jī)理復(fù)雜、井下工況的復(fù)雜性和不可預(yù)見(jiàn)性影響因素多等特點(diǎn)以及井下動(dòng)液面實(shí)時(shí)在線檢測(cè)困難,提出了基于多源信息特征融合的抽油井動(dòng)液面集成軟測(cè)量新方法。該方法解決了抽油機(jī)懸點(diǎn)測(cè)試信號(hào)特征難以提取、模型輸入變量維數(shù)過(guò)多造成訓(xùn)練速度慢和過(guò)擬合、樣本聚類精度不高、多模型輸出合理集成以及靜態(tài)模型動(dòng)態(tài)響應(yīng)特性不佳等問(wèn)題。該方法能夠比較準(zhǔn)確地檢測(cè)抽油井動(dòng)液面位置,具有廣泛的應(yīng)用前景。進(jìn)一步的研究方向是通過(guò)井下動(dòng)液面、產(chǎn)液量等關(guān)鍵生產(chǎn)參數(shù)對(duì)有桿抽油系統(tǒng)綜合運(yùn)行狀態(tài)進(jìn)行推理判別。
References
[1]李兆敏, 林日億, 付路長(zhǎng), 等. 有桿抽油系統(tǒng)效率分析及抽汲參數(shù)優(yōu)化設(shè)計(jì) [J]. 石油學(xué)報(bào), 2005, 26 (5): 102-106. LI Z M, LIN R Y, FU L C, et al. Efficiency analysis of sucker-rod pumping system and optimal design of swabbing parameter [J]. Acta Petrolei Sinica, 2005, 26 (5): 102-106.
[2]姚春冬. 提高抽油機(jī)井系統(tǒng)效率的計(jì)算機(jī)仿真分析 [J]. 石油學(xué)報(bào), 2005, 26 (4): 106-110. YAO C D. Computer simulation for enhancing system efficiency of rod pumping well [J]. Acta Petrolei Sinica, 2005, 26 (4): 106-110.
[3]董世民, 張喜順, 吳長(zhǎng)杰, 等. 抽油機(jī)井區(qū)塊整體節(jié)能參數(shù)仿真優(yōu)化方法 [J]. 石油學(xué)報(bào), 2010, 31 (3): 475-479. DONG S M, ZHANG X S, WU C J, et al. Simulation and optimization method for the integral energy-saving suction parameters of rod pumping wells in an oil field [J]. Acta Petrolei Sinica, 2010, 31 (3): 475-479.
[4]林日億, 孫茂盛, 張邵東, 等. 有桿抽油泵沉沒(méi)度的優(yōu)化設(shè)計(jì)方法[J]. 石油大學(xué)學(xué)報(bào), 2005, 29 (4): 87-90. LIN R Y, SUN M S, ZHANG S D, et al. Optimization design method to determine submergence depth of sucker rod pump [J]. Journal of the University of Petroleum, 2005, 29 (4): 87-90.
[5]董世民, 邢明明, 張紅, 等. 基于系統(tǒng)效率最高的抽油機(jī)合理流壓研究 [J]. 燕山大學(xué)學(xué)報(bào), 2011, 35 (4): 296-301. DONG S M, XING M M, ZHANG H, et al. Study of reasonable flowing pressure of rod pumping wells based on maximum system efficiency [J]. Journal of Yanshan University, 2011, 35 (4): 296-301.
[6]王通, 高憲文, 劉文芳. 自適應(yīng)軟測(cè)量方法在動(dòng)液面預(yù)測(cè)中的研究與應(yīng)用 [J]. 化工學(xué)報(bào), 2014, 65 (12): 4898-4904. WANG T, GAO X W, LIU W F. Adaptive soft sensor method and application in determination of dynamic fluid levels [J]. CIESC Journal, 2014, 65 (12): 4898-4904.
[7]李翔宇, 高憲文, 侯延彬. 基于在線動(dòng)態(tài)高斯過(guò)程回歸抽油井動(dòng)液面軟測(cè)量建模 [J]. 化工學(xué)報(bào), 2015, 66 (6): 2150-2158. LI X Y, GAO X W, HOU Y B. Online dynamic Gaussian process regression for dynamic liquid level soft sensing of sucker-rod pumping well [J]. CIESC Journal, 2015, 66 (6): 2150-2158.
[8]SUYKENS J A K, VANDEWALLE J. Least squares support vector machine classifiers [J]. Neural Processing Letters, 1999, 9 (3): 293-300.
[9]王華忠. 高斯過(guò)程及其在軟測(cè)量建模中的應(yīng)用 [J]. 化工學(xué)報(bào), 2007, 58 (11): 2840-2845. WANG H Z. Gaussian process and its application to soft-sensor modeling [J]. Journal of Chemical Industry and Engineering (China), 2007, 58 (11): 2840-2845.
[10]何志昆, 劉光斌, 趙曦晶, 等. 高斯過(guò)程回歸方法綜述 [J]. 控制與決策, 2013, 28 (8): 1121-1129. HE Z K, LIU G B, ZHAO X J, et al. Overview of Gaussian process regression [J]. Control and Decision, 2013, 28 (8): 1121-1129.
[11]于濤, 王建林, 何坤, 等. 基于MPCA-GP的發(fā)酵過(guò)程分階段軟測(cè)量建模方法 [J]. 儀器儀表學(xué)報(bào), 2013, 34 (12): 2703-2708. YU T, WANG J L, HE K, et al. Staged soft-sensor modeling method for fermentation process based on MPCA-GP [J]. Chinese Journal of Scientific Instrument, 2013, 34 (12): 2703-2708.
[12]湯健, 鄭秀萍, 趙立杰, 等. 基于頻域特征提取與信息融合的磨機(jī)負(fù)荷軟測(cè)量 [J]. 儀器儀表學(xué)報(bào), 2010, 31 (10): 2161-2167. TANG J, ZHENG X P, ZHAO L J, et al. Soft sensing of mill load based on frequency domain feature extraction and information fusion [J]. Chinese Journal of Scientific Instrument, 2010, 31 (10): 2161-2167.
[13]雷瑜, 楊慧中. 基于高斯過(guò)程和貝葉斯決策的組合模型軟測(cè)量 [J].化工學(xué)報(bào), 2013, 64 (12): 4434-4438. LEI Y, YANG H Z. Combination mode soft sensor based on Gaussian process and Bayesian committee machine [J]. CIESC Journal, 2013, 64 (12): 4434-4438.
[14]湯健, 柴天佑, 叢秋梅, 等. 基于EMD和選擇性集成學(xué)習(xí)算法的磨機(jī)負(fù)荷參數(shù)軟測(cè)量 [J]. 自動(dòng)化學(xué)報(bào), 2014, 40 (9): 1853-1866. TANG J, CHAI T Y, CONG Q M, et al. Soft sensor approach for modeling mill load parameters based on EMD and selective ensemble learning algorithm [J]. Acta Automatica Sinica, 2014, 40 (9): 1853-1866.
[15]李修亮,蘇宏業(yè),褚健. 基于在線聚類的多模型軟測(cè)量建模方法[J]. 化工學(xué)報(bào), 2007, 58 (11): 2834-2839. LI X L, SU H Y, CHU J. Multiple models soft-sensing technique based on online clustering arithmetic [J]. Journal of Chemical Industry and Engineering (China), 2007, 58 (11): 2834-2839.
[16]吳敏, 丁雷, 曹衛(wèi)華, 等. 鉛鋅燒結(jié)過(guò)程燒穿點(diǎn)的集成預(yù)測(cè)模型[J]. 控制理論與應(yīng)用, 2009, 26 (7): 739-744. WU M, DING L, CAO W H, et al. An integrated prediction model for burn-through-point in lead-zinc sintering process [J]. Control Theory & Applications, 2009, 26 (7): 739-744.
[17]王振雷, 唐苦, 王昕. 一種基于D-S和ARIMA的多模型軟測(cè)量方法 [J]. 控制與決策, 2014, 29 (7): 1160-1166. WANG Z L, TANG K, WANG X. A multi-model soft sensing method based on D-S and ARIMA model [J]. Control and Decision, 2014, 29 (7): 1160-1166.
[18]湯健, 柴天佑, 趙立杰, 等. 基于振動(dòng)頻譜的磨礦過(guò)程球磨機(jī)負(fù)荷參數(shù)集成建模方法 [J]. 控制理論與應(yīng)用, 2012, 29 (2): 183-191. TANG J, CHAI T Y, ZHAO L J, et al. Ensemble modeling for parameters of ball-mill load in grinding process based on frequency spectrum of shell vibration [J]. Control Theory & Applications, 2012, 29 (2): 183-191.
[19]湯健, 柴天佑, 余文, 等. 在線KPLS建模方法及在磨機(jī)負(fù)荷參數(shù)集成建模中的應(yīng)用 [J]. 自動(dòng)化學(xué)報(bào), 2013, 39 (5): 471-486. TANG J, CHAI T Y, YU W, et al. On-line KPLS algorithm with application to ensemble modeling parameters of mill load [J]. Acta Automatica Sinica, 2013, 39 (5): 471-486.
[20]李麗娟, 宋坤, 趙英凱. 基于仿射傳播聚類的ARA發(fā)酵過(guò)程建模[J]. 化工學(xué)報(bào), 2011, 62 (8): 2116-2121. LI L J, SONG K, ZHAO Y K. Modeling of ARA fermentation based on affinity propagation clustering [J]. CIESC Journal, 2011, 62 (8): 2116-2121.
[21]張文清, 傅雨佳, 楊慧中. 基于改進(jìn)聚類和加權(quán)bagging的多模型軟測(cè)量建模 [J]. 化工學(xué)報(bào), 2012, 63 (9): 2697-2702. ZHANG W Q, FU Y J, YANG H Z. Multi-model soft-sensor modeling based on improved clustering and weighted bagging [J]. CIESC Journal, 2012, 63 (9): 21697-2702.
[22]何巖峰, 吳曉東, 韓國(guó)慶, 等. 示功圖頻譜分析新方法 [J]. 石油學(xué)報(bào), 2008, 29 (4): 619-624. HE Y F, WU X D, HAN G Q, et al. Frequency spectrum analysis method for recognition of dynamometer card [J]. Acta Petrolei Sinica, 2008, 29 (4): 619-624.
[23]曹鵬飛, 羅雄麟. 化工過(guò)程軟測(cè)量建模方法研究進(jìn)展 [J]. 化工學(xué)報(bào), 2013, 64 (3): 788-800. CAO P F, LUO X L. Modeling of soft sensor for chemical process [J]. CIESC Journal, 2013, 64 (3): 788-800.
[24]湯健, 趙立杰, 岳恒, 等. 基于多源數(shù)據(jù)特征融合的球磨機(jī)負(fù)荷軟測(cè)量 [J]. 浙江大學(xué)學(xué)報(bào), 2010, 44 (7): 1406-1413. TANG J, ZHAO L J, YUE H, et al. Soft sensor for ball mill load based on multi-source data feature fusion [J]. Journal of Zhejiang University, 2010, 44 (7): 1406-1413.
[25]MOGHADDAM B. Principal manifolds and probabilistic subspaces for visual recognition [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2002, 24 (6): 780-788.
[26]TWINING C J, TAYLOR C J. The use of kernel principal component analysis to model data distributions [J]. Pattern Recognition, 2003, 36 (1): 217-227.
[27]李海波, 柴天佑, 岳恒. 浮選工藝指標(biāo)KPCA-ELM軟測(cè)量模型及應(yīng)用 [J]. 化工學(xué)報(bào), 2012, 63 (9): 2892-2898. LI H B, CHAI T Y, YUE H. Soft sensor of technical indices based on KPCA-ELM and application for flotation process [J]. CIESC Journal, 2012, 63 (9): 2892-2898.
[28]王強(qiáng), 田學(xué)民. 基于KPCA-LSSVM的軟測(cè)量建模方法 [J]. 化工學(xué)報(bào), 2011, 62 (10): 2813-2817. WANG Q, TIAN X M. Soft sensing based on KPCA and LSSVM [J]. CIESC Journal, 2011, 62 (10): 2813-2817.
[29]LI K, GAO X W, ZHOU H B, et al. Fault diagnosis for down-hole conditions of beam pumping unit based on improved fuzzy ISODATA dynamic clustering algorithm [C]//Proc. 2013 10th International Conference on Fuzzy Systems and Knowledge Discovery. Shenyang, China: IEEE Computer Society, 2013: 279-284.
[30]李琨. 基于示功圖的游梁式抽油機(jī)井下故障診斷方法研究[D]. 沈陽(yáng): 東北大學(xué), 2013. LI K. Study on diagnostic method for down-hole faults of the beam pumping unit based on dynamometer card [D]. Shenyang: Northeastern University, 2013.
[31]田中大, 高憲文, 李琨. 基于KPCA與LSSVM的網(wǎng)絡(luò)控制系統(tǒng)時(shí)延預(yù)測(cè)方法 [J]. 系統(tǒng)工程與電子技術(shù), 2013, 35 (6): 1281-1285. TIAN Z D, GAO X W, LI K. Networked control system time-delay prediction method based on KPCA and LSSVM [J]. Systems Engineering and Electronics, 2013, 35 (6): 1281-1285.
[32]PETELIN D, GRANCHAROVA A, KOCIJAN J. Evolving Gaussian process models for prediction of ozone concentration in the air [J]. Simulation Modelling Practice and Theory, 2013, 24 (6): 68-80.
Ensemble soft sensor modeling for dynamic liquid level of oil well based on multi-source information feature fusion
LI Xiangyu1, GAO Xianwen1, LI Kun2, HOU Yanbin1
(1College of Information Science & Engineering, Northeastern University, Shenyang 110819, Liaoning, China;2College of Engineering, Bohai University, Jinzhou 121013, Liaoning, China)
Abstract:The dynamic liquid level (DLL) of an oil well is traditionally measured onsite by using the acoustic method. This method, however, has its limitation in determining real-time dynamic liquid level. A new ensemble soft-sensor approach of DLL based on the multi-source information feature fusion was proposed. The polish rod load and vibration signal in the time domain was transformed into the frequency domain using fast Fourier transform (FFT). The kernel principal component analysis (KPCA) was used to extract the nonlinear feature of the load and vibration spectral signal and the power, casing head pressure andtubing head pressure time signal. The improved fuzzy interactive self-organizing data analysis technique algorithm (ISODATA) and Gaussian process regression (GPR) were used to fuse time/frequency information feature and establish multiple sub-models. Then, the final DLL prediction model was obtained through the ensemble of the sub-models based on the weight factor calculated by optimized-weighted Dempster-Shafer (D-S) theory. The oil field application showed the validity of the proposed method.
Key words:information fusion; dynamic liquid level; Gaussian process regression; prediction; petroleum; dynamic modeling
中圖分類號(hào):TP 273
文獻(xiàn)標(biāo)志碼:A
文章編號(hào):0438—1157(2016)06—2469—11
DOI:10.11949/j.issn.0438-1157.20151673
基金項(xiàng)目:國(guó)家自然科學(xué)基金項(xiàng)目(61573088,61403040,61433004)。
Corresponding author:Prof. GAO Xianwen, gaoxianwen@ise.neu.edu.cn