高 翔,王云峰,劉海波
(1.中國石油大慶油田有限責(zé)任公司采油工程研究院,黑龍江大慶 163453;2.中國石油大慶油田有限責(zé)任公司第九采油廠工程技術(shù)大隊(duì),黑龍江大慶 163511)
隨著大慶油田開發(fā)進(jìn)入中后期,低產(chǎn)液、低泵 效、低流壓井逐年上升,這部分井存在著系統(tǒng)效率 低、能耗大、設(shè)備磨損嚴(yán)重等問題[1-3]。為提高低效井的系統(tǒng)效率,達(dá)到節(jié)能降耗的目的,通常采用間抽采油技術(shù)[4-5]。但在實(shí)際生產(chǎn)過程中,采用常規(guī)間抽技術(shù)往往因?yàn)橥>畷r間長導(dǎo)致卡泵故障、井底流壓上升,從而影響油井產(chǎn)量。相關(guān)研究表明,常規(guī)間抽技術(shù)平均影響油井產(chǎn)量0.1 m3/d,部分井潛力未得到充分發(fā)揮[6]。在綜合考慮常規(guī)間抽技術(shù)缺點(diǎn)的基礎(chǔ)上,相關(guān)工程技術(shù)人員提出一種抽油機(jī)不停機(jī)間抽技術(shù)。目前,大慶油田累計應(yīng)用不停機(jī)間抽技術(shù)千余口井,與常規(guī)間抽技術(shù)相比,噸液百米耗電降低明顯,系統(tǒng)效率顯著提高,應(yīng)用前景廣闊[7]。
不停機(jī)間抽技術(shù)應(yīng)用過程中,工作制度的確定是最關(guān)鍵的部分[8]。一般情況下,主要參考單井地質(zhì)特征和供液能力,以油井產(chǎn)能為最大目標(biāo),結(jié)合IPR(流入動態(tài)生產(chǎn)曲線)確定合理流壓,通過持續(xù)觀察動液面變化,最終確定最優(yōu)的不停機(jī)間抽采油工作制度。但是該種方法需要對每口井工作制度進(jìn)行多次試驗(yàn)和反復(fù)驗(yàn)證,實(shí)際操作性不強(qiáng),生產(chǎn)單位通常依據(jù)沉沒度和產(chǎn)液情況,將運(yùn)行工作制度定為若干種(表1),從而大大降低了單井個性化設(shè)計強(qiáng)度,也減弱了不停機(jī)間抽技術(shù)的應(yīng)用效果。
近幾年來,數(shù)字化、智能化、智慧化油田的建設(shè)將油田帶到了“大數(shù)據(jù)、人工智能”時代[9],大數(shù)據(jù)挖掘技術(shù)作為機(jī)器學(xué)習(xí)、人工智能的基礎(chǔ),同樣也開始應(yīng)用到油氣田勘探開發(fā)的各個領(lǐng)域[10-13]。2012年,石廣仁教授介紹了八大類數(shù)據(jù)挖掘算法,并通過34 個應(yīng)用實(shí)例對算法的應(yīng)用范圍及條件、基本原理和完整計算方法進(jìn)行了適用性比較[14];2015 年,檀朝東等人系統(tǒng)總結(jié)了大數(shù)據(jù)挖掘技術(shù)在石油工程的應(yīng)用前景[15];2016 年,孫敬等人采用大數(shù)據(jù)挖掘技術(shù)建立的產(chǎn)能評價方程所預(yù)測的氣井產(chǎn)量與實(shí)際產(chǎn)量相比,精度可以達(dá)到90%[16];2018 年,李大偉等人開展了油氣勘探開發(fā)常用數(shù)據(jù)挖掘算法優(yōu)選工作,認(rèn)為最優(yōu)的回歸算法是反向傳播神經(jīng)網(wǎng)絡(luò)(BPNN),最優(yōu)的分類算法是支持向量機(jī)分類(C-SVM)[17]。本文則針對不停機(jī)間抽技術(shù)工作制度確定時出現(xiàn)的問題,通過對相關(guān)采油數(shù)據(jù)進(jìn)行有效分析,明確影響工作制度確定因素的主次關(guān)系,并在對相關(guān)數(shù)據(jù)挖掘常用算法進(jìn)行優(yōu)選的基礎(chǔ)上,構(gòu)建單井個性化工作制度優(yōu)化方法。
表1 生產(chǎn)單位制定不停機(jī)間抽工作制度(運(yùn)行周期30 min)
機(jī)器學(xué)習(xí)數(shù)據(jù)挖掘常用的算法可分為分類、回歸、聚類等,其中分類和回歸是最成熟、應(yīng)用最廣泛的算法。對具體的研究問題、研究對象和數(shù)據(jù)源,不同的分類和回歸算法具有不同的適用性。常用的回歸算法包括反向傳播神經(jīng)網(wǎng)絡(luò)(BPNN)、多元回歸分析(MRA)和支持向量機(jī)回歸(R-SVM)等,常用的分類算法包括決策樹(DTR)、支持向量機(jī)分類(C-SVM)、貝葉斯判別分析(BAYD)、樸素貝葉斯(NBAY)和貝葉斯逐步判別分析(BAYSD)等[17]。由于DTR 算法建立與應(yīng)用非常復(fù)雜[18],BAYD 算法適應(yīng)性弱于BAYSD 算法,因此只針對其他幾類常用的數(shù)據(jù)挖掘的回歸和分類算法進(jìn)行不停機(jī)間抽工作制度預(yù)測,并通過對比預(yù)測過程中產(chǎn)生的總平均相對誤差絕對值來確定最佳的數(shù)據(jù)挖掘算法。
研究結(jié)果對于低產(chǎn)低效井應(yīng)用不停機(jī)間抽技術(shù)確定最優(yōu)工作制度,從而達(dá)到節(jié)能最大化,具有較大的應(yīng)用價值,也可以推廣到其他數(shù)據(jù)挖掘案例,用于指導(dǎo)油氣勘探開發(fā)、采油工作方案設(shè)計等數(shù)據(jù)挖掘工作。
檢驗(yàn)該算法擬合度;③回歸(分類)預(yù)測:將k 個預(yù)測樣本代入擬合方程 y = f ( x0),得到預(yù)測值
為了表示預(yù)測樣本和學(xué)習(xí)樣本的預(yù)測變量y 的結(jié)果精度,通常采用相對誤差絕對值Ri、平均相對誤差絕對值和總平均相對誤差絕對值來判斷[14]。
低產(chǎn)低效井產(chǎn)能的影響因素除了常規(guī)的地質(zhì)特征,還應(yīng)包括油壓、動液面以及生產(chǎn)制度等多方面的因素。通過對實(shí)際油井基礎(chǔ)數(shù)據(jù)[16]進(jìn)行系統(tǒng)分析,將影響因素歸納為9 個獨(dú)立變量(地層系數(shù)、日產(chǎn)液量、孔隙度、含水率、油壓、沖程、沖次、泵徑和泵效)。
取大慶油田A 采油廠的15 個樣本數(shù)據(jù)[19-20],其中,14 個樣本作為學(xué)習(xí)樣本,1 個樣本作為預(yù)測樣本,每個樣本都有9 個獨(dú)立變量數(shù)據(jù)[21](表2),其中,因變量y*為工作制度運(yùn)行時間。為了進(jìn)一步準(zhǔn)確獲取15口樣本井不停機(jī)間抽工作制度,對樣本井進(jìn)行不同不停機(jī)間抽工作制度條件下動液面恢復(fù)試驗(yàn)。圖1 為A1 井不同不停機(jī)間抽工作制度條件下動液面恢復(fù)情況,從圖中可以看出,當(dāng)該井的工作制度為正常運(yùn)行時間30 min,擺動運(yùn)行時間30 min 時,動液面穩(wěn)定在850 m 附近,可以實(shí)現(xiàn)油井產(chǎn)能最大化,所以認(rèn)為該井不停機(jī)間抽最優(yōu)工作制度為正常運(yùn)行時間30 min,擺動運(yùn)行時間30 min。按照同樣方法,可以獲得其他14 個樣本的最優(yōu)工作制度(表2)。
2.2.1 輸入?yún)?shù)
輸入?yún)?shù)包括14 個學(xué)習(xí)樣本和1 個預(yù)測樣本的各個已知變量值 xi( i= 1,2,? ??,9),以及14 個學(xué)習(xí)樣本的預(yù)測變量y*值。另外,根據(jù)現(xiàn)場應(yīng)用現(xiàn)狀,一般情況下,不停機(jī)間抽運(yùn)行周期可分為30,60,90,120 min,所以對于回歸計算,y*值為運(yùn)行時間,則擺動時間為運(yùn)行周期時間減去運(yùn)行時間;而對于分類計算,y*值為運(yùn)行周期,表3 為不同運(yùn)行周期時間對應(yīng)的運(yùn)行周期類別。
2.2.2 學(xué)習(xí)過程
使用回歸、分類算法對表2 中14 個學(xué)習(xí)樣本進(jìn)行學(xué)習(xí)計算,分別建立9 個獨(dú)立變量 xi( i= 1,2,? ??,9)與運(yùn)行時間(回歸)或運(yùn)行周期(分類)的工作制度的預(yù)測擬合方程 y = f ( x0),然后將表2 中的14 個學(xué)習(xí)樣本和1 個預(yù)測樣本的 xi( i= 1,2,? ??,9)值分別代入預(yù)測擬合方程 y = f ( x0),從而得到每個學(xué)習(xí)樣本的運(yùn)行時間T(圖2)和運(yùn)行周期分類(圖3),并計算每種算法所得結(jié)果的誤差(表4、表5)。
表2 不停機(jī)間抽工作制度分析預(yù)測基本數(shù)據(jù)
圖1 A1 井不同不停機(jī)間抽工作制度條件下動液面恢復(fù)
表3 不停機(jī)間抽工作制度運(yùn)行周期分類
2.2.3 回歸結(jié)果分析
由圖2 可知,BPNN、R-SVM 和MRA 三種回歸算法最終預(yù)測的運(yùn)行時間,只有BPNN 算法預(yù)測的結(jié)果與實(shí)際運(yùn)行時間擬合度較高;從表4 也可以看出,用R-SVM 和MRA 算法所得的結(jié)果精度較低,而BPNN 得到的結(jié)果精度則較高。雖然不停機(jī)間抽工作制度優(yōu)化過程非線性關(guān)系很強(qiáng),但BPNN算法較適用。另外,MRA 算法的= 53.27%,所以預(yù)測得到的y 值與相關(guān)的9 個獨(dú)立變量之間具有較強(qiáng)的非線性關(guān)系,MRA 算法計算出的各獨(dú)立變量的相關(guān)性由大到小排序?yàn)?xi( i=5,7,6,9,8,2,1,3,4)。由于用R-SVM 和BPNN 算法所得回歸方程為非線性方程,所以不能計算出預(yù)測運(yùn)行時間T 與各獨(dú)立變量的相關(guān)性。
2.2.4 分類結(jié)果分析
圖3 為C-SVM、BAYSD 和NBAY 三種分類算法的最終預(yù)測運(yùn)行周期分類,從圖中可以看出,CSVM 算法結(jié)果擬合度達(dá)到100%,從表5 也可以看出,C-SVM 算法所得結(jié)果的精度非常高,Ri、和均為0,BAYSD 和NBAY 兩種算法的預(yù)測精度都很低。
圖2 不停機(jī)間抽運(yùn)行時間預(yù)測結(jié)果
圖3 不停機(jī)間抽運(yùn)行周期分類結(jié)果
表4 三種回歸算法計算不停機(jī)間抽運(yùn)行時間結(jié)果誤差 %
表5 三種分類算法計算不停機(jī)間抽運(yùn)行時間結(jié)果誤差 %
綜合數(shù)據(jù)挖掘的回歸和分類算法,優(yōu)選得到C-SVM—BPNN 算法。
通過C-SVM—BPNN 算法對A 采油廠所應(yīng)用的不停機(jī)間抽技術(shù)進(jìn)行工作制度優(yōu)化,由表6 可知,在產(chǎn)液量變化不大的情況下,優(yōu)化后泵效提高2%~8%,系統(tǒng)效率提高3%~5%。
(1)常用數(shù)據(jù)挖掘算法用于優(yōu)化不停機(jī)間抽工作制度,最優(yōu)的回歸算法是BPNN,其次是MRA 和R-SVM;最優(yōu)的分類算法是C-SVM,其次為NBAY和BAYSD。機(jī)器學(xué)習(xí)數(shù)據(jù)挖掘應(yīng)用研究過程中,對于具體的研究對象、研究問題和數(shù)據(jù)源,不同的回歸和分類算法具有不同的適用性,所以針對不同問題要進(jìn)行算法的優(yōu)化選擇。
(2)利用C-SVM—BPNN 算法對不停機(jī)間抽工作制度進(jìn)行優(yōu)化的實(shí)例表明,優(yōu)化后的不停機(jī)間抽井系統(tǒng)效率和泵效均有明顯的提升,說明CSVM—BPNN 算法具有較好的應(yīng)用效果。
表6 部分井不停機(jī)間抽工作制度優(yōu)化前后運(yùn)行情況對比