趙燕紅,馬駟駒,劉小平,景文杰,張召召(.西安長(zhǎng)慶化工集團(tuán)有限公司研究所,陜西西安 7008;.中國(guó)石油長(zhǎng)慶油田分公司第三采油廠,寧夏銀川 750006)
?
基于最小二乘支持向量機(jī)的低滲透油藏調(diào)剖效果預(yù)測(cè)
趙燕紅1,馬駟駒2,劉小平2,景文杰2,張召召2
(1.西安長(zhǎng)慶化工集團(tuán)有限公司研究所,陜西西安710018;2.中國(guó)石油長(zhǎng)慶油田分公司第三采油廠,寧夏銀川750006)
摘要:調(diào)剖效果受油藏地質(zhì)條件、開(kāi)發(fā)狀況和調(diào)剖工藝等諸多因素影響,調(diào)剖效果預(yù)測(cè)實(shí)質(zhì)上是解決一個(gè)多因素共同作用的復(fù)雜非線性問(wèn)題。常規(guī)的數(shù)值模預(yù)測(cè)對(duì)地質(zhì)建模準(zhǔn)確性要求高、歷史擬合時(shí)間長(zhǎng)而不能滿足實(shí)際應(yīng)用需求。本文提出利用最小二乘支持向量機(jī)法構(gòu)建調(diào)剖效果與其主控因素之間的非線性映射模型,將未知井調(diào)剖效果預(yù)測(cè)轉(zhuǎn)化為非線性函數(shù)的求解過(guò)程。以靖安油田五里灣區(qū)塊24口調(diào)剖井資料為學(xué)習(xí)樣本,建立了計(jì)算調(diào)剖后井組增油量、降水量的最小二乘支持向量機(jī)預(yù)測(cè)模型并進(jìn)行了驗(yàn)證。結(jié)果表明,計(jì)算結(jié)果與實(shí)際值擬合精度較高、誤差較小,該方法可用于礦場(chǎng)調(diào)剖效果預(yù)測(cè)與評(píng)價(jià)。
關(guān)鍵詞:調(diào)剖效果;影響因素;最小二乘支持向量機(jī);預(yù)測(cè)模型;五里灣區(qū)塊
影響調(diào)剖效果的因素涉及油藏條件、開(kāi)發(fā)狀況和調(diào)剖工藝等三大類(lèi)中的諸多小類(lèi)[1-4],因此,調(diào)剖效果預(yù)測(cè)實(shí)質(zhì)上成為解決一個(gè)多因素共同作用的復(fù)雜非線性問(wèn)題。目前,廣泛采用數(shù)值模擬法進(jìn)行調(diào)剖效果的預(yù)測(cè)[5-7],該方法對(duì)地質(zhì)建模準(zhǔn)確性要求較高、歷史擬合耗時(shí)較長(zhǎng),往往不能滿足實(shí)際應(yīng)用的需求。本文利用基于統(tǒng)計(jì)學(xué)習(xí)理論的支持向量機(jī)(Support Vector Machine,SVM)方法進(jìn)行調(diào)剖效果預(yù)測(cè)。SVM基于Vapnik的結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理,具有結(jié)構(gòu)簡(jiǎn)單、泛化能力強(qiáng)、求解速度快等特點(diǎn),在解決小樣本、非線性、多維問(wèn)題方面優(yōu)勢(shì)顯著[8-13]。最小二乘支持向量機(jī)(least squares support vector machine,LSSVM)是標(biāo)準(zhǔn)支持向量機(jī)的改進(jìn),采用等式約束代替標(biāo)準(zhǔn)支持向量機(jī)中的不等式約束,并將求解二次規(guī)劃問(wèn)題轉(zhuǎn)化為直接求解線性方程組,大大降低了計(jì)算復(fù)雜程度。對(duì)于調(diào)剖效果與各影響因素的復(fù)雜關(guān)系,LSSVM通過(guò)核函數(shù)將樣本空間映射到特征空間中求出原樣本集的最優(yōu)化分類(lèi)面,進(jìn)而得到輸入變量(影響因素)與輸出變量(調(diào)剖效果)之間的非線性關(guān)系,最終將二者的復(fù)雜關(guān)系轉(zhuǎn)化為非線性函數(shù)估計(jì)和逼近的數(shù)學(xué)求解問(wèn)題。
1.1結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理
設(shè)某區(qū)域的樣本為n維向量,則該區(qū)域的m個(gè)樣本及其值可表示為:
傳統(tǒng)機(jī)器學(xué)習(xí)方法采用經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化原則,即最小化:
根據(jù)Vapnik結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則,機(jī)器學(xué)習(xí)的最終目的是最小化期望風(fēng)險(xiǎn),即最小化:
上式中:R(w)-風(fēng)險(xiǎn)函數(shù);f(x,w)-預(yù)測(cè)函數(shù)集,是對(duì)變量x和y之間關(guān)系的估計(jì);L(y,f(x,w))-采用f(x ,w)對(duì)y進(jìn)行預(yù)測(cè)產(chǎn)生的損失函數(shù);F(x,y)-變量x和y的聯(lián)合分布概率。根據(jù)概率與數(shù)理統(tǒng)計(jì)理論,經(jīng)驗(yàn)風(fēng)險(xiǎn)最小不等于期望風(fēng)險(xiǎn)最小,二者在極壞分布情況下,以概率1-η滿足以下關(guān)系:
1.2最小二乘支持向量機(jī)
SVM是結(jié)構(gòu)風(fēng)險(xiǎn)最小化理論的實(shí)現(xiàn),由Vapnik等于1995年首先提出[8]。SVM因其較好的泛化能力用來(lái)解決各領(lǐng)域中的高維非線性映射問(wèn)題。LSSVM是標(biāo)準(zhǔn)支持向量機(jī)的一種擴(kuò)展,它采用最小二乘線性系統(tǒng)作為損失函數(shù),將求解二次規(guī)劃問(wèn)題轉(zhuǎn)化為求解一組線性方程。對(duì)于n維向量、m個(gè)樣本,通過(guò)非線性變換z=φ(xi),將n維向量映射到l(l>>n)維這個(gè)高維度特征空間中,利用SVM算法實(shí)現(xiàn)輸入數(shù)據(jù)與輸出數(shù)據(jù)之間的非線性擬合,并允許出現(xiàn)擬合偏差。其數(shù)學(xué)關(guān)系表現(xiàn)形式為:
式中:w-權(quán)值矢量;φ(x)-非線性映射,生產(chǎn)和輸入向量x同維的向量;b-偏差;(w,φ)-w和φ(x)的點(diǎn)積。
LSSVM最優(yōu)化問(wèn)題是尋找一個(gè)函數(shù),在規(guī)定誤差內(nèi)能夠估計(jì)出幾乎接近目標(biāo)的輸出,同時(shí)最小化w模型參數(shù),使其具有更強(qiáng)的泛化能力,使回歸模型在模型推廣能力和經(jīng)驗(yàn)風(fēng)險(xiǎn)之間找到最佳平衡點(diǎn),即結(jié)構(gòu)風(fēng)險(xiǎn)最小化。對(duì)于最小二乘支持向量機(jī)方法,優(yōu)化目標(biāo)等價(jià)于一個(gè)最基本的凸二次規(guī)劃問(wèn)題,其形式如下:
在LSSVM回歸模型容許的擬合誤差范圍內(nèi),引入松弛系數(shù)ξ,帶有松弛系數(shù)的同等最優(yōu)化問(wèn)題可表示為:
式中:J(w,ξ)-誤差控制函數(shù);ξ-松弛系數(shù),用于表征允許擬合誤差的程度;wTw-控制模型的復(fù)雜度;C-懲罰因子,用于控制訓(xùn)練錯(cuò)誤率與泛化能力的一個(gè)折中系數(shù),用來(lái)懲罰超出誤差的數(shù)據(jù)點(diǎn),并作為誤差與優(yōu)化目標(biāo)之間的權(quán)重。
利用Lagrange乘數(shù)法求解式(6)的優(yōu)化問(wèn)題,轉(zhuǎn)化為一個(gè)等價(jià)的二次規(guī)劃問(wèn)題,定義Lagrange函數(shù):
式(7)中,αi(i=1,2,…,m)為L(zhǎng)agrange乘子。
根據(jù)KKT優(yōu)化條件得到:
則有:
引入核函數(shù),K(xi,yi)=φ(xi)·φ(yi),根據(jù)式(9),將求解優(yōu)化問(wèn)題轉(zhuǎn)化為求解線性方程:
解上述線性方程組可得到Lagrange乘子αi和偏差參數(shù)b,由此確定LSSVM的輸出為:
式(11)即為需要的LSSVM模型。式中函數(shù)f(x)完全由αi乘子決定。根據(jù)LSSVM回歸函數(shù)的性質(zhì),只有少數(shù)的αi不為0,這些參數(shù)對(duì)應(yīng)的向量稱(chēng)之為支持向量,偏差b也可以由標(biāo)準(zhǔn)支持向量計(jì)算得到。由于式(11)描述的對(duì)象是一個(gè)凸規(guī)劃問(wèn)題,其任一解均為全局最優(yōu)解,而無(wú)局部極值問(wèn)題,即具有較強(qiáng)的全局搜索能力[14]。
另外,式中的核函數(shù)是一個(gè)必須滿足Mercer條件的函數(shù)。核函數(shù)有很多形式,本文采用能夠較好解決復(fù)雜非線性問(wèn)題的徑向基RBF核函數(shù),其表達(dá)式為:
式中:σ-核寬度。最終得到支持向量回歸機(jī)的估計(jì)函數(shù):
2.1輸入?yún)?shù)選取及歸一化
調(diào)剖效果作為輸出參數(shù)是確定的,但其影響因素較多,且各因素對(duì)調(diào)剖效果好壞的關(guān)聯(lián)程度各不相同,這些因素還可能相互關(guān)聯(lián)。本文用灰色關(guān)聯(lián)法確定調(diào)剖效果的主控因素。首先將各因素屬性值進(jìn)行歸一化處理,具體為采用線性函數(shù)法中的最大最小值法將各因素屬性值都映射到[0,1]區(qū)間。對(duì)于某一特定的屬性序列xi(i=1,2,…,m),則有:
式中:x、X分別為歸一化前后的因素屬性值;xmax、xmin分別為因素屬性的最大值和最小值。根據(jù)結(jié)果對(duì)影響調(diào)剖效果的系列因素進(jìn)行關(guān)聯(lián)度排序,選擇影響調(diào)剖效果的主控因素作為模型的輸入?yún)?shù)。此外,在模型進(jìn)行樣本訓(xùn)練時(shí),同樣使用歸一化的屬性值,以利于提升核函數(shù)點(diǎn)積計(jì)算速度。
2.2核函數(shù)參數(shù)優(yōu)化
實(shí)踐表明,合理確定LSSVM模型的松弛系數(shù)ξ、懲罰因子C、核函數(shù)RBF的基寬σ,可以顯著提升模型的精度和推廣能力。本文采用交叉驗(yàn)證網(wǎng)格搜索方法來(lái)確定松弛系數(shù)ξ、懲罰因子C和核寬度σ,并將其最優(yōu)參數(shù)組合代入RBF核函數(shù),通過(guò)公式(13)即可得到需要的LSSVM模型。
表1 LSSVM歸一化訓(xùn)練樣本Tab.1 Normalized training sample of LSSVM
靖安油田五里灣區(qū)塊為典型的低滲透油藏,儲(chǔ)層平均孔隙度12.74 %,平均滲透率1.81×10-3μm2,有效厚度12.4 m。區(qū)塊于1998年大規(guī)模投產(chǎn),采用300 m× 300 m近似正方形反九點(diǎn)井網(wǎng)、同步注水開(kāi)發(fā)。開(kāi)發(fā)過(guò)程中含水不斷上升,2014年底綜合含水達(dá)51.7 %,表現(xiàn)出含水加快上升,產(chǎn)量下降,平面及縱向矛盾日益突出。2015年以來(lái),通過(guò)開(kāi)展“弱凝膠+凝膠顆粒”深部調(diào)剖技術(shù)應(yīng)用,有效緩解了油藏水驅(qū)不均矛盾,穩(wěn)油控水效果明顯。
以五里灣區(qū)塊2015年實(shí)施的24口調(diào)剖井組為例,首先將眾因素屬性值歸一化,通過(guò)灰色關(guān)聯(lián)法得到與調(diào)剖效果關(guān)聯(lián)度前五位的油層厚度、含油飽和度、含水率、變異系數(shù)和調(diào)剖注入量作為模型的輸入?yún)?shù),目標(biāo)輸出分別為調(diào)剖井組增油量和降水量。將上述輸入輸出參數(shù)歸一化后作為學(xué)習(xí)樣本(見(jiàn)表1),應(yīng)用LSSVM進(jìn)行該區(qū)調(diào)剖效果的訓(xùn)練與回歸。在初始訓(xùn)練樣本確定的情況下,利用交叉驗(yàn)證網(wǎng)格搜索方法得到松弛系數(shù)ξ=0.01、懲罰因子C=400、基寬σ=2,使得最終LSSVM法計(jì)算結(jié)果是唯一的。將24個(gè)訓(xùn)練樣本進(jìn)行預(yù)處理后用于LSSVM學(xué)習(xí)。利用LSSVM進(jìn)行訓(xùn)練得到的增油量、降水量計(jì)算值與真實(shí)值的相關(guān)系數(shù)R2分別為0.988 4、0.845 6,擬合程度較高,說(shuō)明該預(yù)測(cè)模型可靠性較好(見(jiàn)圖1)。
利用訓(xùn)練好的預(yù)測(cè)模型對(duì)五里灣區(qū)塊未參與學(xué)習(xí)的3口調(diào)剖井進(jìn)行預(yù)測(cè)及對(duì)比。結(jié)果表明(見(jiàn)表2),模型預(yù)測(cè)的井組增油量與實(shí)際值的平均相對(duì)誤差為5.71 %,井組降水量與實(shí)際的平均相對(duì)誤差為2.71 %,能夠滿足礦場(chǎng)應(yīng)用的精度要求。
圖1 訓(xùn)練樣本計(jì)算值與實(shí)際值的對(duì)比Fig.1 Comparison between calculated and actual values for training sample
表2 檢驗(yàn)樣本的實(shí)際值與模型預(yù)測(cè)值對(duì)比Tab.2 Comparison between calculated and actual values for inspection sample
(1)調(diào)剖效果受多因素影響,難以將其與各影響因素之間建立一種確定的數(shù)學(xué)關(guān)系用于礦場(chǎng)應(yīng)用計(jì)算。利用在小樣本條件下解決關(guān)聯(lián)屬性之間的多維非線性問(wèn)題的優(yōu)越性,提出采用最小二乘支持向量機(jī)法建立調(diào)剖效果與其主控因素之間的非線性映射數(shù)學(xué)模型,進(jìn)而預(yù)測(cè)未知井的調(diào)剖效果。
(2)以靖安油田五里灣區(qū)塊調(diào)剖井為學(xué)習(xí)樣本,將調(diào)剖后井組增油量和降水量作為目標(biāo)輸出,進(jìn)行了最小二乘支持向量機(jī)法實(shí)例計(jì)算及驗(yàn)證。計(jì)算結(jié)果與樣本實(shí)際值擬合相關(guān)性較高,預(yù)測(cè)相對(duì)誤差在6 %以內(nèi),該方法用于調(diào)剖效果預(yù)測(cè)及評(píng)價(jià)是可行的。
參考文獻(xiàn):
[1]趙明宸,陳月明,蔣海巖,等.調(diào)剖措施效果影響因素的不確定性及其關(guān)聯(lián)分析[J].中國(guó)石油大學(xué)學(xué)報(bào)(自然科學(xué)版),2006,30(6):59-62.
[2]徐耀東,任允鵬,丁良成,等.基于支持向量機(jī)的調(diào)剖效果預(yù)測(cè)方法研究[J].斷塊油氣田,2007,14(2):50-52.
[3]巫祥陽(yáng),等.基于支持向量機(jī)的調(diào)剖措施效果預(yù)測(cè)模型研究[J].石油天然氣學(xué)報(bào),2006,28(5):120-121.
[4]汪洪,喬方,于春濤.影響調(diào)剖效果因素的分析[J].鉆采工藝,2008,31(增刊):65-67.
[5]姜漢橋,劉偉,袁謀,等.多輪次調(diào)剖數(shù)值模擬研究[J].石油鉆采工藝,2003,25(5):63-66.
[6]李梅,康志江.深度調(diào)剖數(shù)值模擬研究與應(yīng)用[J].大慶石油地質(zhì)與開(kāi)發(fā),2004,23(3):76-77.
[7]王清平.化學(xué)調(diào)剖效果經(jīng)濟(jì)評(píng)價(jià)方法研究[D].浙江:浙江大學(xué),2002.
[8]Vapnik V N.The nature of statistical learning theory[M].NewYork:Springer,1995.
[9]張學(xué)工.關(guān)于統(tǒng)計(jì)學(xué)習(xí)理論與支持向量機(jī)[J].自動(dòng)化學(xué)報(bào),2000,26(1):32-41.
[10]楊位民,田芳,龔聲蓉,等.基于支持向量機(jī)的壓裂井層優(yōu)選[J].計(jì)算機(jī)工程,2006,32(7):247-249.
[11]聶玲玲,童凱軍,侯東梅,等.利用支持向量機(jī)方法求取縫洞型油氣藏地層系數(shù)[J].中國(guó)海上油氣,2011,23(2):93-96.
[12]侯健,樂(lè)友喜,王才經(jīng),等.基于統(tǒng)計(jì)學(xué)習(xí)理論的提高采收率潛力預(yù)測(cè)[J].石油大學(xué)學(xué)報(bào)(自然科學(xué)版),2004,28(4):67-70.
[13]錢(qián)曉山,陽(yáng)春華.基于GEP的最小二乘支持向量機(jī)模型參數(shù)選擇[J].智能系統(tǒng)學(xué)報(bào),2012,7(3):1-5.
[14]Xu Kaikuo,et al.A novel method for real parameter optimization based on gene expression programming[J].Applied Soft Computing,2009,9(2):725-737.
Effect prediction of profile control based on least squares support vector machine in low permeability reservoir
ZHAO Yanhong1,MA Siju2,LIU Xiaoping2,JING Wenjie2,ZHANG Zhaozhao2
(1.Research Institute of Xi'an Changqing Chemical Group Co.,Ltd.,Xi'an Shanxi 710018,China;2.Oil Production Plant 3 of PetroChina Changqing Oilfield Company,Yinchuan Ningxia 750006,China)
Abstract:The efficiency of profile control is influenced by many factors such as geological conditions,development status and profile control technology,and effect prediction of profile control is considered as solving a complicated nonlinear problem which is influenced by many factors.It can not meet the actual application needs for conventional numerical simulation method with the demanding accuracy of geological modeling and the long time of history fitting.The least squares support vector machine(LSSVM)was used to construct the nonlinear mapping model between the profile control effect and its main controlling factors in this paper,and effect prediction of profile control for unknown well is transformed to the process of solving a nonlinear function.Based on the data of 24 profile control wells of Wuliwan block in Jing'an oilfield,the LSSVM forecast model of increasing oil and decreasing waterbook=38,ebook=43was established,and it was verified by inspection sample.The results show that the fitting accuracy between calculation results and actual values is relatively high and the error is small, the method can be used for prediction and evaluation of profile control effect in field.
Key words:efficiency of profile control;influence factors;least squares support vector machine;prediction model;Wuliwan block
*收稿日期:2015-12-31
DOI:10.3969/j.issn.1673-5285.2016.03.010
中圖分類(lèi)號(hào):TE348
文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1673-5285(2016)03-0037-05