張鳳東, 劉景亮, 黃學(xué)斌, 石 磊
(中國石油化工股份有限公司石油勘探開發(fā)研究院,北京 100083)
預(yù)測儲量是指在圈閉預(yù)探階段預(yù)探井獲得了油氣流或綜合解釋有油氣層存在時,根據(jù)區(qū)域地質(zhì)條件分析和類比,有進一步勘探升級價值的儲量[1]。預(yù)測儲量發(fā)現(xiàn)后,對預(yù)測儲量進行合理評價和升級是石油公司勘探開發(fā)過程中的一項重要任務(wù),它直接影響著勘探開發(fā)決策部署和儲量接替。因此開展預(yù)測儲量升級潛力研究具有重要的現(xiàn)實意義。
一些學(xué)者對儲量升級動用及應(yīng)用聚類分析方法進行了相關(guān)研究。秦偉軍等[2]以油氣預(yù)測儲量區(qū)塊為研究對象,提出了油氣預(yù)測儲量區(qū)塊升級綜合評價方法。采用聚類分析方法,不同學(xué)者對儲層分類、產(chǎn)能預(yù)測、融合算法等進行了研究[3-6]。譚鋒奇等[7]以克拉瑪依礫巖油藏為例,基于聚類分析方法對儲層類型進行了精細劃分。也有學(xué)者從不同角度對儲量替代率預(yù)測方法等進行了研究[8-13]。
為此,應(yīng)用聚類分析方法,將有升級潛力的單元從預(yù)測儲量中快速篩選出來,不僅能為下一步儲量升級動用提供控制儲量目標,為勘探開發(fā)部署提供決策依據(jù),而且能夠提高決策效率、節(jié)省研究成本。
預(yù)測儲量升級主要取決于儲量本身的內(nèi)在要素及當前的認識程度,如油氣藏地質(zhì)條件、品位和儲量規(guī)模等[2],而油藏圈閉類型、儲層類型、儲量豐度、埋深、產(chǎn)能、儲量規(guī)模等因素對儲量升級都有較大的影響。從儲層物性來看,孔隙性、滲透性及流體飽和度等對能否升級具有直接的影響,而原油地下黏度及地面密度是決定開發(fā)難易的重要條件,也影響儲量升級的重要因素。還有政策及外部環(huán)境等條件,雖然也會影響儲量升級,但在此不作為研究對象。
根據(jù)儲量升級的主要影響因素,運用聚類分析方法對預(yù)測儲量單元和控制儲量單元進行統(tǒng)計、計算、歸類,從預(yù)測儲量中找出和控制儲量相似程度高的儲量,從而優(yōu)選出預(yù)測儲量單元。聚類分析就是將儲量單元分組形成多個類或簇,在同一個類中的單元具有較高的相似度,而不同類中的單元差別較大。核心是通過對多個儲量單元特征信息的綜合分析,從大量數(shù)據(jù)中尋找隱含的數(shù)據(jù)分布規(guī)律,將數(shù)據(jù)體中具有相似地質(zhì)特征、物性特征、產(chǎn)能等特征的儲量單元分為同一類,從而達到在預(yù)測儲量中找出目前可升級儲量的目的。
聚類結(jié)果是反映原始數(shù)據(jù)的自然結(jié)構(gòu)特征,以發(fā)現(xiàn)原始數(shù)據(jù)中某些潛在的聯(lián)系和特征。聚類算法要使類間對象(樣本)的相似性盡可能小,類內(nèi)對象的相似性要盡可能大,同一類對象具有相近的宏觀和微觀特征,從而實現(xiàn)聚類的有效劃分。常用的聚類分析方法有快速聚類法、系統(tǒng)聚類法和二階聚類法[12]。
2.1.1 快速聚類分析
快速聚類法又稱為k-mean聚類法,是一種迭代求解的聚類分析算法,具有分類高效、易于操作、擴充性好等特點??焖倬垲悓α繂卧诸惖幕舅悸罚号袛嗝總€單元儲量與每類儲量的相近程度,然后將其合并到最近的類中。聚類中心以及分配給它們的單元就代表一個類。每分配一個新成員,各聚類中心會根據(jù)現(xiàn)有的單元被重新計算。重復(fù)再分配的過程,直到每類中心包含的單元不再變化。算法過程:①選擇n個初始聚類中心;②計算每個單元與這n個中心各自的距離,按照最小距離原則分配到最近聚類;③重新計算,使用每個聚類中的樣本單元均值作為新的聚類中心;④重復(fù)步驟②和③,直到聚類中心不再變化;⑤結(jié)束,得到n個聚類。
2.1.2 系統(tǒng)聚類分析
系統(tǒng)聚類是聚類分析中常規(guī)方法。在系統(tǒng)聚類的過程中,首先判斷不同樣本之間的相似程度,每次將具有最小歐式距離的兩個類合并,合并后再重新計算類與類之間的距離,再次進行合并,直至所有樣本都歸為一類為止,得到系統(tǒng)最終聚類結(jié)果,同時可繪出聚類過程譜系圖。
2.1.3 二階聚類分析
二階聚類又稱兩步聚類,主要用來揭示數(shù)據(jù)內(nèi)在的自然分組[12]。二階聚類整個聚類過程分為前后兩大步驟來完成,第一步對所有單元進行距離考察,構(gòu)建聚類特征樹,同一個樹節(jié)點內(nèi)的記錄相似度高,相似度低的則會生成新的節(jié)點;第二步,在分類樹的基礎(chǔ)上,用凝聚法對節(jié)點進行分類,每一個聚類使用Bayesian信息準則(BIC)或Akaike信息準則(AIC)進行判斷,得出最終的聚類結(jié)果。
預(yù)測儲量升級潛力優(yōu)選的聚類分析就是以儲量單元本身的特性為基礎(chǔ),對比與控制儲量的相似性或相異性,并根據(jù)這種相似或相異程度將其劃分為不同的類。聚類結(jié)果要滿足合理性及進一步研究的可操作性,既反映同類間性質(zhì)的相似性,又把和控制儲量對象差別大的單元劃出去,利于從預(yù)測儲量中篩選出可升級單元。為此,利用聚類分析方法對預(yù)測儲量的優(yōu)選升級可遵循以下流程。
(1)確定所要考察的預(yù)測和控制儲量單元。
(2)檢查整理數(shù)據(jù),補齊缺失值,消除異常點,保證數(shù)據(jù)的完整性、系統(tǒng)性和合理性。
(3)確定性能評估方案,聚類的內(nèi)部度量標準以及實際評價中對分類精度的要求和深入研究的可操作性。
(4)選擇聚類范圍,如同一盆地。也可根據(jù)需要選擇聚類范圍,比如細分沉積相,在同一構(gòu)造沉積相中計算,例如控制儲量、預(yù)測儲量沉積相都選擇灘壩砂。
(5)對數(shù)據(jù)集進行挖掘。
(6)得出計算結(jié)果,對聚類結(jié)果進行分析。
首先選取聚類變量。由于參與聚類的變量決定聚類的結(jié)果,因此篩選有效的聚類變量非常重要。從影響聚類的多種因素中抽取相關(guān)性強的變量進行類比,以對所有樣本數(shù)據(jù)進行有效分類,進而從中優(yōu)選出目標單元。
把選擇的456個預(yù)測儲量單元和946個控制儲量單元放在一個系統(tǒng)中作為數(shù)據(jù)源,運用SPSS統(tǒng)計分析軟件,對系統(tǒng)中的樣品集數(shù)據(jù)進行快速聚類。選擇計算單元名稱作為標注個案,把地質(zhì)儲量、有效厚度、油氣藏埋深等15項數(shù)值型參數(shù)作為計算變量,使用k-mean聚類法對大系統(tǒng)中的數(shù)據(jù)進行迭代計算,直至所有類中心收斂。計算結(jié)果如表1所示,方差分析F檢驗值及顯著性表明各參數(shù)對聚類分析的顯著影響程度。
表1 聚類變量篩選方差分析Table 1 Analysis of variance of cluster variable selection
依照聚類均方應(yīng)大于誤差均方的原則,根據(jù)F檢驗值和顯著性大小聚類計算結(jié)果,確定儲量單元聚類的主控因素主要為:地下黏度、有效孔隙度、豐度、油藏埋深、凝固點、含油飽和度、滲透率、技術(shù)可采儲量、地面密度、地質(zhì)儲量,其次為單元面積、采收率,而千米井深日產(chǎn)量、硫含量和儲層有效厚度的F最小,類間處理的不同帶來的差異小于類內(nèi)個體差異所帶來的差異,故在聚類分析時去除該3類變量,保留其余12項變量參與聚類分析。
再選取2017年渤海灣盆地稀油油藏366個保有控制儲量單元、118個新增預(yù)測儲量單元,共484個單元作為樣本分析的數(shù)據(jù)源,采用快速聚類法對各儲量單元進行計算,根據(jù)距離和相似性逐次分解、合并,經(jīng)多次集群至所有類中心收斂,把所有單元分類到不同的類中得出最終聚類結(jié)果。
如表2所示,聚類計算把20個預(yù)測儲量單元和175個控制儲量單元歸為一類, 表明該20個預(yù)測儲量單元和控制儲量單元具有較高的相似性,這為下一步升級動用提供了明確的優(yōu)選目標。在選出的這20個預(yù)測儲量單元其中,經(jīng)實際驗證,截至2018年底已有永斜558、利943、樁海111(5)等9個單元升級為控制儲量單元,升級率已達45%??梢娡ㄟ^聚類分析優(yōu)選潛力預(yù)測儲量單元具有較高的準確度。表2為選出的11個預(yù)測儲量單元及9個證實已升級為控制儲量的預(yù)測儲量單元。
聚類結(jié)果方差分析如表3所示。從表3可以看出,各變量聚類均方差都遠大于誤差均方差,且顯著性水平均遠小于0.05,說明拒絕12個變量使各類之間無差異的假設(shè),表明參與聚類分析的12個變量能很好地區(qū)分各類,類之間的差異足夠大,能夠較好地把具有相同特征的單元歸于一類,同時把不同類的單元分開。
通過系統(tǒng)聚類,能夠表明聚類的整個過程及各類之間的距離。冰柱圖代表了不同類的聚集過程,把所有單元的聚類過程直觀地表現(xiàn)出來。從冰柱圖可以看出,選出的樁海111(5)、樁海111(4)、樁海111(3)、樁海111(2)等目標單元,在聚類過程中經(jīng)不同次的聚類計算,最終歸為同一類。圖1為一部分單元的聚類過程。
圖1 系統(tǒng)聚類分析冰柱圖Fig.1 System cluster analysis icicle diagram
(1)影響預(yù)測儲量升級的主要因素是儲量本身的內(nèi)在品質(zhì)及認識程度。計算表明影響儲量單元聚類的主控因素為:黏度、有效孔隙度、豐度、油藏埋深、凝固點、含油飽和度、滲透率等要素。
(2)聚類分析根據(jù)儲量本身屬性定量確定各儲量單元之間的親疏程度并進行歸類。應(yīng)用該分析技術(shù),不僅能對可升級預(yù)測儲量進行早期識別,加快儲量升級動用節(jié)奏,為勘探開發(fā)部署提供決策依據(jù),而且能夠節(jié)省研究人員時間和精力,降低研究成本、提高決策效率。
(3)利用聚類分析方法選出的預(yù)測儲量,作為具有優(yōu)先升級潛力的單元,還需結(jié)合圈閉構(gòu)造、儲層連續(xù)性及評價井試采等認識確定當前預(yù)測儲量能否升級為控制儲量。