趙 軍,盧一凡,李宗杰,柳建華
(1.西南石油大學(xué)地球科學(xué)與技術(shù)學(xué)院,四川成都610500;2.中石化西北油田分公司,新疆烏魯木齊830013)
基于密度聚類的K近鄰法在儲(chǔ)層流體識(shí)別中的應(yīng)用
趙 軍1,盧一凡1,李宗杰2,柳建華2
(1.西南石油大學(xué)地球科學(xué)與技術(shù)學(xué)院,四川成都610500;2.中石化西北油田分公司,新疆烏魯木齊830013)
針對(duì)傳統(tǒng)儲(chǔ)層流體識(shí)別方法識(shí)別精度低、運(yùn)算量大、過于依賴個(gè)人經(jīng)驗(yàn)的缺點(diǎn),提出基于密度聚類的K近鄰法,根據(jù)待測(cè)層段測(cè)井?dāng)?shù)據(jù)的空間分布規(guī)律,將樣本按相對(duì)密度聚類成數(shù)據(jù)簇,并利用K近鄰?fù)镀鲍@得各簇所屬類別。將該方法應(yīng)用在某油田奧陶系鷹山組碳酸鹽巖儲(chǔ)層識(shí)別中。結(jié)果表明,較之其他常用識(shí)別方法,該算法識(shí)別精度高,泛化性和魯棒性強(qiáng),在處理大數(shù)據(jù)分類問題時(shí)具有明顯優(yōu)勢(shì),且在識(shí)別常規(guī)方法難以識(shí)別的油水同層時(shí)取得了較好的效果,具有良好的應(yīng)用前景,為利用數(shù)據(jù)挖掘方法解決油田勘探開發(fā)中的復(fù)雜問題提供了新思路。
測(cè)井解釋;流體識(shí)別;K近鄰法;相對(duì)密度聚類;數(shù)據(jù)挖掘
利用測(cè)井資料對(duì)儲(chǔ)層流體進(jìn)行精確識(shí)別是儲(chǔ)層評(píng)價(jià)工作的重要任務(wù)。常規(guī)測(cè)井解釋中,流體識(shí)別一般采用曲線重疊法[1-2]和交會(huì)圖法[2-4],識(shí)別依據(jù)為測(cè)井曲線重疊時(shí)線間距的變化或測(cè)井?dāng)?shù)據(jù)交會(huì)分析建立的圖版,識(shí)別結(jié)果過于依賴經(jīng)驗(yàn)判斷,分類標(biāo)準(zhǔn)因人而異,精度難以保證,而目前對(duì)上述方法的改進(jìn)僅限于判別因子與閾值的優(yōu)化[5-8],并未從實(shí)質(zhì)上解決這一問題?,F(xiàn)有的機(jī)器學(xué)習(xí)法,如Fisher判別法[9-11]、神經(jīng)網(wǎng)絡(luò)[12-15]等,亦存在一定缺陷:前者依據(jù)組間與組內(nèi)均方差之比最大的原則,尋找將多維數(shù)據(jù)點(diǎn)投影為一維數(shù)值的線性函數(shù)建立圖版進(jìn)行識(shí)別,但由于地下結(jié)構(gòu)復(fù)雜,測(cè)井?dāng)?shù)據(jù)往往線性不可分,此時(shí)算法精度難以保證;后者通過某種算法構(gòu)建參數(shù)間的映射模型[15]以實(shí)現(xiàn)流體識(shí)別,但該算法學(xué)習(xí)效率固定,網(wǎng)絡(luò)參數(shù)由個(gè)人經(jīng)驗(yàn)或反復(fù)試驗(yàn)確定而缺乏理論指導(dǎo),處理速度慢,且結(jié)果值得商榷。筆者根據(jù)測(cè)井?dāng)?shù)據(jù)結(jié)構(gòu),利用局部相對(duì)密度將待測(cè)樣本點(diǎn)聚類成簇,并利用K近鄰?fù)镀鲍@得各簇所屬類別。
基于密度聚類的K近鄰法(density clustering based K-nearest neighbor method,DCBKNN),是對(duì)相對(duì)密度聚類和K近鄰法的綜合,其主要思想是,利用相對(duì)密度聚類將待測(cè)樣本中雜亂分布的數(shù)據(jù)點(diǎn)簡(jiǎn)化成為數(shù)據(jù)簇,之后只需利用K近鄰?fù)镀迸袛嗝總€(gè)簇的核心點(diǎn)所屬的類別即可實(shí)現(xiàn)儲(chǔ)層流體類型的識(shí)別。
1.1相對(duì)密度聚類算法構(gòu)建數(shù)據(jù)簇
聚類分析(clustering analysis)是一種根據(jù)數(shù)據(jù)結(jié)構(gòu)特征的相似性將數(shù)據(jù)集劃分成若干個(gè)小組的數(shù)理分析方法,其中每個(gè)數(shù)據(jù)組均是由一系列隸屬于同一類別的數(shù)據(jù)點(diǎn)構(gòu)成的集合,稱為數(shù)據(jù)簇(data cluster)[16-19]。
基于密度的聚類方法認(rèn)為整個(gè)數(shù)據(jù)空間由若干分布稠密的數(shù)據(jù)區(qū)域和零星分布的數(shù)據(jù)點(diǎn)構(gòu)成,這些高密度區(qū)域構(gòu)成的數(shù)據(jù)簇被分散數(shù)據(jù)點(diǎn)構(gòu)成的稀疏空間所分隔,而算法的目的就是根據(jù)全局密度的差異找出這些數(shù)據(jù)簇。
常用的密度聚類法中最典型的是DBSCAN算法[18-19],其核心參數(shù)為鄰域半徑Eps和鄰域內(nèi)最少元素?cái)?shù)量minPts。通過檢索找出若干個(gè)高密度區(qū)域的核心點(diǎn)并擴(kuò)展形成數(shù)據(jù)簇,要求簇內(nèi)每個(gè)元素在半徑Eps內(nèi)都能至少包含minPts個(gè)點(diǎn)。該方法存在一些難以克服的缺點(diǎn)。首先,聚類參數(shù)Eps和minPts的敏感性過強(qiáng),即使是細(xì)微的改變也能造成巨大的偏差。圖1顯示了不同的聚類參數(shù)對(duì)聚類結(jié)果的影響。當(dāng)Eps和minPts的設(shè)置合理時(shí),圖中分布緊密的數(shù)據(jù)能準(zhǔn)確地聚類成兩個(gè)簇,如圖1(a)所示。此時(shí)略增大minPts,使簇Ⅱ中元素?cái)?shù)量達(dá)不到minPts的要求,機(jī)器會(huì)對(duì)聚類結(jié)果進(jìn)行自動(dòng)修改,造成將簇Ⅰ和簇Ⅱ誤分成一類的結(jié)果,如圖1(b)所示。其次,聚類參數(shù)的選擇往往基于個(gè)人經(jīng)驗(yàn),且根據(jù)問題的不同,取值也往往大相徑庭,很難給出一個(gè)完善的參考區(qū)間,這在處理一些復(fù)雜問題時(shí)給使用者造成了極大的不便。最后,該算法在核心點(diǎn)的提取和擴(kuò)展過程中,繁冗的計(jì)算和儲(chǔ)存過程會(huì)大量占用內(nèi)存[18]。可見,該方法在處理數(shù)據(jù)量大、結(jié)構(gòu)復(fù)雜的儲(chǔ)層流體識(shí)別問題時(shí),實(shí)用價(jià)值很有限。
圖1 不同的聚類參數(shù)對(duì)聚類結(jié)果的影響Fig.1 Distinct influence to clustering result when selecting different parameters
為了彌補(bǔ)DBSCAN的上述缺點(diǎn),本文中引入K近鄰相對(duì)密度以替換全局密度,不再使用Eps和minPts這兩個(gè)參數(shù),而是通過設(shè)置閾值對(duì)簇的范圍進(jìn)行控制,按照相對(duì)密度的高低,將分布相對(duì)疏松的點(diǎn)排除出簇,達(dá)到了較好的聚類效果。
對(duì)于儲(chǔ)層流體識(shí)別問題,首先需選擇適當(dāng)?shù)臏y(cè)井識(shí)別因子。測(cè)井解釋中一般選擇GR(自然伽馬)、RD(深側(cè)向電阻率)、RS(淺側(cè)向電阻率)、AC(聲波時(shí)差)、DEN(密度)、CNL(補(bǔ)償中子)、SP(自然電位)等常規(guī)測(cè)井參數(shù)及其衍生參數(shù)作為識(shí)別因子。根據(jù)測(cè)試資料,提取流體類型已知的數(shù)據(jù)點(diǎn)構(gòu)建參考樣本集,提取待識(shí)別的數(shù)據(jù)點(diǎn)構(gòu)成待測(cè)樣本集。由于識(shí)別因子的取值范圍差異較大,有時(shí)甚至相差多個(gè)數(shù)量級(jí),因此需對(duì)參考樣本集和待測(cè)樣本集采取標(biāo)準(zhǔn)化處理以消除樣本量綱不同造成的誤差。
其次,選擇一個(gè)合適的K值,對(duì)標(biāo)準(zhǔn)化后的待測(cè)數(shù)據(jù)集中所有元素依次檢索其K個(gè)最近鄰,并計(jì)算其平均K近鄰距離nnad(xi),選擇出nnad(xi)最小的點(diǎn)作為核心點(diǎn),將核心點(diǎn)與其K近鄰作為初始簇。
對(duì)于K值的選擇,可以通過選擇一個(gè)較小的初值,再根據(jù)參考樣本集進(jìn)行交叉驗(yàn)證得到最優(yōu)值[20]。具體操作為,從參考樣本集中隨機(jī)抽取部分?jǐn)?shù)據(jù)作為訓(xùn)練集而將剩余數(shù)據(jù)作為測(cè)試集,根據(jù)訓(xùn)練集元素的類別和分布確定初始K值,在測(cè)試集中進(jìn)行驗(yàn)證,并根據(jù)需要對(duì)其進(jìn)行適當(dāng)修改,多次重復(fù)交叉驗(yàn)證過程,以得到最優(yōu)K值。為了保證K近鄰?fù)镀苯Y(jié)果不會(huì)出現(xiàn)“平票”的情況,應(yīng)盡量保證K為奇數(shù)。
數(shù)據(jù)集中某一點(diǎn)x*與其K近鄰集合中各元素的平均K近鄰距nnad(xi)的計(jì)算公式為
其中
式中,d(x*,xi)為歐氏距離;分別為點(diǎn)x*與xi的第p個(gè)測(cè)井參數(shù)對(duì)應(yīng)的數(shù)值。
再次,根據(jù)參考樣本集選定一個(gè)合理的閾值λ,根據(jù)核心點(diǎn)在簇中的相對(duì)密度對(duì)初始簇進(jìn)行擴(kuò)展,得到目標(biāo)簇。
對(duì)于核心點(diǎn)為xcore的初始簇C,采用如下方法進(jìn)行擴(kuò)展。首先計(jì)算xcore在C中的相對(duì)密度rden(xcore),觀察其相對(duì)密度是否滿足條件rden(xcore)≥λ。若不滿足該條件,則將在C之內(nèi)與xcore距離最遠(yuǎn)的點(diǎn)剔除出簇,直到滿足條件為止;若滿足該條件,則將在C之外與xcore距離最近的點(diǎn)加入C,直到不滿足條件為止。通過擴(kuò)展得到的簇即為目標(biāo)簇。其中xcore在C中的相對(duì)密度[21]的計(jì)算公式為
λ為一個(gè)不大于1的無(wú)量綱常數(shù),其選擇須根據(jù)樣本的數(shù)據(jù)結(jié)構(gòu)而定。一般方法是首先選擇一個(gè)接近于1的初始值,利用已知從屬類別的參考樣本對(duì)該初始值進(jìn)行反復(fù)驗(yàn)證,直到達(dá)到預(yù)期聚類效果時(shí)為止。λ的取值僅影響簇的范圍和數(shù)量,取值過小會(huì)造成誤判,取值過大僅會(huì)造成運(yùn)算量的增大,對(duì)判別結(jié)果影響不大,因此λ的選擇應(yīng)秉承“寧大勿小”的原則。
最后,將聚類完畢的目標(biāo)簇中數(shù)據(jù)提取出來(lái),并對(duì)剩余數(shù)據(jù)重復(fù)進(jìn)行上述聚類步驟,直到剩下的點(diǎn)無(wú)法納入任何簇內(nèi)為止。將這些點(diǎn)分別當(dāng)作單點(diǎn)構(gòu)成的簇來(lái)看待。
1.2加權(quán)K近鄰?fù)镀狈ㄗR(shí)別待測(cè)樣本
式中,ωi為權(quán)重系數(shù);ni為第i類中的樣本數(shù)量;n為所有類別中樣本的總數(shù)。
經(jīng)過加權(quán)K近鄰?fù)镀保梢缘玫矫總€(gè)數(shù)據(jù)點(diǎn)所對(duì)應(yīng)的流體類別,用“1、2、3、4”分別代表“干層、油層、油水同層、水層”,可以繪制出流體指示識(shí)別曲線,并依此識(shí)別各層段流體類別。
1.3算法實(shí)現(xiàn)流程
DCBKNN算法的實(shí)現(xiàn)流程如圖2所示。
對(duì)每個(gè)簇的核心點(diǎn),分別與參考樣本集中的元素計(jì)算加權(quán)距離,尋找其K個(gè)最近鄰居進(jìn)行投票,將核心點(diǎn)歸類于其中占優(yōu)勢(shì)的類別,并將各簇元素歸類于其核心點(diǎn)所屬類別。
在測(cè)井解釋工作中,由于試油、錄井及其他資料的限制,各類別參考樣本的容量很難做到完全一致,加之地質(zhì)結(jié)構(gòu)錯(cuò)綜復(fù)雜,傳統(tǒng)的K近鄰分類法的計(jì)算精度很難得出令人滿意的結(jié)果。針對(duì)上述問題,在K近鄰法的基礎(chǔ)上,引入權(quán)重系數(shù)對(duì)近鄰距離的計(jì)算值進(jìn)行加權(quán),從而有效地減小了由樣本容量的差異導(dǎo)致的誤差,實(shí)現(xiàn)了提高識(shí)別精度的目的[23]。
待測(cè)樣本集X*中某一點(diǎn)x*m與參考樣本X中屬于第i類的樣本點(diǎn)xn之間的加權(quán)距離為
其中
圖2 DCBKNN算法實(shí)現(xiàn)步驟流程Fig.2 Flow-chart of DCBKNN algorithm
選取深側(cè)向電阻率(RD)、淺側(cè)向電阻率(RS)、聲波時(shí)差(AC)、密度(DEN)、補(bǔ)償中子(CNL)、自然伽馬(GR)等6條常規(guī)測(cè)井曲線作為識(shí)別因子,應(yīng)用某油田奧陶系鷹山組碳酸鹽巖地層24口井共42個(gè)試油層段的測(cè)試結(jié)果,將流體識(shí)別類型分為干層、油層、油水同層和水層等4類。
從各層段中提取最能體現(xiàn)該層段流體性質(zhì)的特征點(diǎn)作為參考樣本集。通過對(duì)樣本集的交叉驗(yàn)證和反復(fù)測(cè)試,選定適合本問題的參數(shù)K=13和λ=0.92。
采用上述的DCBKNN算法對(duì)待測(cè)樣本進(jìn)行判別。首先將標(biāo)準(zhǔn)化后的2209個(gè)待測(cè)樣本點(diǎn)聚類為117個(gè)數(shù)據(jù)簇,其中包括單點(diǎn)構(gòu)成的簇79個(gè)。利用加權(quán)K近鄰?fù)镀睂?duì)這117個(gè)簇的核心點(diǎn)進(jìn)行識(shí)別,得到的結(jié)果即為各簇元素的類別。應(yīng)用結(jié)果表明,DCBKNN算法識(shí)別準(zhǔn)確度高達(dá)90.48%,如表1所示,說明該算法在面對(duì)數(shù)據(jù)量大、結(jié)構(gòu)復(fù)雜的儲(chǔ)層流體識(shí)別問題時(shí),亦能保證較高的識(shí)別精度。
表1 DCBKNN算法識(shí)別結(jié)果統(tǒng)計(jì)Table 1 Identification result statistics of DCBKNN algorithm
續(xù)表
圖3 DCBKNN在層段28、29的識(shí)別結(jié)果Fig.3 Identification results of DCBKNN on interval 28 and 29
此外,在識(shí)別其他方法難以準(zhǔn)確識(shí)別的油水同層方面,DCBKNN算法仍具有一定的優(yōu)勢(shì)。在參與測(cè)試的42個(gè)層段中,有油水同層段5個(gè)(層段13、19、26、28、37),其中僅有1個(gè)層段判斷錯(cuò)誤(層段26),識(shí)別正確率達(dá)80%。以同一口井中的層段28、29為例進(jìn)行說明,見圖2。從測(cè)井響應(yīng)來(lái)看,層段28(圖3中層段1)平均深側(cè)向電阻率為450.06 Ω·m,具有小幅正差異,聲波、中子曲線小幅升高,密度曲線小幅降低,整體表現(xiàn)為油水同層特征;層段29(即圖3中層段2)平均深側(cè)向電阻率為328.62 Ω·m,具有較大幅度正差異,聲波、中子曲線升高幅度和密度曲線降低幅度均十分明顯,整體表現(xiàn)為油層。DCBKNN算法的結(jié)果用“1、2、3、4”分別代表“干層、油層、油水同層、水層”,通過運(yùn)算得出的識(shí)別曲線,判斷層段28、29分別為油水同層和油層,與試油結(jié)論完全吻合。由此可見,DCBKNN算法在識(shí)別油水同層等復(fù)雜儲(chǔ)層時(shí)具有較好的效果。
(1)基于密度聚類的K近鄰法是對(duì)K近鄰法和密度聚類算法的改進(jìn),引入權(quán)重函數(shù)以減小樣本比重對(duì)K近鄰法的影響,引入相對(duì)密度以彌補(bǔ)密度聚類算法參數(shù)敏感性過高的缺點(diǎn)。利用相對(duì)密度聚類對(duì)K近鄰法的數(shù)據(jù)加以簡(jiǎn)化,提高了運(yùn)算效率,在處理數(shù)據(jù)量大、結(jié)構(gòu)復(fù)雜的問題時(shí),亦能保證較高的識(shí)別精度。
(2)基于密度聚類的K近鄰法是一種非參數(shù)的識(shí)別方法,既能有效解決傳統(tǒng)識(shí)別方法過于依賴個(gè)人主觀經(jīng)驗(yàn)的問題,又能克服其他常用的數(shù)據(jù)挖掘和模式識(shí)別方法精度低、運(yùn)算慢、易產(chǎn)生過擬合的缺點(diǎn),提高了算法的泛化性和魯棒性。
(3)基于密度聚類的K近鄰法能更好地識(shí)別其他常用算法難以識(shí)別的油水同層、油氣同層等復(fù)雜層段,具有良好的應(yīng)用前景,為利用數(shù)據(jù)挖掘方法解決油田勘探開發(fā)中的復(fù)雜問題提供了新思路。
[1] 趙克超,陶果,王天波,等.泌陽(yáng)凹陷深層系低孔低滲油氣層測(cè)井識(shí)別技術(shù)[J].石油大學(xué)學(xué)報(bào):自然科學(xué)版,2005,29(6):27-31. ZHAO Kechao,TAO Guo,WANG Tianbo,et al.Hydrocarbon identification of the deep-seated reservoirs with low porosity and low permeability from well logs in Biyang sag[J].Journal of the University of Petroleum,China(Edition of Natural Science),2005,29(6):27-31.
[2] 司馬立強(qiáng),鄭淑芬,羅寧,等.川東地區(qū)石炭系儲(chǔ)層流體性質(zhì)測(cè)井判別方法適應(yīng)性分析[J].天然氣工業(yè),2012,22(6):45-48. SIMA Liqiang,ZHENG Shufen,LUO Ning,et al.A-daptability analysis of discriminating the property of fluids in carboniferous reservoirs in east Sichuan by logging methods[J].Natural Gas Industry,2012,22(6):45-48.
[3] 徐德龍,李濤,黃寶華,等.利用交會(huì)圖法識(shí)別國(guó)外M油田巖性與流體類型的研究[J].地球物理學(xué)進(jìn)展,2012,27(3):1123-1132. XU Delong,LI Tao,HUANG Baohua,et al.Research on the identification of lithology and fluid type of foreign moilfield by using the crossplot method[J].Progress in Geophys,2012,27(3):1123-1132.
[4] 鄒文,賀振華,陳愛萍,等.定量交會(huì)圖技術(shù)及其在流體識(shí)別中的應(yīng)用[J].石油物探,2008,47(1):45-48. ZOU Wen,HE Zhenhua,CHEN Aiping,et al.Application of quantitative crossplot technique in fluid identification[J].Geophysical Prospecting for Petroleum,2008,47(1):45-48.
[5] 陳剛.一種新的識(shí)別低電阻率油層的交會(huì)圖及其應(yīng)用[J].中國(guó)石油大學(xué)學(xué)報(bào):自然科學(xué)版,2008,32(3):36-39. CHEN Gang.A new cross plot for identifying low resistivity reservoirs and its application[J].Journal of China U-niversity of Petroleum(Edition of Natural Science),2008,32(3):36-39.
[6] 陳鋼花,張蕾,宋國(guó)奇,等.測(cè)井資料在地層不整合縱向結(jié)構(gòu)研究中的應(yīng)用[J].中國(guó)石油大學(xué)學(xué)報(bào):自然科學(xué)版,2010,34(1):50-54. CHEN Ganghua,ZHANG Lei,SONG Guoqi,et al.Application of logging data to unconformable vertical structure research of stratum[J].Journal of China University of Petroleum(Edition of Natural Science),2010,34(1):50-54.
[7] 袁宇,高楚橋,鄒雯,等.基于交會(huì)圖和全概率公式的流體識(shí)別方法[J].石油天然氣學(xué)報(bào),2013,35(5):79-82 YUAN Yu,GAO Chuqiao,ZOU Wen,et al.Method of fluid identification based on crossplot and total probability formula[J].Journal of Oil and Gas Technology,2013,35(5):79-82.
[8] 李梅,賴強(qiáng),黃科,等.低孔低滲碎屑巖儲(chǔ)層流體性質(zhì)測(cè)井識(shí)別技術(shù):以四川盆地安岳氣田須家河組氣藏為例[J].天然氣工業(yè),2013,33(6):34-38. LI Mei,LAI Qiang,HUANG Ke,et al.Logging identification of fluid properties in low porosity and low permeability clastic reservoirs:a cases study of Xujiahe Fm gas reservoirs in the Anyue Gas Field,Sichuan Basin[J]. Natural Gas Industry,2013,33(6):34-38.
[9] 樊家琨.應(yīng)用多元分析[M].開封:河南大學(xué)出版社,1993:135-144.
[10] 羅德江.基于核Fisher判別的碎屑巖儲(chǔ)層流體識(shí)別[J].地球物理學(xué)進(jìn)展,2013,28(4):1919-1924. LUO Dejiang.The method on the fluid identification of rock elastic properties by Fisher discriminant analysis infragmental rock[J].Progress in Geophys,2013,28(4):1919-1924.
[11] 黃烈林,侯健,陳月明,等.Fisher判別法在聚合物驅(qū)替潛力評(píng)價(jià)中的應(yīng)用[J].石油大學(xué)學(xué)報(bào):自然科學(xué)版,2002,26(1):49-51. HUANG Lielin,HOU Jian,CHEN Yueming,et al.Application of Fisher discrimination method to potential evaluation of polymer flooding[J].Journal of the University of Petroleum,China(Edition of Natural Science),2002,26(1):49-51.
[12] 劉立峰,孫贊東,韓劍發(fā),等.量子粒子群模糊神經(jīng)網(wǎng)絡(luò)碳酸鹽巖流體識(shí)別方法研究[J].地球物理學(xué)報(bào),2014,57(3):991-1000. LIU Lifeng,SUN Zandong,HAN Jianfa,et al.A carbonate fluid identification method based on quantum particle swarm fuzzy neural network[J].Chinese Journal of Geophysics,2014,57(3):991-1000.
[13] 岳文正,陶果.地球物理測(cè)井多參數(shù)綜合識(shí)別儲(chǔ)層流體類型的新型神經(jīng)網(wǎng)絡(luò)[J].石油大學(xué)學(xué)報(bào):自然科學(xué)版,2004,28(3):30-42. YUE Wenzheng,TAO Guo.A new neural network applied to comprehemsive recognition of reservoirs fluid type using geophysical well logging parameters[J]. Journal of the University of Petroleum,China(Edition of Natural Science),2004,28(3):30-42.
[14] 李學(xué)慧.蘇北盆地低電阻率油層的識(shí)別及其分布[J].中國(guó)石油大學(xué)學(xué)報(bào):自然科學(xué)版,2008,32(5):1-6. LI Xuehui.Identification of the low resistivity reservoir and its distribution in Subei Basin[J].Journal of China University of Petroleum(Edition of Natural Science),2008,32(5):1-6.
[15] 孟慶民,張士誠(chéng),王莉,等.數(shù)據(jù)挖掘技術(shù)在氣田壓裂效果評(píng)價(jià)中的應(yīng)用[J].中國(guó)石油大學(xué)學(xué)報(bào):自然科學(xué)版,2008,32(5):165-169. MENG Qingmin,ZHANG Shicheng,WANG Li,et al. Application of data mining to postfracture response evaluation in gas field[J].Journal of China University of Petroleum(Edition of Natural Science),2008,32(5):165-169.
[16] 潘和平,樊政軍,馬勇.基于信息熵識(shí)別油氣層和水層的聚類方法[J].石油大學(xué)學(xué)報(bào):自然科學(xué)版,2004,28(6):31-34. PAN Heping,F(xiàn)AN Zhengjun,MA Yong.Clustering method for identification of oil(gas)-bearing formation and water-bearing formation based on information entropy[J].Journal of the University of Petroleum,China(E-dition of Natural Science),2004,28(6):31-34.
[17] 印興耀,葉端南,張廣智.基于核空間的模糊聚類方法在儲(chǔ)層預(yù)測(cè)中的應(yīng)用[J].中國(guó)石油大學(xué)學(xué)報(bào):自然科學(xué)版,2012,36(1):53-59. YIN Xingyao,YE Duannan,ZHANG Guangzhi.Application of kernel fuzzy C-means method to reservoir prediction[J].Journal of China University of Petroleum(E-dition of Natural Science),2012,36(1):53-59.
[18] 趙杰,楊柳.聚類分析的dBscan的改進(jìn)與實(shí)現(xiàn)[J].微電子學(xué)與計(jì)算機(jī),2009,26(11):189-192. ZHAO Jie,YANG Liu.The improvement and implementation of dBscan clustering algorithm[J].Microelectronics&Computer,2009,26(11):189-192.
[19] 馮少榮,肖文俊.DBSCAN聚類算法的研究與改進(jìn)[J].中國(guó)礦業(yè)大學(xué)學(xué)報(bào),2008,37(1):105-111. FENG Shaorong,XIAO Wenjun.An improved DBSCAN clustering algorithm[J].Journal of China University of Mining&Technology,2008,37(1):105-111.
[20] 李航.統(tǒng)計(jì)學(xué)習(xí)方法[M].北京:清華大學(xué)出版社,2012:37-44.
[21] 孫凌燕,楊明,任建斌.一種基于相對(duì)密度的快速聚類算法[J].微電子學(xué)與計(jì)算機(jī),2009,26(12):109-116. SUN Lingyan,YANG Ming,REN Jianbin.A fast density-based clustering algorithm[J].Microelectronics& Computer,2009,26(12):109-116.
[22] 王淑盛,徐正光,劉黃偉,等.改進(jìn)的K近鄰方法在巖性識(shí)別中的應(yīng)用[J].地球物理學(xué)進(jìn)展,2004,19(2):478-480. WANG Shusheng,XU Zhengguang,LIU Huangwei,et al.The advanced k-nearest neighborhood method used in the recognition of lithology[J].Progress in Geophysics,2004,19(2):478-480.
[23] 曹根,葛孝堃,楊麗琴.基于K-近鄰法的局部加權(quán)樸素貝葉斯分類算法[J].計(jì)算機(jī)軟件與應(yīng)用,2011,28(9):267-291. CAO Gen,GE Xiaokun,YANG Liqin.Locally weighted naive Bayes classification algorithm based on K-nearest neighborhood[J].Computer Applications and Software,2004,19(2):478-480.
(編輯 修榮榮)
Application of density clustering based K-nearest neighbor method for fluid identification
ZHAO Jun1,LU Yifan1,LI Zongjie2,LIU Jianhua2
(1.School of Geoscience and Technology,Southwest Petroleum University,Chengdu 610500,China;2.Sinopec Northwest Oilfield Branch,Urumqi 830013,China)
Reservoir fluid identification is an indispensable link in logging interpretation.In order to remove the defects of traditional approaches,such as unsatisfying accuracy,excessive computation,undue dependence on personal experience,a density clustering based K-nearest neighbor method was proposed.According to the spatial distribution of the interval logging data under test,data clusters are formed based on relative density.And then with K-nearest neighbor voting method,the categories of all clusters become available.Comparing with other commonly used identification methods,tested on the carbonate reservoir of Ordovician Yingshan Formation in an oil field,this approach shows a high accuracy,strong generalization and robustness,as well as better effects on oil-water layer identification which is usually difficult for the compared methods.The method has a good application prospect and provides a new thought on solving complex problems in oilfield exploration and development with data mining methods.
logging interpretation;fluid identification;K-nearest neighbor method;relative density clustering;data mining
P 631.84;TE 122.2
A
1673-5005(2015)05-0065-07
10.3969/j.issn.1673-5005.2015.05.009
2015-03-24
國(guó)家“十二五”重大專項(xiàng)(2011ZX05049-001-001)
趙軍(1970-),男,教授,博士,研究方向?yàn)橛蜌鉁y(cè)井、地質(zhì)。E-mail:zhaojun_70@126.com。
引用格式:趙軍,盧一凡,李宗杰,等.基于密度聚類的K近鄰法在儲(chǔ)層流體識(shí)別中的應(yīng)用[J].中國(guó)石油大學(xué)學(xué)報(bào):自然科學(xué)版,2015,39(5):65-71.
ZHAO Jun,LU Yifan,LI Zongjie,et al.Application of density clustering based K-nearest neighbor method for fluid identification[J].Journal of China University of Petroleum(Edition of Natural Science),2015,39(5):65-71.
中國(guó)石油大學(xué)學(xué)報(bào)(自然科學(xué)版)2015年5期