谷宇峰 張道勇 鮑志東
(①自然資源部油氣資源戰(zhàn)略研究中心,北京 100034;②中國石油大學(xué)(北京),北京 102249)
對于致密砂巖儲層,因受成巖作用和裂縫分布等多種地質(zhì)因素影響,較難準確獲取滲透率,因此在測井解釋中滲透率預(yù)測方法始終為研究難點。滲透率預(yù)測模型主要分為物理模型[1-3]和擬合模型[4-6]。常用的物理模型有指數(shù)型[1-3]、Kozeny-Carman[2-3,7]、Timur[2,8-9]和Herron[2,8-9]等。雖然上述物理模型基于測井理論,能得到可靠的滲透率預(yù)測值,但推廣性較差,原因在于:難以準確獲取模型的許多非測井曲線參數(shù),如束縛水飽和度和巖石礦物含量等,導(dǎo)致在資料不充足的情況下無法應(yīng)用;致密砂巖儲層孔喉系統(tǒng)復(fù)雜,且易發(fā)育裂縫,使?jié)B透率測井響應(yīng)存在多解性,因此利用同一模型難以良好解釋研究區(qū)所有層段。由于滲透率本質(zhì)上是多種地質(zhì)特征參數(shù)的綜合反映,而這些參數(shù)大多與測井響應(yīng)相關(guān),因此從數(shù)學(xué)角度上講可由測井曲線擬合滲透率[4-6]。擬合模型一般僅用于計算測井曲線,且無需過多考慮地質(zhì)因素的影響,極大減少了滲透率預(yù)測的計算量,因此在測井解釋中得到快速發(fā)展[10-12]。多元線性擬合和逐步迭代為經(jīng)典的擬合方法。與多元線性擬合相比,逐步迭代考慮了自變量共線性問題,因此應(yīng)用更廣泛。劉建建等[10]利用逐步回歸建立了長6儲層滲透率模型。劉敏[11]以測井資料為基礎(chǔ),利用逐步回歸估算了長慶T氣田致密砂巖儲層滲透率。由嘉雨[12]利用逐步回歸計算了榆樹林油田葡萄花油層儲層參數(shù)。雖然逐步迭代能快速預(yù)測滲透率,但也存在問題,如難以確定各類測井曲線與滲透率之間的復(fù)雜關(guān)系,因此無法用解析式表示目的層滲透率最優(yōu)擬合模型。
為更智能地建立擬合模型,人們嘗試利用機器學(xué)習(xí)技術(shù)預(yù)測滲透率。當前,擬合性能較好的機器學(xué)習(xí)模型包括支持向量回歸(support vector regression,SVR)[13-16]和梯度提升決策樹(gradient boosting decision tree,GBDT)等[17-20]。鄧浩陽[13]利用SVR估算高孔、低滲碳酸鹽巖儲層滲透率。李佳[14]利用SVR和其他機器學(xué)習(xí)模型預(yù)測多孔介質(zhì)滲透率,且SVR預(yù)測效果較好。Majid等[15]、Zhang等[16]利用以徑向基函數(shù)為主的SVR預(yù)測儲層滲透率,取得較好效果[15-16]。Subasi等[17]使用改進GBDT模型高效預(yù)測了常規(guī)油氣儲層滲透率。韓啟迪等[18]、謝云欣[19]、Zhang等[20]認為GBDT在測井解釋方面具有發(fā)展前景。雖然上述擬合模型的預(yù)測效果較好,但仍存在一些應(yīng)用問題:①由于建模時需多種經(jīng)驗參數(shù)(SVR需要懲罰系數(shù)等,GBDT需要回歸決策樹(classification and regression tree,CART)個數(shù)和學(xué)習(xí)速率等),難以優(yōu)化預(yù)測結(jié)果;②由于模型沒有加入正則化項,在學(xué)習(xí)過程中易出現(xiàn)過擬合現(xiàn)象;③受自身算法的限制,模型在訓(xùn)練大量樣本時非常低效。針對上述問題,人們提出了一種性能更好的模型——XGBoost[21-23],高效地實現(xiàn)了GBDT算法并進行了算法和工程上的許多改進。該模型加入了正則化項,并將擬合模型精細化,因此在理論上較SVR和GBDT等擁有更強的預(yù)測能力[21-22]。閆星宇等[23]利用XGBoost較好地預(yù)測了致密砂巖含氣儲層參數(shù),但其采用試錯法調(diào)試參數(shù),效率低,且無法保證所用參數(shù)為最優(yōu)組合。為此,本文從優(yōu)化參數(shù)角度出發(fā),利用粒子群優(yōu)化(particle swarm optimization,PSO)算法改進XGBoost[24-26],進而提出滲透率預(yù)測模型PSO-XGBoost,并闡述該模型的方法原理及相關(guān)實驗。
因為XGBoost利用測井數(shù)據(jù)預(yù)測滲透率,所以訓(xùn)練樣本和預(yù)測樣本數(shù)據(jù)集應(yīng)由測井曲線和實測滲透率數(shù)據(jù)構(gòu)成,可表示為
A={Xmn,Ym}
(1)
式中:Xmn為測井數(shù)據(jù)集,m為樣本量,n為測井曲線個數(shù);Ym為滲透率向量。在確定樣本數(shù)據(jù)集后,預(yù)測模型可表示為[21-23]
(2)
式中:f0(xi)為初始模型(也稱基分類器),xi為第i個樣本;k=1,2,…,KX為迭代次數(shù);j=1,2,…,Tk為CART葉節(jié)點,Tk為第k次迭代的CART葉節(jié)點個數(shù);wj,k為第k次迭代的第j葉節(jié)點對應(yīng)的所有樣本的替代值;η為學(xué)習(xí)速率。
f0(xi)一般由損失函數(shù)確定,即
(3)
式中L(yi,α)為損失函數(shù),確定目標值與預(yù)測值之間的差值,yi為第i個樣本目標值,α為使損失函數(shù)達到最小的常數(shù)。wj,k由
(4)
XGBoost采用不同損失函數(shù)可得到不同的訓(xùn)練效果??紤]到平方損失函數(shù)對異常點或噪聲點敏感,本文采用絕對損失函數(shù)建模[21-22]。
由于XGBoost在建模中要設(shè)定許多經(jīng)驗參數(shù),如CART葉節(jié)點個數(shù)、學(xué)習(xí)速率和正則化系數(shù)等,因此需優(yōu)化才能保證建模質(zhì)量。PSO能解決多目標最優(yōu)化問題,因此文中用該技術(shù)優(yōu)化XGBoost。如設(shè)定優(yōu)化種群數(shù)量為q,則XGBoost參數(shù)種群可表示為
Γ={σi'|σi'=(σ1i',σ2i',…,σzi')i'=1,2,…,q} (5)式中σi'為種子向量,包含z個優(yōu)化參數(shù)。
確定種群后,PSO的迭代公式可表示為[24-26]
(6)
為在PSO迭代前期鎖定全局最優(yōu)解方向,ω一般取較大值,而在迭代后期取較小值進行局部搜索。本文采用線性下降法(linear decreasing inertia weight,LDIW)優(yōu)化ω[25-26]。
綜合上述,圖1總結(jié)了PSO-XGBoost計算流程[21-26]。
圖1 PSO-XGBoost計算流程
實驗?zāi)康膶訛榧к吞镂鞑块L4+5段致密砂巖儲層。姬塬油田處于鄂爾多斯盆地中西部,位于天環(huán)坳陷和陜北斜坡兩個一級構(gòu)造單元之間(圖2a)。長4+5段是三疊系延長組主力層系之一,儲層形成受控于沉積相帶展布,多為水下分流河道砂體,部分為河口壩砂體[27-30]。分析現(xiàn)有資料可知,儲層孔隙以原生粒間孔(圖2c)、粒間溶孔(圖2d)和晶間孔(圖2e、圖2f)為主,在某些井區(qū)發(fā)育微裂縫(圖2g),表明儲層具有一定的儲集空間和滲流通道[27-28]。然而,在成巖作用階段,受石英次生增大和自生黏土礦物等影響,孔喉結(jié)構(gòu)以細孔—細微喉道和微孔—細微喉道組合為主,在壓汞曲線上多體現(xiàn)為Ⅲ型和Ⅳ型(圖2h),說明儲層滲流性較差。因此,在評價儲層時,能否獲取準確滲透率數(shù)值將成為一關(guān)鍵研究點[29-30]。
由巖心和測井等資料分析得知,目的層可劃分為4個小層(長4+511、長4+512、長4+521、長4+522)。采用指數(shù)模型分析小層滲透率時,發(fā)現(xiàn)孔滲相關(guān)性較差(圖3),其擬合優(yōu)度R2一般小于0.5。對于其他常用物理模型,如Kozeny-Carman模型等,因基礎(chǔ)資料不充足無法應(yīng)用。以上情況說明常規(guī)物理模型并不適用于預(yù)測目的層滲透率,故文中采用PSO-XGBoost進行預(yù)測。為突出驗證效果,在實驗中對比了逐步迭代、SVR和GBDT三種模型的驗證結(jié)果。驗證井共有8口,分布在研究區(qū)東、西部(圖2b),東、西部儲層因受不同沉積和成巖作用影響而具有不同的品質(zhì)。為綜合驗證PSO-XGBoost的預(yù)測能力,設(shè)計了三個實驗。三個實驗分別為:利用西區(qū)井資料(H1、H2、Y1)預(yù)測東區(qū)井資料(HA);利用東區(qū)井資料(L1、H3、H4)預(yù)測西區(qū)井資料(HB);利用全區(qū)井資料預(yù)測東、西區(qū)井資料(HA、HB)。前兩個實驗可了解不同儲層品質(zhì)的井區(qū)資料的相互預(yù)測效果,第三個實驗考查在訓(xùn)練更多樣本的情況下模型的預(yù)測能力。
圖2 工區(qū)及其儲層相關(guān)資料(a)鄂爾多斯盆地構(gòu)造單元劃分;(b)姬塬油田研究區(qū)長4+5頂面構(gòu)造圖;(c)原生粒間孔(YP1井,長4+511);(d)長石溶蝕孔隙(YP2井,長4+522);(e)高嶺石晶間孔(YZ1井,長4+512);(f)綠泥石與伊利石晶間孔(YZ2井,長4+522);(g)微裂縫(YZ3井,長4+522);(h)儲層壓汞曲線分類
實驗測井數(shù)據(jù)由H1、H2和Y1井資料組成,共534個樣本。每個樣本由6條測井曲線構(gòu)成,包括聲波時差(AC)、補償中子測井(CNL)、補償密度測井 (DEN)、自然伽馬(GR)、自然電位(SP)和原狀地層電阻率(RT)。樣本對應(yīng)的滲透率值由氣測實驗得到,變化范圍為0.01~7.60mD。表1展示了部分訓(xùn)練樣本數(shù)據(jù)。由于對比模型SVR和GBDT在計算中也涉及經(jīng)驗參數(shù),因此為使驗證對象都處于相同優(yōu)化狀態(tài),也用PSO進行優(yōu)化。對于逐步迭代,由于算法只利用自變量和因變量數(shù)據(jù)進行分析,不涉及處理其他經(jīng)驗參數(shù),因此無需優(yōu)化。由PSO-XGBoost計算流程(圖1)可知,因增加PSO優(yōu)化流程,訓(xùn)練樣本分為兩部分,一部分用于建模,另一部分用于PSO迭代檢測。為此,在實驗中將訓(xùn)練樣本以比例0.7/0.3分配給建模和優(yōu)化檢測,即374個樣本用于建模,160個樣本用于優(yōu)化檢測。
表1 部分訓(xùn)練樣本數(shù)據(jù)
雖然逐步迭代公式無需優(yōu)化,但為防止所建模型過擬合,也采用上述訓(xùn)練樣本分配方案進行建模和檢測。應(yīng)用逐步迭代之前,先要確定測井曲線與滲透率之間的關(guān)系式。由于該模型只是從數(shù)學(xué)角度出發(fā)對數(shù)據(jù)進行處理,且為加強通用性,一般不加入交叉項和冪指數(shù)項,所以設(shè)定的滲透率與所用的測井曲線的關(guān)系式一般為線性[8-10]。滲透率和RT常呈數(shù)量級變化,但目的層的RT變化不大,因此建模時將滲透率數(shù)據(jù)K以對數(shù)形式分析。由374個訓(xùn)練樣本擬合得到的逐步迭代模型為
lgK=0.017AC+0.028CNL-1.91DEN-0.021GR+0.013SP+0.003RT+1.746
(7)
式(7)的調(diào)整擬合優(yōu)度R2(0.68)高于常規(guī)指數(shù)模型(圖3)。因此,與常規(guī)指數(shù)模型相比,以多種測井曲線資料為基礎(chǔ),利用逐步迭代建立的擬合模型能更好地反映致密砂巖儲層滲透率的變化趨勢。采用MSE (mean squared error)評價計算誤差[7-12],因此誤差單位應(yīng)為mD2。在下文中,為表達簡便,MSE只討論其數(shù)值。統(tǒng)計逐步迭代模型的160個檢測樣本的驗證結(jié)果(圖4a)表明,72.5%的結(jié)果與目標值處于同一數(shù)量級,說明該模型在預(yù)測同一井區(qū)的數(shù)據(jù)時效果較好。
圖3 不同小層的指數(shù)型孔(φ)—滲(K)模型(a)長4+511;(b)長4+512;(c)長4+521;(d)長4+522
預(yù)測樣本為HA井數(shù)據(jù),共50個,其構(gòu)成比例與訓(xùn)練樣本一致。利用逐步迭代模型進行預(yù)測的MSE較大(0.8744,表2),說明逐步迭代建立的擬合模型在不同儲層品質(zhì)的井區(qū)資料的相互預(yù)測中效果不理想。
對于SVR,首先確定參數(shù)框架,之后再進行PSO優(yōu)化建模,其中3個參數(shù)需要優(yōu)化[13-16,24-26]。需要說明的是,重力系數(shù)和加速系數(shù)雖為經(jīng)驗值,但一般不需要改動,即大幅度改動這些參數(shù)也不明顯影響優(yōu)化結(jié)果,側(cè)面說明利用PSO技術(shù)進行優(yōu)化可減少模型調(diào)參工作量。SVR參數(shù)優(yōu)化結(jié)果與初始設(shè)定值差別較大,說明參數(shù)優(yōu)化的必要性(表3)。優(yōu)化過程(圖5a)表明,在100次迭代中,MSE由1.400降至0.4919,說明了PSO的優(yōu)化作用。PSO-SVR的驗證結(jié)果統(tǒng)計(圖4b)表明,84.38%的計算結(jié)果與目標值處于同一數(shù)量級,其可靠程度較逐步迭代模型有所提升,表明PSO-SVR能更好地處理來自同一井區(qū)的數(shù)據(jù)。利用PSO-SVR的MSE較逐步迭代小(0.7212,表2),但仍不理想,說明該模型在利用其他井區(qū)資料預(yù)測滲透率時效果不好。
表2 實驗MSE統(tǒng)計
對于GBDT,表3分別展示了初始參數(shù)設(shè)定、優(yōu)化參數(shù)設(shè)定和參數(shù)優(yōu)化結(jié)果[17-20]。優(yōu)化過程(圖5a)表明,MSE由0.8000降至0.1124,表明PSO在參數(shù)優(yōu)化方面的顯著作用。PSO-GBDT驗證結(jié)果統(tǒng)計(圖4c)表明,92.5%的結(jié)果與目標值數(shù)處于同一數(shù)量級,說明在處理檢測樣本時該模型的預(yù)測能力較逐步迭代、SVR強,且MSE(0.1526,表2)遠小于上述兩種模型,說明該模型能有效利用其他井區(qū)資料預(yù)測目標井數(shù)據(jù)。
對于XGBoost,表3分別展示了初始參數(shù)、PSO 優(yōu)化參數(shù)和參數(shù)優(yōu)化結(jié)果[21-23]。優(yōu)化過程(圖5a)表明,MSE由0.7000降至0.1059,充分說明XGBoost的參數(shù)優(yōu)化得益于PSO技術(shù)。PSO-XGBoost驗證結(jié)果統(tǒng)計(圖4d)表明,94.37%的結(jié)果與目標值數(shù)處于同一數(shù)量級,表明在處理來自同一井區(qū)的資料時,該模型的預(yù)測能力強于前三種模型,且MSE(0.1273,表2)最小,證明該模型能有效利用其他井區(qū)資料高精度地完成預(yù)測任務(wù)。
圖4 實驗1建模驗證結(jié)果統(tǒng)計(a)逐步迭代; (b)PSO-SVR; (c)PSO-GBDT; (d)PSO-XGBoost綠色點為預(yù)測滲透率K′與巖心滲透率K處于同一數(shù)量級,紅色點表示兩者不在同一數(shù)量級
表3 預(yù)測模型參數(shù)設(shè)置和參數(shù)優(yōu)化結(jié)果
圖6為實驗1預(yù)測結(jié)果柱狀圖。由圖可知,PSO-GBDT和PSO-XGBoost落在計算誤差列中的數(shù)據(jù)點最多,但后者的數(shù)據(jù)點整體更偏向0線,表明PSO-XGBoost預(yù)測結(jié)果的精度最高。
本實驗訓(xùn)練數(shù)據(jù)由L1、H3和H4井資料構(gòu)成,共505個樣本,樣本構(gòu)成要素同實驗1。滲透率值由氣測實驗得到。在實驗中將訓(xùn)練樣本以比例0.7/0.3分配給建模和優(yōu)化檢測。
對于逐步迭代,建模得到的擬合公式為
lgK=-0.017AC-12.36DEN-0.09GR-0.023SP+0.018RT+36.803
(8)
式中的擬合變量缺少CNL,說明CNL曲線在實驗中對于滲透率變化無影響。對比式(7)和式(8)發(fā)現(xiàn),逐步迭代在處理不同井區(qū)資料時得到的擬合表達式差別較大,表明模型的推廣性差,即由本井區(qū)資料所建的擬合模型不適用于預(yù)測其他井區(qū)資料。預(yù)測數(shù)據(jù)由HB井資料構(gòu)成,共50個樣本,其構(gòu)成要素與訓(xùn)練樣本一致。利用逐步迭代模型進行預(yù)測的MSE(0.3479,表2)明顯小于實驗1,表明該模型的預(yù)測能力受建模數(shù)據(jù)影響較大,因此模型的預(yù)測穩(wěn)定性非常差。
對于SVR,參數(shù)及其優(yōu)化設(shè)定同實驗1。優(yōu)化過程(圖5b)表明,MSE由約1.2000降至0.3871,表明模型的預(yù)測能力受PSO優(yōu)化而得到提升。PSO-SVR的MSE(0.1756,表2)明顯小于實驗1,表明該模型的預(yù)測能力受建模資料品質(zhì)影響較大,因此計算穩(wěn)定性不佳而難以推廣應(yīng)用。
對于GBDT,參數(shù)及其優(yōu)化設(shè)定同實驗1。優(yōu)化過程(圖5b)表明,MSE由約0.8000降至0.1106,說明PSO起到了良好的優(yōu)化作用。PSO-GBDT的MSE(0.1413,表2)與實驗1相近,表明該模型能利用其他井區(qū)資料有效預(yù)測滲透率,而且預(yù)測穩(wěn)定性較好,能夠推廣應(yīng)用。
對于XGBoost,參數(shù)及其優(yōu)化設(shè)定同實驗1。優(yōu)化過程(圖5b)表明,MSE由約0.7000降至0.0988,說明PSO技術(shù)在建模中起到了良好的優(yōu)化作用。PSO-XGBoost的MSE(0.0667,表2)最小,再次證明PSO-XGBoost能夠利用其他井區(qū)資料有效預(yù)測滲透率,而且預(yù)測能力最強。
圖7 為實驗2預(yù)測結(jié)果柱狀圖。由圖可見:雖然PSO-SVR的計算誤差與PSO-XGBoost的相近,且都靠近0點,但在計算誤差列的頂端和末段都處于0.5~1范圍內(nèi),且中間有些點的誤差已經(jīng)大于1;PSO-XGBoost在這些區(qū)域的點都基本落在0~0.5范圍內(nèi),表明PSO-XGBoost的計算結(jié)果更精確。
在本實驗中,將由東、西井區(qū)資料合并構(gòu)成的訓(xùn)練數(shù)據(jù)進行預(yù)測。訓(xùn)練樣本有1039個,對于所有模型,將訓(xùn)練樣本以比例0.7/0.3分配給建模和優(yōu)化檢測。
對于逐步迭代,得到的擬合公式為
lgK=0.032CNL-7.06DEN-0.014GR-0.012SP-0.004RT+19.198
(9)
模型經(jīng)算法判斷將AC曲線去除,形成的擬合表達式與實驗1、實驗2的不一致,再次說明在處理不同的建模數(shù)據(jù)時逐步迭代容易形成不同的擬合公式,難以推廣應(yīng)用。對于目標井的MSE(分別為0.3360和0.1581,表2)較實驗1、實驗2的小,表明在訓(xùn)練更多學(xué)習(xí)樣本的情況下,模型的預(yù)測能力得到明顯提升。
對于SVR,優(yōu)化過程(圖5c)表明PSO具優(yōu)化作用,PSO-SVR的MSE(分別為0.1534和0.1146,表2)小于實驗1、實驗2,證明該模型的預(yù)測能力在處理更多訓(xùn)練樣本的情況下得到加強。同時,MSE與實驗1的相差較大,與實驗2的相差較小,也再次表明模型的預(yù)測能力受訓(xùn)練數(shù)據(jù)品質(zhì)影響較大,反映了模型的預(yù)測穩(wěn)定性差。
對于GBDT,PSO-GBDT的MSE(分別為0.1352和0.0990,表2)小于實驗1、實驗2,但相差不大,說明模型不僅在訓(xùn)練更多學(xué)習(xí)樣本后形成更強的預(yù)測能力,而且模型的預(yù)測穩(wěn)定性較好,能夠推廣應(yīng)用。
對于XGBoost,PSO-XGBoost的MSE(分別為0.1259和0.0378,表2)小于實驗1、實驗2,且降幅較小,說明XGBoost的預(yù)測能力不僅在處理更多訓(xùn)練樣本后得到提升,而且預(yù)測穩(wěn)定性好。與PSO-GBDT相比,XGBoost的MSE更小,說明該模型更具備推廣價值。
由圖6和圖7的計算誤差列可看出,在處理更多建模樣本的情況下,各驗證模型的MSE較實驗1、實驗2有所減小,很好地說明了擴大訓(xùn)練樣本容量是一種提升各驗證模型預(yù)測能力的有效手段。同時,PSO-XGBoost的MSE最小,再一次說明該模型預(yù)測滲透率的能力最強,最具推廣應(yīng)用價值。
圖6 實驗1預(yù)測結(jié)果柱狀圖
表2展示了各驗證模型在不同實驗中的計算耗時。從整體上看,PSO-SVR耗時最少,PSO-XGBoost耗時最多。PSO-XGBoost的計算速度最慢是因為在實驗中沒有采用XGBoost并行計算技術(shù)??紤]到在處理大數(shù)據(jù)時,XGBoost計算耗時會隨著回歸樹量的增加而成倍增長,為此設(shè)計了能夠并行計算的數(shù)據(jù)存儲方式及其處理方法[21-23]。在處理大于10萬個樣本或樣本包含上百個變量的數(shù)據(jù)體時,才能明顯體現(xiàn)XGBoost的并行計算效率。雖然PSO-XGBoost在處理所用的訓(xùn)練樣本(小數(shù)據(jù)體)時耗時最長,但與其他模型的耗時差距并不大,在可接受范圍之內(nèi),并且所得結(jié)果的精度更高,說明PSO-XGBoost在處理一般小型數(shù)據(jù)體時效率較高。
為更好地對比各模型預(yù)測結(jié)果的可靠度,計算誤差一列只顯示預(yù)測值與目標值數(shù)量級差小于一個量級的數(shù)據(jù)點(圖7同),因此數(shù)據(jù)點值越小,預(yù)測結(jié)果誤差越??;不同顏色、線條對應(yīng)不同的計算結(jié)果(圖7同)
圖7 實驗2預(yù)測結(jié)果柱狀圖
本文從優(yōu)化參數(shù)角度出發(fā),利用PSO算法改進XGBoost[24-26],得到滲透率預(yù)測模型PSO-XGBoost,闡述了該模型的方法原理并進行了預(yù)測致密砂巖儲層滲透率實驗,得到以下認識:
(1)與物理模型相比,擬合模型涉及的儲層特征參數(shù)較少,因此在建模資料不充足的情況下,適用性更好。
(2)致密砂巖儲層因孔喉系統(tǒng)復(fù)雜且易發(fā)育裂縫,使?jié)B透率在測井響應(yīng)上與孔隙度相關(guān)性差,導(dǎo)致指數(shù)模型適用性差。
(3)與指數(shù)模型相比,逐步迭代能更好地反映滲透率與測井曲線之間的線性響應(yīng)關(guān)系,但由于預(yù)測性能受建模數(shù)據(jù)品質(zhì)影響很大,導(dǎo)致計算穩(wěn)定性不佳,使其難以推廣使用。
(4)SVR參數(shù)能夠由PSO技術(shù)優(yōu)化,且形成的PSO-SVR在處理小型數(shù)據(jù)體時能快速給出預(yù)測結(jié)果。但模型的預(yù)測性能隨訓(xùn)練樣本品質(zhì)的變化而有較大的波動,導(dǎo)致模型預(yù)測穩(wěn)定性較差,因此PSO-SVR難以推廣使用。
(5)使用PSO技術(shù)可優(yōu)化GBDT參數(shù),形成的PSO-GBDT不僅能快速給出可靠的預(yù)測結(jié)果,且模型的預(yù)測性能隨訓(xùn)練樣本品質(zhì)變化的波動不大,表明具備推廣應(yīng)用性。
(6)使用PSO技術(shù)可優(yōu)化XGBoost參數(shù),且形成的PSO-XGBoost預(yù)測效率高,穩(wěn)定性好,具備推廣使用性。與PSO-GBDT相比,PSO-XGBoost的預(yù)測精度更高,表明更具推廣使用價值。
(7)逐步迭代、PSO-SVR、PSO-GBDT、PSO-XGBoost的預(yù)測能力都可在訓(xùn)練更多學(xué)習(xí)樣本后得到明顯提升。