• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于袋外預(yù)測和擴展空間的隨機森林改進算法

    2022-03-12 05:55:36張彥春
    計算機工程 2022年3期
    關(guān)鍵詞:結(jié)點決策樹準(zhǔn)確性

    常 碩,張彥春

    (1.復(fù)旦大學(xué) 計算機科學(xué)技術(shù)學(xué)院,上海 200082;2.廣州大學(xué) 網(wǎng)絡(luò)空間先進技術(shù)研究院,廣州 510006)

    0 概述

    隨機森林具有良好的準(zhǔn)確性和高效性,被認為是性能最優(yōu)的分類算法之一。文獻[1]在121 個數(shù)據(jù)集上對179 個分類器進行評估,在所得實驗結(jié)果中隨機森林表現(xiàn)最好。然而,這121 個數(shù)據(jù)集中大多數(shù)據(jù)規(guī)模較小,在數(shù)據(jù)規(guī)模較大的數(shù)據(jù)集上,隨機森林的表現(xiàn)一般不如AdaBoost(Adaptive Boosting)等boost 算法[2]。雖然存在上述問題,但是隨機森林算法十分簡單,可并行化,訓(xùn)練時間遠低于boost 算法且不容易過擬合[3],因此,其仍是當(dāng)今最流行的分類算法之一。

    文獻[4]通過使用多個特征評估度量來降低決策樹間的相關(guān)性而非決策樹的準(zhǔn)確性,同時使用加權(quán)平均進行預(yù)測,在分類數(shù)據(jù)集上其預(yù)測結(jié)果較好。文獻[5]通過復(fù)雜的動態(tài)集成方法進行預(yù)測,設(shè)計一種提高隨機森林在某些數(shù)據(jù)集上預(yù)測性能的方法,實驗結(jié)果表明,在27 個分類數(shù)據(jù)集中,該方法能改善12 個數(shù)據(jù)集中隨機森林的預(yù)測表現(xiàn)。文獻[6]在隨機選擇K個劃分特征的基礎(chǔ)上,通過隨機選擇劃分結(jié)點來進一步降低決策樹間的相關(guān)性并提高隨機森林的預(yù)測表現(xiàn),實驗結(jié)果表明,在12 個分類數(shù)據(jù)集中,該方法能夠顯著改善5 個數(shù)據(jù)集中隨機森林的預(yù)測表現(xiàn)。文獻[7]通過袋外(out-of-bag)預(yù)測誤差對決策樹的預(yù)測進行加權(quán),在10 個噪聲數(shù)據(jù)集上該方法取得了較好的性能表現(xiàn)。文獻[8]提出一種不放回的抽樣方法,其提高了算法效率,并在7 個數(shù)據(jù)集上提高了預(yù)測準(zhǔn)確性。文獻[9]提出一種對特征子集加權(quán)抽樣的方法,該方法提高了與分類相關(guān)的屬性的抽樣概率,在高維數(shù)據(jù)上取得了較好的性能表現(xiàn)。文獻[10]通過PCA(Principle Component Analysis)對每個決策樹的輸入特征隨機分組進行旋轉(zhuǎn)預(yù)處理,以降低決策樹間的相關(guān)性并提高隨機森林的性能,實驗結(jié)果表明,在33 個分類數(shù)據(jù)集中,該方法能夠顯著改善10 個數(shù)據(jù)集中隨機森林的預(yù)測表現(xiàn)。文獻[11]通 過LDA(Linear Discriminative Analysis)為每個分裂結(jié)點選擇傾斜的分裂方向,使決策樹的決策邊界傾向坐標(biāo)軸,該方法同樣降低了決策樹間的相關(guān)性,在一些數(shù)據(jù)集上取得了更好的表現(xiàn)。文獻[12]通過Householder QR 分解對每個決策樹的輸入特征進行隨機旋轉(zhuǎn),類似于文獻[10],其提高了隨機森林的性能表現(xiàn)。文獻[13]通過在每個分裂結(jié)點隨機抽樣一個稀疏矩陣,利用該矩陣對結(jié)點的輸入特征進行旋轉(zhuǎn),在旋轉(zhuǎn)后的稀疏特征空間中搜索最佳劃分結(jié)點,該方法提高了隨機森林的準(zhǔn)確性。文獻[14]通過拓展特征空間的方式,為每個決策樹的輸入特征隨機生成部分新特征,其能降低決策樹間的相關(guān)性,且未顯著降低決策樹的準(zhǔn)確性,實驗結(jié)果表明,在36 個分類數(shù)據(jù)集中,該方法能夠明顯改善8 個數(shù)據(jù)集中隨機森林的預(yù)測表現(xiàn)。

    上述方法大多在構(gòu)建決策樹時通過某些方式注入隨機性,這會降低決策樹間的相關(guān)性,從而提高隨機森林的預(yù)測表現(xiàn)。在數(shù)據(jù)規(guī)模較大時,注入隨機性的方式并不能顯著降低決策樹間的相關(guān)性,同時又因為犧牲了決策樹的準(zhǔn)確性,使得隨機森林及其改進算法的性能改善效果有限,其預(yù)測表現(xiàn)一般不如AdaBoost 等boost 算法。因此,本文提出一種基于out-of-bag 預(yù)測的改進算法,將隨機森林的out-of-bag預(yù)測概率視為特征,將其與原始特征相結(jié)合,重新訓(xùn)練隨機森林。out-of-bag 預(yù)測概率能夠改善決策樹的劃分,有效提高決策樹的準(zhǔn)確性,從而提升隨機森林的預(yù)測準(zhǔn)確性。由于out-of-bag 預(yù)測概率會增大決策樹間的相關(guān)性,因此本文利用文獻[14]所提方法來降低由out-of-bag 預(yù)測帶來的決策樹相關(guān)性,且不顯著降低決策樹的準(zhǔn)確性,從而保證隨機森林的預(yù)測性能。

    1 相關(guān)工作

    1.1 隨機森林

    隨機森林是當(dāng)今最流行的分類器之一[1],其在bootstrap 的基礎(chǔ)上,通過隨機選擇特征子集來分裂決策樹的結(jié)點,進一步為決策樹注入隨機性,從而降低決策樹間的相關(guān)性,提高預(yù)測的準(zhǔn)確性[15]。

    對于數(shù)據(jù)集D={(xi,yi),i=1,2,…,m},其中,xi和yi分別表示第i個樣本的特征向量和類別,隨機森林的訓(xùn)練過程如下(其中,T和k均為預(yù)先設(shè)定好的超參數(shù)):

    t從1 到T:

    1)從數(shù)據(jù)集D中有放回地抽樣得到m個樣本的數(shù)據(jù)集Dt,未被抽樣到的樣本組成數(shù)據(jù)集Dt-oob。

    2)在數(shù)據(jù)集Dt上,訓(xùn)練一棵無剪枝的決策樹ft。在訓(xùn)練過程中,對于決策樹中的每個結(jié)點,通過隨機選擇k個特征來對結(jié)點進行劃分,直到結(jié)點內(nèi)的樣本類別都相同或只有一個樣本為止。

    最終,隨機森林通過平均所有決策樹的輸出來獲得最終輸出,即:

    在抽樣得到的數(shù)據(jù)集Dt中,不重復(fù)的樣本大約占63.2%,剩下大約占36.8%的Dt-oob被稱為out-of-bag樣本。顯然以ft預(yù)測Dt-oob是無偏的,因此可以用ft對Dt-oob預(yù)測的平均結(jié)果作為對Dt的預(yù)測。對于Dt中的樣本x,其預(yù)測為:

    其中:I為指示函數(shù)。

    1.2 空間擴展

    文獻[14]為了降低決策樹間的相關(guān)性,提出一種隨機組合的特征空間擴展方法。對于每個決策樹,其輸入特征由特征本身加上特征的隨機組合,每個決策樹的輸入特征都不相同,從而降低了決策樹間的相關(guān)性。同時,由于特征的量綱不同且一些特征間存在相關(guān)性,生成的特征中會有部分特征對決策樹的貢獻和原特征相同,甚至表現(xiàn)更好,因此擴展空間方法不會顯著降低決策樹的準(zhǔn)確性。

    1.3 AdaBoost

    AdaBoost 以其優(yōu)秀的泛化性能而受到學(xué)術(shù)界的關(guān)注[16-17]。AdaBoost 通過確定性的方式更新樣本的權(quán)重,使新的決策樹更加關(guān)注之前分類錯誤的樣本,從而提高了最終的泛化能力。AdaBoost 的輸出由T個決策樹的輸出加權(quán)組成,即:

    其中:αt為每輪迭代產(chǎn)生的權(quán)重。

    假設(shè)經(jīng)過t-1 輪迭代,F(xiàn)t-1(x)是經(jīng)過t-1 輪迭代得到的結(jié)果模型:

    則在第t輪迭代中,需要得到αt、ft(x)和Ft(x):

    為了能夠進一步提高泛化性能,需要使Ft(x)在損失函數(shù)L上最小,即聯(lián)合優(yōu)化αt和ft(x)使損失函數(shù)L最小:

    其中:L為度量類別y和模型Ft(x)之間差異的損失函數(shù)。

    2 隨機森林改進算法

    2.1 改進理論

    理論1隨機森林的泛化誤差上界為:

    其中:PPE*為泛化誤差為決策樹間相關(guān)系數(shù)的平均;s為單個決策樹泛化性能的期望[15]。

    為了提高隨機森林的預(yù)測表現(xiàn),大多數(shù)改進方法通過犧牲單個決策樹的準(zhǔn)確性來降低決策樹間的相關(guān)性,即以降低s為代價來降低,從而減小隨機森林的泛化誤差上界,提高其預(yù)測表現(xiàn)。這在數(shù)據(jù)規(guī)模較小時有效,但在數(shù)據(jù)規(guī)模較大時,決策樹間的相關(guān)性還是較高,泛化誤差不能得到顯著降低,因此,隨機森林及其改進算法性能改善有限。針對該問題,本文通過提高s而非降低s來提高隨機森林的預(yù)測表現(xiàn)。

    理論2令T為一個在有l(wèi)個實數(shù)值特征的數(shù)據(jù)的基礎(chǔ)上構(gòu)建的二元決策樹,共有N個內(nèi)部結(jié)點,則有VC-dimension(T)∈O(Nlb(Nl))[18]。

    理論3令H是一組函數(shù),其取值在{-1,1}范圍,其VC-dimension 為d,則對于任意δ,至少有1-δ的概率,式(8)對所有h∈H成立。

    其中:S為m個樣本的訓(xùn)練集;R(h)表示泛化風(fēng)險;(h)表示經(jīng)驗風(fēng)險[19]。

    在決策樹的構(gòu)建過程中,同目標(biāo)類別y較相關(guān)的特征會產(chǎn)生較少的葉子結(jié)點,不太相關(guān)的特征會產(chǎn)生較多的葉子結(jié)點,而且較相關(guān)的特征產(chǎn)生的葉子結(jié)點能夠得到更小的經(jīng)驗風(fēng)險。如圖1 所示,決策樹在特征x2上只會產(chǎn)生2 個葉子結(jié)點,而在特征x1上會產(chǎn)生8 個葉子結(jié)點,且特征x2上的經(jīng)驗風(fēng)險明顯小于x1。由于決策樹中只有度為0 和度為2 的結(jié)點,因此決策樹內(nèi)部結(jié)點的數(shù)量N2與葉子結(jié)點的數(shù)量N0的關(guān)系為N2=N0-1。受此啟發(fā),如果能夠構(gòu)造一些較相關(guān)的特征來幫助構(gòu)建決策樹,那么不僅能夠降低決策樹的經(jīng)驗風(fēng)險,還能降低決策樹的VC-dimension,從而提高決策樹的準(zhǔn)確性。

    圖1 特征與目標(biāo)間相關(guān)性的直觀表示Fig.1 Visual representation of the correlation between features and targets

    以隨機森林的out-of-bag 預(yù)測概率作為特征有以下2 個優(yōu)點:

    1)隨機森林的準(zhǔn)確率高于單個決策樹,對于二分類問題,僅使用預(yù)測概率就能使決策樹的經(jīng)驗風(fēng)險接近隨機森林的經(jīng)驗風(fēng)險,對于多分類問題,預(yù)測概率也能有效降低決策樹的經(jīng)驗風(fēng)險,同時有效減少決策樹的內(nèi)部結(jié)點。

    2)通過out-of-bag 估計得到預(yù)測概率僅需非常小的代價,在隨機森林的訓(xùn)練階段即可得到預(yù)測概率且其是無偏的,而通過交叉預(yù)測得到預(yù)測概率不僅十分耗時,得到的結(jié)果也是有偏的。

    以隨機森林的out-of-bag 預(yù)測概率作為構(gòu)造的特征,與原始特征相結(jié)合并重新訓(xùn)練隨機森林,能夠顯著提高單個決策樹的準(zhǔn)確性s,從而提高隨機森林的準(zhǔn)確性。但是不可避免的,準(zhǔn)確性的提升會提高決策樹間的相關(guān)性,即提高了的值,甚至可能大幅提高的值,從而僅能略微提高甚至降低隨機森林的準(zhǔn)確性。

    為了解決上述問題,本文通過文獻[14]提出的擴展空間算法,使隨機森林中的每個決策樹構(gòu)建在不同的訓(xùn)練數(shù)據(jù)上,從而在不顯著降低決策樹準(zhǔn)確性s的情況下,降低決策樹間的相關(guān)性。

    2.2 改進算法描述

    本文利用out-of-bag 預(yù)測概率作為新的特征來構(gòu)建決策樹,從而降低決策樹的VC-dimension 以及經(jīng)驗風(fēng)險和泛化風(fēng)險,最終提高決策樹的準(zhǔn)確性s和隨機森林的預(yù)測性能?;趏ut-of-bag 預(yù)測的改進算法描述如下所示:

    為了深入了解2018年高考中數(shù)學(xué)學(xué)科核心素養(yǎng)的考查情況,下面以全國I卷試題為例,基于《普通高中數(shù)學(xué)課程標(biāo)準(zhǔn)(2017年版)》中對數(shù)學(xué)學(xué)科核心素養(yǎng)的界定和水平劃分,參考喻平的“核心素養(yǎng)評價框架”[17],對高考數(shù)學(xué)試題素養(yǎng)考查情況作出分析.

    算法1基于out-of-bag 預(yù)測的改進算法

    由于決策樹準(zhǔn)確性s的提高,會使決策樹間的預(yù)測更加相同,從而提高決策樹間的相關(guān)性,影響了算法1 對隨機森林的改善效果。為此,本文通過文獻[14]提出的擴展空間算法,對算法1 進行改進,改進算法描述如下:

    算法2基于out-of-bag 預(yù)測和擴展空間的改進算法1

    算法3擴展特征空間算法E

    算法3 即為文獻[14]提出的擴展特征空間算法,本文使用文獻[14]中表現(xiàn)最好的相減操作。擴展空間算法等價于通過以2 個特征為1 組的方式,將n個特征隨機劃分為組,從而生成個特征,該過程可以產(chǎn)生許多不同的劃分,其總量為:

    其中:K=。例如,當(dāng)n=10 時,K=5,M=945。算法3 為使生成的特征數(shù)量為n,對其做了2 次上述操作,在n為奇數(shù)時,將2 次操作各自多出的1 個特征劃分為1 組,從而生成n個特征。

    在算法1 和算法2 的訓(xùn)練過程中,out-of-bag 預(yù)測概率的準(zhǔn)確性越高,對隨機森林的提升效果就越好。out-of-bag 預(yù)測雖然是無偏的,但對于其中的每個樣本,大約只有37.8%的決策樹會對其作出預(yù)測。相比于測試集的全部決策樹預(yù)測,兩者之間的準(zhǔn)確性會有所差異。為了降低這部分差異,本文將算法1和算法2 產(chǎn)生的out-of-bag 預(yù)測概率相結(jié)合,通過加法融合來提高out-of-bag 預(yù)測概率的準(zhǔn)確性,減少其與測試集預(yù)測之間的差異。上述過程的算法描述如下:

    算法4基于out-of-bag 預(yù)測和擴展空間的改進算法2

    算法4 相比算法2 又需要額外訓(xùn)練一個隨機森林,其時間復(fù)雜度為,該隨機森林就是文獻[14]中的擴展空間隨機森林。通過再額外訓(xùn)練一個隨機森林,將得到的預(yù)測概率分別同原隨機森林的預(yù)測概率做平均,能夠提高out-of-bag 預(yù)測的準(zhǔn)確性,減少其與測試集預(yù)測之間的差異,從而進一步提高隨機森林的預(yù)測表現(xiàn)。

    3 數(shù)據(jù)集與實驗設(shè)置

    3.1 數(shù)據(jù)集

    本文收集32 個分類數(shù)據(jù)集,這些數(shù)據(jù)集全都來自UCI 機器學(xué)習(xí)數(shù)據(jù)庫[20],數(shù)據(jù)集的統(tǒng)計特性如表1所示。其中:Nint 表示樣本的數(shù)量;Nnum 表示數(shù)值特征數(shù)量;Ncat 表示類別特征數(shù)量;Ncls 表示類別數(shù)量。這些數(shù)據(jù)集的樣本數(shù)量在329~67 557 之間,特征數(shù)量在4~90 之間,類別數(shù)量在2~26 之間。每個數(shù)據(jù)集都只含數(shù)值特征或類別特征,表中的“—”表示沒有該類型的特征。有些數(shù)據(jù)集存在缺失值,需要對其進行填充:對于類別特征的缺失,本文使用最常見的特征值對其進行填充;對于數(shù)值特征的缺失,本文使用文獻[21]提出的序列回歸填充方法對其進行填充。

    表1 實驗數(shù)據(jù)集統(tǒng)計信息Table 1 Experimental datasets statistics

    3.2 模型選擇和超參數(shù)搜索

    本文以RF 表示原始隨機森林,以oRF 表示算法1 改進的隨機森林,以eRF 表示文獻[14]提出的擴展隨機森林,以oeRF 表示算法2 改進的隨機森林,以oe2RF 表示算法4 改進的隨機森林。同時還將本文算法與AdaBoost 類算法,具體為文獻[22]提出的Multi-AdaBoost 算法(以BT 表示)進行對比。

    對于超參數(shù),由于隨機森林和AdaBoost 都是樹模型,本文將兩者的決策樹數(shù)量都設(shè)為100,只調(diào)整決策樹的深度,以5 折交叉驗證網(wǎng)格搜索的方式選擇最佳的樹深。上述模型均使用文獻[23]中的scikit-learn 機器學(xué)習(xí)庫。

    4 實驗結(jié)果及分析

    4.1 實驗度量

    本文使用準(zhǔn)確率(acc)作為模型性能的評估度量。除此之外,由于隨機森林的性能與s、有關(guān),即與單個決策樹的準(zhǔn)確性和決策樹之間的相關(guān)性有關(guān),而單個決策樹的準(zhǔn)確性又與決策樹的經(jīng)驗風(fēng)險、VC-dimension 有關(guān),因此,本文還使用如下度量:

    1)決策樹準(zhǔn)確率的平均值(atc)。以單個決策樹對測試集預(yù)測準(zhǔn)確率的平均來表示單個決策樹的準(zhǔn)確性。

    2)決策樹kappa 的平均值(kapp)。文獻[24]以kappa 值來度量2 個分類器預(yù)測之間的一致性,顯然其還可以用來度量決策樹間的相關(guān)性。對于c個類,kappa 定義在2 個分類器預(yù)測的c×c混淆矩陣M上[10]。以N表示樣本的總數(shù)量,則2 個分類器之間的kappa 值為:

    其中:Mks表示其中一個分類器預(yù)測樣本為k而另一個分類器預(yù)測樣本為s的數(shù)量。在隨機森林中共有T個決策樹,因此,需要度量T(T-1)/2 次kappa 的值并對其做平均。

    3)決策樹out-of-bag 準(zhǔn)確率的平均值(abc)。以單個決策樹對out-of-bag 樣本預(yù)測準(zhǔn)確率的平均來近似表示決策樹的經(jīng)驗風(fēng)險。

    4)決策樹中葉子結(jié)點數(shù)量的平均值(node)。由理論2 可知,決策樹的VC-dimension 與實值特征數(shù)量、內(nèi)部結(jié)點數(shù)量有關(guān),但實值特征數(shù)量要經(jīng)過log處理,因此,決策樹的VC-dimension 主要受內(nèi)部結(jié)點數(shù)量影響,而決策樹內(nèi)部結(jié)點數(shù)量又與葉子結(jié)點數(shù)量有關(guān),因此,本文以決策樹葉子結(jié)點數(shù)量來近似表示決策樹的VC-dimension。

    4.2 實驗結(jié)果

    本文隨機地將80%的樣本劃分為訓(xùn)練集,將剩下的20%樣本劃分為測試集。由于數(shù)據(jù)集規(guī)模的不同,該劃分過程重復(fù)的次數(shù)也不同。對于樣本數(shù)量小于1 500 的數(shù)據(jù)集,該劃分重復(fù)30 次;對于樣本數(shù)量大于等于1 500 而小于8 000 的數(shù)據(jù)集,該劃分重復(fù)20 次;對于樣本數(shù)量大于等于8 000 的數(shù)據(jù)集,該劃分重復(fù)10 次。本文使用校正的paired t-test 對實驗結(jié)果做顯著性檢驗[25]。對于2 個不同的數(shù)據(jù)集劃分,2 個訓(xùn)練集之間至少有75%的部分相同,容易出現(xiàn)Type I 類錯誤[26]。因此,本文使用校正的paired ttest,將顯著性水平設(shè)為95%。

    實驗結(jié)果如表2 所示,其中,加粗表示該模型的預(yù)測acc 最高,下劃線表示該模型的預(yù)測結(jié)果顯著優(yōu)于RF,“×”表示該模型的預(yù)測結(jié)果顯著劣于RF,表格倒數(shù)第3 行表示模型的平均acc,倒數(shù)第2 行表示模型的平均rank,倒數(shù)第1 行表示模型相較于RF 的顯著性win-tie-loss 記錄。從表2 可以看出,本文方法和文獻[14]方法都能提高RF 的預(yù)測性能,其中表現(xiàn)最好的是本文提出的oe2RF 模型,在32 個數(shù)據(jù)集中,oe2RF 能夠獲得最高的平均acc 以及最低的平均rank,能夠在19 個數(shù)據(jù)集上顯著優(yōu)于RF。

    表2 模型預(yù)測性能比較Table 2 Comparison of prediction performance of models

    本文還對比了oe2RF 與RF、BT 的性能差異,對比結(jié)果如圖2 所示。從圖2 可以看出,BT 性能優(yōu)于RF,而oe2RF 能獲得比BT 更優(yōu)的性能表現(xiàn)。

    圖2 oe2RF 與RF、BT 的性能對比Fig.2 Performance comparison of oe2RF with RF and BT

    各模型的平均訓(xùn)練時間如表3 所示,其中訓(xùn)練時間指各模型最終額外訓(xùn)練的隨機森林的訓(xùn)練時間,總訓(xùn)練時間可由表中數(shù)據(jù)相加得到。例如,oRF總訓(xùn)練時間=RF 訓(xùn)練時間+oRF 訓(xùn)練時間,eRF 總訓(xùn)練時間=eRF 訓(xùn)練時間。顯然,各個模型最終額外的訓(xùn)練時間開銷大致符合2.2 節(jié)中額外訓(xùn)練的隨機森林的算法時間復(fù)雜度分析,其中部分波動是由于:1)out-of-bag 預(yù)測有效減少了決策樹中葉子結(jié)點的數(shù)量,這會降低訓(xùn)練時間,例如,在ID 為10 和21 的數(shù)據(jù)集上,oRF 的訓(xùn)練時間小于RF;2)在擴展特征空間時,每次生成n個特征需要時間復(fù)雜度為O(mn)的時間開銷,這會提高訓(xùn)練時間,例如,在ID 為26 和32 的數(shù)據(jù)集上,由于2 個數(shù)據(jù)集的特征均為類別特征,訓(xùn)練時需要對其進行one-hot 編碼,編碼后的特征數(shù)量較多,對其進行空間擴展會帶來較多的額外時間開銷。

    表3 模型平均訓(xùn)練時間Table 3 Models average training time s

    4.3 結(jié)果分析

    本文方法對RF 的性能提升在于提高了單個決策樹的準(zhǔn)確性,同時由于提高決策樹的準(zhǔn)確性會使決策樹間的相關(guān)性提高,因此本文借助文獻[14]方法降低決策樹間的相關(guān)性,且不顯著降低決策樹的準(zhǔn)確性,從而較好地改善了RF 的預(yù)測性能。

    如圖3 所示,圖中的每個點代表一個數(shù)據(jù)集,橫坐標(biāo)表示各模型與RF 在kapp 上的差異,縱坐標(biāo)表示各模型與RF 在atc 上的差異。從圖3 可以看出:oRF 能夠大幅提高決策樹的atc,但也會大幅提高決策樹間的kapp;eRF 能夠在不顯著降低決策樹atc的情況下降低決策樹間的kapp,圖中部分atc 和kapp 提高的原因在于劃分結(jié)點時特征子集的選擇正比于特征數(shù)量,如果將特征子集數(shù)量設(shè)為固定值,將不會出現(xiàn)該情況;oeRF 相比于oRF 降低了kapp,也降低了atc,但相比于RF 的kapp 和atc 提高了很多;oe2RF 相比于oeRF 提高了atc,略微提高了kapp,因此,其能夠獲得最好的性能表現(xiàn)。由圖3可知,本文方法能大幅提高單個決策樹的準(zhǔn)確性,符合理論2 和理論3,其實驗驗證如圖4 所示,橫坐標(biāo)表示各模型與RF 在node 上的差異,縱坐標(biāo)表示各模型與RF在abc 上的差異。從圖4 可以看出:oRF、oeRF 和oe2RF均能大幅提高決策樹的abc,且同時降低決策樹的node,從而提高了決策樹的atc;eRF略微提高了決策樹的abc,同時降低了決策樹的node,其原因在于特征子集正比于特征數(shù)量,而且特征量綱的不同和特征間存在相關(guān)性,擴展特征空間時可能會產(chǎn)生部分較好的特征,有利于決策樹劃分,在固定特征子集大小時,這種情況很少發(fā)生。

    圖3 各模型與RF 在atc 和kapp 上的性能差異Fig.3 Performance difference between each model and RF on atc and kapp

    圖4 各模型與RF 在決策樹abc 和node 上的性能差異Fig.4 Performance difference between each model and RF on decision tree abc and node

    5 結(jié)束語

    多數(shù)已有預(yù)測方法犧牲單個決策樹的準(zhǔn)確性來提高隨機森林的性能,本文通過out-of-bag 預(yù)測概率提高單個決策樹的準(zhǔn)確性,同時利用文獻[14]所提擴展空間方法降低決策樹間的相關(guān)性,以有效改善隨機森林的預(yù)測性能。在32 個UCI 分類數(shù)據(jù)集上的實驗結(jié)果驗證了該方法的有效性。后續(xù)將進一步提升決策樹的準(zhǔn)確性,同時利用數(shù)據(jù)旋轉(zhuǎn)技術(shù)來降低決策樹間的相關(guān)性,從而提高隨機森林的準(zhǔn)確性。

    猜你喜歡
    結(jié)點決策樹準(zhǔn)確性
    淺談如何提高建筑安裝工程預(yù)算的準(zhǔn)確性
    一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
    決策樹和隨機森林方法在管理決策中的應(yīng)用
    電子制作(2018年16期)2018-09-26 03:27:06
    Ladyzhenskaya流體力學(xué)方程組的確定模與確定結(jié)點個數(shù)估計
    基于決策樹的出租車乘客出行目的識別
    美劇翻譯中的“神翻譯”:準(zhǔn)確性和趣味性的平衡
    論股票價格準(zhǔn)確性的社會效益
    基于肺癌CT的決策樹模型在肺癌診斷中的應(yīng)用
    超聲引導(dǎo)在腎組織活檢中的準(zhǔn)確性和安全性分析
    基于Raspberry PI為結(jié)點的天氣云測量網(wǎng)絡(luò)實現(xiàn)
    国产精品电影一区二区三区| 亚洲四区av| 久久精品夜夜夜夜夜久久蜜豆| 白带黄色成豆腐渣| 日本三级黄在线观看| 最近最新免费中文字幕在线| 最新中文字幕久久久久| 变态另类成人亚洲欧美熟女| 高清在线国产一区| 中国美女看黄片| 亚洲自偷自拍三级| 久久热精品热| 国产午夜福利久久久久久| 人妻丰满熟妇av一区二区三区| 久久午夜亚洲精品久久| 国产黄a三级三级三级人| 此物有八面人人有两片| 国产精品99久久久久久久久| 精品久久久久久成人av| 日韩欧美精品免费久久| 国产亚洲91精品色在线| 大型黄色视频在线免费观看| 91狼人影院| 国产精品久久电影中文字幕| 高清毛片免费观看视频网站| 变态另类丝袜制服| 亚洲真实伦在线观看| 亚洲va日本ⅴa欧美va伊人久久| 99热这里只有精品一区| 嫁个100分男人电影在线观看| 国产av不卡久久| 亚洲经典国产精华液单| 亚洲人成网站高清观看| 非洲黑人性xxxx精品又粗又长| 国产伦人伦偷精品视频| 久久精品国产自在天天线| 亚洲av二区三区四区| 欧美最黄视频在线播放免费| 韩国av在线不卡| 一区二区三区免费毛片| 亚洲18禁久久av| 精品人妻1区二区| 看十八女毛片水多多多| 午夜精品一区二区三区免费看| 两人在一起打扑克的视频| 久久久久久久精品吃奶| 国产成年人精品一区二区| 午夜福利在线在线| 亚洲av二区三区四区| 日韩一区二区视频免费看| 97超级碰碰碰精品色视频在线观看| 丰满乱子伦码专区| 久久精品91蜜桃| 免费在线观看成人毛片| 亚洲欧美日韩卡通动漫| 精品午夜福利在线看| 最好的美女福利视频网| 亚洲av二区三区四区| 天堂av国产一区二区熟女人妻| 老司机午夜福利在线观看视频| 色精品久久人妻99蜜桃| 国产精品三级大全| 精品久久久久久久久亚洲 | www日本黄色视频网| 麻豆成人av在线观看| 午夜免费男女啪啪视频观看 | 99热这里只有是精品在线观看| 毛片一级片免费看久久久久 | 国产亚洲av嫩草精品影院| 最近视频中文字幕2019在线8| 男女做爰动态图高潮gif福利片| 国内少妇人妻偷人精品xxx网站| 成年版毛片免费区| 日日夜夜操网爽| 91麻豆av在线| 99在线视频只有这里精品首页| 校园人妻丝袜中文字幕| 国产私拍福利视频在线观看| 亚洲乱码一区二区免费版| 国产午夜福利久久久久久| 免费看光身美女| 啦啦啦观看免费观看视频高清| 欧美中文日本在线观看视频| 日本欧美国产在线视频| 精品免费久久久久久久清纯| 天堂√8在线中文| 午夜福利欧美成人| 午夜福利高清视频| 国产乱人伦免费视频| 在线国产一区二区在线| 级片在线观看| 女人被狂操c到高潮| 久9热在线精品视频| 69av精品久久久久久| 成年女人永久免费观看视频| 久久婷婷人人爽人人干人人爱| 此物有八面人人有两片| av.在线天堂| 久久久久国产精品人妻aⅴ院| 小蜜桃在线观看免费完整版高清| 国产久久久一区二区三区| 美女 人体艺术 gogo| 亚洲四区av| 亚洲五月天丁香| 观看美女的网站| 国产精品三级大全| 日韩欧美三级三区| 3wmmmm亚洲av在线观看| 又粗又爽又猛毛片免费看| 国产精品亚洲一级av第二区| 国产成人一区二区在线| 国产欧美日韩精品一区二区| 日韩欧美国产在线观看| 女的被弄到高潮叫床怎么办 | 麻豆久久精品国产亚洲av| 精品福利观看| 欧美绝顶高潮抽搐喷水| 国产精品久久久久久久久免| 欧美xxxx黑人xx丫x性爽| 69人妻影院| 淫秽高清视频在线观看| 在线免费观看的www视频| 一a级毛片在线观看| 国产男靠女视频免费网站| 91久久精品电影网| 中文亚洲av片在线观看爽| 日韩,欧美,国产一区二区三区 | 天堂网av新在线| 久久精品国产亚洲av天美| 干丝袜人妻中文字幕| 能在线免费观看的黄片| 久久午夜亚洲精品久久| 欧美成人性av电影在线观看| 听说在线观看完整版免费高清| 免费高清视频大片| 免费电影在线观看免费观看| 久久这里只有精品中国| eeuss影院久久| 国产三级在线视频| 22中文网久久字幕| 精品一区二区三区视频在线观看免费| 欧美不卡视频在线免费观看| 日本熟妇午夜| 内射极品少妇av片p| 18+在线观看网站| 日日夜夜操网爽| 国产探花在线观看一区二区| 国产色爽女视频免费观看| 成人亚洲精品av一区二区| 色视频www国产| 桃色一区二区三区在线观看| 可以在线观看的亚洲视频| 久久九九热精品免费| 国模一区二区三区四区视频| 一个人观看的视频www高清免费观看| 欧美性感艳星| 深爱激情五月婷婷| a级毛片免费高清观看在线播放| 亚洲熟妇中文字幕五十中出| 亚洲一级一片aⅴ在线观看| 一进一出好大好爽视频| www.色视频.com| 成人国产麻豆网| 3wmmmm亚洲av在线观看| 精品久久久久久久久亚洲 | 精品无人区乱码1区二区| 51国产日韩欧美| 中文字幕精品亚洲无线码一区| 国产精品美女特级片免费视频播放器| 真人一进一出gif抽搐免费| 男人的好看免费观看在线视频| videossex国产| 国产精品久久视频播放| 成人无遮挡网站| 亚洲五月天丁香| 国产精品久久视频播放| 日韩欧美精品免费久久| 一本久久中文字幕| 俺也久久电影网| 久久九九热精品免费| 日韩亚洲欧美综合| 日韩亚洲欧美综合| 成人av在线播放网站| 欧美xxxx性猛交bbbb| bbb黄色大片| 午夜激情欧美在线| 少妇人妻精品综合一区二区 | 欧美潮喷喷水| 美女被艹到高潮喷水动态| 午夜视频国产福利| 日日夜夜操网爽| 亚洲中文日韩欧美视频| 国产亚洲精品av在线| 伦理电影大哥的女人| 波多野结衣高清无吗| 有码 亚洲区| 一个人免费在线观看电影| 国内精品宾馆在线| 国产久久久一区二区三区| a级一级毛片免费在线观看| 日韩国内少妇激情av| 亚洲中文字幕一区二区三区有码在线看| 无遮挡黄片免费观看| 国产精品自产拍在线观看55亚洲| x7x7x7水蜜桃| 日本熟妇午夜| 午夜影院日韩av| av在线天堂中文字幕| 免费看av在线观看网站| 国产精品不卡视频一区二区| 2021天堂中文幕一二区在线观| 舔av片在线| 免费看日本二区| 不卡视频在线观看欧美| 日韩,欧美,国产一区二区三区 | 成年女人看的毛片在线观看| 亚洲成人久久性| 成人毛片a级毛片在线播放| 欧美+亚洲+日韩+国产| av天堂在线播放| 亚洲精品日韩av片在线观看| 一a级毛片在线观看| 我的女老师完整版在线观看| 国产精品人妻久久久影院| 精品久久国产蜜桃| 中文字幕熟女人妻在线| 69av精品久久久久久| 桃红色精品国产亚洲av| 国产美女午夜福利| 成年女人毛片免费观看观看9| 日本在线视频免费播放| 十八禁国产超污无遮挡网站| 免费在线观看日本一区| 久久久久免费精品人妻一区二区| 亚洲国产精品合色在线| 中文亚洲av片在线观看爽| 亚洲专区中文字幕在线| 国产一区二区三区av在线 | 免费黄网站久久成人精品| 日韩欧美国产在线观看| 国产激情偷乱视频一区二区| 老司机深夜福利视频在线观看| av福利片在线观看| 成人毛片a级毛片在线播放| 国产一区二区三区av在线 | 直男gayav资源| 国产 一区 欧美 日韩| 天堂av国产一区二区熟女人妻| 不卡视频在线观看欧美| 亚洲电影在线观看av| 又爽又黄无遮挡网站| 成年女人毛片免费观看观看9| 老师上课跳d突然被开到最大视频| 日日摸夜夜添夜夜添小说| 少妇熟女aⅴ在线视频| 全区人妻精品视频| 亚洲真实伦在线观看| 国产免费av片在线观看野外av| 九色成人免费人妻av| 日本免费a在线| 在线观看午夜福利视频| 午夜激情福利司机影院| 亚洲图色成人| 窝窝影院91人妻| 成人国产综合亚洲| 国产一区二区三区视频了| 久久人人精品亚洲av| 亚洲一级一片aⅴ在线观看| 国产一区二区三区在线臀色熟女| 亚洲av熟女| 久久午夜亚洲精品久久| 成年女人毛片免费观看观看9| 日本一本二区三区精品| 91在线观看av| 夜夜看夜夜爽夜夜摸| 欧美又色又爽又黄视频| 99久久精品热视频| 成人特级av手机在线观看| 亚洲国产精品成人综合色| 乱系列少妇在线播放| 婷婷丁香在线五月| 日日夜夜操网爽| 白带黄色成豆腐渣| 中文字幕av成人在线电影| 黄色女人牲交| 久久久久久大精品| 色播亚洲综合网| 日韩 亚洲 欧美在线| 亚洲人成网站在线播| 可以在线观看毛片的网站| 久久久久国产精品人妻aⅴ院| 91久久精品电影网| 九九久久精品国产亚洲av麻豆| 麻豆国产97在线/欧美| 精品久久久久久久末码| 亚洲成a人片在线一区二区| 真实男女啪啪啪动态图| 亚洲最大成人中文| 国内少妇人妻偷人精品xxx网站| 国产伦精品一区二区三区视频9| 久久久久久久午夜电影| 天天躁日日操中文字幕| 国产中年淑女户外野战色| 一本精品99久久精品77| 欧美日本视频| 亚洲一区二区三区色噜噜| 一a级毛片在线观看| 国产一区二区三区在线臀色熟女| 桃红色精品国产亚洲av| 国产精品久久久久久久久免| 国产精品野战在线观看| 一个人看的www免费观看视频| 自拍偷自拍亚洲精品老妇| 欧美精品国产亚洲| 欧美黑人巨大hd| 美女高潮的动态| 日日摸夜夜添夜夜添小说| 国产精品亚洲一级av第二区| 亚洲国产精品sss在线观看| 国产男人的电影天堂91| 嫩草影院入口| 两个人的视频大全免费| 婷婷色综合大香蕉| 国产黄a三级三级三级人| 亚洲五月天丁香| 蜜桃亚洲精品一区二区三区| 波多野结衣巨乳人妻| 精品一区二区三区视频在线观看免费| 男人舔女人下体高潮全视频| 露出奶头的视频| 麻豆国产av国片精品| 午夜久久久久精精品| 黄色一级大片看看| 精品久久久久久,| 欧美日韩中文字幕国产精品一区二区三区| 中亚洲国语对白在线视频| 国产69精品久久久久777片| 看片在线看免费视频| 亚洲一区二区三区色噜噜| www.色视频.com| 免费人成视频x8x8入口观看| 欧美3d第一页| 国产亚洲精品av在线| 久久热精品热| 免费高清视频大片| 亚洲欧美清纯卡通| 亚洲久久久久久中文字幕| 一个人看视频在线观看www免费| 22中文网久久字幕| 亚洲av成人av| 嫁个100分男人电影在线观看| 亚洲不卡免费看| 久久久久国产精品人妻aⅴ院| 村上凉子中文字幕在线| 中文字幕熟女人妻在线| 日韩 亚洲 欧美在线| 大又大粗又爽又黄少妇毛片口| 变态另类成人亚洲欧美熟女| 午夜a级毛片| 岛国在线免费视频观看| 国产单亲对白刺激| 亚洲无线观看免费| 日韩欧美国产一区二区入口| 久久久久久国产a免费观看| 精品一区二区三区视频在线| 乱码一卡2卡4卡精品| 欧美日韩综合久久久久久 | 日韩欧美免费精品| 一进一出抽搐动态| 免费观看精品视频网站| 身体一侧抽搐| 久久人人爽人人爽人人片va| 日本一二三区视频观看| 午夜久久久久精精品| 麻豆成人av在线观看| 99久久精品热视频| 精品久久久久久久末码| 国产精品永久免费网站| 少妇高潮的动态图| 在线观看一区二区三区| 欧美激情在线99| 91精品国产九色| 欧美精品啪啪一区二区三区| 久久国产乱子免费精品| 免费看美女性在线毛片视频| 啦啦啦啦在线视频资源| 伦精品一区二区三区| 国产真实伦视频高清在线观看 | 波多野结衣巨乳人妻| 亚洲av中文av极速乱 | 啦啦啦韩国在线观看视频| 99久久久亚洲精品蜜臀av| 精品久久国产蜜桃| 亚洲国产色片| 国产在线男女| 男女啪啪激烈高潮av片| 综合色av麻豆| 啦啦啦啦在线视频资源| 伊人久久精品亚洲午夜| 91av网一区二区| 日本爱情动作片www.在线观看 | 麻豆av噜噜一区二区三区| 久久久久久久久久成人| 欧美日韩精品成人综合77777| 少妇猛男粗大的猛烈进出视频 | 亚洲人成网站高清观看| 国产免费一级a男人的天堂| 99在线人妻在线中文字幕| 人妻少妇偷人精品九色| 午夜免费男女啪啪视频观看 | 97碰自拍视频| 日韩欧美免费精品| 欧美极品一区二区三区四区| 黄色日韩在线| 亚洲精品色激情综合| 能在线免费观看的黄片| 91在线观看av| 精华霜和精华液先用哪个| 一个人观看的视频www高清免费观看| 精品久久久久久久久久久久久| 成人特级黄色片久久久久久久| 免费不卡的大黄色大毛片视频在线观看 | av女优亚洲男人天堂| 国产在线男女| 无遮挡黄片免费观看| 日韩av在线大香蕉| 国产aⅴ精品一区二区三区波| av在线蜜桃| 99九九线精品视频在线观看视频| 极品教师在线视频| 麻豆成人av在线观看| 国产欧美日韩精品亚洲av| 中文字幕精品亚洲无线码一区| 国产伦一二天堂av在线观看| 午夜a级毛片| 久久九九热精品免费| 少妇的逼水好多| 亚洲精品日韩av片在线观看| 久久天躁狠狠躁夜夜2o2o| 成人综合一区亚洲| 日本五十路高清| 禁无遮挡网站| 波多野结衣巨乳人妻| 18禁黄网站禁片免费观看直播| 一边摸一边抽搐一进一小说| 日韩大尺度精品在线看网址| 亚洲真实伦在线观看| 日韩av在线大香蕉| 亚洲精品亚洲一区二区| 亚洲av日韩精品久久久久久密| 啦啦啦啦在线视频资源| 国产精品1区2区在线观看.| 亚洲av成人av| 最新在线观看一区二区三区| 亚洲经典国产精华液单| 美女黄网站色视频| 在线免费观看不下载黄p国产 | 狂野欧美激情性xxxx在线观看| 91麻豆av在线| 色综合色国产| 欧美日本亚洲视频在线播放| 少妇猛男粗大的猛烈进出视频 | 精品人妻熟女av久视频| 国产精品乱码一区二三区的特点| 香蕉av资源在线| 无人区码免费观看不卡| 成人国产综合亚洲| 久久人人爽人人爽人人片va| 久久精品国产99精品国产亚洲性色| 欧美最新免费一区二区三区| 国国产精品蜜臀av免费| 一卡2卡三卡四卡精品乱码亚洲| 国产熟女欧美一区二区| 乱人视频在线观看| 级片在线观看| av在线观看视频网站免费| 久久午夜福利片| 国产激情偷乱视频一区二区| 欧美bdsm另类| 国产真实乱freesex| 亚洲国产精品合色在线| 长腿黑丝高跟| 亚洲av电影不卡..在线观看| 国产精品一区二区性色av| 91在线精品国自产拍蜜月| 啦啦啦观看免费观看视频高清| 午夜影院日韩av| 国产精华一区二区三区| 国产亚洲精品av在线| 久久精品国产清高在天天线| 午夜激情欧美在线| 欧美日韩综合久久久久久 | 国产精品美女特级片免费视频播放器| 又黄又爽又免费观看的视频| 亚洲熟妇熟女久久| 国产精品久久电影中文字幕| 在线观看av片永久免费下载| 欧美黑人巨大hd| 午夜日韩欧美国产| 国产91精品成人一区二区三区| 久久99热6这里只有精品| 成人特级黄色片久久久久久久| 亚洲av一区综合| 日韩大尺度精品在线看网址| 色噜噜av男人的天堂激情| 一进一出抽搐动态| 亚洲av二区三区四区| 最近视频中文字幕2019在线8| 最近最新中文字幕大全电影3| 国产真实伦视频高清在线观看 | 又紧又爽又黄一区二区| 极品教师在线免费播放| 成人美女网站在线观看视频| 国产不卡一卡二| 亚洲人成伊人成综合网2020| 日本成人三级电影网站| 国内毛片毛片毛片毛片毛片| 国内精品久久久久精免费| avwww免费| 97超级碰碰碰精品色视频在线观看| 亚洲国产高清在线一区二区三| 69人妻影院| 久久久久久久久中文| 丰满人妻一区二区三区视频av| 国产69精品久久久久777片| 成人av一区二区三区在线看| 免费搜索国产男女视频| 中国美白少妇内射xxxbb| 免费高清视频大片| 黄色丝袜av网址大全| 搡老岳熟女国产| 午夜激情福利司机影院| 不卡一级毛片| 在线观看午夜福利视频| 人妻制服诱惑在线中文字幕| 91久久精品国产一区二区三区| 亚洲人成网站高清观看| 国产精品av视频在线免费观看| 成人鲁丝片一二三区免费| 精品人妻偷拍中文字幕| 最后的刺客免费高清国语| 亚洲va日本ⅴa欧美va伊人久久| 欧美一区二区国产精品久久精品| 精品久久久久久久久久久久久| 婷婷色综合大香蕉| 97超级碰碰碰精品色视频在线观看| 免费在线观看影片大全网站| 日韩高清综合在线| 黄色一级大片看看| 制服丝袜大香蕉在线| 午夜免费男女啪啪视频观看 | 亚洲一级一片aⅴ在线观看| 欧洲精品卡2卡3卡4卡5卡区| 自拍偷自拍亚洲精品老妇| 精品人妻熟女av久视频| 日本黄大片高清| 国产成人影院久久av| h日本视频在线播放| 日日干狠狠操夜夜爽| 91狼人影院| 亚洲狠狠婷婷综合久久图片| 啦啦啦韩国在线观看视频| 亚洲精品色激情综合| 级片在线观看| 久久久成人免费电影| 国产久久久一区二区三区| 婷婷色综合大香蕉| 成人二区视频| 精品久久久久久,| 99热这里只有是精品在线观看| 91午夜精品亚洲一区二区三区 | 国产熟女欧美一区二区| 国产精品久久视频播放| 网址你懂的国产日韩在线| 丝袜美腿在线中文| 欧美日韩瑟瑟在线播放| 深爱激情五月婷婷| 欧美日本视频| 在线观看美女被高潮喷水网站| 午夜免费男女啪啪视频观看 | 亚洲自偷自拍三级| 久久国产精品人妻蜜桃| 久久精品国产清高在天天线| 久久久久久久久久久丰满 | 91在线精品国自产拍蜜月| 国产免费男女视频| 观看美女的网站| 久久久久久久久久成人| 欧美一区二区亚洲| 国产精品不卡视频一区二区| 国产一区二区三区在线臀色熟女| 久久久久久久久中文| 狂野欧美激情性xxxx在线观看| 久久久久久久久中文| 91久久精品国产一区二区三区| 人人妻人人看人人澡| 久久久久久国产a免费观看| 日韩一区二区视频免费看| 国产一区二区亚洲精品在线观看| 99久久精品一区二区三区| 成年女人永久免费观看视频| 国产伦精品一区二区三区四那| 国产一区二区亚洲精品在线观看| 窝窝影院91人妻| 久久精品综合一区二区三区| 午夜免费男女啪啪视频观看 | 有码 亚洲区| 午夜视频国产福利| 国产一区二区三区在线臀色熟女| 在线播放无遮挡| 免费看美女性在线毛片视频| 日韩国内少妇激情av| 岛国在线免费视频观看| 免费无遮挡裸体视频| 97热精品久久久久久|