• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    一種改進(jìn)的隨機(jī)森林Boost多標(biāo)簽文本分類(lèi)算法

    2022-12-03 01:56:46邵孟良齊德昱
    關(guān)鍵詞:集上文檔排序

    邵孟良 齊德昱

    1(廣州軟件學(xué)院計(jì)算機(jī)系 廣東 廣州 510990)2(華南理工大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院 廣東 廣州 510006)

    0 引 言

    互聯(lián)網(wǎng)上海量的數(shù)據(jù)通常以非結(jié)構(gòu)化的形式表示和存儲(chǔ),需要通過(guò)高效的自動(dòng)文本分類(lèi)[1]系統(tǒng)來(lái)管理和組織這些數(shù)據(jù)。因此,文本分類(lèi)是非常重要的研究領(lǐng)域。

    文本分類(lèi)指從一組預(yù)定義類(lèi)別中自動(dòng)指定文本的合適分類(lèi)。研究人員提出了很多用于文本分類(lèi)的分類(lèi)算法,如支持向量機(jī)[2]、決策樹(shù)[3]等。但這些算法僅限于單標(biāo)簽分類(lèi)問(wèn)題。然而,文本可能屬于多種分類(lèi)。為此,研究人員提出了一些多標(biāo)簽分類(lèi)算法,例如二進(jìn)制相關(guān)算法和分類(lèi)器鏈算法等。AdaBoost.MH[4]是Adaboost的多標(biāo)簽形式,其準(zhǔn)確性較高,是當(dāng)前性能領(lǐng)先的多標(biāo)簽分類(lèi)算法之一。與Boosting算法類(lèi)似,AdaBoost.MH迭代構(gòu)建弱假設(shè)集合,然后將其合并為一個(gè)能夠估計(jì)給定實(shí)例的多個(gè)標(biāo)簽的分類(lèi)器。當(dāng)數(shù)據(jù)集較大時(shí),AdaBoost.MH在弱監(jiān)督學(xué)習(xí)過(guò)程中迭代地檢驗(yàn)所有訓(xùn)練特征,其耗時(shí)較長(zhǎng)[5]。文獻(xiàn)[6]使用了一種長(zhǎng)短期記憶模型,即一種機(jī)器學(xué)習(xí)的方法進(jìn)行文本分類(lèi)學(xué)習(xí),并使用注意力機(jī)制對(duì)詞匯文本的貢獻(xiàn)程度進(jìn)行度量。文獻(xiàn)[7]提出了AdaBoost.MH的改進(jìn)算法隨機(jī)森林提升(RF-Boost),其首先對(duì)訓(xùn)練特征進(jìn)行排序,然后在每個(gè)Boosting輪過(guò)濾并使用排序靠前特征的較小子集,生成新的弱假設(shè)。實(shí)驗(yàn)結(jié)果表明,RF-Boost是一種快速準(zhǔn)確的多標(biāo)簽文本分類(lèi)算法。但作為一個(gè)話題模型,要求對(duì)話題估計(jì)進(jìn)行重采樣,當(dāng)數(shù)據(jù)量較大時(shí),兩種用于RF-Boost的特征排序方法可能會(huì)增加計(jì)算時(shí)間。文獻(xiàn)[8]提出一種非獨(dú)立同分布的多實(shí)例多標(biāo)簽分類(lèi)算法,在圖像和文本數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,該算法大大提高了多標(biāo)簽分類(lèi)的準(zhǔn)確性。

    本文分析了現(xiàn)有的特征加權(quán)方法,即信息增益、卡方、GSS系數(shù)、互信息、優(yōu)勢(shì)比、F1得分和準(zhǔn)確度[9],并提出改進(jìn)的RF-Boost(IRF-Boost)。本文方法基于權(quán)重選擇單個(gè)排序特征,傳遞到基礎(chǔ)學(xué)習(xí)器生成一個(gè)新假設(shè),因此不需要檢查所有的訓(xùn)練特征,甚至不需要檢查排序特征子集。通過(guò)實(shí)證分析表明,本文方法能夠快速準(zhǔn)確地進(jìn)行多標(biāo)簽文本分類(lèi)。

    1 Boosting算法

    1.1 AdaBoost.MH

    AdaBoost.MH算法中,通過(guò)將指數(shù)誤差最小化來(lái)實(shí)現(xiàn)最大限度降低漢明損失:

    式中:α(r)為基礎(chǔ)系數(shù),取正實(shí)值。

    在選擇Z的最小弱假設(shè)h(r)后,對(duì)下一個(gè)Boosting輪(r+1)的分布W(r+1)進(jìn)行更新和歸一化:

    在后續(xù)迭代中重復(fù)相同過(guò)程,直至所有Boosting輪執(zhí)行完畢。完成所有Boosting輪之后,AdaBoost.MH將選定的弱假設(shè)組成最終分類(lèi)器:

    因此,正值表示要分配給給定文本x的正確標(biāo)簽,負(fù)值則表示錯(cuò)誤標(biāo)簽:

    lH(x)=sign(H(x,l))l=1,2,…,m

    (5)

    為使用AdaBoost.MH進(jìn)行文本分類(lèi),利用代表訓(xùn)練文檔的單個(gè)詞(詞項(xiàng))構(gòu)建弱假設(shè)。設(shè)T={t1,t2,…,tv}為所有訓(xùn)練詞項(xiàng)的集合。每個(gè)文檔xj表示為包含v個(gè)二進(jìn)制權(quán)值的向量x=(x1,x2,…,xv),其中若ti出現(xiàn)在x中,則xi值為1;否則,xi值為0。

    式中:c01和c1l為第r次迭代過(guò)程中,根據(jù)基礎(chǔ)目標(biāo)Z(r)的最小化策略選出的常數(shù)。為得到詞項(xiàng)ti的c01和c1l值,先將訓(xùn)練文檔集合分割為兩個(gè)子集(X0,X1):

    Xu={x:xi=u}u=0,1

    (7)

    式中:ti出現(xiàn)在X1中的每個(gè)文檔中,且未出現(xiàn)在X0中的任何文檔。

    式中:u=0,1;φ(xi,l)為目標(biāo)函數(shù);p=1或-1。

    式(9)和式(10)均加入了較小的值ε,以避免除零。根據(jù)文獻(xiàn)[10],取ε=1/mn。通過(guò)選擇α(r)=1,利用式(11)得出Z(r):

    1.2 RF-Boost

    在RF-Boost中,首先對(duì)訓(xùn)練特征進(jìn)行排序,接著在每個(gè)Boosting輪中僅利用排序特征的較小子集得到與樞紐詞項(xiàng)相對(duì)應(yīng)的弱假設(shè)。在當(dāng)前Boosting輪選定后,在其后的Boosting輪移除樞紐詞項(xiàng),并替換為排序特征索引中下一個(gè)排序特征。

    算法1RF-Boost弱監(jiān)督學(xué)習(xí)算入:訓(xùn)練集S,均勻分布W,Boosting輪數(shù)R,訓(xùn)練特征索引T,特征排序法F,排序特征數(shù)k。

    輸出:最終分類(lèi)器H(x,l)。

    begin

    2.H*←();

    3.W(1)←W;

    5.forr←1至Rdo

    //對(duì)于每次迭代r

    6.H(r)←();

    //生成一組弱假設(shè)Η(r),每個(gè)弱假設(shè)對(duì)應(yīng)一個(gè)特征

    7.fori←1至kdo

    //對(duì)于RF中的每個(gè)排序特征

    //將訓(xùn)練樣本,當(dāng)前排

    //序特征和權(quán)重分布傳入基礎(chǔ)學(xué)習(xí)器,并得到一個(gè)新的弱假設(shè)

    10.endfor

    //選擇最優(yōu)弱假設(shè)

    12.forj←1至kdo

    16.endif

    17.endfor

    19.更新W(r +1);

    21.endfor

    end

    1.3 本文方法

    RF-Boost和本文方法之間的差異在于,RF-Boost在每個(gè)Boosting輪中,將排序特征的較小子集傳入基礎(chǔ)學(xué)習(xí)器,用以選擇弱假設(shè);而本文方法則僅選擇一個(gè)排序特征。因此,弱假設(shè)搜索空間的大小從k(RF-Boost中排序特征數(shù)量)降低至1(本文方法)。

    算法2本文IRF-Boost的弱監(jiān)督學(xué)習(xí)算入:訓(xùn)練集S,均勻分布W,Boosting輪數(shù)R,訓(xùn)練特征索引T,特征排序法F。

    輸出:最終分類(lèi)器H(x,l)。

    begin

    2.Η*←();

    3.W(1)←W;

    4.forr←1至Rdo

    //對(duì)于每次迭代r

    7.fori←1至|×|do

    //對(duì)于S中的每個(gè)樣本

    8.forl←1至|×|do

    //對(duì)于S中的每個(gè)標(biāo)簽

    10.endfor

    11.endfor

    12.endfor

    end

    本文方法IRF-Boost可視為RF-Boost的特殊形式,其選定特征數(shù)量為1。雖然本文僅將一個(gè)特征選擇為樞紐詞項(xiàng)并傳入基礎(chǔ)學(xué)習(xí)器,但通過(guò)本文的實(shí)證驗(yàn)證,確定本文方法能夠如AdaBoost.MH一樣,將弱假設(shè)的漢明損失最小化。AdaBoost.MH的最終分類(lèi)器的漢明損失最大為:

    假定訓(xùn)練特征的數(shù)量為2 000個(gè)。AdaBoost.MH構(gòu)建2 000個(gè)弱假設(shè),每個(gè)假設(shè)對(duì)應(yīng)一個(gè)特征。對(duì)于2 000個(gè)弱假設(shè)h1,h2,…,h2 000,僅返回特定特征t*上的一個(gè)弱假設(shè),該弱假設(shè)能夠最小化基礎(chǔ)目標(biāo)函數(shù)Z*的值。假定選定要進(jìn)入RF-Boost中弱監(jiān)督學(xué)習(xí)程序的排序特征的數(shù)量為100(k=100,作為用戶(hù)的輸入),則RF-Boost將弱假設(shè)的搜索空間從2 000(AdaBoost.MH)降至100。由此,生成的弱假設(shè)數(shù)量也降至100。在這100個(gè)弱假設(shè)中,僅選擇一個(gè)能夠最小化Z*的弱假設(shè)h*用于最終分類(lèi)器。與之相比,本文方法則將生成的弱假設(shè)數(shù)量降至1個(gè),對(duì)應(yīng)于傳入基礎(chǔ)學(xué)習(xí)器的特征(t1)。因此,本文方法中無(wú)須執(zhí)行弱假設(shè)選擇,因此加速了弱監(jiān)督學(xué)習(xí)過(guò)程。

    2 特征排序法和BoWT文本表征模型

    2.1 特征排序法

    用于特征排序的特征加權(quán)方法有很多,RF-Boost和本文方法基于通過(guò)不同的指標(biāo)進(jìn)行特征加權(quán)排序,這些指標(biāo)分別為信息增益、卡方、互信息、優(yōu)勢(shì)比、GSS系數(shù)、F1得分和準(zhǔn)確度。

    對(duì)于T中的每個(gè)標(biāo)簽l和特征詞項(xiàng)t,假定tp為l中且包含t的文檔數(shù)量,fp為不在l中且包含t的文檔數(shù)量,fn為l中且不包含t的文檔數(shù)量,tn為不在l中且不包含t的文檔數(shù)量。設(shè)gPos=tp+fn,gNeg=fp+tn,fPos=tp+fp,fNeg=tn+fn,并設(shè)n為訓(xùn)練集中文檔總數(shù)量。將以下每個(gè)特征加權(quán)(選擇)度量的得分,作為詞項(xiàng)t被分入標(biāo)簽l的權(quán)重。

    信息增益(IG)是廣泛使用的詞項(xiàng)重要性度量,以信息理論為基礎(chǔ)[11]。將詞項(xiàng)t分入標(biāo)簽l的近似信息增益為:

    卡方(CHI)測(cè)量?jī)蓚€(gè)變量之間的相關(guān)性,并評(píng)估其獨(dú)立性。利用卡方定義詞項(xiàng)t和分類(lèi)l的獨(dú)立性:

    互信息(MI)是廣泛使用的特征加權(quán)方法,測(cè)量?jī)蓚€(gè)變量X和Y所共享的信息程度:

    優(yōu)勢(shì)比(OR)測(cè)量詞項(xiàng)t出現(xiàn)在類(lèi)別l中的概率比詞項(xiàng)t不出現(xiàn)在類(lèi)別l中的概率大多少:

    GSS系數(shù)(GSS)是一種簡(jiǎn)化卡方法,是一種特征選擇法。將詞項(xiàng)t分入標(biāo)簽l的GSS系數(shù)定義為:

    F1得分(F1)和準(zhǔn)確度(ACC)用于評(píng)價(jià)分類(lèi)算法的性能。對(duì)于詞項(xiàng)t和分類(lèi)l,F(xiàn)1得分和準(zhǔn)確度的定義分別為:

    特征排序法的函數(shù)表示為Sort-F[Sc,M]。其中,第1個(gè)參數(shù)Sc表示所有分類(lèi)之間的動(dòng)態(tài)調(diào)度策略。如輪詢(xún)策略,即選取每個(gè)分類(lèi)輪流提出的最優(yōu)特征;或者均勻隨機(jī)策略,以隨機(jī)化觀察為基礎(chǔ),根據(jù)分布概率,隨機(jī)選擇下一個(gè)分類(lèi)。若已知分類(lèi)的重要性不平等(例如分類(lèi)成本等),則使用該信息對(duì)選擇概率分布進(jìn)行偏移。第2個(gè)參數(shù)M是分類(lèi)任務(wù)的特征排序指標(biāo),可包括特征評(píng)分度量,例如信息增益或卡方檢驗(yàn)等。本文特征排序法的偽代碼如下:

    對(duì)于數(shù)據(jù)集的每個(gè)分類(lèi)c:

    對(duì)于在分類(lèi)c和所有其他分類(lèi)之間進(jìn)行二元子任務(wù)區(qū)分,根據(jù)參數(shù)M對(duì)所有特征進(jìn)行排序;

    保存分類(lèi)c的特征排序;

    當(dāng)輸出未完成時(shí):

    利用動(dòng)態(tài)調(diào)度策略Sc,選擇下一個(gè)分類(lèi)cn;

    從排序表中,選出cn的下一個(gè)特征fn。

    若該fn不在輸出中,則將其添加到輸出中。

    2.2 BoWT文本表征模型

    BoW(詞袋)是典型的文本表征模型,其使用單個(gè)詞在向量空間中表征文本[13]。但BoW會(huì)忽略詞的順序及其在文本中的關(guān)系,而且BoW會(huì)生成高維空間,增加分類(lèi)算法的訓(xùn)練時(shí)長(zhǎng)。文獻(xiàn)[14]的實(shí)驗(yàn)結(jié)果表明,基于話題的表征法不適用于不平衡數(shù)據(jù)。這是因?yàn)榕c樣本較少的分類(lèi)相關(guān)聯(lián)的話題數(shù)量很少,因此無(wú)法完全表現(xiàn)這些類(lèi)別的特征。文獻(xiàn)[7]提出了BoWT混合式表征法,通過(guò)將排序靠前的詞和話題合并到一個(gè)表征模型中,解決了較少樣本話題的表征問(wèn)題。

    BoWT如圖1所示,首先使用LDA估計(jì)訓(xùn)練文檔間的話題,然后基于其概率選擇話題,并將話題與排序靠前的詞相結(jié)合,生成新的合并表征模型。在評(píng)價(jià)階段,基于話題估計(jì)階段中的LDA輸出,推導(dǎo)出測(cè)試文本的話題,并與選定的訓(xùn)練特征結(jié)合,以表征用于評(píng)價(jià)分類(lèi)性能的測(cè)試文檔。

    圖1 BoWT文本表征模型

    3 實(shí) 驗(yàn)

    3.1 數(shù)據(jù)集

    本文使用文本分類(lèi)系統(tǒng)評(píng)價(jià)中常用的四個(gè)多標(biāo)簽數(shù)據(jù)集:

    (1) Reuters-21578,包含135個(gè)類(lèi)別的新聞集合,共包含12 902個(gè)文檔,其中9 603個(gè)文檔用于訓(xùn)練,3 299個(gè)文檔用于測(cè)試。本文在135個(gè)類(lèi)別中,僅使用了包含文本數(shù)量較大的10個(gè)類(lèi)別。

    (2) 20-Newsgroups(20NG),一個(gè)多標(biāo)簽文本數(shù)據(jù)集,包含分布在20個(gè)不同新聞組(類(lèi)別)上的20 000個(gè)文檔。本文使用的20NG版本中包含18 846個(gè)文檔,分為11 314個(gè)訓(xùn)練文檔和7 532個(gè)測(cè)試文檔。

    (3) OHSUMED,1991年醫(yī)學(xué)主題(MeSH)摘要集合,目標(biāo)是將摘要分為23種心血管疾病類(lèi)別。該數(shù)據(jù)包含13 929個(gè)摘要,分為6 286個(gè)訓(xùn)練摘要和7 643個(gè)測(cè)試摘要。

    (4) TMC2007,為2007年SIAM文本挖掘競(jìng)賽而開(kāi)發(fā)的多標(biāo)簽文本數(shù)據(jù)集,包含22個(gè)類(lèi)別上的28 596個(gè)測(cè)試樣本,分為21 519篇訓(xùn)練文本和7 077篇測(cè)試文本。

    3.2 實(shí)驗(yàn)設(shè)置

    對(duì)每個(gè)數(shù)據(jù)集進(jìn)行預(yù)處理,即詞語(yǔ)切分、標(biāo)準(zhǔn)化、詞干提取、停用詞移除。使用BoWT表征模型表示特征,將每個(gè)數(shù)據(jù)集的估計(jì)話題數(shù)量設(shè)為200個(gè)[15]。對(duì)于所有的特征排序法,選擇每個(gè)數(shù)據(jù)集的前3 500個(gè)權(quán)重最高的特征(詞和話題)。利用不同Boosting輪數(shù)(從200至2000輪遞增,增量為200輪)對(duì)Boosting算法進(jìn)行評(píng)價(jià)。使用宏觀平均F1(MacroF1)和微觀平均F1(MicroF1)評(píng)價(jià)分類(lèi)性能。

    實(shí)驗(yàn)分為兩個(gè)步驟:(1) 評(píng)價(jià)用于RF-Boost的特征排序法;(2) 使用在RF-Boost中性能最優(yōu)的排序法,對(duì)AdaBoost.MH、RF-Boost和本文方法進(jìn)行比較分析。

    本文使用秩和檢驗(yàn)[16]驗(yàn)證Boosting算法的統(tǒng)計(jì)顯著性。秩和檢驗(yàn)定義為:

    式中:Nd為數(shù)據(jù)集數(shù)量;k為評(píng)價(jià)的方法的數(shù)量;Rj為每個(gè)方法的平均秩次。

    通過(guò)對(duì)Boosting算法在不同數(shù)據(jù)集上的性能秩次進(jìn)行秩和檢驗(yàn),利用式(20)與k-1自由度得到分布,并計(jì)算在5%顯著水平下的p值。本文在秩和檢驗(yàn)后還進(jìn)行了雙尾Bonferroni-Dunn檢驗(yàn),對(duì)各方法進(jìn)行逐對(duì)比較。

    3.3 結(jié)果分析

    本文將評(píng)價(jià)分為兩部分:① 特征排序法在RF-Boost中的性能;② 各Boosting算法的實(shí)證比較和統(tǒng)計(jì)分析。

    3.3.1特征排序法的評(píng)價(jià)

    圖2給出了對(duì)于不同的特征排序法,在所有數(shù)據(jù)集上RF-Boost在MacroF1方面的性能??梢钥闯觯琈I特征在除OHSUMED數(shù)據(jù)集之外的所有數(shù)據(jù)集上得到了最優(yōu)性能。這是因?yàn)镸I計(jì)算每個(gè)訓(xùn)練詞項(xiàng)與類(lèi)別之間的相依性,衡量出現(xiàn)的詞項(xiàng)的信息量,準(zhǔn)確地分配標(biāo)簽。但MI在OHSUMED數(shù)據(jù)集上體現(xiàn)的性能較差,這是因?yàn)樵摂?shù)據(jù)集的性質(zhì)和結(jié)構(gòu)。

    (a) 20NG (b) OHSUMED

    (c) Reuster (d) TMC2007圖2 RF-Boost的MacroF1在使用不同的特征選擇法的得分

    表1給出了對(duì)于所有排序方法和所有數(shù)據(jù)集,在MacroF1和MicroF1上的RF-Boost的最優(yōu)結(jié)果。從表1可知,MI在除OHSUMED數(shù)據(jù)集之外的所有數(shù)據(jù)集上均取得了最優(yōu)MacroF1和MicroF1值;OR特征排序法的平均秩次僅次于MI;OR在OHSUMED數(shù)據(jù)集上取得了最優(yōu)MacroF1值;GSS排序法在整體上性能最差。

    表1 RF-Boost的最優(yōu)MacroF1和MicroF1數(shù)值(%)

    續(xù)表1

    3.3.2Boosting算法的比較評(píng)價(jià)

    本文通過(guò)實(shí)驗(yàn)證明MI的性能最佳,所以將其作為特征排序和選擇方法,對(duì)所有Boosting算法進(jìn)行評(píng)價(jià)。圖3給出了在使用不同Boosting輪數(shù)時(shí),所有Boosting算法在4個(gè)數(shù)據(jù)集上的MacroF1結(jié)果。當(dāng)Boosting輪數(shù)超過(guò)400時(shí),AdaBoost.MH的性能稍?xún)?yōu)于RF-Boost。但在Boosting輪數(shù)為200至400之間時(shí),本文方法取得了最優(yōu)性能。本文方法在除TMC2007之外的所有數(shù)據(jù)集上的性能均優(yōu)于AdaBoost.MH。圖4給出了MicroF1結(jié)果??梢?jiàn)本文方法在20NG和OHSUMED數(shù)據(jù)集上性能優(yōu)于AdaBoost.MH,后者在Reuters和RMC2007數(shù)據(jù)集上性能更好。此外,RF-Boost在除OHSUMED之外的所有數(shù)據(jù)集上均優(yōu)于AdaBoost.MH和本文方法。

    (a) 20NG (b) OHSUMED

    (c) Reuters (d) TMC2007圖3 不同輪數(shù)時(shí)Boosting算法的MacroF1數(shù)值

    (a) 20NG (b) OHSUMED

    (c) Reuters (d) TMC2007圖4 不同輪數(shù)時(shí)Boosting算法的MicroF1數(shù)值

    表2給出了所有數(shù)據(jù)集上,所有Boosting算法的最優(yōu)MacroF1和MicroF1數(shù)值。為了驗(yàn)證Boosting算法之間差異的統(tǒng)計(jì)顯著性,本文使用5%顯著水平下的秩和檢驗(yàn),并進(jìn)行雙尾Bonferroni-Dunn檢驗(yàn),以逐對(duì)的方法進(jìn)行比較。但Boosting算法的最優(yōu)實(shí)驗(yàn)結(jié)果不能用于分析該算法在所有Boosting輪的整體性能,將使用特定Boosting輪數(shù)取得的每個(gè)分類(lèi)結(jié)果作為驗(yàn)證統(tǒng)計(jì)顯著性的獨(dú)立觀察。

    表2 所有Boosting算法的最優(yōu)MacroF1和MicroF1結(jié)果(%)

    為了驗(yàn)證Boosting算法之間的差異顯著性,首先基于MacroF1度量,對(duì)每個(gè)Boosting輪數(shù)和所有數(shù)據(jù)集上的分類(lèi)性能進(jìn)行排序。然后,進(jìn)行秩和檢驗(yàn),并根據(jù)式(20)得到分布。得出的p值為0.000 1,低于顯著水平(0.05)。這表明方法性能之間存在顯著差異,且剔除具有相同性能的弱假設(shè)。在剔除了弱假設(shè)后,本文進(jìn)行雙尾Bonferroni-Dunn檢驗(yàn)。表3給出了Boosting算法之間的逐對(duì)比較,其中秩和檢驗(yàn)之后進(jìn)行的雙尾Bonferroni-Dunn檢驗(yàn),α=0.5,臨界值為5.991,p值(雙尾)為0.000 1,Bonferroni糾正顯著水平為0.016 7。由表可知,RF-Boost顯著優(yōu)于本文方法和AdaBoost.MH。此外,本文方法和AdaBoost.MH的性能之間無(wú)顯著差異,但本文方法的訓(xùn)練比AdaBoost.MH要快得多,是比AdaBoost.MH更優(yōu)秀的分類(lèi)器。

    表3 不同算法之間的逐對(duì)比較

    3.4 計(jì)算成本

    假定訓(xùn)練樣本數(shù)為n,分類(lèi)數(shù)為m,訓(xùn)練特征數(shù)(特征選擇之后)為v。AdaBoost.MH中執(zhí)行一次Boosting迭代的時(shí)長(zhǎng)與n、m和v為線性關(guān)系,即時(shí)間復(fù)雜度為O(mnv)。RF-Boost將v減少至較少數(shù)量k。因此,RF-Boost中一輪Boosting的時(shí)間復(fù)雜度為O(mnk)。本文方法僅將一個(gè)特征傳入基礎(chǔ)學(xué)習(xí)器,即k=1。因此,本文方法的時(shí)間復(fù)雜度為O(mn),即本文方法計(jì)算時(shí)間與分類(lèi)數(shù)量和訓(xùn)練集大小是線性相關(guān)的。

    圖5給出了在Reuters數(shù)據(jù)集上,不同輪數(shù)的Boosting算法的學(xué)習(xí)成本。測(cè)試系統(tǒng)使用Java開(kāi)發(fā),PC配置了3.00 GHz Inter CORE-i5處理器,8.00 GB RAM,使用Windows 10 64位操作系統(tǒng)。從圖5可知,本文方法在所有案例中速度均最快,其次為RF-Boost,AdaBoost.MH速度最慢。本文方法比AdaBoost.MH快約4倍,因此適用于學(xué)習(xí)時(shí)間要求較高的文本分類(lèi)任務(wù)。

    圖5 不同Boosting算法的學(xué)習(xí)時(shí)間

    4 結(jié) 語(yǔ)

    特征排序?qū)F-Boost的準(zhǔn)確度和速度至關(guān)重要,本文通過(guò)實(shí)驗(yàn)證明,在眾多特征排序法中,MI能夠改進(jìn)RF-Boost的性能。但由于特征排序法的性能基本上取決于數(shù)據(jù)集的性質(zhì),所以不存在整體上的最優(yōu)特征選排序法。

    本文提出了改進(jìn)的RF-Boost方法,即IRF-Boost,從排序靠前的特征中選擇一個(gè)特征進(jìn)入基礎(chǔ)學(xué)習(xí)器,用以生成新的弱假設(shè)。實(shí)驗(yàn)結(jié)果證明,本文方法能夠加速了學(xué)習(xí)的過(guò)程,且不會(huì)降低分類(lèi)性能。本文方法的性能與AdaBoost.MH無(wú)顯著差異,但本文方法的主要特點(diǎn)是快速性,其速度比AdaBoost.MH約快4倍。

    猜你喜歡
    集上文檔排序
    排序不等式
    有人一聲不吭向你扔了個(gè)文檔
    Cookie-Cutter集上的Gibbs測(cè)度
    恐怖排序
    鏈完備偏序集上廣義向量均衡問(wèn)題解映射的保序性
    節(jié)日排序
    刻舟求劍
    兒童繪本(2018年5期)2018-04-12 16:45:32
    復(fù)扇形指標(biāo)集上的分布混沌
    基于RI碼計(jì)算的Word復(fù)制文檔鑒別
    Persistence of the reproductive toxicity of chlorpiryphos-ethyl in male Wistar rat
    欧美黄色片欧美黄色片| 婷婷色av中文字幕| 老熟女久久久| videosex国产| 亚洲欧美成人综合另类久久久| 亚洲avbb在线观看| 老司机深夜福利视频在线观看 | 亚洲国产精品一区二区三区在线| 亚洲av男天堂| 亚洲av片天天在线观看| 国产无遮挡羞羞视频在线观看| 午夜福利一区二区在线看| 欧美激情高清一区二区三区| 亚洲第一欧美日韩一区二区三区 | 99国产精品一区二区三区| 日韩制服丝袜自拍偷拍| videosex国产| 首页视频小说图片口味搜索| 在线 av 中文字幕| 80岁老熟妇乱子伦牲交| 最新的欧美精品一区二区| √禁漫天堂资源中文www| 老司机深夜福利视频在线观看 | 久久久久精品国产欧美久久久 | 免费观看人在逋| 亚洲伊人久久精品综合| netflix在线观看网站| 久久久久久久国产电影| 亚洲性夜色夜夜综合| 亚洲欧美成人综合另类久久久| 亚洲精品av麻豆狂野| 久久久久久免费高清国产稀缺| 91成人精品电影| 一区福利在线观看| 男女免费视频国产| 国产精品 国内视频| 色综合欧美亚洲国产小说| 欧美人与性动交α欧美软件| 男人添女人高潮全过程视频| 午夜福利在线观看吧| 国产亚洲午夜精品一区二区久久| 下体分泌物呈黄色| 人妻一区二区av| 在线看a的网站| 最黄视频免费看| 天天躁狠狠躁夜夜躁狠狠躁| 91麻豆精品激情在线观看国产 | 国产淫语在线视频| 日本黄色日本黄色录像| 99国产综合亚洲精品| 亚洲精品久久久久久婷婷小说| 一进一出抽搐动态| 多毛熟女@视频| 色播在线永久视频| 曰老女人黄片| 手机成人av网站| 动漫黄色视频在线观看| 国产在线一区二区三区精| 在线观看一区二区三区激情| 国产伦理片在线播放av一区| 大型av网站在线播放| 久久久国产成人免费| 亚洲av男天堂| 美女扒开内裤让男人捅视频| 高潮久久久久久久久久久不卡| 女人爽到高潮嗷嗷叫在线视频| 亚洲精品一卡2卡三卡4卡5卡 | 老汉色av国产亚洲站长工具| 美女脱内裤让男人舔精品视频| 又大又爽又粗| 国产一区二区在线观看av| 久久久精品94久久精品| 亚洲中文日韩欧美视频| 国产日韩欧美视频二区| 乱人伦中国视频| 久久精品国产a三级三级三级| 精品久久蜜臀av无| 久久久久国产一级毛片高清牌| 亚洲精品国产色婷婷电影| 男男h啪啪无遮挡| 777久久人妻少妇嫩草av网站| 亚洲国产成人一精品久久久| 久久国产精品男人的天堂亚洲| 一二三四社区在线视频社区8| 亚洲欧美精品自产自拍| 嫁个100分男人电影在线观看| 黄色片一级片一级黄色片| 亚洲精品日韩在线中文字幕| 成人黄色视频免费在线看| 亚洲av国产av综合av卡| 国产成人免费无遮挡视频| 韩国精品一区二区三区| 国产精品久久久久久人妻精品电影 | a级片在线免费高清观看视频| 欧美亚洲 丝袜 人妻 在线| 人人澡人人妻人| 成人av一区二区三区在线看 | 欧美精品啪啪一区二区三区 | 久久久久久亚洲精品国产蜜桃av| av免费在线观看网站| 亚洲精品一二三| 成人手机av| 国产99久久九九免费精品| 亚洲专区中文字幕在线| 精品国产一区二区三区久久久樱花| 亚洲av男天堂| 99热全是精品| 成人亚洲精品一区在线观看| 国产激情久久老熟女| 亚洲欧美日韩另类电影网站| 人人妻人人澡人人爽人人夜夜| 亚洲三区欧美一区| 国产一区二区三区综合在线观看| 成人国产av品久久久| 亚洲精品在线美女| 国产一区二区三区在线臀色熟女 | 91麻豆精品激情在线观看国产 | 午夜影院在线不卡| 国产精品成人在线| 国产成+人综合+亚洲专区| 免费少妇av软件| 亚洲一区二区三区欧美精品| 窝窝影院91人妻| 国产在线一区二区三区精| 中文字幕另类日韩欧美亚洲嫩草| 亚洲欧洲精品一区二区精品久久久| 蜜桃国产av成人99| 男女免费视频国产| 9色porny在线观看| 在线观看人妻少妇| 中国美女看黄片| 久久99热这里只频精品6学生| 丝瓜视频免费看黄片| 欧美激情高清一区二区三区| av一本久久久久| 婷婷成人精品国产| 精品久久久久久久毛片微露脸 | 自线自在国产av| 欧美激情高清一区二区三区| 淫妇啪啪啪对白视频 | 久久九九热精品免费| 在线观看免费高清a一片| 新久久久久国产一级毛片| 最近最新中文字幕大全免费视频| 久久99热这里只频精品6学生| 日本五十路高清| 亚洲一码二码三码区别大吗| 国产99久久九九免费精品| 精品人妻一区二区三区麻豆| 黄片大片在线免费观看| 午夜福利视频精品| 日韩欧美一区视频在线观看| 女警被强在线播放| 少妇 在线观看| 十八禁网站网址无遮挡| 日本vs欧美在线观看视频| www日本在线高清视频| 国产免费av片在线观看野外av| 久9热在线精品视频| 大片免费播放器 马上看| 18禁观看日本| 天天影视国产精品| 国产精品熟女久久久久浪| 亚洲va日本ⅴa欧美va伊人久久 | 久久久欧美国产精品| 99香蕉大伊视频| 国产亚洲精品一区二区www | 两个人免费观看高清视频| 成人手机av| 女人爽到高潮嗷嗷叫在线视频| 久热这里只有精品99| 亚洲一卡2卡3卡4卡5卡精品中文| 我要看黄色一级片免费的| 久久精品国产亚洲av香蕉五月 | 免费高清在线观看视频在线观看| 免费在线观看视频国产中文字幕亚洲 | 亚洲国产av影院在线观看| 欧美国产精品va在线观看不卡| 精品人妻在线不人妻| 日本av免费视频播放| 中文字幕高清在线视频| 热99久久久久精品小说推荐| 99久久精品国产亚洲精品| 热99国产精品久久久久久7| 91麻豆精品激情在线观看国产 | 一区二区av电影网| 欧美久久黑人一区二区| 亚洲午夜精品一区,二区,三区| 亚洲少妇的诱惑av| 在线观看免费视频网站a站| 秋霞在线观看毛片| 狠狠精品人妻久久久久久综合| av在线app专区| www.av在线官网国产| 一区二区三区精品91| 亚洲综合色网址| 一本大道久久a久久精品| 亚洲av成人不卡在线观看播放网 | 美女扒开内裤让男人捅视频| 岛国在线观看网站| 免费少妇av软件| 亚洲国产精品一区二区三区在线| 国产精品亚洲av一区麻豆| 咕卡用的链子| 999久久久国产精品视频| 久久中文字幕一级| 国产99久久九九免费精品| 搡老岳熟女国产| 香蕉国产在线看| 天堂8中文在线网| 老熟妇仑乱视频hdxx| 免费在线观看影片大全网站| 亚洲av成人不卡在线观看播放网 | 一区在线观看完整版| 高潮久久久久久久久久久不卡| 一二三四在线观看免费中文在| 成人av一区二区三区在线看 | 看免费av毛片| 丰满饥渴人妻一区二区三| 两个人免费观看高清视频| 亚洲一码二码三码区别大吗| 亚洲国产欧美在线一区| 国产精品久久久久成人av| 国产成人系列免费观看| 丰满迷人的少妇在线观看| 侵犯人妻中文字幕一二三四区| 少妇被粗大的猛进出69影院| cao死你这个sao货| 国产激情久久老熟女| 一级黄色大片毛片| 80岁老熟妇乱子伦牲交| 天天躁日日躁夜夜躁夜夜| 美女中出高潮动态图| 欧美日韩福利视频一区二区| 欧美成人午夜精品| 人成视频在线观看免费观看| 女人爽到高潮嗷嗷叫在线视频| 亚洲国产精品999| 少妇的丰满在线观看| 欧美 日韩 精品 国产| av网站免费在线观看视频| 一区二区三区四区激情视频| 亚洲国产精品999| 老司机午夜福利在线观看视频 | av在线app专区| 久久九九热精品免费| 五月天丁香电影| 国产三级黄色录像| 午夜免费鲁丝| 久久亚洲国产成人精品v| 欧美黄色淫秽网站| 日韩制服丝袜自拍偷拍| 99精品久久久久人妻精品| 日韩 亚洲 欧美在线| 俄罗斯特黄特色一大片| 中文字幕高清在线视频| 久久久水蜜桃国产精品网| 欧美国产精品一级二级三级| videos熟女内射| 久久九九热精品免费| 亚洲一区中文字幕在线| 国内毛片毛片毛片毛片毛片| 91精品伊人久久大香线蕉| 他把我摸到了高潮在线观看 | 国产成+人综合+亚洲专区| 日本黄色日本黄色录像| 人人澡人人妻人| avwww免费| 99热网站在线观看| 天天躁夜夜躁狠狠躁躁| 久久久国产成人免费| 久久久久国产精品人妻一区二区| 亚洲国产精品一区二区三区在线| 一本大道久久a久久精品| 大香蕉久久网| 亚洲精品久久午夜乱码| 人妻一区二区av| 国产激情久久老熟女| 精品亚洲成a人片在线观看| 如日韩欧美国产精品一区二区三区| 精品福利观看| 亚洲精品中文字幕一二三四区 | 亚洲伊人色综图| 后天国语完整版免费观看| 久久久久国产精品人妻一区二区| 亚洲国产欧美一区二区综合| 在线 av 中文字幕| 亚洲欧美精品自产自拍| av电影中文网址| av有码第一页| 脱女人内裤的视频| 国产精品二区激情视频| 黄片播放在线免费| 亚洲视频免费观看视频| 2018国产大陆天天弄谢| 在线观看一区二区三区激情| 一本—道久久a久久精品蜜桃钙片| 午夜精品国产一区二区电影| 亚洲天堂av无毛| 亚洲精品成人av观看孕妇| 最近中文字幕2019免费版| 亚洲精品久久午夜乱码| 国产欧美日韩精品亚洲av| 正在播放国产对白刺激| 精品视频人人做人人爽| 色综合欧美亚洲国产小说| 新久久久久国产一级毛片| 99热国产这里只有精品6| 啦啦啦啦在线视频资源| 国产色视频综合| 亚洲专区国产一区二区| 亚洲av欧美aⅴ国产| 高清欧美精品videossex| 女性生殖器流出的白浆| 久久 成人 亚洲| 亚洲av美国av| 亚洲情色 制服丝袜| 久久久精品免费免费高清| 欧美一级毛片孕妇| 欧美精品高潮呻吟av久久| 色婷婷av一区二区三区视频| 亚洲精品一区蜜桃| 免费不卡黄色视频| 91成人精品电影| 国产一区二区在线观看av| 中文字幕制服av| 亚洲色图 男人天堂 中文字幕| 亚洲精品成人av观看孕妇| 国产精品久久久久久人妻精品电影 | 久久精品亚洲熟妇少妇任你| 中文字幕另类日韩欧美亚洲嫩草| 夜夜骑夜夜射夜夜干| 久久女婷五月综合色啪小说| 精品国产国语对白av| 日韩熟女老妇一区二区性免费视频| 精品一区在线观看国产| 日韩制服丝袜自拍偷拍| 在线精品无人区一区二区三| 久久亚洲精品不卡| 精品福利永久在线观看| 久久久精品94久久精品| 12—13女人毛片做爰片一| 少妇裸体淫交视频免费看高清 | 精品国产乱码久久久久久男人| 久久午夜综合久久蜜桃| 亚洲伊人色综图| 中亚洲国语对白在线视频| 中文字幕高清在线视频| 欧美黑人精品巨大| bbb黄色大片| 手机成人av网站| 亚洲精品中文字幕一二三四区 | 亚洲第一av免费看| 欧美日韩亚洲国产一区二区在线观看 | www.精华液| 美女午夜性视频免费| av又黄又爽大尺度在线免费看| tube8黄色片| 少妇的丰满在线观看| 天天躁狠狠躁夜夜躁狠狠躁| 老司机福利观看| 国产又爽黄色视频| 欧美另类亚洲清纯唯美| 国产精品久久久人人做人人爽| 国产精品欧美亚洲77777| 欧美在线黄色| 免费久久久久久久精品成人欧美视频| 精品人妻在线不人妻| 国产成人啪精品午夜网站| 久久精品aⅴ一区二区三区四区| 法律面前人人平等表现在哪些方面 | 免费观看a级毛片全部| 蜜桃国产av成人99| 一进一出抽搐动态| videos熟女内射| av福利片在线| 亚洲av成人一区二区三| 在线观看舔阴道视频| 两个人免费观看高清视频| 精品熟女少妇八av免费久了| 水蜜桃什么品种好| 免费女性裸体啪啪无遮挡网站| 午夜日韩欧美国产| a级片在线免费高清观看视频| 色综合欧美亚洲国产小说| 精品人妻1区二区| 亚洲精品自拍成人| 两性午夜刺激爽爽歪歪视频在线观看 | 国产福利在线免费观看视频| 精品国产乱子伦一区二区三区 | 午夜久久久在线观看| 女人被躁到高潮嗷嗷叫费观| 国产黄色免费在线视频| 我要看黄色一级片免费的| 久久国产精品大桥未久av| 久久久久久久久免费视频了| av在线app专区| 桃红色精品国产亚洲av| av电影中文网址| 亚洲精品美女久久av网站| 日本猛色少妇xxxxx猛交久久| 日本91视频免费播放| 国产成人一区二区三区免费视频网站| a 毛片基地| 中文字幕另类日韩欧美亚洲嫩草| 91精品伊人久久大香线蕉| 精品一品国产午夜福利视频| 精品国产一区二区久久| 亚洲精品中文字幕在线视频| 欧美亚洲 丝袜 人妻 在线| 又黄又粗又硬又大视频| 捣出白浆h1v1| 精品一区在线观看国产| 欧美黑人精品巨大| 中文字幕色久视频| 黑人巨大精品欧美一区二区蜜桃| 成人手机av| 亚洲精品成人av观看孕妇| 国产精品 国内视频| 成年人午夜在线观看视频| 狠狠婷婷综合久久久久久88av| 精品国产国语对白av| 亚洲男人天堂网一区| 亚洲欧洲精品一区二区精品久久久| 青春草视频在线免费观看| 亚洲精品乱久久久久久| 精品人妻1区二区| 久久这里只有精品19| 久久久久久免费高清国产稀缺| 1024视频免费在线观看| 老熟妇乱子伦视频在线观看 | 亚洲天堂av无毛| 亚洲精品成人av观看孕妇| 国产有黄有色有爽视频| 啦啦啦视频在线资源免费观看| 新久久久久国产一级毛片| 久久九九热精品免费| 欧美大码av| 午夜影院在线不卡| 极品人妻少妇av视频| 国产成人欧美| 亚洲人成电影观看| 欧美精品啪啪一区二区三区 | 欧美黑人精品巨大| 最近最新中文字幕大全免费视频| 91精品伊人久久大香线蕉| 精品人妻熟女毛片av久久网站| 国产人伦9x9x在线观看| 欧美+亚洲+日韩+国产| 人人妻人人澡人人看| 国产一级毛片在线| 人人妻人人澡人人爽人人夜夜| 久久国产精品人妻蜜桃| 精品视频人人做人人爽| 爱豆传媒免费全集在线观看| 亚洲 国产 在线| 中文欧美无线码| 亚洲精品在线美女| 伊人亚洲综合成人网| 又黄又粗又硬又大视频| videosex国产| 天堂8中文在线网| 国产欧美日韩一区二区三 | 窝窝影院91人妻| 亚洲精品美女久久久久99蜜臀| 久久影院123| 他把我摸到了高潮在线观看 | 久久综合国产亚洲精品| 欧美黑人精品巨大| 人妻久久中文字幕网| 国产日韩欧美在线精品| 最新在线观看一区二区三区| 久久人人97超碰香蕉20202| 69精品国产乱码久久久| 婷婷色av中文字幕| 一区二区三区精品91| 午夜两性在线视频| a级毛片在线看网站| 亚洲 欧美一区二区三区| 老司机影院成人| 19禁男女啪啪无遮挡网站| 久久午夜综合久久蜜桃| 国产精品香港三级国产av潘金莲| 99久久精品国产亚洲精品| 男人舔女人的私密视频| 别揉我奶头~嗯~啊~动态视频 | 欧美xxⅹ黑人| 精品国产国语对白av| 久久国产精品大桥未久av| 王馨瑶露胸无遮挡在线观看| 日韩熟女老妇一区二区性免费视频| 啦啦啦在线免费观看视频4| 在线天堂中文资源库| 国产99久久九九免费精品| 老汉色av国产亚洲站长工具| 高潮久久久久久久久久久不卡| 十八禁网站免费在线| 午夜免费鲁丝| 国产欧美日韩精品亚洲av| 黄色怎么调成土黄色| 十八禁网站免费在线| 久久99热这里只频精品6学生| 美女高潮喷水抽搐中文字幕| 久久青草综合色| 久久人妻熟女aⅴ| 日韩一区二区三区影片| 久久性视频一级片| 欧美亚洲日本最大视频资源| 国产麻豆69| 久久精品aⅴ一区二区三区四区| 男女国产视频网站| 1024香蕉在线观看| 国产成人av激情在线播放| 中文字幕另类日韩欧美亚洲嫩草| 建设人人有责人人尽责人人享有的| 国产一区二区在线观看av| 午夜福利一区二区在线看| 在线观看免费高清a一片| 亚洲av欧美aⅴ国产| 中文字幕制服av| 欧美日韩亚洲国产一区二区在线观看 | 亚洲精品久久午夜乱码| 肉色欧美久久久久久久蜜桃| 亚洲精品在线美女| 各种免费的搞黄视频| 亚洲,欧美精品.| 91九色精品人成在线观看| 亚洲激情五月婷婷啪啪| 国产在线一区二区三区精| av一本久久久久| 亚洲av电影在线进入| 少妇 在线观看| 亚洲国产av影院在线观看| 国产免费av片在线观看野外av| 热re99久久国产66热| 日韩人妻精品一区2区三区| 成年av动漫网址| 法律面前人人平等表现在哪些方面 | 久久久国产一区二区| 在线精品无人区一区二区三| 老司机深夜福利视频在线观看 | 丝袜喷水一区| 午夜免费鲁丝| 永久免费av网站大全| 纯流量卡能插随身wifi吗| 免费久久久久久久精品成人欧美视频| 亚洲中文av在线| 九色亚洲精品在线播放| 国产精品秋霞免费鲁丝片| 国产欧美日韩一区二区三 | 国产在线免费精品| 国产精品99久久99久久久不卡| 午夜老司机福利片| kizo精华| 91九色精品人成在线观看| 91国产中文字幕| 国产又色又爽无遮挡免| 亚洲av成人一区二区三| 黄片大片在线免费观看| 亚洲成人免费av在线播放| 精品一区二区三区av网在线观看 | 亚洲美女黄色视频免费看| 在线观看人妻少妇| 高潮久久久久久久久久久不卡| 满18在线观看网站| 三上悠亚av全集在线观看| 国产男女内射视频| 精品久久久久久久毛片微露脸 | 免费观看av网站的网址| 亚洲中文字幕日韩| 成年女人毛片免费观看观看9 | 成人国产一区最新在线观看| 国产人伦9x9x在线观看| 99精国产麻豆久久婷婷| 婷婷成人精品国产| 午夜久久久在线观看| 精品久久久久久久毛片微露脸 | 男女下面插进去视频免费观看| 999久久久国产精品视频| 国产亚洲午夜精品一区二区久久| 美女高潮喷水抽搐中文字幕| 人妻人人澡人人爽人人| 国产av又大| 日韩 欧美 亚洲 中文字幕| 精品少妇久久久久久888优播| 91av网站免费观看| 欧美日韩亚洲高清精品| av一本久久久久| 免费观看人在逋| 纯流量卡能插随身wifi吗| 欧美国产精品一级二级三级| 亚洲九九香蕉| 天堂俺去俺来也www色官网| 色综合欧美亚洲国产小说| 国产在线免费精品| 一边摸一边做爽爽视频免费| 色婷婷av一区二区三区视频| 91精品三级在线观看| 97人妻天天添夜夜摸| 欧美日韩一级在线毛片| 欧美在线黄色| 亚洲av成人一区二区三| tocl精华| 国产免费av片在线观看野外av| 亚洲欧美清纯卡通| 69精品国产乱码久久久| 国产精品久久久人人做人人爽| 无限看片的www在线观看| 一区在线观看完整版| 午夜福利一区二区在线看| 欧美乱码精品一区二区三区| 亚洲一卡2卡3卡4卡5卡精品中文| 久久毛片免费看一区二区三区| 亚洲精品国产av成人精品| 99热国产这里只有精品6|