• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    一種基于聚類提升的不平衡數(shù)據(jù)分類算法

    2014-07-18 11:14:39胡小生張潤晶鐘
    集成技術(shù) 2014年2期
    關(guān)鍵詞:代價分類器聚類

    胡小生張潤晶鐘 勇

    1(佛山科學(xué)技術(shù)學(xué)院電子與信息工程學(xué)院 佛山 528000)

    2(佛山科學(xué)技術(shù)學(xué)院信息與教育技術(shù)中心 佛山 528000)

    一種基于聚類提升的不平衡數(shù)據(jù)分類算法

    胡小生1張潤晶2鐘 勇1

    1(佛山科學(xué)技術(shù)學(xué)院電子與信息工程學(xué)院 佛山 528000)

    2(佛山科學(xué)技術(shù)學(xué)院信息與教育技術(shù)中心 佛山 528000)

    不平衡數(shù)據(jù)分類是機器學(xué)習(xí)研究領(lǐng)域中的一個熱點問題。針對傳統(tǒng)分類算法處理不平衡數(shù)據(jù)的少數(shù)類識別率過低問題,文章提出了一種基于聚類的改進(jìn) AdaBoost 分類算法。算法首先進(jìn)行基于聚類的欠采樣,在多數(shù)類樣本上進(jìn)行 K 均值聚類,之后提取聚類質(zhì)心,與少數(shù)類樣本數(shù)目一致的聚類質(zhì)心和所有少數(shù)類樣本組成新的平衡訓(xùn)練集。為了避免少數(shù)類樣本數(shù)量過少而使訓(xùn)練集過小導(dǎo)致分類精度下降,采用少數(shù)過采樣技術(shù)過采樣結(jié)合聚類欠采樣。然后,借鑒代價敏感學(xué)習(xí)思想,對 AdaBoost 算法的基分類器分類誤差函數(shù)進(jìn)行改進(jìn),賦予不同類別樣本非對稱錯分損失。實驗結(jié)果表明,算法使模型訓(xùn)練樣本具有較高的代表性,在保證總體分類性能的同時提高了少數(shù)類的分類精度。

    不平衡數(shù)據(jù)分類;K 均值聚類;AdaBoost;集成學(xué)習(xí)

    1 引 言

    不平衡數(shù)據(jù)集是指在一個數(shù)據(jù)集中,某些類的數(shù)量遠(yuǎn)遠(yuǎn)大于其他類別的數(shù)量,其中類別數(shù)量多的為多數(shù)類,類別數(shù)量少的為少數(shù)類。在現(xiàn)實應(yīng)用領(lǐng)域中,廣泛存在著不平衡數(shù)據(jù)集:文本分類、醫(yī)療診斷、信用卡詐騙檢測和網(wǎng)絡(luò)入侵檢測等,在處理這些情況的過程中,少數(shù)類的識別準(zhǔn)確率更為重要,其錯分代價更大。傳統(tǒng)分類方法為保證總體分類精度,通常將少數(shù)類誤分到多數(shù)類來保證整體分類精度,實際分類效果并不理想。因此,如何有效地對不平衡數(shù)據(jù)進(jìn)行分類是當(dāng)今機器學(xué)習(xí)和數(shù)據(jù)挖掘領(lǐng)域研究的一個熱點問題。

    鑒于不平衡數(shù)據(jù)分類的重要性,國內(nèi)外學(xué)者進(jìn)行了大量研究,現(xiàn)有的不平衡數(shù)據(jù)處理方法主要有兩個方面:

    (1)數(shù)據(jù)層面,改變數(shù)據(jù)的分布。最簡單的兩種方法是隨機過采樣(Oversampling)和隨機欠采樣(Undersampling),前者對少數(shù)類樣本復(fù)制使數(shù)據(jù)分布相對平衡,后者通過抽取一部分多數(shù)類樣本達(dá)到數(shù)據(jù)平衡目的。兩者各有缺點:過采樣通過不斷復(fù)制少數(shù)類而使數(shù)據(jù)規(guī)模變大,使分類器學(xué)習(xí)到的決策域變小,從而容易導(dǎo)致過擬合的問題;欠采樣由于抽取部分多數(shù)類樣本使信息丟失嚴(yán)重。目前,很多學(xué)者提出改進(jìn)的數(shù)據(jù)采樣方法[1-5]。為了避免隨機過采樣的不足,Chawla等[1]提出一種少數(shù)過采樣技術(shù)(Synthetic Minority Oversampling Technique,SMOTE)算法,通過采用少數(shù)類樣本合成技術(shù)產(chǎn)生新的樣本,該算法可使少數(shù)類具有更大的泛化空間,但也可能導(dǎo)致分類器過于擬合,同時不可避免地會產(chǎn)生噪音樣例或者邊際樣例?;诖?,Batista 等提出了 SMOTE 與 Tomek links[2]相結(jié)合的數(shù)據(jù)平衡方法[3]。Yen 等[4]提出了一種基于聚類的抽樣方法SBC(Undersampling Based on Clustering)。SBC通過聚類后簇內(nèi)的多數(shù)類與少數(shù)類的比例確定抽樣參數(shù),但該算法忽略了數(shù)據(jù)分布的特征,導(dǎo)致樣本代表性差,不能反映原始數(shù)據(jù)的分布。蔣盛益等[5]提出了一趟聚類的數(shù)據(jù)下抽樣算法,根據(jù)訓(xùn)練樣本聚類后簇的特征與數(shù)據(jù)傾斜程度確定抽樣比例,該方法較好地保持了少數(shù)類信息,縮小了數(shù)據(jù)分布的差異,提高了分類的性能,但該方法面臨著如何自適應(yīng)確定抽樣比例參數(shù)以對不同密度的簇分離的問題。

    (2)算法層面,修改已有的分類算法或者提出新的算法。代價敏感學(xué)習(xí)、主動學(xué)習(xí)、集成學(xué)習(xí)以及單類別學(xué)習(xí)等,是處理不平衡數(shù)據(jù)集的常見算法[6-8]。其中,代價敏感學(xué)習(xí)賦予各個類別不同的錯分代價,研究表明代價敏感學(xué)習(xí)和不平衡數(shù)據(jù)學(xué)習(xí)之間存在很強的聯(lián)系,代價敏感學(xué)習(xí)的相關(guān)理論和算法可以用來解決不平衡數(shù)據(jù)的學(xué)習(xí)問題[9]。集成學(xué)習(xí)通過對多個分類器的分類識別結(jié)果進(jìn)行融合能很好地提高單一目標(biāo)的分類識別效果,作為集成學(xué)習(xí)方法的 boosting 提升技術(shù)用于提高分類性能,無論數(shù)據(jù)集是否平衡,都可以通過 boosting 迭代創(chuàng)建集成模型,提升弱分類器的性能。當(dāng)前,將 boosting 技術(shù)應(yīng)用于不平衡數(shù)據(jù)分類主要有兩類:一種將代價敏感學(xué)習(xí)和 boosting 技術(shù)相結(jié)合,例如 AdaCost[10]和RareBoost[11];另一類是將數(shù)據(jù)采樣處理方法和boosting 技術(shù)相結(jié)合,例如 SMOTEBoost[12]。

    本文提出一種融合無監(jiān)督聚類和 boosting 提升技術(shù)的不平衡數(shù)據(jù)分類算法——基于聚類改進(jìn)AdaBoost 分類算法。為了研究方便,本文主要關(guān)注二分類情況,少數(shù)類也稱為正類,多數(shù)類稱為負(fù)類,而正類、負(fù)類的類別標(biāo)簽取值分別為{+ 1,—1}。算法首先進(jìn)行基于聚類的欠采樣,在負(fù)類樣本上進(jìn)行 K 均值聚類,使聚類數(shù)量與正類樣本數(shù)量相同。之后每個聚類得到聚類質(zhì)心,將所有的聚類質(zhì)心與正類樣本組成平衡的訓(xùn)練集,參與后續(xù)改進(jìn) AdaBoost 算法的訓(xùn)練。最后借鑒代價敏感學(xué)習(xí)思想,對 AdaBoost 錯分的正類樣本賦予更大的錯分代價,進(jìn)而修改了各個基分類器的輸出決策權(quán)重,最終得到分類集成學(xué)習(xí)模型。

    2 基于聚類的數(shù)據(jù)欠采樣

    對于不平衡數(shù)據(jù)集,對負(fù)類樣本進(jìn)行欠采樣和在正類進(jìn)行過采樣均能改變數(shù)據(jù)分布,使數(shù)據(jù)達(dá)到平衡。但仍存在缺點:過采樣容易導(dǎo)致過度擬合問題,欠采樣則會引起信息丟失。為了抽取最具代表的訓(xùn)練樣本,需對樣本進(jìn)行劃分。本文選取 K 均值聚類方法進(jìn)行欠采樣,將訓(xùn)練集中的負(fù)類樣本聚類為 k 個不相交的子集,然后,在各子集上提取最富有代表性的樣本信息,與正類樣本組成新的平衡訓(xùn)練集。

    本方法首先提取訓(xùn)練集中的正類樣本個數(shù)k,并以 k 為聚類中心數(shù)目對訓(xùn)練集中所有的負(fù)類樣本進(jìn)行 K 均值聚類,提取 k 個聚類質(zhì)心?!柏?fù)”類樣本的 k 個聚類質(zhì)心加上所有的正類樣本組成一個新的平衡訓(xùn)練集。

    獲取聚類質(zhì)心的具體流程如下:

    算法 1 聚類欠采樣算法:

    輸入:數(shù)據(jù)集 D

    輸出:平衡的訓(xùn)練集 Dtrain

    (1)S=pre_process[D]; // 數(shù)據(jù)預(yù)處理

    (2)train[S]=隨機取數(shù)據(jù)集 S 中的 80% 樣本,test[S]=S 中剩余的 20% 樣本;

    (3)提取 train[S] 中正、負(fù)類樣本集合 S+、S—,計算 S+中正類樣本數(shù)量 k,令 K=k;

    (4)對集合 S—的樣本進(jìn)行 K 均值聚類,得到k 個不相交子集及其聚類質(zhì)心;

    (5)提取 k 個聚類質(zhì)心記為集合 S';

    由于數(shù)據(jù)集中的屬性一般有連續(xù)型和分類型兩種,因此,在算法 1 的第一步須進(jìn)行數(shù)據(jù)預(yù)處理 pre_process() 過程。具體方法為:對于數(shù)據(jù)集中的分類型屬性,采用二進(jìn)制編碼方式進(jìn)行轉(zhuǎn)換,將分類型的屬性轉(zhuǎn)換為若干個取值 0 和 1 的屬性;而對于連續(xù)型屬性,為了消除不同量綱所造成的影響,對輸入數(shù)據(jù)進(jìn)行最大最小歸一化處理,進(jìn)而將所有數(shù)據(jù)歸一化到[0,1]之間,其公式如下所示:

    其中,分別表示特征 A 上數(shù)據(jù)的最大值和最小值。

    算法 1 的實質(zhì)是為了組成一個新的平衡數(shù)據(jù)集,對負(fù)類樣本進(jìn)行聚類壓縮,由聚類的質(zhì)心代表聚類的所有樣本。此方法對大規(guī)模數(shù)據(jù)(正類樣本數(shù)量比較大)能取得較好的效果,但若在正類樣本數(shù)量很小時,單純使用此方法將會導(dǎo)致輸出的平衡訓(xùn)練集過小而難以到達(dá)理想的分類精度。針對此問題,提出一個將 SMOTE 與聚類欠采樣相結(jié)合方法,在過采樣與欠采樣之間尋找一個平衡點。其中,SMOTE 通過生成合成樣本對正類樣本進(jìn)行過采樣。具體為:對于每個正類樣本 x,在其同類中查找 n 個近鄰,根據(jù)上采樣的倍率 N,在樣本 x 和被選中的近鄰樣本之間進(jìn)行隨機插值,生成新的樣本。

    3 AdaBoost 算法及其改進(jìn)

    3.1 AdaBoost 算法簡介

    AdaBoost 算法是一種典型的集成學(xué)習(xí)算法,可以有效提高單一學(xué)習(xí)器的泛化能力。它首先賦予訓(xùn)練集中每個訓(xùn)練樣例相同的初始權(quán)重,然后通過若干輪訓(xùn)練得到若干弱分類器,在每一輪訓(xùn)練結(jié)束后,增加沒有正確分類的樣本的權(quán)值,減少正確分類的樣本的權(quán)重,使系統(tǒng)在下一輪訓(xùn)練中更加關(guān)注那些分類錯誤的樣本,最后這些弱分類器通過加權(quán)集成為一個強分類器完成分類任務(wù)。算法中每個基分類器的投票權(quán)值計算如下:

    子分類器 ht形成后,實例樣本的權(quán)重更新公式如下:

    3.2 AdaBoost 算法改進(jìn)

    在 AdaBoost 算法中,每個基分類器的投票權(quán)重是基于總體的誤分情況,目的是減少平均誤分率,也就是提高總體分類正確率。對于類別平衡的數(shù)據(jù)集來說,這種學(xué)習(xí)方法是可靠的。然而對于類別不平衡數(shù)據(jù)集,單純地追求基分類器的分類精度,對合成分類器的分類效果影響并不直接。因此為了在總體上獲得較高的精度,分離器通常傾向于忽視數(shù)量較少的正類樣本,結(jié)果使得到的分類器在正類上識別效果差。而在實際中,正類樣本的識別往往是最需要關(guān)注的。因此,本文考慮對 AdaBoost 算法中基分類器的投票權(quán)重進(jìn)行改進(jìn),使其充分考慮到正類的樣本數(shù)據(jù)。

    改進(jìn) AdaBoost 算法基分類器的投票權(quán)重具體做法是對公式(3)中的 εt的定義計算方式進(jìn)行修改,進(jìn)而改變了基分類器的輸出投票權(quán)重 at。改進(jìn)方法實質(zhì)是借鑒代價敏感學(xué)習(xí)思想,對基分類器的誤分代價在各個類別上不再一視同仁,對正類樣本的錯分,賦予更大的誤分代價。假設(shè)原始訓(xùn)練集的不平衡度為 r,r=負(fù)類樣本數(shù)量/正類樣本數(shù)量,則修改公式(3):

    公式(6)與公式(3)相比,在計算分類器的誤分代價時,對每個樣本實例的誤分代價乘上一個系數(shù)當(dāng)樣本為負(fù)類時,樣本誤分代價與初始算法相比不變;當(dāng)樣本為正類時,樣本誤分代價需乘上系數(shù) r。公式(6)表明,當(dāng)某個基分類器誤分較多正類樣本時,其誤分總代價 εt增大,相應(yīng)在最終決策輸出時其投票權(quán)重 at值變小。

    4 實驗結(jié)果及分析

    4.1 數(shù)據(jù)集

    通常情況下,將不平衡度在[1.5, 3.5)、[3.5, 9.5)、[9.5, +∞ )分別稱為低度不平衡范圍、中度不平衡范圍和高度不平衡范圍。為了評估算法的性能,選擇 8 組具有不同實際應(yīng)用背景的不同平衡度的 UCI 數(shù)據(jù),如表 1 所示。對于含有多個類別的數(shù)據(jù),采用與其他文獻(xiàn)相似的方法:將其中的一類作為少數(shù)類,合并剩下的各個類別成為一個整體為多數(shù)類。例如,將 page-blocks 的類別5 作為少數(shù)類,合并其他的類作為多數(shù)類。

    4.2 評價標(biāo)準(zhǔn)

    在傳統(tǒng)的分類學(xué)習(xí)中,一般采用分類精度(分類正確的樣本個數(shù)占總樣本個數(shù)的百分比)作為評價指標(biāo),然而對于不平衡數(shù)據(jù)集,這一指標(biāo)實際意義不大,因為它反映的是多數(shù)類樣本的分類測試結(jié)果。針對不平衡數(shù)據(jù),很多學(xué)者提出建立在混淆矩陣基礎(chǔ)上的 F-measure、G-mean 等評價指標(biāo)[13],混淆矩陣如下表 2 所示。

    表 1 UCI 數(shù)據(jù)集Table 1. UCI datasets

    表 2 混淆矩陣Table 2. Confusion matrix

    在某些應(yīng)用中,人們更加關(guān)注少數(shù)類樣本的分類性能,F(xiàn)-measure 就是用于衡量少數(shù)類分類性能的指標(biāo)。F-measure 是查全率(recall)和查準(zhǔn)率(precision)的調(diào)和均值,其取值接近兩者的較小者,因此,較大 F-measure 值表示 recall 和precision 都較大:

    G-mean 是一種衡量分類器整體分類性能的評價指標(biāo),其定義如下:

    從定義中可以看出,G-mean 兼顧了少數(shù)類和多數(shù)類精度的平均,在保持正、負(fù)類分類精度平衡的情況下最大化兩類的精度,能夠反映出分類器的整體性能。

    本文采用 F-measure 和 G-mean 作為評價標(biāo)準(zhǔn)。其中,使用 F-measure 來衡量正類的分類性能,而使用 G-mean 來衡量整體分類性能。

    4.3 實驗結(jié)果

    在 weka3.6.3 環(huán)境下對本文算法進(jìn)行了驗證,并且與傳統(tǒng)的分類算法 AdaBoost、SMOTEBoost 和 RUSBoost 進(jìn)行了比較,相關(guān)結(jié)果如表 3 和表 4 所示。實驗中,AdaBoost、SMOTEBoost 和 RUSBoost 算法的基分類器均采用 J48 算法,本文所提算法的基分類器則采用在小樣本平衡集上分類性能表現(xiàn)優(yōu)異的支持向量機(Support Vector Machine)算法。為比較方便起見,實驗中對數(shù)據(jù)采用五折交叉驗證(5-fold cross-validation)方式。為了保證數(shù)據(jù)在進(jìn)行分組過程中不平衡度保持一致,采用分層采樣方式,即:將數(shù)據(jù)集中的正類樣本和負(fù)類樣本分別隨機分為 5 等份,兩兩隨機組合得到 5 個大小一致的子集,將其中一份作為測試集,其余 4 個子集作為訓(xùn)練集,重復(fù) 5 次,以平均值作為最終的分類結(jié)果。

    從表 3 可以看出,在少數(shù)類的識別評價度量 F-measure 值方面,本文算法具有明顯優(yōu)勢:8 組 UCI 數(shù)據(jù)集中的 6 組精度最高,特別是在高度不平衡度的 nuersery、page-blocks 數(shù)據(jù)集上,與所比較的三種算法中的最優(yōu)算法有 5% 以上的精度提升。與傳統(tǒng) AdaBoost 算法相比,在低不平衡度條件下,本文算法與之差異不明顯,但隨著不平衡度的增加,本文算法精度較高,例如在 letter、nursery、page-blocks 數(shù)據(jù)集上分別有30.7%、19.8%、31.1% 的提升。另外,隨著數(shù)據(jù)集不平衡度的增加,數(shù)據(jù)采樣方法與 Boost 技術(shù)相結(jié)合的提升方法中,SMOTEBoost 算法的少數(shù)類識別性能比 RUSBoost 算法更好。

    表 3 各種方法的 F-measure 值比較Table 3. F-measure values on test datasets

    表 4 各種方法的 G-mean 值比較Table 4. G-mean values on test datasets

    表 4 給出了體現(xiàn)分類器對不平衡數(shù)據(jù)集的整體分類效果的評價。從中可以看出,在低度不平衡度和中度不平衡度條件下,本文算法的G-mean 值在整體上最優(yōu);而在高度不平衡條件下,G-mean 值度量指標(biāo)稍遜于所比較的算法,主要原因是在高度不平衡范圍下,所比較的三類算法中的分類器傾向于忽略正類樣本,在降低了體現(xiàn)少數(shù)類識別準(zhǔn)確率的 F-measure 值情況下,提高了整體分類性能的 G-mean 值。

    5 結(jié)束語

    本文提出一種在無監(jiān)督聚類基礎(chǔ)上的改進(jìn)AdaBoost 算法用于處理不平衡數(shù)據(jù)分類。該方法首先進(jìn)行基于聚類的欠采樣處理,對初始訓(xùn)練集上的負(fù)類樣本進(jìn)行無監(jiān)督的 K 均值聚類;同時借鑒代價敏感學(xué)習(xí)思想,對 AdaBoost 算法進(jìn)行了改進(jìn),對基分類器的不同類別樣本分類誤分賦予不對稱代價,在損失一定程度多數(shù)類分類性能的情況下,提高少數(shù)類的分類精度,以更符合實際的應(yīng)用情況。實驗結(jié)果表明,該方法在顯著降低實際參與模型訓(xùn)練樣本數(shù)量的同時,能夠取得不錯的分類性能,為大規(guī)模不平衡數(shù)據(jù)集分類問題提供了一種新的方法。

    由于數(shù)據(jù)集本身的多樣性和復(fù)雜性,樣本的分布也呈現(xiàn)多樣性,如果能實現(xiàn)估計正負(fù)類樣本潛在的分布,根據(jù)不同的潛在分布設(shè)置不同的聚類方式,對算法的分類性能將會提高更多。

    [1] Chawla NV, Bowyer KW, Hall LO, et al. SMOTE: synthetic minority over-sampling technique [J]. Journal of Artificial Intelligence Research, 2002, 16(1): 321-357.

    [2] Tomek I. Two modifications of CNN [J]. IEEE Transactions on Systems, Man and Communications, 1976, 6(11): 769-772.

    [3] Batista GE, Prati RC, Monard MC. A study of the behavior of several methods for balancing machine learning training data [J]. ACM SIGKDD Explorations Newsletter, 2004, 6(1): 20-29.

    [4] Yen SJ, Lee YS. Under-sampling approaches for improving prediction of the minority class in an imbalanced dataset [C] // International Conference on Intelligent Computing, Lecture Notes in Control and Information Sciences, 2006: 731-740.

    [5] 蔣盛益, 苗邦, 余雯. 基于一趟聚類的不平衡數(shù)據(jù)下抽樣算法 [J]. 小型微型計算機系統(tǒng), 2012, 33(2): 232-236.

    [6] He HB, Garcia EA. Learning from imbalanced data [J]. IEEE Transactions on Knowledge and Data Engineering, 2009, 21(9): 1263-1284.

    [7] 翟云, 楊炳儒, 曲武. 不平衡類數(shù)據(jù)挖掘研究綜述 [J]. 計算機科學(xué), 2010, 37(10): 27-32.

    [8] 李雄飛, 李軍, 董元方, 等. 一種新的不平衡數(shù)據(jù)學(xué)習(xí)算法 PCBoost [J]. 計算機學(xué)報, 2012, 35(2): 202-209.

    [9] 凌曉峰, Sheng VS. 代價敏感分類器的比較研究 [J]. 計算機學(xué)報, 2007, 30(8): 1203-1212.

    [10] Fan W, Stolfo S, Zhang J, et al. AdaCost: misclassification cost-sensitive boosting [C] // Proceedings of the 16th International Conference on Machine Learning, 1999: 97-105.

    [11] Joshi MV, Kumar V, Agarwal RC. Evaluating boosting algorithms to classify rare classes: comparison and improvements [C] // Proceedings of the 1st IEEE International Conference on Data Mining, 2001: 257-264.

    [12] Chawla NV, Lazarevic A, Hall LO, et al. SMOTEBoost: improving prediction of the minority class in boosting [C] // Proceedings of the 7th European Conference Principles and Practice of Knowledge Discovery in Databases, 2003: 107-119.

    [13] 林智勇, 郝志峰, 楊曉偉. 若干評價準(zhǔn)則對不平衡數(shù)據(jù)學(xué)習(xí)的影響 [J]. 華南理工大學(xué)學(xué)報(自然科學(xué)版), 2010, 4(38): 126-135.

    A Clustering-Based Enhanced Classification Algorithm for Imbalanced Data

    HU Xiaosheng1ZHANG Runjing2ZHONG Yong1

    1( College of Electronic and Information Engineering, Foshan University, Foshan 528000, China )
    2( Information and Education Technology Center, Foshan University, Foshan 528000, China )

    Imbalanced data exist widely in the real world and their classification is a hot topic in the field of machine learning. A clustering-based enhanced AdaBoost algorithm was proposed to improve the poor classification performance produced by the traditional algorithm in classifying the minority class of imbalanced datasets. The algorithm firstly constructs balanced training sets by the clustering-based undersampling, using K-means clustering to cluster the majority class and extract cluster centroids and then merge with all minority class instances to generate a new balanced training set. To avoid the declining of the classification accuracy caused by the shortage of training sets owing to too few minority class samples, SMOTE (Synthetic Minority Oversampling Technique) combining the clustering-based undersampling was used. Next, the misclassification loss function in the basic classifier of the AdaBoost algorithm was modified based on the costsensitive learning theory to assign asymmetric misclassification losses to samples of different classes. The experimental results show that, the proposed algorithm makes the model training samples more representative and greatly increases the classification accuracy of the minority class, keeping the overall classification performance.

    imbalanced data classification; K-mean clustering; AdaBoost; ensemble learning

    TP 18

    A

    2013-08-22

    廣東高校優(yōu)秀青年創(chuàng)新人才培養(yǎng)項目(2013LYM_0097);佛山市智能教育評價指標(biāo)體系研究(DX20120220);佛山科學(xué)技術(shù)學(xué)院校級科研項目。

    胡小生(通訊作者),碩士,講師,高級工程師,研究方向為機器學(xué)習(xí)和數(shù)據(jù)挖掘,E-mail:feihu@fosu.edu.cn ;張潤晶,高級工程師,研究方向為信息檢索和信息安全;鐘勇,博士,教授,研究方向為信息安全、信息檢索和云計算。

    猜你喜歡
    代價分類器聚類
    BP-GA光照分類器在車道線識別中的應(yīng)用
    電子測試(2018年1期)2018-04-18 11:52:35
    愛的代價
    海峽姐妹(2017年12期)2018-01-31 02:12:22
    基于DBSACN聚類算法的XML文檔聚類
    電子測試(2017年15期)2017-12-18 07:19:27
    代價
    加權(quán)空-譜與最近鄰分類器相結(jié)合的高光譜圖像分類
    結(jié)合模糊(C+P)均值聚類和SP-V-支持向量機的TSK分類器
    基于改進(jìn)的遺傳算法的模糊聚類算法
    成熟的代價
    一種層次初始的聚類個數(shù)自適應(yīng)的聚類方法研究
    基于LLE降維和BP_Adaboost分類器的GIS局部放電模式識別
    天天一区二区日本电影三级| 国产精品人妻久久久久久| 免费观看的影片在线观看| 午夜福利欧美成人| 国产伦一二天堂av在线观看| 99久国产av精品| 日韩欧美精品免费久久| 国产精品人妻久久久影院| 婷婷精品国产亚洲av在线| 欧美不卡视频在线免费观看| 亚洲久久久久久中文字幕| 欧美在线一区亚洲| 色噜噜av男人的天堂激情| 国产高清不卡午夜福利| 男女那种视频在线观看| 免费人成视频x8x8入口观看| 深夜精品福利| 最好的美女福利视频网| 成人特级黄色片久久久久久久| 真人做人爱边吃奶动态| 精品一区二区三区av网在线观看| 国产精华一区二区三区| 亚洲最大成人av| 久久精品久久久久久噜噜老黄 | 国产aⅴ精品一区二区三区波| 亚洲va在线va天堂va国产| 国国产精品蜜臀av免费| 久久精品久久久久久噜噜老黄 | 日日摸夜夜添夜夜添小说| 如何舔出高潮| 男插女下体视频免费在线播放| 在线免费观看的www视频| 中文亚洲av片在线观看爽| 欧美人与善性xxx| 国内精品久久久久精免费| 一级av片app| a在线观看视频网站| 九九热线精品视视频播放| 日韩精品有码人妻一区| 全区人妻精品视频| 国产伦精品一区二区三区四那| 久久久久性生活片| 中文字幕熟女人妻在线| 久久久精品大字幕| 久久久久久久精品吃奶| 日本 av在线| 日本成人三级电影网站| av黄色大香蕉| 好男人在线观看高清免费视频| 免费看美女性在线毛片视频| 免费av毛片视频| 悠悠久久av| 亚洲性久久影院| 特大巨黑吊av在线直播| 给我免费播放毛片高清在线观看| 精品久久国产蜜桃| 美女免费视频网站| 精品一区二区三区视频在线观看免费| 日日摸夜夜添夜夜添av毛片 | 免费观看在线日韩| 啦啦啦韩国在线观看视频| 一级av片app| 一本一本综合久久| 欧美性感艳星| 久久这里只有精品中国| 日本五十路高清| av在线蜜桃| 国产探花极品一区二区| 国产探花在线观看一区二区| 欧美高清成人免费视频www| 在线免费观看不下载黄p国产 | 国产毛片a区久久久久| 免费在线观看日本一区| 亚洲avbb在线观看| 狂野欧美白嫩少妇大欣赏| 嫩草影院入口| 国产精品爽爽va在线观看网站| 日韩欧美一区二区三区在线观看| 村上凉子中文字幕在线| 日韩欧美 国产精品| 在线a可以看的网站| 日本一本二区三区精品| 国产精品国产三级国产av玫瑰| 一a级毛片在线观看| 尾随美女入室| 午夜影院日韩av| 看十八女毛片水多多多| 午夜免费男女啪啪视频观看 | 麻豆国产av国片精品| 欧美成人a在线观看| 国产精品精品国产色婷婷| 色吧在线观看| 婷婷六月久久综合丁香| 免费看a级黄色片| 亚洲人成网站在线播放欧美日韩| 欧美激情国产日韩精品一区| 老熟妇乱子伦视频在线观看| 99热精品在线国产| 国产v大片淫在线免费观看| 中文字幕精品亚洲无线码一区| 成人性生交大片免费视频hd| 色精品久久人妻99蜜桃| 美女xxoo啪啪120秒动态图| 精品午夜福利在线看| 男女做爰动态图高潮gif福利片| 国产真实伦视频高清在线观看 | 深爱激情五月婷婷| 国产一区二区激情短视频| 国产蜜桃级精品一区二区三区| 在线观看一区二区三区| 少妇被粗大猛烈的视频| 婷婷精品国产亚洲av在线| 91午夜精品亚洲一区二区三区 | 99国产精品一区二区蜜桃av| 久久久久久国产a免费观看| 国产一区二区激情短视频| 国产男人的电影天堂91| 久久婷婷人人爽人人干人人爱| 日韩欧美精品v在线| 免费看a级黄色片| 2021天堂中文幕一二区在线观| av天堂在线播放| 神马国产精品三级电影在线观看| 日日啪夜夜撸| 大型黄色视频在线免费观看| 在线播放国产精品三级| 18禁裸乳无遮挡免费网站照片| 日本a在线网址| 女人十人毛片免费观看3o分钟| 一个人观看的视频www高清免费观看| 亚洲国产精品成人综合色| 日本免费a在线| 天美传媒精品一区二区| 听说在线观看完整版免费高清| 日韩强制内射视频| 哪里可以看免费的av片| 亚洲熟妇中文字幕五十中出| 十八禁网站免费在线| 国产精品一区二区三区四区久久| 长腿黑丝高跟| 色哟哟·www| 国产精品三级大全| eeuss影院久久| 精品一区二区三区人妻视频| 看片在线看免费视频| 久久久国产成人精品二区| 午夜激情欧美在线| 亚洲一区高清亚洲精品| 一进一出抽搐动态| 18禁黄网站禁片午夜丰满| 热99re8久久精品国产| xxxwww97欧美| 欧美色欧美亚洲另类二区| 成年女人毛片免费观看观看9| 久久99热6这里只有精品| 熟女人妻精品中文字幕| 无人区码免费观看不卡| 在线看三级毛片| 简卡轻食公司| bbb黄色大片| 国产日本99.免费观看| 97超级碰碰碰精品色视频在线观看| 亚洲欧美激情综合另类| 日本撒尿小便嘘嘘汇集6| 人妻久久中文字幕网| 精品日产1卡2卡| 九九爱精品视频在线观看| 精品久久久久久成人av| 人妻久久中文字幕网| 精品久久久久久成人av| 精品久久久久久久久久免费视频| 亚洲人成网站高清观看| 中文字幕av在线有码专区| 国产av麻豆久久久久久久| 尾随美女入室| 天天一区二区日本电影三级| 亚洲av五月六月丁香网| 亚洲经典国产精华液单| 九九在线视频观看精品| 在线观看av片永久免费下载| 亚洲成人精品中文字幕电影| 3wmmmm亚洲av在线观看| 男女做爰动态图高潮gif福利片| 97超视频在线观看视频| 精品久久久久久久久av| 黄色视频,在线免费观看| 国产国拍精品亚洲av在线观看| 中文字幕熟女人妻在线| 免费大片18禁| 极品教师在线免费播放| 久久久久久久午夜电影| 黄色女人牲交| 国产精品久久久久久精品电影| 黄色视频,在线免费观看| 国产精品精品国产色婷婷| 欧美黑人欧美精品刺激| 91av网一区二区| av国产免费在线观看| 国产av在哪里看| 国产女主播在线喷水免费视频网站 | 亚洲美女搞黄在线观看 | 乱系列少妇在线播放| 精品欧美国产一区二区三| 别揉我奶头~嗯~啊~动态视频| 97热精品久久久久久| a在线观看视频网站| 久久天躁狠狠躁夜夜2o2o| 一边摸一边抽搐一进一小说| 日本欧美国产在线视频| 俺也久久电影网| 久久久色成人| 亚洲成人久久爱视频| 国内精品久久久久久久电影| 亚洲男人的天堂狠狠| 亚洲图色成人| 国产精品一区二区免费欧美| 真实男女啪啪啪动态图| 亚洲av中文字字幕乱码综合| 日本一本二区三区精品| 精品国内亚洲2022精品成人| 午夜激情福利司机影院| 成人无遮挡网站| 好男人在线观看高清免费视频| 久久久久性生活片| 两人在一起打扑克的视频| 色视频www国产| 99久国产av精品| 99久久成人亚洲精品观看| 免费人成在线观看视频色| 日韩国内少妇激情av| 精品福利观看| 动漫黄色视频在线观看| 日日啪夜夜撸| av国产免费在线观看| 亚洲熟妇中文字幕五十中出| 日韩强制内射视频| 欧美在线一区亚洲| 欧美成人一区二区免费高清观看| 好男人在线观看高清免费视频| 热99re8久久精品国产| 国产精品久久电影中文字幕| 国产在视频线在精品| 中文字幕高清在线视频| 黄色日韩在线| 欧美+亚洲+日韩+国产| 18禁黄网站禁片免费观看直播| 欧美一区二区国产精品久久精品| 日日干狠狠操夜夜爽| 成年人黄色毛片网站| 美女 人体艺术 gogo| aaaaa片日本免费| 久久久久久久久久久丰满 | 免费观看精品视频网站| 在线播放无遮挡| 亚洲av二区三区四区| 永久网站在线| 日韩欧美 国产精品| 国产午夜精品久久久久久一区二区三区 | www.www免费av| 97超级碰碰碰精品色视频在线观看| 欧美成人免费av一区二区三区| 乱码一卡2卡4卡精品| 国产精品不卡视频一区二区| 亚洲国产高清在线一区二区三| 亚洲欧美日韩无卡精品| 亚洲熟妇中文字幕五十中出| 亚洲精品影视一区二区三区av| 成人av在线播放网站| 99热这里只有精品一区| 中文字幕高清在线视频| 白带黄色成豆腐渣| 小说图片视频综合网站| 午夜福利在线在线| 18禁黄网站禁片免费观看直播| 97超视频在线观看视频| 美女xxoo啪啪120秒动态图| 精品欧美国产一区二区三| x7x7x7水蜜桃| 中文在线观看免费www的网站| 级片在线观看| 国产激情偷乱视频一区二区| 国产精品98久久久久久宅男小说| 嫩草影视91久久| 国产精品一及| 精品久久国产蜜桃| 两个人视频免费观看高清| 成年人黄色毛片网站| 欧美3d第一页| 九色国产91popny在线| 国内精品一区二区在线观看| 日韩精品青青久久久久久| 久久中文看片网| 久久亚洲真实| 国产综合懂色| 亚洲va日本ⅴa欧美va伊人久久| 国产白丝娇喘喷水9色精品| 一区二区三区高清视频在线| 九九久久精品国产亚洲av麻豆| a级毛片a级免费在线| 熟女人妻精品中文字幕| 淫妇啪啪啪对白视频| .国产精品久久| 亚洲乱码一区二区免费版| 国国产精品蜜臀av免费| 简卡轻食公司| 日日夜夜操网爽| 欧美最新免费一区二区三区| 国产真实伦视频高清在线观看 | 中文字幕久久专区| 欧美区成人在线视频| 精品国产三级普通话版| 色播亚洲综合网| 91精品国产九色| 国产午夜精品论理片| 国内少妇人妻偷人精品xxx网站| 国产精品国产三级国产av玫瑰| 两个人视频免费观看高清| 91麻豆av在线| 久久久久国产精品人妻aⅴ院| 91av网一区二区| 岛国在线免费视频观看| 女人被狂操c到高潮| 亚洲,欧美,日韩| 久久人人精品亚洲av| or卡值多少钱| 欧美丝袜亚洲另类 | 国产免费av片在线观看野外av| 国产精品精品国产色婷婷| 成人性生交大片免费视频hd| 国产 一区 欧美 日韩| 久久精品国产亚洲av涩爱 | 在线免费观看不下载黄p国产 | 男女下面进入的视频免费午夜| 国产精品日韩av在线免费观看| 美女cb高潮喷水在线观看| 亚洲人成网站在线播| 成人高潮视频无遮挡免费网站| 国产精品无大码| 免费观看人在逋| 美女高潮的动态| 在线播放无遮挡| 国产三级在线视频| 黄色视频,在线免费观看| 国产亚洲欧美98| 日韩在线高清观看一区二区三区 | 国产一区二区在线观看日韩| 校园人妻丝袜中文字幕| 美女高潮的动态| 少妇熟女aⅴ在线视频| 搡老岳熟女国产| 日日干狠狠操夜夜爽| 两人在一起打扑克的视频| 尾随美女入室| av中文乱码字幕在线| 日本免费a在线| 欧美3d第一页| 午夜日韩欧美国产| 色在线成人网| 一个人免费在线观看电影| 国产v大片淫在线免费观看| 欧美人与善性xxx| 亚洲精品日韩av片在线观看| 亚洲av熟女| 欧美高清性xxxxhd video| 色综合色国产| 草草在线视频免费看| 久久久久国内视频| 中文在线观看免费www的网站| 国产一区二区三区视频了| 床上黄色一级片| 乱系列少妇在线播放| 少妇的逼水好多| 深夜a级毛片| 欧美激情在线99| 99热这里只有精品一区| 网址你懂的国产日韩在线| 国产男人的电影天堂91| 精品无人区乱码1区二区| 国产精品99久久久久久久久| 少妇被粗大猛烈的视频| 日韩高清综合在线| x7x7x7水蜜桃| 久久久久久久久久久丰满 | 欧美xxxx黑人xx丫x性爽| 成人三级黄色视频| 久久香蕉精品热| 一个人看的www免费观看视频| 免费在线观看影片大全网站| 变态另类丝袜制服| 国产视频内射| 黄色配什么色好看| 黄色女人牲交| 久久久久九九精品影院| 精品国内亚洲2022精品成人| 久久热精品热| 极品教师在线免费播放| 老司机午夜福利在线观看视频| 又黄又爽又免费观看的视频| 国产主播在线观看一区二区| 俺也久久电影网| 国产在线男女| 精品国产三级普通话版| 美女cb高潮喷水在线观看| 成人综合一区亚洲| 日韩一本色道免费dvd| 午夜亚洲福利在线播放| 欧美极品一区二区三区四区| 国产精品98久久久久久宅男小说| 天堂动漫精品| 一级av片app| 欧美区成人在线视频| 亚洲av日韩精品久久久久久密| 极品教师在线视频| 国产精品1区2区在线观看.| 高清日韩中文字幕在线| 精品欧美国产一区二区三| 波多野结衣巨乳人妻| 午夜影院日韩av| 欧美激情在线99| 亚洲精品456在线播放app | 亚洲精品国产成人久久av| 51国产日韩欧美| 日韩欧美在线乱码| 亚洲精品一区av在线观看| 岛国在线免费视频观看| 亚洲人成网站高清观看| 亚洲 国产 在线| 最近中文字幕高清免费大全6 | 干丝袜人妻中文字幕| 亚洲成av人片在线播放无| 亚洲自拍偷在线| 国内精品宾馆在线| 精品国内亚洲2022精品成人| 国产精品无大码| 禁无遮挡网站| 伊人久久精品亚洲午夜| 99久久中文字幕三级久久日本| 国产真实乱freesex| 看十八女毛片水多多多| 日韩精品有码人妻一区| 国产淫片久久久久久久久| 中文字幕高清在线视频| 久久国产乱子免费精品| 成人午夜高清在线视频| 九色国产91popny在线| 国产午夜福利久久久久久| 精品久久久久久久久av| 久久国内精品自在自线图片| 韩国av一区二区三区四区| 亚洲乱码一区二区免费版| 亚洲狠狠婷婷综合久久图片| 久久草成人影院| 成人国产综合亚洲| 亚洲一级一片aⅴ在线观看| 欧美色欧美亚洲另类二区| 亚洲精品一卡2卡三卡4卡5卡| 国产国拍精品亚洲av在线观看| 午夜激情欧美在线| 国内精品一区二区在线观看| 久久久久国内视频| 十八禁国产超污无遮挡网站| 亚洲av中文av极速乱 | 黄色丝袜av网址大全| 又粗又爽又猛毛片免费看| 男女之事视频高清在线观看| 成人亚洲精品av一区二区| 变态另类成人亚洲欧美熟女| 精品久久久久久久久av| 亚洲最大成人中文| 久久欧美精品欧美久久欧美| 午夜福利在线观看吧| 18+在线观看网站| 我的女老师完整版在线观看| 性欧美人与动物交配| 成年女人看的毛片在线观看| 狠狠狠狠99中文字幕| 精品久久久噜噜| 久久亚洲精品不卡| 三级毛片av免费| 亚洲中文字幕日韩| 在线观看美女被高潮喷水网站| 人妻丰满熟妇av一区二区三区| 91av网一区二区| 能在线免费观看的黄片| 精品不卡国产一区二区三区| 嫩草影院精品99| 中文字幕久久专区| 亚洲精品成人久久久久久| 男人和女人高潮做爰伦理| 一个人看的www免费观看视频| 欧美日韩中文字幕国产精品一区二区三区| 九九爱精品视频在线观看| 国产av在哪里看| 国产亚洲av嫩草精品影院| 久久久久国产精品人妻aⅴ院| 91久久精品国产一区二区三区| 精品久久久久久久久久久久久| 无遮挡黄片免费观看| 18禁黄网站禁片午夜丰满| 亚洲av五月六月丁香网| 久久久久久大精品| 男女那种视频在线观看| 在线观看一区二区三区| xxxwww97欧美| 欧美一区二区精品小视频在线| 日韩高清综合在线| 国产精品国产高清国产av| 黄色视频,在线免费观看| a级一级毛片免费在线观看| 国产精品免费一区二区三区在线| 老司机午夜福利在线观看视频| 亚洲专区中文字幕在线| a在线观看视频网站| 99久久九九国产精品国产免费| 淫秽高清视频在线观看| 乱码一卡2卡4卡精品| eeuss影院久久| 两人在一起打扑克的视频| 色哟哟哟哟哟哟| 久久久久国内视频| 国产白丝娇喘喷水9色精品| 狂野欧美激情性xxxx在线观看| 日韩大尺度精品在线看网址| 男人舔女人下体高潮全视频| 精品无人区乱码1区二区| 免费观看在线日韩| 精品久久久久久久末码| 特级一级黄色大片| 狂野欧美激情性xxxx在线观看| 亚洲人成网站高清观看| 久久精品国产清高在天天线| 色av中文字幕| 2021天堂中文幕一二区在线观| 成人av在线播放网站| 午夜福利在线观看免费完整高清在 | 性色avwww在线观看| 又黄又爽又免费观看的视频| 噜噜噜噜噜久久久久久91| 免费观看精品视频网站| 免费电影在线观看免费观看| 又爽又黄a免费视频| 日韩精品有码人妻一区| 老司机午夜福利在线观看视频| 人人妻,人人澡人人爽秒播| 亚洲成人久久爱视频| 国产一区二区三区视频了| 嫁个100分男人电影在线观看| 成年版毛片免费区| 日韩欧美免费精品| 国产午夜精品论理片| 亚洲狠狠婷婷综合久久图片| 免费一级毛片在线播放高清视频| 国产精品一区二区三区四区久久| 国产 一区 欧美 日韩| 日韩欧美三级三区| 99热这里只有是精品50| 高清日韩中文字幕在线| 亚洲美女搞黄在线观看 | 国产一区二区三区视频了| 久久久久久久精品吃奶| 中文资源天堂在线| 最近视频中文字幕2019在线8| 成人精品一区二区免费| 国产一区二区激情短视频| 亚洲三级黄色毛片| 免费高清视频大片| 成人综合一区亚洲| 精品乱码久久久久久99久播| 99久久成人亚洲精品观看| 男女做爰动态图高潮gif福利片| 99久国产av精品| 五月伊人婷婷丁香| 91精品国产九色| 搡老岳熟女国产| 老司机福利观看| 搡老岳熟女国产| 女的被弄到高潮叫床怎么办 | 精品欧美国产一区二区三| 婷婷精品国产亚洲av| 一区二区三区四区激情视频 | 精品午夜福利在线看| 中文在线观看免费www的网站| 一a级毛片在线观看| 成熟少妇高潮喷水视频| 无遮挡黄片免费观看| 国产视频内射| 人人妻人人澡欧美一区二区| 欧美丝袜亚洲另类 | 欧美xxxx黑人xx丫x性爽| 精品不卡国产一区二区三区| 春色校园在线视频观看| 精品一区二区三区视频在线观看免费| 春色校园在线视频观看| 成年女人看的毛片在线观看| 国内精品宾馆在线| 国产爱豆传媒在线观看| 亚洲欧美激情综合另类| av在线观看视频网站免费| 一级av片app| 五月伊人婷婷丁香| 国产精品久久电影中文字幕| www.色视频.com| 久久国产精品人妻蜜桃| 国产男人的电影天堂91| 成人欧美大片| 欧美性感艳星| 亚洲欧美日韩东京热| 日韩av在线大香蕉| 日本成人三级电影网站| 99久久精品国产国产毛片| 99在线人妻在线中文字幕| 午夜精品一区二区三区免费看| 国产精品一区二区三区四区久久| 免费人成在线观看视频色| 日韩强制内射视频|