• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    利用采樣安全系數(shù)的多類不平衡過采樣算法*

    2020-10-15 01:45:26董明剛
    計(jì)算機(jī)與生活 2020年10期

    董明剛,劉 明,敬 超+

    1.桂林理工大學(xué)信息科學(xué)與工程學(xué)院,廣西桂林 541004

    2.廣西嵌入式技術(shù)與智能系統(tǒng)重點(diǎn)實(shí)驗(yàn)室,廣西桂林 541004

    1 引言

    近年來,多類不平衡問題引起了學(xué)術(shù)界和工業(yè)界的廣泛關(guān)注,如癌癥檢測、故障檢查等。多類不平衡問題指的是個(gè)別類(小類)的樣本數(shù)量比其他類(大類)要少得多,并且小類更加重要,這對(duì)于傳統(tǒng)分類算法來說是一個(gè)巨大的挑戰(zhàn)[1-2];因?yàn)閭鹘y(tǒng)分類算法都是針對(duì)平衡數(shù)據(jù)集或以誤判代價(jià)相等為前提的,因此它往往偏向于大類,這就導(dǎo)致了算法整體分類效果的下降[3]。

    多類不平衡學(xué)習(xí)問題主要有兩大類解決方法[1-2]:(1)算法級(jí),例如代價(jià)敏感學(xué)習(xí)算法[3]、集成學(xué)習(xí)算法[4];(2)數(shù)據(jù)級(jí),例如欠采樣算法[5](減少大類樣本的數(shù)量)、過采樣算法[6-14](增加小類樣本的數(shù)量)。盡管欠采樣和過采樣方法對(duì)解決多類不平衡問題都具有較好的效果,但欠采樣方法在刪除樣本時(shí)可能會(huì)損失重要的樣本信息,而過采樣算法不會(huì)遇到這種問題[9]。

    2002年,Chawla等提出了合成少數(shù)過采樣技術(shù)[6](synthetic minority oversampling technique,SMOTE)算法,通過在小類樣本點(diǎn)和同類近鄰之間合成樣本點(diǎn)來生成平衡數(shù)據(jù)集,取得了較好的效果,但它沒有對(duì)小類樣本點(diǎn)進(jìn)行區(qū)分性選擇,從而會(huì)出現(xiàn)過度泛化和加重類別邊界的重疊等問題。針對(duì)上述不足,學(xué)者們提出了大量的改進(jìn)算法。自適應(yīng)合成過采樣[7](adaptive synthetic sampling,ADASYN)通過學(xué)習(xí)難度來自適應(yīng)決定合成樣本點(diǎn)的數(shù)量,從而避免出現(xiàn)過度泛化問題。Han等提出的邊界線合成少數(shù)過采樣技術(shù)[8](borderline synthetic minority over-sampling technique,BSMOTE)只著重于決策邊界的小類樣本點(diǎn),其他小類樣本點(diǎn)不合成樣本點(diǎn)。嚴(yán)遠(yuǎn)亭等提出了一種構(gòu)造性覆蓋算法的SMOTE過采樣方法[9],認(rèn)為被孤立的少數(shù)類樣本點(diǎn)也很重要,提出了基于覆蓋內(nèi)樣本點(diǎn)個(gè)數(shù)與基于覆蓋密度這兩種選擇關(guān)鍵樣本的方法來有效地選取典型的少數(shù)類樣本點(diǎn)進(jìn)行過采樣,從而有效地防止過度泛化。黃海松等提出了一種基于樣本特性的新型過采樣方式[10],它綜合考慮了數(shù)據(jù)集中不同類別的類內(nèi)距離、類間距離與不平衡度之間的關(guān)系,對(duì)數(shù)據(jù)集進(jìn)行距離帶劃分,可以很好地區(qū)分開不同類別,從而有效地防止了類別重疊問題。很多研究也將選擇權(quán)重與過采樣算法相結(jié)合,Barua等在2014年提出了大類加權(quán)小類過采樣技術(shù)[11](majority weighted minority oversampling technique,MWMOTE),該算法根據(jù)學(xué)習(xí)難度來計(jì)算權(quán)重,并且只在同一個(gè)聚類簇的范圍內(nèi)生成新的樣本點(diǎn),可以有效地避免邊界重疊問題。Zhu等提出的多類不平衡過采樣[12](synthetic minority oversampling for multiclass,SMOM)技術(shù)則是考慮到了過度泛化問題,首先利用聚類方法對(duì)樣本點(diǎn)進(jìn)行劃分,再計(jì)算每個(gè)鄰域方向的權(quán)重,從而避免了過度泛化。

    綜上所述,盡管在多類不平衡學(xué)習(xí)上已經(jīng)取得了大量的優(yōu)異成果,但過度泛化問題和多類不平衡問題中更嚴(yán)重的類別重疊問題仍然沒有得到很好的解決,總體的分類性能還是稍顯不足,因此本文提出了一種利用采樣安全系數(shù)的多類不平衡過采樣(sampling safety coefficient for multi-class imbalance oversampling,SSCMIO)算法。首先利用樣本點(diǎn)的局部特性,本文提出了近鄰采樣安全系數(shù),為那些會(huì)產(chǎn)生過度泛化的鄰域方向分配較小的選擇權(quán)重,選擇那些較為安全的鄰域方向合成樣本點(diǎn),從而避免過度泛化。考慮到多類不平衡問題更加嚴(yán)重的類別重疊問題,本文提出了反向近鄰采樣安全系數(shù),為那些異常的樣本點(diǎn)分配一個(gè)較小的選擇權(quán)重,從而避免合成樣本點(diǎn)侵入到其他類別區(qū)域,減輕多類不平衡數(shù)據(jù)集中更為嚴(yán)重的類別重疊問題。最后將SSCMIO算法與7種典型的過采樣算法對(duì)來自KEEL[15]和UCI[16]機(jī)器學(xué)習(xí)數(shù)據(jù)庫上的16個(gè)數(shù)據(jù)集進(jìn)行了預(yù)處理,使用基于C4.5決策樹的RIPPER[17]分類器進(jìn)行分類,結(jié)果表明經(jīng)過SSCMIO算法預(yù)處理過的數(shù)據(jù)集有更好的分類效果。

    2 基于選擇權(quán)重的過采樣算法

    2.1 MWMOTE算法

    MWMOTE[11]算法主要是考慮到某些小類樣本點(diǎn)難以學(xué)習(xí)和類別邊界重疊問題,首先它重新定義了邊界點(diǎn),將邊界點(diǎn)作為難以學(xué)習(xí)的小類樣本點(diǎn),再與聚類方法結(jié)合。算法的主要描述如下:

    (1)首先找出大類的邊界點(diǎn),再根據(jù)大類邊界點(diǎn)定義出小類的邊界點(diǎn),這些小類的邊界點(diǎn)就是難以學(xué)習(xí)的小類樣本點(diǎn)。

    (2)根據(jù)密度因子和靠近因子每個(gè)樣本點(diǎn)計(jì)算選擇權(quán)重,詳細(xì)信息參見文獻(xiàn)[11]。

    (3)根據(jù)選擇權(quán)重在同一個(gè)聚類簇的范圍內(nèi)合成新的樣本點(diǎn)。

    2.2 自適應(yīng)半監(jiān)督加權(quán)過采樣算法

    Nekooeimehr等在2016年提出了自適應(yīng)半監(jiān)督加權(quán)過采樣[13](adaptive semi-unsupervised weighted oversampling,A-SUWO)算法。首先,為了防止過度重疊,該算法使用半監(jiān)督聚類算法對(duì)小類樣本點(diǎn)進(jìn)行聚類,為同一簇內(nèi)的樣本點(diǎn)計(jì)算選擇權(quán)重,并且在聚類過程中對(duì)小類樣本的簇邊界進(jìn)行嚴(yán)格限制,從而避免重疊樣本的產(chǎn)生。同時(shí)對(duì)原始的數(shù)據(jù)集先進(jìn)行一次分類,根據(jù)分類錯(cuò)誤率和混淆矩陣來自適應(yīng)確定每個(gè)樣本點(diǎn)所需要的合成樣本點(diǎn)數(shù)量。在合成樣本點(diǎn)的時(shí)候,只有在同一簇內(nèi)的小類樣本點(diǎn)才能合成樣本點(diǎn),減少合成樣本點(diǎn)侵入到其他類區(qū)域,降低了生成重疊樣本的機(jī)會(huì)。

    2.3 SMOM算法

    SMOM[12]算法是Zhu等在2017年提出來的,與SMOTE算法的隨機(jī)合成新的樣本點(diǎn)不同,SMOM將選擇權(quán)重分配給每個(gè)鄰域方向,對(duì)于可以產(chǎn)生過度泛化的鄰域方向賦予較小的選擇權(quán)重,從而避免過度泛化。算法主要描述如下:

    (1)使用聚類算法將小類樣本點(diǎn)劃分為優(yōu)秀樣本點(diǎn)和被困樣本點(diǎn)。

    (2)對(duì)于每個(gè)被困樣本點(diǎn),根據(jù)過度泛化因子和復(fù)雜因子來計(jì)算其選擇權(quán)重,對(duì)于那些優(yōu)秀樣本點(diǎn)則賦予一個(gè)定值權(quán)重,詳細(xì)信息參見文獻(xiàn)[12]。

    (3)若樣本點(diǎn)為被困樣本點(diǎn),則根據(jù)選擇權(quán)重來選擇近鄰,運(yùn)用式(1)來合成樣本點(diǎn),否則隨機(jī)選擇近鄰,運(yùn)用式(1)來合成樣本點(diǎn)。

    其中,Xnew表示新合成的樣本點(diǎn),X和Xneighbor分別表示某一樣本點(diǎn)和它的任意一個(gè)近鄰,rand為隨機(jī)函數(shù),可以產(chǎn)生一個(gè)[0,1]之間的隨機(jī)數(shù)。

    3 利用采樣安全系數(shù)的多類不平衡過采樣算法

    如今多類不平衡問題已經(jīng)引起了廣泛的關(guān)注,但現(xiàn)有的過采樣算法有可能會(huì)導(dǎo)致過度泛化問題,使得算法整體的分類性能下降[12]。并且多類不平衡問題相較于兩類不平衡問題擁有更加復(fù)雜的類別邊界,從而導(dǎo)致了不同類別之間會(huì)出現(xiàn)更加嚴(yán)重的類別重疊現(xiàn)象,增加了分類難度。針對(duì)以上兩個(gè)問題,本文提出了利用采樣安全系數(shù)的多類不平衡過采樣算法。首先為了防止過度泛化,提出了近鄰采樣安全系數(shù),為那些過度泛化的鄰域分配一個(gè)較小的選擇權(quán)重,然后運(yùn)用反向近鄰采樣安全系數(shù)來防止合成樣本點(diǎn)侵入到其他類別區(qū)域,從而降低了類的識(shí)別難度,提升了算法的整體性能。

    3.1 近鄰采樣安全系數(shù)

    現(xiàn)有的過采樣方法在處理多類不平衡這一更具挑戰(zhàn)性的問題時(shí),往往會(huì)導(dǎo)致過度泛化??紤]到數(shù)據(jù)集中的每個(gè)樣本點(diǎn)的近鄰對(duì)分類結(jié)果的貢獻(xiàn)都不同,這意味著一些近鄰更重要,對(duì)分類結(jié)果影響更大,故本文提出了近鄰采樣安全系數(shù),它考慮了樣本點(diǎn)的局部特性,為那些會(huì)產(chǎn)生過度泛化的鄰域方向分配較小的選擇權(quán)重,選擇那些較為安全的鄰域方向合成樣本點(diǎn),從而避免過度泛化,提升算法的整體性能。

    如圖1所示,以二維數(shù)據(jù)為例,圖中有3類數(shù)據(jù),圓形樣本點(diǎn)表示當(dāng)前需要過采樣的小類,其他為大類。小類中任意樣本點(diǎn)Xi的k1個(gè)近鄰分布在虛線圓內(nèi),虛線圓被相互垂直的兩條實(shí)線分成了A、B、C、D四部分。將Xi點(diǎn)的右上區(qū)域按圖中的垂直虛線分為3個(gè)區(qū)域A1、A2、A3。由于SMOTE方法是在樣本點(diǎn)Xi和其近鄰Yj之間隨機(jī)合成樣本點(diǎn),由圖可知,在區(qū)域A2和A3內(nèi)存在其他類別樣本點(diǎn)對(duì)合成樣本點(diǎn)的影響遠(yuǎn)比區(qū)域A1要小得多,故選定區(qū)域A1作為鄰域。在區(qū)域D中樣本點(diǎn)Xn,鄰域內(nèi)其他類別的樣本點(diǎn)相對(duì)而言較少,分配較高的選擇權(quán)重,并且為其他鄰域方向分配一個(gè)較小的權(quán)重,可以很好地避免過度泛化問題,提高了算法的總體分類性能。

    Fig.1 Neighbor sampling safety coefficient圖1 近鄰采樣安全系數(shù)

    近鄰安全系數(shù)很好地反映了樣本點(diǎn)的局部特性,用來衡量樣本點(diǎn)Xi和其近鄰Yj之間的泛化程度,對(duì)于那些會(huì)產(chǎn)生嚴(yán)重過度泛化的鄰域方向分配較小的選擇權(quán)重,從而提升合成樣本點(diǎn)的質(zhì)量,降低類的識(shí)別難度。它可以表示為:

    其中,MaxNumc表示Xc內(nèi)其他類別樣本點(diǎn)的最大數(shù)量,Num(Xi,Yj)表示Xj i鄰域內(nèi)其他類別樣本點(diǎn)的數(shù)量,NeiSafe(Xi,Yj)表示樣本點(diǎn)Xi和其第j個(gè)近鄰Yj之間的采樣安全系數(shù)。

    近鄰采樣安全系數(shù)的偽代碼如算法1所示。

    算法1近鄰采樣安全系數(shù)

    3.2 反向近鄰采樣安全系數(shù)

    相較于兩類不平衡問題,多類不平衡問題中不同類別之間重疊現(xiàn)象更加嚴(yán)重,類別邊界更加模糊??紤]到不同類別之間的重疊問題,防止合成樣本點(diǎn)侵入到其他類別區(qū)域,故采用了反向近鄰采樣安全系數(shù),從而避免合成侵入到其他類別區(qū)域的樣本點(diǎn)。它的定義如下:

    其中,max、mean分別表示最大值函數(shù)和平均值函數(shù);RN表示同一類別所有樣本的反向近鄰數(shù)量的集合;NeiSafe表示樣本點(diǎn)的反向近鄰與該樣本點(diǎn)的近鄰安全系數(shù)的集合。

    反向近鄰安全系數(shù)很好地反映了樣本點(diǎn)的全局特性,若樣本點(diǎn)的反向近鄰安全系數(shù)很小,那么該樣本點(diǎn)很可能是潛在的異常樣本點(diǎn),并且侵入了其他類別區(qū)域,因此為此類樣本點(diǎn)分配一個(gè)較小的權(quán)重,可以很好地減輕多類不平衡中更嚴(yán)重的類別重疊問題,提高了類的識(shí)別度。如圖2所示,給出了小類樣本點(diǎn)X1、X2、X3和X4的近鄰虛線圓,由圖可知樣本點(diǎn)X1的反向近鄰有X2、X3和X4,其反向近鄰采樣安全系數(shù)很小,故該樣本點(diǎn)是異常的樣本點(diǎn),存在于重疊的邊界區(qū)域,若對(duì)其合成大量樣本就會(huì)加重類別重疊問題,使得分類性能大大降低,故采用反向近鄰采樣安全系數(shù)為此類樣本點(diǎn)分配一個(gè)較小的選擇權(quán)重,減輕類別重疊問題。

    Fig.2 Reverse neighbor sampling safety coefficient圖2 反向近鄰采樣安全系數(shù)

    反向近鄰采樣安全系數(shù)的偽代碼如算法2所示。

    算法2反向近鄰采樣安全系數(shù)

    3.3 SSCMIO算法主框架

    采樣安全系數(shù)決定應(yīng)該選擇哪些樣本點(diǎn)來合成樣本點(diǎn)。更高的安全系數(shù)意味著其合成樣本點(diǎn)不會(huì)導(dǎo)致過度泛化,也能避免侵入到其他類別區(qū)域,減輕類別重疊,提升了合成樣本點(diǎn)的質(zhì)量,因此將這些合成樣本添加到數(shù)據(jù)集中可以獲得更高的分類精度。采樣安全系數(shù)的定義如下:

    SSCMIO算法主框架偽代碼如算法3所示。首先為了防止過度泛化,利用樣本點(diǎn)的局部特性,采用近鄰采樣安全系數(shù)為小類樣本點(diǎn)的每個(gè)鄰域分配選擇權(quán)重,并且若該近鄰采樣安全系數(shù)為0,則不在該鄰域內(nèi)合成樣本點(diǎn);考慮到不同類別之間的重疊問題,利用樣本點(diǎn)的全局特性,計(jì)算出樣本點(diǎn)的反向近鄰采樣安全系數(shù),從而避免合成的樣本點(diǎn)侵入到其他類別區(qū)域,利用式(4)為每個(gè)樣本點(diǎn)分配采樣安全系數(shù)。

    算法3SSCMIO算法主框架

    3.4 時(shí)間復(fù)雜度分析

    假定數(shù)據(jù)集中的第c個(gè)小類數(shù)量為Nc,設(shè)所有的小類點(diǎn)的數(shù)量為n,即n=,計(jì)算一個(gè)樣本點(diǎn)的近鄰采樣安全系數(shù)和反向近鄰采樣安全系數(shù)的時(shí)間復(fù)雜度均為O(logn+k1),其中k1為計(jì)算安全系數(shù)時(shí)的近鄰和反向近鄰數(shù)量,O(logn)為計(jì)算一個(gè)樣本點(diǎn)的k1個(gè)近鄰的時(shí)間復(fù)雜度,且k1遠(yuǎn)小于n,故SSCMIO算法時(shí)間復(fù)雜度為O(nlogn)。

    4 仿真實(shí)驗(yàn)

    4.1 實(shí)驗(yàn)設(shè)置與數(shù)據(jù)集

    本文是在Windows 8系統(tǒng)下實(shí)現(xiàn)的,使用了WEKA平臺(tái)[18]中基于C4.5決策樹的RIPPER分類器[17]進(jìn)行分類,分類器參數(shù)使用了WEKA平臺(tái)下算法的默認(rèn)值,并且采用5折交叉驗(yàn)證,獨(dú)立運(yùn)行10次,取平均值作為最終結(jié)果。對(duì)比算法有SMOTE[6]、ADASYN[7]、BSMOTE[8],基于分類超平面的混合采樣算法(hybrid sampling algorithm based on support vector machine,SVM_HS)[19]、MWMOTE[11]、SMOM[12]、ASUWO[13],這些算法的參數(shù)均采用算法的默認(rèn)參數(shù),經(jīng)過實(shí)驗(yàn)對(duì)比,發(fā)現(xiàn)算法中的k1取值為4可以取得最好的性能,具體的實(shí)驗(yàn)對(duì)比見4.4節(jié)。

    為了驗(yàn)證算法的有效性,本文采用了來自KEEL[15]和UCI[16]機(jī)器學(xué)習(xí)數(shù)據(jù)庫的16個(gè)數(shù)據(jù)集進(jìn)行驗(yàn)證,將過采樣后得到的平衡數(shù)據(jù)集用基于C4.5決策樹的RIPPER[17]分類器進(jìn)行分類,文中的數(shù)據(jù)集在不平衡率(imbalance rate,IR)大于1.45時(shí)判定為小類,IR為最大類與最小類的數(shù)量比值,數(shù)據(jù)集的基本信息如表1所示。

    Table 1 Basic information of datasets表1 數(shù)據(jù)集的基本信息

    4.2 性能評(píng)價(jià)指標(biāo)

    采用多類不平衡數(shù)據(jù)集中常用的Precision[1,20-21]、Recall[1,20-21]、F-measure[22]、MG[23]、MAUC[24]這5個(gè)指標(biāo)來評(píng)價(jià)算法的優(yōu)劣性。其定義如式(5)~式(9)所示:

    其中,TP表示正類樣本預(yù)測為正類的數(shù)量;FN表示正類樣本預(yù)測為負(fù)類的數(shù)量;FP表示負(fù)類樣本預(yù)測為正類的數(shù)量;β一般設(shè)置為1;A(ci,cj)=表示類i和類j的AUC面積,且A(ci|cj)與A(cj|ci)不相等。

    Precision、Recall和F-measure僅計(jì)算最小的類,其中MG和MAUC分別是在二類評(píng)價(jià)指標(biāo)G-mean[25]和AUC[26-27](area under ROC curve)的基礎(chǔ)上擴(kuò)展的多類不平衡學(xué)習(xí)的評(píng)價(jià)指標(biāo),可以很好地評(píng)價(jià)算法的整體性能[20]。

    4.3 實(shí)驗(yàn)結(jié)果對(duì)比與分析

    Table 2 Comparison of Precision表2 Precision 的對(duì)比

    表2到表6給出了SSCMIO算法和其他7種算法在16個(gè)數(shù)據(jù)集上的5種評(píng)價(jià)指標(biāo)對(duì)比結(jié)果,加粗表示當(dāng)前數(shù)據(jù)集的最優(yōu)值。

    Table 3 Comparison of Recall表3 Recall的對(duì)比

    Table 4 Comparison of F-measure表4 F-measure的對(duì)比

    表2展示了8個(gè)算法在評(píng)價(jià)指標(biāo)Precision上的結(jié)果,從表中可以看出在16個(gè)數(shù)據(jù)集中,SSCMIO算法取得了11個(gè)最優(yōu)值,相比于SMOTE、BSMOTE、SVM_HS、ADASYN、MWMOTE、SMOM、A-SUWO平均提升了0.066 5、0.030 4、0.108 6、0.059 8、0.069 2、0.091 2、0.025 5,16個(gè)數(shù)據(jù)集中相比表現(xiàn)最差的算法提升最多的是voice96,提升了0.481 8。

    表3展示了8個(gè)算法在評(píng)價(jià)指標(biāo)Recall上的結(jié)果,從表中可以看出在16個(gè)數(shù)據(jù)集中,SSCMIO算法取得了11個(gè)最優(yōu)值,相比于SMOTE、BSMOTE、SVM_HS、ADASYN、MWMOTE、SMOM、A-SUWO平均提升了0.085 8、0.044 6、0.008 4、0.101 2、0.123 3、0.125 3、0.073 9,16個(gè)數(shù)據(jù)集中相比表現(xiàn)最差的算法提升最多的是voice9,提升了0.305 3。

    Table 5 Comparison of MG表5 MG 的對(duì)比

    Table 6 Comparison of MAUC表6 MAUC 的對(duì)比

    表4展示了8個(gè)算法在評(píng)價(jià)指標(biāo)F-measure上的結(jié)果,從表中可以看出在16個(gè)數(shù)據(jù)集中,SSCMIO算法取得了11個(gè)最優(yōu)值,相比于SMOTE、BSMOTE、SVM_HS、ADASYN、MWMOTE、SMOM、A-SUWO平均提升了0.080 9、0.038 8、0.057 0、0.087 4、0.104 6、0.116 0、0.056 0,16個(gè)數(shù)據(jù)集中相比表現(xiàn)最差的算法提升最多的是voice96,提升了0.342 0。

    Fig.3 Comparison of k1 value圖3 k1值對(duì)比

    表5展示了8個(gè)算法在評(píng)價(jià)指標(biāo)MG上的結(jié)果,從表中可以看出在16個(gè)數(shù)據(jù)集中,SSCMIO算法取得了11個(gè)最優(yōu)值,其中數(shù)據(jù)集ERA有個(gè)別類別被全部分錯(cuò),故MG值均為0。相比于SMOTE、BSMOTE、SVM_HS、ADASYN、MWMOTE、SMOM、A-SUWO平均提升了0.096 4、0.054 5、0.073 3、0.098 8、0.113 1、0.101 2、0.070 9,16個(gè)數(shù)據(jù)集中相比表現(xiàn)最差的算法提升最多的是voice96,提升了0.266 4。

    表6展示了8個(gè)算法在評(píng)價(jià)指標(biāo)MAUC上的結(jié)果,從表中可以看出在16個(gè)數(shù)據(jù)集中,SSCMIO算法取得了12個(gè)最優(yōu)值,相比于SMOTE、BSMOTE、SVM_HS、ADASYN、MWMOTE、SMOM、A-SUWO平均提升了0.038 8、0.024 0、0.056 2、0.042 6、0.045 4、0.042 6、0.029 6,16個(gè)數(shù)據(jù)集中相比表現(xiàn)最差的算法提升最多的是ERA,提升了0.130 7。

    表2到表6的實(shí)驗(yàn)結(jié)果可以表明SSCMIO算法的有效性,這是因?yàn)镾SCMIO算法考慮了樣本點(diǎn)的局部特性,為樣本點(diǎn)的每一個(gè)鄰域計(jì)算選擇權(quán)重,從而有效避免了過度泛化;再從全局特性出發(fā),采用反向近鄰安全系數(shù)減少了噪聲和離群點(diǎn)的影響,也減輕了類別邊界的重疊問題,使得合成的樣本點(diǎn)更加合理,降低了分類器的分類難度,從而提升了算法的總體性能。

    4.4 參數(shù)值的討論

    如圖3所示,本文給出了SSCMIO算法在k1取不同值時(shí)的折線圖,圖中縱坐標(biāo)分別表示在16個(gè)數(shù)據(jù)集上的MG和MAUC這兩個(gè)指標(biāo)上的百分比之和,橫坐標(biāo)表示不同的k1值。MG和MAUC均是由二類評(píng)價(jià)指標(biāo)拓展而來,能夠很好地描述算法的總體性能。從圖中可以看出當(dāng)k1取值為4時(shí),SSCMIO算法的效果是最佳的。相比k1的其他取值,在MG上,16個(gè)數(shù)據(jù)集總的最大提升為0.413 0,在MAUC上的最大提升為0.071 7,故本文將k1的值設(shè)置為4。

    5 結(jié)束語

    本文提出了一種利用采樣安全系數(shù)的多類不平衡過采樣算法(SSCMIO)來處理多類不平衡問題。首先為了防止過度泛化,充分利用樣本點(diǎn)的局部特性,提出了近鄰采樣安全系數(shù);然后利用樣本點(diǎn)的全局特性,提出了反向近鄰采樣安全系數(shù),防止合成樣本點(diǎn)侵入到其他類別區(qū)域,很好地減輕了不同類別之間的重疊問題。將SSCMIO算法與7種典型的過采樣算法在16種不同平衡度的真實(shí)數(shù)據(jù)集上進(jìn)行了對(duì)比實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明在大多數(shù)的數(shù)據(jù)集上SSCMIO算法表現(xiàn)得更優(yōu)。

    下一步工作將從以下兩方面開展:(1)用于實(shí)驗(yàn)的數(shù)據(jù)集都是數(shù)值型的,未來將研究SSCMIO算法應(yīng)用到非數(shù)值型數(shù)據(jù)集和混合型數(shù)據(jù)集;(2)可以研究如何將采樣安全系數(shù)和聚類方法相結(jié)合,以便更好地防止過度泛化和重疊問題。

    中文字幕人妻熟人妻熟丝袜美| 欧美黄色片欧美黄色片| 亚洲欧美日韩卡通动漫| 97超级碰碰碰精品色视频在线观看| 色尼玛亚洲综合影院| 国产精品亚洲美女久久久| 亚洲中文字幕一区二区三区有码在线看| 婷婷色综合大香蕉| 我要搜黄色片| 亚洲欧美精品综合久久99| 99久久精品一区二区三区| 国产极品精品免费视频能看的| 久久婷婷人人爽人人干人人爱| 亚洲内射少妇av| 俺也久久电影网| 国产成人欧美在线观看| 欧美日本视频| 婷婷精品国产亚洲av在线| 亚洲18禁久久av| 在线观看午夜福利视频| www.熟女人妻精品国产| 网址你懂的国产日韩在线| 一a级毛片在线观看| 亚洲无线在线观看| 亚洲人与动物交配视频| 看片在线看免费视频| .国产精品久久| 91av网一区二区| 国产精品女同一区二区软件 | 成人av在线播放网站| 十八禁国产超污无遮挡网站| 亚洲中文字幕一区二区三区有码在线看| 国内揄拍国产精品人妻在线| 国产成人影院久久av| 黄色丝袜av网址大全| 亚洲av五月六月丁香网| 久久精品久久久久久噜噜老黄 | 又爽又黄无遮挡网站| 国产熟女xx| 亚洲一区二区三区色噜噜| 日韩欧美一区二区三区在线观看| 99国产精品一区二区蜜桃av| 亚洲av电影不卡..在线观看| 亚洲av五月六月丁香网| 男女做爰动态图高潮gif福利片| 国产精品女同一区二区软件 | 国产伦在线观看视频一区| 中文字幕av成人在线电影| 亚洲熟妇熟女久久| 少妇人妻精品综合一区二区 | 亚洲综合色惰| 欧美成人一区二区免费高清观看| 久久久久久久亚洲中文字幕 | 99久久精品国产亚洲精品| 午夜免费男女啪啪视频观看 | 999久久久精品免费观看国产| 美女黄网站色视频| 国产人妻一区二区三区在| 成人一区二区视频在线观看| 国内少妇人妻偷人精品xxx网站| АⅤ资源中文在线天堂| 欧美色视频一区免费| 日韩亚洲欧美综合| 国产精品野战在线观看| 悠悠久久av| 有码 亚洲区| 成年人黄色毛片网站| 精品一区二区三区av网在线观看| 国产免费一级a男人的天堂| 国产精品一区二区三区四区久久| 久久久色成人| 午夜日韩欧美国产| av国产免费在线观看| 两个人视频免费观看高清| 一级av片app| 亚洲va日本ⅴa欧美va伊人久久| 一级a爱片免费观看的视频| 亚洲性夜色夜夜综合| 日本撒尿小便嘘嘘汇集6| 在线国产一区二区在线| 亚洲美女黄片视频| 男女视频在线观看网站免费| 色尼玛亚洲综合影院| 中文亚洲av片在线观看爽| 九九久久精品国产亚洲av麻豆| 嫩草影院入口| 成人一区二区视频在线观看| 国产爱豆传媒在线观看| 嫩草影院精品99| 热99re8久久精品国产| 18+在线观看网站| 99国产极品粉嫩在线观看| 18禁在线播放成人免费| 首页视频小说图片口味搜索| 波野结衣二区三区在线| 国产国拍精品亚洲av在线观看| av女优亚洲男人天堂| a级一级毛片免费在线观看| 亚洲 国产 在线| 亚洲狠狠婷婷综合久久图片| 亚洲一区高清亚洲精品| 欧美不卡视频在线免费观看| 五月玫瑰六月丁香| 国产视频内射| 在线播放无遮挡| 热99re8久久精品国产| 99久久精品一区二区三区| 久久久久亚洲av毛片大全| 成人特级av手机在线观看| 久久久久性生活片| 99久久九九国产精品国产免费| 久久亚洲精品不卡| a在线观看视频网站| 国产成人a区在线观看| 我的老师免费观看完整版| 露出奶头的视频| 首页视频小说图片口味搜索| 午夜两性在线视频| 成人特级av手机在线观看| 两人在一起打扑克的视频| 天天一区二区日本电影三级| 国产一区二区在线观看日韩| 久9热在线精品视频| 久久久久久久久中文| 成人国产一区最新在线观看| 男女视频在线观看网站免费| 观看免费一级毛片| 日韩精品青青久久久久久| 国产精品爽爽va在线观看网站| 欧美丝袜亚洲另类 | 欧美又色又爽又黄视频| 亚洲欧美日韩卡通动漫| 国产精品电影一区二区三区| 亚洲精品亚洲一区二区| 免费观看人在逋| 99热这里只有精品一区| 久久热精品热| 偷拍熟女少妇极品色| 午夜福利成人在线免费观看| 999久久久精品免费观看国产| a级毛片免费高清观看在线播放| 国产精品伦人一区二区| 欧美日韩黄片免| 九九热线精品视视频播放| 欧美3d第一页| 国产一级毛片七仙女欲春2| 色综合站精品国产| 欧美成人免费av一区二区三区| 亚洲国产精品合色在线| 亚洲av美国av| 久久草成人影院| 婷婷亚洲欧美| АⅤ资源中文在线天堂| 国产v大片淫在线免费观看| 国产白丝娇喘喷水9色精品| 在线免费观看的www视频| 1024手机看黄色片| 老司机深夜福利视频在线观看| 亚洲片人在线观看| 别揉我奶头~嗯~啊~动态视频| netflix在线观看网站| 国产不卡一卡二| 青草久久国产| 成人永久免费在线观看视频| 精品国产三级普通话版| 18禁黄网站禁片午夜丰满| 内射极品少妇av片p| 久久久成人免费电影| 日韩亚洲欧美综合| 亚洲,欧美,日韩| 国产免费av片在线观看野外av| 1024手机看黄色片| 欧美精品啪啪一区二区三区| 长腿黑丝高跟| 亚洲欧美精品综合久久99| 亚洲精品一卡2卡三卡4卡5卡| 十八禁网站免费在线| 国产69精品久久久久777片| 国产黄片美女视频| 女生性感内裤真人,穿戴方法视频| 很黄的视频免费| 亚洲va日本ⅴa欧美va伊人久久| 国产精品免费一区二区三区在线| 99热这里只有是精品在线观看 | 一级作爱视频免费观看| 成人永久免费在线观看视频| 美女高潮喷水抽搐中文字幕| 欧美成人免费av一区二区三区| 又紧又爽又黄一区二区| 亚洲av日韩精品久久久久久密| 欧美日韩亚洲国产一区二区在线观看| 成人毛片a级毛片在线播放| 我要搜黄色片| 国产 一区 欧美 日韩| 91午夜精品亚洲一区二区三区 | 久久精品国产亚洲av天美| 免费在线观看影片大全网站| 天天躁日日操中文字幕| 亚洲国产日韩欧美精品在线观看| 欧美午夜高清在线| 91麻豆av在线| 欧美+亚洲+日韩+国产| 丝袜美腿在线中文| 国产精品一及| 久久久久性生活片| 两个人的视频大全免费| 最近最新免费中文字幕在线| 国产免费男女视频| 久久中文看片网| 成年免费大片在线观看| 在线观看免费视频日本深夜| 欧美成人性av电影在线观看| 欧美一级a爱片免费观看看| 此物有八面人人有两片| 丝袜美腿在线中文| 韩国av一区二区三区四区| 国产高清激情床上av| 一进一出抽搐动态| 亚洲电影在线观看av| 中文字幕熟女人妻在线| 天堂网av新在线| 亚洲精品日韩av片在线观看| 中文字幕精品亚洲无线码一区| 一个人看视频在线观看www免费| 久久亚洲精品不卡| 一级av片app| 1000部很黄的大片| 日韩高清综合在线| 搞女人的毛片| 国产一区二区亚洲精品在线观看| 精品人妻一区二区三区麻豆 | 国产亚洲精品av在线| 亚洲片人在线观看| xxxwww97欧美| 亚洲一区二区三区色噜噜| 一级毛片久久久久久久久女| 免费一级毛片在线播放高清视频| 午夜福利欧美成人| 很黄的视频免费| 在线观看66精品国产| 亚洲av电影在线进入| 尤物成人国产欧美一区二区三区| 精华霜和精华液先用哪个| 青草久久国产| 又紧又爽又黄一区二区| 亚洲黑人精品在线| 国产成+人综合+亚洲专区| 美女免费视频网站| 国产淫片久久久久久久久 | 听说在线观看完整版免费高清| 亚洲国产精品久久男人天堂| 色在线成人网| 国产麻豆成人av免费视频| 成年版毛片免费区| 性色av乱码一区二区三区2| 精品国内亚洲2022精品成人| 久久精品久久久久久噜噜老黄 | 国产午夜精品论理片| 十八禁网站免费在线| 日韩欧美在线二视频| 又粗又爽又猛毛片免费看| 成人无遮挡网站| 欧美激情国产日韩精品一区| 亚洲av电影在线进入| 99热这里只有是精品50| 丰满的人妻完整版| 免费看日本二区| 永久网站在线| 午夜免费激情av| 欧美+日韩+精品| 精品熟女少妇八av免费久了| 欧美三级亚洲精品| 久久久久久久精品吃奶| 内射极品少妇av片p| 国产精品日韩av在线免费观看| 亚洲男人的天堂狠狠| 国内少妇人妻偷人精品xxx网站| 中国美女看黄片| 少妇熟女aⅴ在线视频| 国产一区二区在线av高清观看| 中文字幕免费在线视频6| 亚洲av成人不卡在线观看播放网| 亚洲成人久久爱视频| 波野结衣二区三区在线| 夜夜爽天天搞| 婷婷亚洲欧美| 我要搜黄色片| 搡老熟女国产l中国老女人| АⅤ资源中文在线天堂| 观看免费一级毛片| 国产主播在线观看一区二区| 国产单亲对白刺激| 久久国产乱子伦精品免费另类| 男人和女人高潮做爰伦理| 免费无遮挡裸体视频| 我要看日韩黄色一级片| 国产激情偷乱视频一区二区| 亚洲,欧美精品.| 校园春色视频在线观看| 2021天堂中文幕一二区在线观| 久久久国产成人免费| 欧美日韩综合久久久久久 | 成年人黄色毛片网站| 亚洲精品一卡2卡三卡4卡5卡| 男女之事视频高清在线观看| 欧美+日韩+精品| 露出奶头的视频| 国产精品电影一区二区三区| 国产欧美日韩一区二区三| 色av中文字幕| 日韩欧美精品v在线| 国产中年淑女户外野战色| 成人毛片a级毛片在线播放| 禁无遮挡网站| 亚洲专区国产一区二区| 嫩草影院入口| 变态另类成人亚洲欧美熟女| 亚洲国产精品成人综合色| 午夜免费男女啪啪视频观看 | 丰满人妻一区二区三区视频av| 一卡2卡三卡四卡精品乱码亚洲| 91字幕亚洲| 久久久国产成人免费| 亚洲电影在线观看av| 亚洲黑人精品在线| 亚洲av二区三区四区| 最近中文字幕高清免费大全6 | 一级黄色大片毛片| 性色avwww在线观看| 免费无遮挡裸体视频| 18禁在线播放成人免费| 一本综合久久免费| 精品免费久久久久久久清纯| 色5月婷婷丁香| 噜噜噜噜噜久久久久久91| 国产av麻豆久久久久久久| 一二三四社区在线视频社区8| 级片在线观看| 国产精品av视频在线免费观看| 国产精品久久久久久久久免 | 熟女人妻精品中文字幕| 91字幕亚洲| 精品熟女少妇八av免费久了| 亚洲 国产 在线| 日韩有码中文字幕| 97碰自拍视频| 三级毛片av免费| 日韩人妻高清精品专区| 很黄的视频免费| 成人av一区二区三区在线看| 国产美女午夜福利| 此物有八面人人有两片| 美女 人体艺术 gogo| 人妻夜夜爽99麻豆av| 在线观看午夜福利视频| 在线a可以看的网站| 亚洲精华国产精华精| 亚洲av二区三区四区| 老鸭窝网址在线观看| 国产黄片美女视频| 男女视频在线观看网站免费| 精品不卡国产一区二区三区| 18美女黄网站色大片免费观看| 99久久精品热视频| 国产精华一区二区三区| 国产综合懂色| 国产午夜精品久久久久久一区二区三区 | 国产av一区在线观看免费| av天堂中文字幕网| 露出奶头的视频| 欧美中文日本在线观看视频| 一级黄色大片毛片| 欧美成人性av电影在线观看| 亚洲av成人精品一区久久| 欧美在线黄色| 亚洲欧美激情综合另类| 女同久久另类99精品国产91| 日本a在线网址| av专区在线播放| 日韩成人在线观看一区二区三区| 99riav亚洲国产免费| 18+在线观看网站| 国产不卡一卡二| 18禁黄网站禁片午夜丰满| 网址你懂的国产日韩在线| a级毛片a级免费在线| 国产欧美日韩一区二区精品| 熟妇人妻久久中文字幕3abv| 日韩欧美一区二区三区在线观看| 成人av在线播放网站| 又黄又爽又免费观看的视频| 精品久久国产蜜桃| 在线国产一区二区在线| 国产精品自产拍在线观看55亚洲| 日韩欧美在线乱码| 嫩草影院新地址| 成人国产综合亚洲| 免费人成视频x8x8入口观看| 内射极品少妇av片p| 嫩草影院新地址| 国产精品国产高清国产av| 一区二区三区四区激情视频 | 免费搜索国产男女视频| 白带黄色成豆腐渣| 国产精品久久视频播放| 国产精品久久久久久久电影| 亚洲人成电影免费在线| 亚洲精品一区av在线观看| 欧美色欧美亚洲另类二区| 神马国产精品三级电影在线观看| 成人鲁丝片一二三区免费| 少妇被粗大猛烈的视频| 老师上课跳d突然被开到最大视频 久久午夜综合久久蜜桃 | 久久草成人影院| 91av网一区二区| 国产精品久久电影中文字幕| 他把我摸到了高潮在线观看| 男女那种视频在线观看| 国产高清视频在线观看网站| 波多野结衣巨乳人妻| 久久久久久大精品| 中文资源天堂在线| 日本a在线网址| 国产黄片美女视频| 俺也久久电影网| 动漫黄色视频在线观看| bbb黄色大片| 国产男靠女视频免费网站| 国产v大片淫在线免费观看| 精品久久久久久久久亚洲 | 女同久久另类99精品国产91| 久久久国产成人免费| 国产精品久久久久久亚洲av鲁大| xxxwww97欧美| 婷婷色综合大香蕉| 老女人水多毛片| 麻豆国产97在线/欧美| 亚洲午夜理论影院| 女人十人毛片免费观看3o分钟| 又紧又爽又黄一区二区| 精品熟女少妇八av免费久了| 国产真实伦视频高清在线观看 | 国产精品亚洲一级av第二区| av女优亚洲男人天堂| 婷婷精品国产亚洲av在线| 欧美色欧美亚洲另类二区| 村上凉子中文字幕在线| 99久国产av精品| 99久久精品热视频| 窝窝影院91人妻| 国产精品精品国产色婷婷| 欧美+日韩+精品| 嫩草影院入口| 欧美一区二区精品小视频在线| 亚洲欧美日韩无卡精品| 在线看三级毛片| 少妇人妻一区二区三区视频| 国产精品永久免费网站| 深夜精品福利| 中文字幕av在线有码专区| 黄色视频,在线免费观看| 国产精品国产高清国产av| 亚洲精品影视一区二区三区av| 国产精品久久久久久久电影| 99热6这里只有精品| 自拍偷自拍亚洲精品老妇| 婷婷丁香在线五月| 亚洲自偷自拍三级| 亚洲国产日韩欧美精品在线观看| 亚洲七黄色美女视频| 黄色日韩在线| 可以在线观看的亚洲视频| 国产精华一区二区三区| 99久久99久久久精品蜜桃| 男人狂女人下面高潮的视频| 午夜福利视频1000在线观看| av天堂中文字幕网| 免费观看的影片在线观看| 国产极品精品免费视频能看的| 欧美成人一区二区免费高清观看| 亚洲av五月六月丁香网| 久久午夜福利片| 色哟哟哟哟哟哟| 国产真实乱freesex| 久久久久久九九精品二区国产| 久久久国产成人免费| 男人舔奶头视频| 日韩 亚洲 欧美在线| 日本与韩国留学比较| 欧洲精品卡2卡3卡4卡5卡区| 久久久久久久久大av| 日韩人妻高清精品专区| 欧美黄色淫秽网站| 色综合亚洲欧美另类图片| 直男gayav资源| 男女床上黄色一级片免费看| 亚洲av中文字字幕乱码综合| 听说在线观看完整版免费高清| 搞女人的毛片| 色播亚洲综合网| 亚洲 欧美 日韩 在线 免费| 能在线免费观看的黄片| 免费看a级黄色片| 日韩欧美在线二视频| 国产精品,欧美在线| 免费观看精品视频网站| 我要看日韩黄色一级片| 黄色日韩在线| 国产成人aa在线观看| 一级a爱片免费观看的视频| 国产成人啪精品午夜网站| 天堂动漫精品| 欧美乱色亚洲激情| 亚洲五月天丁香| 永久网站在线| 亚洲一区高清亚洲精品| eeuss影院久久| 亚洲av成人精品一区久久| 听说在线观看完整版免费高清| 欧美精品啪啪一区二区三区| 日本一二三区视频观看| 精品人妻1区二区| 直男gayav资源| 久久久久久大精品| 欧美激情久久久久久爽电影| 男人的好看免费观看在线视频| 久久欧美精品欧美久久欧美| 欧美中文日本在线观看视频| 黄色女人牲交| 国产成人a区在线观看| av在线天堂中文字幕| 激情在线观看视频在线高清| 国产亚洲av嫩草精品影院| 国产乱人视频| 内地一区二区视频在线| 女生性感内裤真人,穿戴方法视频| 久久精品国产亚洲av涩爱 | 久久久久久久久大av| 99久久99久久久精品蜜桃| 久久久久国内视频| 精品人妻1区二区| 国产aⅴ精品一区二区三区波| 亚洲熟妇中文字幕五十中出| 日韩欧美国产在线观看| 国产成+人综合+亚洲专区| 国产高潮美女av| 亚洲欧美清纯卡通| 欧美三级亚洲精品| 国产精品久久视频播放| a级一级毛片免费在线观看| 91麻豆精品激情在线观看国产| 成人亚洲精品av一区二区| 97碰自拍视频| 给我免费播放毛片高清在线观看| 国产伦在线观看视频一区| 深夜精品福利| 日日摸夜夜添夜夜添小说| 欧美性猛交╳xxx乱大交人| 久久久久久久久久成人| 久久久久久久精品吃奶| 亚洲国产高清在线一区二区三| 桃红色精品国产亚洲av| 女同久久另类99精品国产91| 性色avwww在线观看| 国产精品久久久久久久电影| 成年免费大片在线观看| 久久99热这里只有精品18| 国产精品电影一区二区三区| 一夜夜www| 麻豆久久精品国产亚洲av| 最新在线观看一区二区三区| 亚洲av美国av| 日韩国内少妇激情av| 日本一二三区视频观看| 精华霜和精华液先用哪个| 国产精品一区二区免费欧美| 我要搜黄色片| 国产高清视频在线播放一区| 亚洲男人的天堂狠狠| 亚洲熟妇熟女久久| 婷婷亚洲欧美| 别揉我奶头~嗯~啊~动态视频| 在线观看一区二区三区| 99热精品在线国产| 男女视频在线观看网站免费| 亚洲av成人不卡在线观看播放网| 精品人妻一区二区三区麻豆 | 国产一区二区三区视频了| 极品教师在线视频| 麻豆国产97在线/欧美| 国产乱人伦免费视频| 一级作爱视频免费观看| 精品久久久久久久久亚洲 | 国产精品综合久久久久久久免费| 国产视频内射| 一进一出好大好爽视频| 国产午夜精品论理片| 一级作爱视频免费观看| 久久亚洲精品不卡| 人人妻人人看人人澡| 最近最新免费中文字幕在线| 欧美又色又爽又黄视频| 在线播放国产精品三级| 欧美一区二区亚洲| 国产一级毛片七仙女欲春2| 老司机福利观看| 国产一区二区激情短视频| 在线观看66精品国产| 日本黄色片子视频| 一二三四社区在线视频社区8| 伦理电影大哥的女人| 国产中年淑女户外野战色| 97超视频在线观看视频| 亚洲国产精品合色在线| 午夜精品久久久久久毛片777|