• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    一種小樣本數(shù)據(jù)的特征選擇方法

    2018-10-15 09:05:50王文劍
    計(jì)算機(jī)研究與發(fā)展 2018年10期
    關(guān)鍵詞:互信息特征選擇子集

    許 行 張 凱 王文劍,2

    1(山西大學(xué)計(jì)算機(jī)與信息技術(shù)學(xué)院 太原 030006) 2(計(jì)算智能與中文信息處理教育部重點(diǎn)實(shí)驗(yàn)室(山西大學(xué)) 太原 030006)

    隨著通信和存儲技術(shù)的發(fā)展、網(wǎng)絡(luò)的普及,各領(lǐng)域數(shù)據(jù)的產(chǎn)生和收集變的更加容易,大數(shù)據(jù)及相關(guān)產(chǎn)業(yè)應(yīng)運(yùn)而生,而處理這些數(shù)據(jù)成為機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘領(lǐng)域研究的核心及關(guān)鍵問題.現(xiàn)實(shí)生活中,有一類稱為小樣本的數(shù)據(jù),其特點(diǎn)是相比于特征維數(shù)其樣本數(shù)目較少,比如基因表達(dá)譜數(shù)據(jù)需要通過微陣列實(shí)驗(yàn)獲取,實(shí)驗(yàn)成本的昂貴限制了實(shí)驗(yàn)次數(shù),使得數(shù)據(jù)的規(guī)模較小,同時(shí)該實(shí)驗(yàn)測試上萬個(gè)基因的表達(dá)水平,又使得數(shù)據(jù)維數(shù)非常高,這使得傳統(tǒng)的機(jī)器學(xué)習(xí)算法處理小樣本數(shù)據(jù)可能會失效[1],因此,通過特征選擇來降低數(shù)據(jù)維數(shù)是解決它的一種有效途徑.

    特征選擇能在不失去數(shù)據(jù)原有價(jià)值的基礎(chǔ)上去除不相關(guān)和冗余特征,提高數(shù)據(jù)的質(zhì)量,降低學(xué)習(xí)算法在數(shù)據(jù)集上的計(jì)算代價(jià),加快數(shù)據(jù)挖掘的速度,同時(shí)有助于生成更易理解的結(jié)果和更緊湊、泛化能力更強(qiáng)的模型[2].根據(jù)是否與后續(xù)完成數(shù)據(jù)分析任務(wù)(如分類、聚類、回歸等)的算法相獨(dú)立,特征選擇方法可分為嵌入、封裝和過濾3類[3].嵌入型方法將特征選擇算法作為分類算法的一個(gè)組成部分嵌入到分類算法中,封裝型方法將后續(xù)分類算法的分類準(zhǔn)確率作為所選特征子集的評價(jià)準(zhǔn)則,過濾型方法與后續(xù)分類算法無關(guān),直接利用訓(xùn)練數(shù)據(jù)的統(tǒng)計(jì)性能評估特征.對于嵌入型和封裝型方法,將特征選擇算法作為分類算法的組成部分或者使用分類算法作為特征子集的評價(jià)標(biāo)準(zhǔn),都會造成特征選擇算法的計(jì)算成本隨著維數(shù)的升高而急劇上升,可能不適合小樣本數(shù)據(jù)的特征選擇.而過濾型方法有獨(dú)立的評估函數(shù),通過樣本的統(tǒng)計(jì)屬性來評價(jià)特征子集對于分類任務(wù)所起的作用,它不將任何分類器納入到評估標(biāo)準(zhǔn),由此選擇出無關(guān)于特定分類算法的特征子集.因此,過濾型方法可以離線進(jìn)行特征選擇,它相對于后續(xù)分類算法的獨(dú)立性可避免高維數(shù)據(jù)造成的較高的分類算法運(yùn)行成本,與嵌入型和封裝型相比,過濾型特征選擇方法在計(jì)算上是高效的.

    典型的過濾型特征選擇方法使用距離度量、信息度量、相關(guān)性度量和一致性度量等統(tǒng)計(jì)指標(biāo)衡量特征的類區(qū)分能力.距離度量是利用距離來度量特征之間、特征與類別之間的相關(guān)性,常用的有歐氏距離、S階閔可夫斯基測度、切比雪夫距離、平方距離等,Relief[4]及其變種ReliefF[5]、BFF(best first strategy for feature selection)[6]和基于核空間距離方法[7]都是基于距離度量的算法.信息度量是指選擇具有最小不確定性的特征,常用的信息度量為衡量信息不確定性的熵函數(shù),如Shannon熵、條件熵、信息增益、互信息(mutual information, MI)等.BIF(best individual features)[8], UFS -MI(unsupervised feature selection approach based on mutual information)[9], CMIM(conditional mutual information maximiza-tion)[10]分別是使用互信息和條件互信息作為評價(jià)標(biāo)準(zhǔn)的特征選擇方法.相關(guān)性度量是利用特征與類別的可分離性間的重要性程度判斷相關(guān)性,如Pearson相關(guān)系數(shù)、概率誤差、Fisher分?jǐn)?shù)、線性可判定分析、最小平方回歸誤差[11]、平方關(guān)聯(lián)系數(shù)[12]等.Ding等人[13]和Peng等人[14]在mRMR(minimal-redundancy-maximal- relevance)中處理連續(xù)特征時(shí),分別使用F-Statistic和Pearson相關(guān)系數(shù)度量特征與類別和已選特征間的相關(guān)性程度,Hall[15]給出一種同時(shí)考慮特征的類區(qū)分能力和特征間冗余性的相關(guān)性度量標(biāo)準(zhǔn).一致性度量是指給定2個(gè)樣本,若他們特征值相同而類別不同,則它們是不一致的,否則是一致的,一致性準(zhǔn)則試圖保留原始特征的辨識能力,用不一致率來度量,典型算法有Focus[16],LVF(Las Vegas filter)[17]等.這些方法有的運(yùn)行效率不夠高,有的降維之后分類模型性能不夠好,因此研究針對小樣本數(shù)據(jù)的過濾型特征選擇方法仍有重要的價(jià)值.

    由于互信息有2個(gè)優(yōu)點(diǎn)[18]:1)可以測量隨機(jī)變量之間的多種關(guān)系,包括非線性關(guān)系,這保證了互信息在特征與類別之間的關(guān)系未知的情況下仍然有效;2)在平移、旋轉(zhuǎn)和保留特征矢量順序的特征空間變換情況下,值不會發(fā)生改變,這保證了互信息在特征選擇中的任何階段都能準(zhǔn)確度量任意2個(gè)特征之間的關(guān)系.因此,基于互信息的過濾型特征選擇方法可以很好地度量特征與特征之間、特征與類別之間的關(guān)系,從而更有效地進(jìn)行特征選擇.本文針對小樣本數(shù)據(jù)提出一種基于互信息的過濾型特征選擇方法,用以提高其選出的特征子集所構(gòu)造的分類模型的分類性能,同時(shí)具有更好的運(yùn)行效率.

    1 小樣本數(shù)據(jù)的特征選擇方法

    本文首先提出一種基于互信息的特征選擇方法(MI-based feature selection, MIFS),根據(jù)互信息對特征排序,之后按順序迭代地對特征分組,在各組內(nèi)選出與類別相關(guān)性最大的特征得到特征子集,然后利用Boruta算法[19]自動(dòng)地確定最佳特征子集.

    1.1 基于互信息的特征選擇方法

    有效的特征選擇方法需要同時(shí)考慮特征與類別的相關(guān)性和不同特征之間的冗余性,并且避免在類別相關(guān)度差別較大的特征上計(jì)算冗余度.為了實(shí)現(xiàn)以上2點(diǎn),提出基于互信息的特征選擇算法MIFS.考慮到互信息度量特征與類別之間的關(guān)系的優(yōu)勢,MIFS先根據(jù)特征與類別之間的相關(guān)性對特征排序,之后提出了一個(gè)分組標(biāo)準(zhǔn),將特征進(jìn)行分組,并從不同的組內(nèi)找到需要選出的特征作為特征子集.

    給定數(shù)據(jù)集D的樣本數(shù)為n,特征維數(shù)為m,用a1,a2,…,am表示其特征,c表示其類別,特征ai的值域?yàn)閂i,c的值域?yàn)閂c.

    特征ai與類別c之間的互信息I(ai,c)為

    (1)

    其中p(vi,vc)表示特征ai的取值為vi且類別c的取值為vc的概率.I(ai,c)的值越大,表示特征ai和類別c的關(guān)聯(lián)度越大.

    計(jì)算每個(gè)特征與類別之間的互信息后,按互信息從大到小的順序?qū)μ卣髋判?,然后對特征集進(jìn)行分組,定義特征分組的標(biāo)準(zhǔn)Q為

    (2)

    (3)

    (4)

    其中,G表示一個(gè)特征組,ai,aj為G內(nèi)的特征,I(ai,aj)為特征ai與特征aj之間的互信息:

    (5)

    其中p(vi,vj)表示特征ai的取值為vi且特征aj的取值為vj的概率.I(ai,aj)的值越大,表示特征ai和aj越相似.

    這里SG為特征組G與類別的關(guān)聯(lián)度,RG為特征組G內(nèi)所有特征的相似性,特征組G的Q值越大,表示該特征組中的特征與類別的關(guān)聯(lián)度越大,特征組內(nèi)特征之間的冗余度越??;反之,Q值越小,表示該特征組中的特征與類別的關(guān)聯(lián)度越小,特征組內(nèi)特征之間的冗余度越大.

    為了計(jì)算特征分組的初始Q值,需要選出2個(gè)特征放入分組中:首先將排在第1位的特征a1放入分組,然后計(jì)算特征a1與其他每個(gè)特征ai之間的互信息,并選出互信息最大的特征,即最相似的特征放入該分組.之后按式(2)計(jì)算分組的Q值,記錄為q0.

    對于其他特征,將此時(shí)排在最前面的特征添加到當(dāng)前分組中,再計(jì)算其Q值,如果Qq0時(shí)停止向這個(gè)特征組添加特征,此時(shí)的特征組就作為第1個(gè)分組.在未被分組的特征上重復(fù)上述步驟得到新的特征組,依此類推,直到所有的特征都被分入特征組中,則得到所有特征組.最后取出每個(gè)特征組中的第1個(gè)特征作為其所在特征組的代表,用取出的特征構(gòu)成候選特征子集.

    MIFS算法的主要步驟總結(jié)如下:

    算法1. MIFS算法.

    輸入:數(shù)據(jù)集D、候選特征個(gè)數(shù)k;

    輸出:候選特征子集Scan.

    ① 按式(1)計(jì)算數(shù)據(jù)集D中每個(gè)特征與類別c的互信息I(ai,c);

    ② 將特征按互信息從大到小排序,得到特征集A;

    ③ 按以下步驟對特征集A分組:

    ④ 令t=1,從A中取出排在第1位的特征a1放入分組Gt;

    ⑤ 按式(5)計(jì)算特征a1與其他每個(gè)特征ai之間的互信息I(ai,aj),將最大的特征放入分組Gt;

    ⑥ 按式(2)計(jì)算Gt的Q值,記為q0;

    ⑦ 從A中剩余的特征中取出排在最前面的特征放入分組Gt中,按式(2)計(jì)算Gt的Q值;如果Q≤q0,則重復(fù)步驟⑦;如果Q>q0,則將當(dāng)前的Gt作為第1個(gè)分組;

    ⑧ 令t=t+1,在剩下的A上重復(fù)步驟④~⑦,得到新的特征組Gt,直到t=k,或者A中所有特征都被分入特征組中時(shí)停止;

    ⑨ 取出每個(gè)特征組的第1個(gè)特征放入特征集Scan;

    ⑩ 返回Scan.

    1.2 MIFS-Boruta算法

    MIFS算法可以通過對特征分組的方式去除冗余特征,但它同大多數(shù)過濾型特征算法類似,無法自動(dòng)確定最佳特征.

    Boruta[19]是一種全相關(guān)的封裝型特征選擇方法,它試圖找到攜帶可用于預(yù)測的信息的所有特征,而不是像大多數(shù)傳統(tǒng)封裝型算法一樣只找到在分類器上產(chǎn)生最小誤差的特征子集.無論特征與決策變量的相關(guān)性強(qiáng)弱與否,Boruta都會找到所有的相關(guān)特征,這使得它非常適合應(yīng)用于確定最佳特征子集.

    Boruta算法首先將數(shù)據(jù)集擴(kuò)充,通過隨機(jī)打亂原數(shù)據(jù)集各特征的取值,生成與原數(shù)據(jù)集的特征數(shù)量相同的“影子”特征,由于這些“影子”特征是隨機(jī)生成的,所以Boruta算法認(rèn)為它們是不重要的特征.之后分別在各個(gè)原始特征與“影子”特征上采用隨機(jī)森林進(jìn)行分類,計(jì)算各特征的效果,將“影子”特征中分類效果最好的特征作為衡量原始特征是否重要的標(biāo)準(zhǔn),從而去除不重要的特征.Boruta算法能找到候選特征中與類別相關(guān)的所有特征,從而直接確定特征數(shù)目,得到最優(yōu)特征子集.

    Boruta可以找到所有相關(guān)特征這一優(yōu)點(diǎn)正好可以解決MIFS算法無法自動(dòng)給出最佳子集的問題,因此我們考慮建立MIFS和Boruta的混合模型.在混合模型中,封裝型算法可以充分利用過濾方法獲得的結(jié)果,提高運(yùn)行效率,并獲得產(chǎn)生較高分類性能的子集,同時(shí),過濾型方法也可以利用封裝型方法來確定特征子集中的特征個(gè)數(shù),這樣封裝和過濾方法的特性得到了很好的互補(bǔ)[14].因此本節(jié)提出一種基于MIFS和Boruta的混合模型,用以設(shè)計(jì)高效的特征選擇算法自動(dòng)選出一組冗余較小且數(shù)量較小的特征,稱為MIFS-Boruta算法.

    MIFS-Boruta算法的主要步驟歸納如下:

    算法2. MIFS-Boruta特征選擇算法.

    輸入:數(shù)據(jù)集D、候選特征子集個(gè)數(shù)k、迭代次數(shù)r;

    輸出:特征子集S.

    ① 在數(shù)據(jù)集D上運(yùn)行MIFS算法得到包含k個(gè)候選特征的特征集Scan;

    ② 從數(shù)據(jù)集D中取出特征集Scan對應(yīng)的數(shù)據(jù)作為新的數(shù)據(jù)集Dsub;

    ③ 在數(shù)據(jù)集Dsub上運(yùn)行Boruta算法,Boruta算法的迭代次數(shù)為參數(shù)r;

    ④ 返回特征子集S.

    MIFS算法初始化時(shí)選擇的和類別互信息最大的特征將會包含在最優(yōu)的特征子集中,因?yàn)樵撎卣魇紫缺环湃氲?個(gè)特征分組,之后根據(jù)分組標(biāo)準(zhǔn)Q向該特征組中添加特征使其內(nèi)部的特征之間有較高的冗余度,同時(shí)使得特征組與類別的關(guān)聯(lián)度隨著特征數(shù)量的增加而減小,所以在此特征組中只需選擇一個(gè)與類別關(guān)聯(lián)度最大的特征作為該組的代表,這個(gè)特征就是算法初始化時(shí)選出的和類別互信息最大的特征,因此該特征被選為最優(yōu)特征子集的候選特征;然后采用Boruta算法從候選特征中去除不重要的特征,而由于與類別互信息最大的特征的分類效果通常不會低于“影子”特征的分類效果,因此該特征不會被去除,包含在最優(yōu)特征子集中.

    1.3 時(shí)間復(fù)雜度分析

    假設(shè)給定數(shù)據(jù)集的樣本數(shù)為n,特征維數(shù)為m,則MIFS算法中求類別和每個(gè)特征之間的互信息的時(shí)間復(fù)雜度為O(mn2),對特征排序的時(shí)間復(fù)雜度為O(mlogm),迭代地對特征分組的復(fù)雜度在最壞的情況下為O(mn),所以MIFS算法的時(shí)間復(fù)雜度為O(mlogm+mn2).由于本文算法針對小樣本數(shù)據(jù),其中n?m,因此可以將樣本數(shù)n視為常數(shù),得到關(guān)于特征維數(shù)m的時(shí)間復(fù)雜度為O(mlogm).

    而MIFS-Boruta特征選擇算法的運(yùn)行時(shí)間是由MIFS算法和Boruta算法2部分運(yùn)行時(shí)間組成,如果用k表示第1階段MIFS算法得到的候選特征子集中特征的個(gè)數(shù),根據(jù)文獻(xiàn)[19]中的分析可知,Boruta算法的時(shí)間復(fù)雜度為O(kn),同理,在小樣本問題中可看作關(guān)于維數(shù)的時(shí)間復(fù)雜度O(k).綜上,MIFS-Boruta特征選擇算法的時(shí)間復(fù)雜度為O(mlogm)+O(k),又因?yàn)閗?m,因此算法的時(shí)間復(fù)雜度實(shí)際上為O(mlogm).

    2 實(shí)驗(yàn)結(jié)果與分析

    2.1 實(shí)驗(yàn)數(shù)據(jù)

    為了驗(yàn)證算法在高維數(shù)據(jù)上的性能和有效性,以及該方法是否適用于實(shí)際問題,本文使用了11個(gè)公開可用的數(shù)據(jù)集,特征數(shù)目在1 024~19 993之間,平均特征個(gè)數(shù)為6 924,其中6個(gè)數(shù)據(jù)集的維度超過了5 000,3個(gè)數(shù)據(jù)集具有不少于10 000維的特征,這些數(shù)據(jù)集主要是圖像和生物微陣列數(shù)據(jù),數(shù)據(jù)集的詳細(xì)信息如表1所示.為了便于處理,本文對連續(xù)型特征的數(shù)據(jù)使用等距離散化的方法進(jìn)行了預(yù)處理.實(shí)驗(yàn)在1臺i7-2600 3.40 GHz 4核處理器、4 GB內(nèi)存的電腦上運(yùn)行,開發(fā)環(huán)境為Matlab R2015a.

    Table 1 Datasets Used in the Experiments表1 實(shí)驗(yàn)數(shù)據(jù)集

    2.2 特征選擇結(jié)果比較

    為了驗(yàn)證本文算法是否能夠獲得較好的特征選擇結(jié)果,將本文的MIFS-Boruta算法與CMIM[10],ICAP(interaction capping)[20],CIFE(conditional infomax feature extraction)[21],mRMR[14],L1MI(L1 least-squares mutual information)[22]5種經(jīng)典的特征選擇算法進(jìn)行比較,其中CMIM,ICAP,CIFE,L1MI方法是基于互信息度量的過濾型特征選擇算法,mRMR是基于相關(guān)性度量的過濾型特征選擇算法.這些方法在使用時(shí)一般都要指定降維之后的特征數(shù),為公平起見,實(shí)驗(yàn)中將這些方法分別與Boruta方法結(jié)合,預(yù)先設(shè)定了特征選擇算法在每個(gè)樣本集上的候選特征數(shù)k,本文根據(jù)經(jīng)驗(yàn)將其設(shè)為原始數(shù)據(jù)集特征維數(shù)的1.5%~5%之間.表2為在不同數(shù)據(jù)集上各特征選擇算法選出的特征個(gè)數(shù).由于每種方法的第2階段都是Boruta,故本文表中的方法名稱都省略了-Boruta.

    Table 2 Feature Selection Results Under the Combinations of Different Feature Selection Algorithms and Boruta Algorithm表2 不同特征選擇算法與Boruta算法組合時(shí)特征選擇結(jié)果

    從表2可以看出所有的特征選擇算法所選出的特征個(gè)數(shù)遠(yuǎn)小于原始特征維度m,最終選出的特征個(gè)數(shù)也明顯小于候選特征個(gè)數(shù),CIFE算法在8個(gè)數(shù)據(jù)集上都得到了最少的特征個(gè)數(shù),ICAP和CMIM算法分別在2個(gè)和1個(gè)數(shù)據(jù)集上取得了最少的特征個(gè)數(shù),本文的MIFS方法所選出的特征個(gè)數(shù)在5個(gè)數(shù)據(jù)集上少于L1MI和mRMR,4個(gè)數(shù)據(jù)集上少于CIMI.

    5種算法分別和Boruta算法組合的特征選擇方法得到的5個(gè)特征子集中,存在部分與MIFS-Boruta算法所選特征相同的特征,相同特征的個(gè)數(shù)如圖1所示:

    Fig. 1 The comparison of the same features selected by MIFS-Boruta algorithm and other algorithms圖1 MIFS-Boruta算法與其他算法選出的相同特征比較

    從圖1可以看出,MIFS選出的特征與5種算法選出的特征中基本上都存在相同的特征,其中與mRMR方法所選特征最為相近,相同特征的數(shù)量最多.盡管MIFS與這些方法選出的特征不盡相同,但后邊的實(shí)驗(yàn)表明這對分類結(jié)果的影響不大.

    2.3 運(yùn)行時(shí)間比較

    由于確定最佳特征子集都采用算法Boruta,因此只需要比較6種算法在確定候選特征子集過程中的運(yùn)行時(shí)間,這些算法在11個(gè)數(shù)據(jù)集上的運(yùn)行時(shí)間結(jié)果如表3所示.為了比較的公平性,本實(shí)驗(yàn)將選出的特征數(shù)目k全部設(shè)定為150個(gè).從表3中可以看到,所提出的MIFS算法在8個(gè)數(shù)據(jù)集上的運(yùn)行時(shí)間均小于其他幾個(gè)基于互信息的特征選擇算法,只有在lung,pixraw10P,SMK_CAN_187這3個(gè)數(shù)據(jù)集上,MIFS算法稍慢于CMIM算法.因此在大多數(shù)數(shù)據(jù)集上,MIFS算法具有更高的運(yùn)行效率.

    Table 3 The Running Time of Different Feature Selection Algorithms表3 不同特征選擇算法運(yùn)行時(shí)間 s

    2.4 在特征子集的分類性能比較

    為了驗(yàn)證所提算法特征選擇的有效性,分別選取支持向量機(jī)(support vector machine, SVM),決策樹,K-近鄰(K-nearest neighbor, KNN) 3個(gè)分類器作為分類算法.SVM是監(jiān)督學(xué)習(xí)模型,本文使用常用的線性SVM模型;決策樹是通過學(xué)習(xí)算法構(gòu)造的樹形結(jié)構(gòu)的分類器,它是一種非線性分類器,本文使用經(jīng)典的ID3算法;對于KNN分類器,選用1NN算法(單最近鄰算法),它通過最鄰近的1個(gè)樣本的類別來決定待分樣本所屬的類別.在所有數(shù)據(jù)集上進(jìn)行10次十折交叉驗(yàn)證測試分類性能.

    實(shí)驗(yàn)使用3個(gè)指標(biāo)來評價(jià)特征子集選擇算法的性能:1)最低分類錯(cuò)誤率;2)平均最低分類錯(cuò)誤率;3)Win/Tie/Lose記錄(該記錄表示在給定度量上,所提算法獲得比其他特征選擇算法更好、相等和更差的性能的數(shù)據(jù)集數(shù)目,可簡記為W/T/L).

    不同特征選擇方法得到的特征子集在使用SVM、決策樹和KNN作為分類器時(shí)的最低分類錯(cuò)誤率分別如表4~6所示,表中的Average Error表示各方法在所有數(shù)據(jù)集下的平均最低分類錯(cuò)誤率,W/T/L行表示所提出方法在11個(gè)數(shù)據(jù)集上的分類錯(cuò)誤率勝于、相同、弱于其所在列的方法的數(shù)據(jù)集數(shù)目.

    Table 4 Classification Error Rate on SVM Classifier表4 SVM分類器上的分類錯(cuò)誤率 %

    Table 5 Classification Error Rate on Decision Tree Classifier表5 決策樹分類器上的分類錯(cuò)誤率 %

    Table 6 Classification Error Rate on CNN Classifier表6 KNN分類器上的分類錯(cuò)誤率 %

    從表4可以看出,在使用SVM作分類器時(shí),MIFS算法在4個(gè)數(shù)據(jù)集上取得了最低的分類錯(cuò)誤率,并且平均分類錯(cuò)誤率最低;在W/T/L指標(biāo)中,MIFS算法除了小幅落后于mRMR算法外,均優(yōu)于其他方法.因此MIFS算法選出的特征子集在SVM分類器上的表現(xiàn)良好.

    從表5可以看出,在使用決策樹作分類器時(shí),MIFS算法在5個(gè)數(shù)據(jù)集上取得了最低的分類錯(cuò)誤率,接近全部數(shù)據(jù)集的一半.對于平均分類錯(cuò)誤率,MIFS算法取得了第2名,僅與第1名相差0.2個(gè)百分點(diǎn);在W/T/L指標(biāo)中,MIFS算法均優(yōu)于其他方法.

    從表6可以看出,MIFS算法在KNN分類器上分別在4個(gè)數(shù)據(jù)集中取得了最低的分類錯(cuò)誤率,同時(shí)取得了最低的平均分類錯(cuò)誤率,低于第2名1.09個(gè)百分點(diǎn);從W/T/L指標(biāo)來看,MIFS算法也都優(yōu)于其他方法,因此MIFS算法選出的特征子集在KNN分類器上具有更好的分類性能.

    綜上,在使用最簡單的支持向量機(jī)、決策樹、KNN三種分類器時(shí),MIFS方法都取得了很好的分類結(jié)果.

    3 結(jié) 論

    本文提出了一種針對小樣本數(shù)據(jù)的特征選擇方法,該方法首先通過互信息對特征分組,選出組內(nèi)與類別相關(guān)性最大的特征,大大降低了數(shù)據(jù)集的維度.同時(shí)為了解決無法自動(dòng)給出最佳子集的問題,構(gòu)造了過濾型與封裝型算法結(jié)合的2階段混合模型,即MIFS-Boruta算法,該算法不僅降低了數(shù)據(jù)集的維度,而且能夠自動(dòng)確定最佳特征子集,實(shí)驗(yàn)驗(yàn)證了所提算法的有效性.該算法為解決小樣本問題提供了一種有效的方法.

    然而,MIFS-Boruta算法的候選特征個(gè)數(shù)需要人為設(shè)定,如果設(shè)定的值過大,則會影響最終特征選擇的運(yùn)行效率;如果設(shè)定的值過小,則會影響最終選出特征的性能.因此,如何自動(dòng)確定合理的候選特征個(gè)數(shù)還需要進(jìn)一步的研究.

    猜你喜歡
    互信息特征選擇子集
    由一道有關(guān)集合的子集個(gè)數(shù)題引發(fā)的思考
    拓?fù)淇臻g中緊致子集的性質(zhì)研究
    關(guān)于奇數(shù)階二元子集的分離序列
    Kmeans 應(yīng)用與特征選擇
    電子制作(2017年23期)2017-02-02 07:17:06
    基于互信息的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)
    聯(lián)合互信息水下目標(biāo)特征選擇算法
    改進(jìn)的互信息最小化非線性盲源分離算法
    電測與儀表(2015年9期)2015-04-09 11:59:22
    每一次愛情都只是愛情的子集
    都市麗人(2015年4期)2015-03-20 13:33:22
    基于增量式互信息的圖像快速匹配方法
    基于特征選擇和RRVPMCD的滾動(dòng)軸承故障診斷方法
    汤姆久久久久久久影院中文字幕 | 一级毛片黄色毛片免费观看视频| 又爽又黄a免费视频| 99热这里只有是精品50| 天堂网av新在线| 精品国内亚洲2022精品成人| 人妻一区二区av| 高清午夜精品一区二区三区| 亚洲av二区三区四区| 色综合色国产| 亚洲不卡免费看| 国产探花在线观看一区二区| av在线老鸭窝| 精品一区二区三卡| 男女那种视频在线观看| 日韩一区二区视频免费看| 天堂av国产一区二区熟女人妻| 黄色一级大片看看| 精品熟女少妇av免费看| 少妇被粗大猛烈的视频| 91av网一区二区| av国产免费在线观看| 亚洲av在线观看美女高潮| 麻豆成人av视频| 日日摸夜夜添夜夜爱| 男人舔女人下体高潮全视频| 秋霞在线观看毛片| 久久6这里有精品| 好男人在线观看高清免费视频| 国产美女午夜福利| 亚洲人与动物交配视频| 熟女人妻精品中文字幕| 在线天堂最新版资源| 欧美97在线视频| 国产久久久一区二区三区| 天堂影院成人在线观看| 亚洲在久久综合| 婷婷色麻豆天堂久久| 夫妻午夜视频| 亚洲精品中文字幕在线视频 | 国产激情偷乱视频一区二区| 免费看不卡的av| 99久久精品一区二区三区| 免费观看av网站的网址| 国产国拍精品亚洲av在线观看| 久久久久九九精品影院| 伊人久久国产一区二区| 欧美不卡视频在线免费观看| 色综合亚洲欧美另类图片| 成人午夜高清在线视频| 啦啦啦中文免费视频观看日本| 国产美女午夜福利| 免费观看精品视频网站| 三级毛片av免费| 91精品一卡2卡3卡4卡| 国产精品蜜桃在线观看| 又爽又黄a免费视频| 国产乱来视频区| 免费av不卡在线播放| 国产成人aa在线观看| 成人特级av手机在线观看| 国产亚洲91精品色在线| 国产在视频线精品| 久久久a久久爽久久v久久| 美女脱内裤让男人舔精品视频| 九九久久精品国产亚洲av麻豆| 久久6这里有精品| 精品久久久久久成人av| 在线a可以看的网站| 菩萨蛮人人尽说江南好唐韦庄| 一二三四中文在线观看免费高清| 午夜久久久久精精品| 白带黄色成豆腐渣| 国产精品人妻久久久久久| 精品久久国产蜜桃| 亚洲欧美精品专区久久| 日韩精品有码人妻一区| 高清日韩中文字幕在线| 国产高清国产精品国产三级 | 午夜激情福利司机影院| 男人和女人高潮做爰伦理| 国产亚洲一区二区精品| 最近的中文字幕免费完整| 亚洲最大成人中文| 欧美高清性xxxxhd video| 国产精品熟女久久久久浪| 亚洲国产精品成人综合色| 毛片一级片免费看久久久久| 日本熟妇午夜| 免费大片黄手机在线观看| 99视频精品全部免费 在线| 2021天堂中文幕一二区在线观| 久久久久久久久久黄片| 亚洲av一区综合| 日韩成人av中文字幕在线观看| 一夜夜www| 婷婷色综合www| 久久99热6这里只有精品| 天堂av国产一区二区熟女人妻| 国产免费福利视频在线观看| 菩萨蛮人人尽说江南好唐韦庄| 日韩av在线大香蕉| 日韩一区二区三区影片| 又爽又黄a免费视频| 汤姆久久久久久久影院中文字幕 | 大话2 男鬼变身卡| 女人十人毛片免费观看3o分钟| 久久久精品94久久精品| 91久久精品国产一区二区三区| 69av精品久久久久久| 青青草视频在线视频观看| 国产高清有码在线观看视频| 久久人人爽人人片av| 一级av片app| 精品久久久久久久久久久久久| 久久精品国产鲁丝片午夜精品| 欧美一级a爱片免费观看看| 少妇高潮的动态图| 男女啪啪激烈高潮av片| 热99在线观看视频| 久久久精品94久久精品| 综合色丁香网| 我的女老师完整版在线观看| 亚洲精品色激情综合| 亚洲18禁久久av| 久久久久久久午夜电影| 久久这里只有精品中国| 久久久精品欧美日韩精品| 日韩欧美精品免费久久| 男人狂女人下面高潮的视频| 99热网站在线观看| 久久久成人免费电影| 美女国产视频在线观看| 国产伦精品一区二区三区视频9| 亚洲精华国产精华液的使用体验| 欧美变态另类bdsm刘玥| 三级经典国产精品| 亚洲精品aⅴ在线观看| av网站免费在线观看视频 | 丰满少妇做爰视频| 插阴视频在线观看视频| 国产精品美女特级片免费视频播放器| 色尼玛亚洲综合影院| 成人高潮视频无遮挡免费网站| 99re6热这里在线精品视频| 亚洲婷婷狠狠爱综合网| 在线 av 中文字幕| 国产一级毛片在线| 国产成人a区在线观看| 天堂影院成人在线观看| 国产高清三级在线| 插阴视频在线观看视频| 国模一区二区三区四区视频| 国产黄片视频在线免费观看| 久久99热这里只频精品6学生| 国产精品熟女久久久久浪| 中文乱码字字幕精品一区二区三区 | 夫妻性生交免费视频一级片| 免费观看av网站的网址| 中文欧美无线码| 美女xxoo啪啪120秒动态图| 亚洲欧美一区二区三区国产| 乱码一卡2卡4卡精品| 国产毛片a区久久久久| 亚洲av国产av综合av卡| 国产爱豆传媒在线观看| 婷婷色麻豆天堂久久| 七月丁香在线播放| 能在线免费观看的黄片| 中文在线观看免费www的网站| 国产黄片美女视频| 精品人妻视频免费看| 91久久精品电影网| 男女啪啪激烈高潮av片| 欧美日韩在线观看h| 国产一区二区在线观看日韩| 国产综合精华液| 亚洲综合精品二区| 国产片特级美女逼逼视频| 水蜜桃什么品种好| 啦啦啦韩国在线观看视频| 国产成人精品福利久久| 久久久久久九九精品二区国产| 日韩不卡一区二区三区视频在线| 嫩草影院入口| 亚洲精品乱码久久久v下载方式| av在线老鸭窝| 国产一区二区三区综合在线观看 | 亚洲丝袜综合中文字幕| 亚洲无线观看免费| 欧美日韩综合久久久久久| 日韩人妻高清精品专区| 国产一区亚洲一区在线观看| 亚洲aⅴ乱码一区二区在线播放| 国内精品宾馆在线| 韩国av在线不卡| 丝袜喷水一区| .国产精品久久| 亚洲精品成人久久久久久| 国产精品精品国产色婷婷| 三级国产精品片| 欧美激情国产日韩精品一区| 成人国产麻豆网| 亚洲av电影在线观看一区二区三区 | 午夜福利成人在线免费观看| 免费少妇av软件| 亚洲色图av天堂| 午夜福利网站1000一区二区三区| 欧美bdsm另类| 嫩草影院新地址| 国产av国产精品国产| 亚洲欧美一区二区三区国产| 国产精品人妻久久久久久| 亚洲国产精品sss在线观看| 亚洲精品久久午夜乱码| 午夜老司机福利剧场| av女优亚洲男人天堂| 亚洲久久久久久中文字幕| 伊人久久国产一区二区| 99热全是精品| 又爽又黄a免费视频| 日韩,欧美,国产一区二区三区| 少妇高潮的动态图| 麻豆久久精品国产亚洲av| 精品一区在线观看国产| 能在线免费看毛片的网站| 熟妇人妻不卡中文字幕| 国产乱人视频| 亚洲国产精品成人综合色| 国产一区有黄有色的免费视频 | ponron亚洲| 久久久亚洲精品成人影院| 亚洲国产精品sss在线观看| 午夜亚洲福利在线播放| 男人和女人高潮做爰伦理| 婷婷色av中文字幕| 国产午夜精品一二区理论片| 夜夜看夜夜爽夜夜摸| 2021天堂中文幕一二区在线观| 一区二区三区四区激情视频| 亚洲国产成人一精品久久久| 网址你懂的国产日韩在线| 国产一区二区三区av在线| 97在线视频观看| 午夜免费激情av| 老女人水多毛片| .国产精品久久| 91av网一区二区| 日韩欧美精品免费久久| 日韩成人伦理影院| 欧美日韩精品成人综合77777| 综合色av麻豆| 亚洲国产最新在线播放| 亚洲人与动物交配视频| 丝袜喷水一区| 人妻夜夜爽99麻豆av| 汤姆久久久久久久影院中文字幕 | 国产亚洲最大av| 午夜福利视频精品| 干丝袜人妻中文字幕| 日本-黄色视频高清免费观看| 亚洲av电影在线观看一区二区三区 | 亚洲av电影不卡..在线观看| 大话2 男鬼变身卡| 国产视频首页在线观看| 久99久视频精品免费| 欧美97在线视频| 精品酒店卫生间| 日韩av不卡免费在线播放| 国产欧美另类精品又又久久亚洲欧美| 一本一本综合久久| 蜜桃久久精品国产亚洲av| 特级一级黄色大片| 亚洲自拍偷在线| 搡老妇女老女人老熟妇| 久久久久九九精品影院| 亚洲av中文字字幕乱码综合| 亚洲18禁久久av| 亚洲精品一区蜜桃| 亚洲成人中文字幕在线播放| 又爽又黄无遮挡网站| 一区二区三区高清视频在线| 欧美成人a在线观看| 观看免费一级毛片| 久久久亚洲精品成人影院| 久久人人爽人人爽人人片va| 18禁裸乳无遮挡免费网站照片| 久99久视频精品免费| 免费黄频网站在线观看国产| 精品国产露脸久久av麻豆 | 欧美日韩精品成人综合77777| 精品人妻熟女av久视频| 欧美日韩综合久久久久久| 久久久精品94久久精品| 特大巨黑吊av在线直播| 成人高潮视频无遮挡免费网站| 久久99精品国语久久久| 久久精品国产自在天天线| 日日摸夜夜添夜夜爱| 又黄又爽又刺激的免费视频.| 秋霞伦理黄片| 欧美+日韩+精品| 精品熟女少妇av免费看| 亚洲国产av新网站| 免费看美女性在线毛片视频| 欧美丝袜亚洲另类| 亚洲成人av在线免费| 免费看美女性在线毛片视频| 啦啦啦韩国在线观看视频| 亚洲欧美精品专区久久| 两个人的视频大全免费| 免费av不卡在线播放| 亚州av有码| 亚洲欧美一区二区三区国产| 日韩,欧美,国产一区二区三区| 97人妻精品一区二区三区麻豆| 大话2 男鬼变身卡| 热99在线观看视频| 日本一二三区视频观看| 黄色欧美视频在线观看| 免费高清在线观看视频在线观看| 激情 狠狠 欧美| 99热全是精品| 国产成人freesex在线| 草草在线视频免费看| 午夜免费激情av| 高清在线视频一区二区三区| 亚洲欧美一区二区三区黑人 | 天堂√8在线中文| 麻豆乱淫一区二区| 国产爱豆传媒在线观看| 久99久视频精品免费| 熟女电影av网| 成人无遮挡网站| 久久久久国产网址| 国产黄片视频在线免费观看| 内射极品少妇av片p| 欧美另类一区| 日韩欧美一区视频在线观看 | 人人妻人人看人人澡| 国产美女午夜福利| 国内少妇人妻偷人精品xxx网站| 99久久精品国产国产毛片| 美女脱内裤让男人舔精品视频| 亚洲精品影视一区二区三区av| 成人高潮视频无遮挡免费网站| 日本免费a在线| 亚洲欧美成人精品一区二区| av一本久久久久| 欧美一级a爱片免费观看看| 免费播放大片免费观看视频在线观看| 色尼玛亚洲综合影院| 亚洲欧美成人综合另类久久久| 99热这里只有是精品在线观看| ponron亚洲| 在线免费十八禁| 欧美xxⅹ黑人| 亚洲va在线va天堂va国产| 三级男女做爰猛烈吃奶摸视频| 欧美激情在线99| 不卡视频在线观看欧美| 国产高清国产精品国产三级 | 丝袜喷水一区| 国产亚洲91精品色在线| a级一级毛片免费在线观看| 久久久久久久午夜电影| 尾随美女入室| 综合色丁香网| 精品酒店卫生间| 少妇猛男粗大的猛烈进出视频 | 菩萨蛮人人尽说江南好唐韦庄| 直男gayav资源| 亚洲国产精品专区欧美| 男女那种视频在线观看| 国产精品人妻久久久影院| 真实男女啪啪啪动态图| 亚洲熟妇中文字幕五十中出| 成人午夜精彩视频在线观看| 欧美性感艳星| www.av在线官网国产| 国产免费视频播放在线视频 | 丰满少妇做爰视频| 欧美xxⅹ黑人| 成人性生交大片免费视频hd| 久久精品人妻少妇| 久久精品夜色国产| 汤姆久久久久久久影院中文字幕 | 日本黄大片高清| 亚洲四区av| 寂寞人妻少妇视频99o| 国产片特级美女逼逼视频| 男的添女的下面高潮视频| 国产精品久久久久久精品电影小说 | 亚洲国产精品国产精品| 日韩三级伦理在线观看| 国产激情偷乱视频一区二区| 我要看日韩黄色一级片| 欧美日本视频| 视频中文字幕在线观看| 大香蕉久久网| 少妇猛男粗大的猛烈进出视频 | 国产 亚洲一区二区三区 | 日韩欧美国产在线观看| 97超视频在线观看视频| 久久久精品免费免费高清| 中文精品一卡2卡3卡4更新| 欧美高清性xxxxhd video| 黄片wwwwww| 女人被狂操c到高潮| 91av网一区二区| 免费黄网站久久成人精品| 亚洲国产精品专区欧美| 一级爰片在线观看| av一本久久久久| av在线亚洲专区| 国产高清有码在线观看视频| h日本视频在线播放| 好男人视频免费观看在线| 在线a可以看的网站| 99久久精品国产国产毛片| 纵有疾风起免费观看全集完整版 | 极品教师在线视频| 国产熟女欧美一区二区| 日韩国内少妇激情av| 亚洲欧洲国产日韩| a级毛色黄片| 国产精品一区二区性色av| 日本免费a在线| 欧美极品一区二区三区四区| 成年版毛片免费区| 亚洲精品成人久久久久久| 一本久久精品| 亚洲丝袜综合中文字幕| 在线观看一区二区三区| 亚洲va在线va天堂va国产| 91狼人影院| av免费在线看不卡| 午夜老司机福利剧场| 99久国产av精品| 欧美三级亚洲精品| 亚洲国产欧美人成| 丝瓜视频免费看黄片| 国产毛片a区久久久久| 五月玫瑰六月丁香| 亚洲精品中文字幕在线视频 | 欧美变态另类bdsm刘玥| 精品午夜福利在线看| 成年av动漫网址| 久久久久久久久中文| 亚洲欧洲国产日韩| 干丝袜人妻中文字幕| 精品国产一区二区三区久久久樱花 | 黄片wwwwww| 成年人午夜在线观看视频 | 免费av不卡在线播放| 3wmmmm亚洲av在线观看| 天天躁日日操中文字幕| 伦精品一区二区三区| 18禁在线播放成人免费| 国产精品一区二区在线观看99 | 女人被狂操c到高潮| 国产爱豆传媒在线观看| 激情五月婷婷亚洲| 午夜福利成人在线免费观看| av在线蜜桃| 欧美日韩视频高清一区二区三区二| 一级av片app| 一夜夜www| 大片免费播放器 马上看| 成人午夜高清在线视频| 18禁裸乳无遮挡免费网站照片| 亚洲四区av| 国产精品国产三级国产专区5o| 欧美日韩亚洲高清精品| 久久久a久久爽久久v久久| 日韩欧美一区视频在线观看 | 亚洲在线观看片| 亚洲精华国产精华液的使用体验| 国产一区二区三区综合在线观看 | 免费黄色在线免费观看| 啦啦啦啦在线视频资源| 亚洲精品乱码久久久v下载方式| 欧美97在线视频| 日韩国内少妇激情av| 精品熟女少妇av免费看| 国产三级在线视频| 色综合亚洲欧美另类图片| 色综合站精品国产| 六月丁香七月| 非洲黑人性xxxx精品又粗又长| 亚洲精品乱码久久久v下载方式| 啦啦啦韩国在线观看视频| 成人欧美大片| 久久久久国产网址| 欧美精品一区二区大全| 日韩伦理黄色片| 激情 狠狠 欧美| 成人av在线播放网站| 国产乱人偷精品视频| 免费大片黄手机在线观看| 国产三级在线视频| 成人特级av手机在线观看| 国产精品嫩草影院av在线观看| 免费黄网站久久成人精品| 精品少妇黑人巨大在线播放| 神马国产精品三级电影在线观看| 亚洲熟妇中文字幕五十中出| 一级毛片我不卡| 久久久久久久久久久丰满| 国产毛片a区久久久久| 欧美日韩在线观看h| 成人漫画全彩无遮挡| 简卡轻食公司| 啦啦啦韩国在线观看视频| 欧美xxⅹ黑人| 亚州av有码| 最近手机中文字幕大全| 99热这里只有精品一区| 成人高潮视频无遮挡免费网站| 亚洲乱码一区二区免费版| 舔av片在线| 成年免费大片在线观看| 亚洲欧美成人精品一区二区| 日韩精品青青久久久久久| 欧美另类一区| 免费黄色在线免费观看| 午夜精品一区二区三区免费看| 黄色配什么色好看| 国产精品福利在线免费观看| 一级二级三级毛片免费看| 亚洲精品成人av观看孕妇| 国产午夜精品一二区理论片| 亚洲av中文av极速乱| 搡老乐熟女国产| 99热这里只有是精品在线观看| 亚洲精华国产精华液的使用体验| 亚洲精品自拍成人| 激情 狠狠 欧美| 天堂俺去俺来也www色官网 | 天堂av国产一区二区熟女人妻| 精品人妻偷拍中文字幕| 国产亚洲最大av| 成年免费大片在线观看| 亚洲在久久综合| 男人舔女人下体高潮全视频| 亚洲国产精品成人综合色| 亚洲精品乱码久久久v下载方式| 波野结衣二区三区在线| 亚洲伊人久久精品综合| 男插女下体视频免费在线播放| 乱码一卡2卡4卡精品| 精品一区二区三区人妻视频| 男女边吃奶边做爰视频| 青春草国产在线视频| 伊人久久精品亚洲午夜| 五月伊人婷婷丁香| 91精品伊人久久大香线蕉| 天堂影院成人在线观看| 亚洲欧美成人综合另类久久久| 99热这里只有是精品在线观看| 日韩欧美 国产精品| 亚洲av一区综合| 国产91av在线免费观看| 久久久久久久久久久免费av| 黑人高潮一二区| 亚洲欧美一区二区三区国产| 久久久久久久久久成人| 又大又黄又爽视频免费| 亚洲av免费高清在线观看| 免费av观看视频| 免费观看a级毛片全部| 国模一区二区三区四区视频| 夜夜爽夜夜爽视频| 男女边摸边吃奶| 91在线精品国自产拍蜜月| 色尼玛亚洲综合影院| 国产精品一区二区性色av| 舔av片在线| 九九爱精品视频在线观看| 精品一区二区三区人妻视频| 观看免费一级毛片| 中文字幕av成人在线电影| 久久99热这里只频精品6学生| 亚洲国产精品国产精品| 国产av码专区亚洲av| 床上黄色一级片| 免费看日本二区| 全区人妻精品视频| 国产精品爽爽va在线观看网站| 亚洲av不卡在线观看| 亚洲欧美一区二区三区黑人 | 久久久精品免费免费高清| av免费观看日本| 国产亚洲精品久久久com| 国产又色又爽无遮挡免| 精品国产三级普通话版| 国产精品熟女久久久久浪| 亚洲无线观看免费| 99热网站在线观看| 韩国av在线不卡| 大陆偷拍与自拍| 精品一区在线观看国产| 亚洲不卡免费看| 精品人妻偷拍中文字幕| 亚洲国产精品成人综合色| 日韩电影二区| 男女下面进入的视频免费午夜| 好男人在线观看高清免费视频| 欧美激情国产日韩精品一区| 久久久久久久久久黄片| 欧美丝袜亚洲另类| 精品国产一区二区三区久久久樱花 | 精品人妻熟女av久视频| 黄色配什么色好看| 精品久久国产蜜桃|