• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    面向代價敏感的多標記不完備數據特征選擇算法

    2019-01-24 09:01:26錢文彬王映龍吳兵龍
    小型微型計算機系統 2018年12期
    關鍵詞:決策表特征選擇子集

    黃 琴,錢文彬,王映龍,吳兵龍

    (江西農業(yè)大學 計算機與信息工程學院,南昌 330045)(江西省高等學校農業(yè)信息技術重點實驗室,南昌 330045)

    1 引 言

    由于在許多現實應用領域中,數據特征值的獲取通常是需要花費金錢、時間或其他資源作為代價成本,因此,將代價引入到數據挖掘和知識發(fā)現領域是顯得尤為必要.近年來,代價敏感學習問題作為數據挖掘領域的十大最具挑戰(zhàn)性問題之一[1],已受到越來越多研究者的關注,并被廣泛應用于醫(yī)學[2,3]、模式識別[4]、人臉識別[5-8]等各個研究領域.另外,特征選擇作為一種有效的數據降維方法[9-12],其目的是通過去除冗余特征,提高數據的質量,加快數據挖掘的速度.由于基于代價敏感的特征選擇算法是對特征選擇問題的擴展,從而基于代價敏感的特征選擇問題也受到了廣大研究者的關注.

    近年來,基于代價敏感學習的單標記特征選擇研究取得了一些有意義的成果.Li等[13]在C4.5算法的基礎上提出了基于兩種自適應機制的代價敏感決策樹算法,一種是選擇自適應分割點機制來構建分類器,另一種機制即自適應刪除屬性機制,在選擇節(jié)點的過程中刪除冗余屬性.Zhao等[14]用啟發(fā)式算法選擇結點中的屬性,并構造了一種基于加權類分布批量刪除屬性機制的代價敏感決策樹算法.Zhao等[15]通過自適應鄰域粗糙集模型和快速回溯算法構造了一種基于自適應鄰域粒度的多級置信度的代價敏感特征選擇算法.Zhou等[16]提出基于均勻森林的代價敏感特征選擇算法,其在構建基礎決策樹過程中結合特征代價,從而生成低代價的特征子集.Fan等[17]通過測試代價構造自適應鄰域模型,從而實現對異構數據的屬性約簡.Zhao等[18]提出不同粒度下對應不同置信水平相關的數據精度,在覆蓋粗糙集模型下設計一種基于置信水平的代價敏感屬性選擇.Min等[19]提出了一種基于啟發(fā)式算法的最小化測試代價屬性約簡方法,并用四種度量方法來評價約簡算法的性能指標.Min等[20]提出基于測試代價約束問題的特征選擇算法,并用回溯法和啟發(fā)式算法進行分析.Liu等[21]通過優(yōu)化F-measures函數,解決不平衡類問題,實現基于測試代價的特征選擇的算法.Dai等[22]在有效的索引能力的基礎上,提出了一種基于離散粒子群算法在測試代價敏感屬性約簡中的應用.

    上述基于代價敏感的特征選擇算法研究主要面向單標記分類問題,但由于多標記高維數據廣泛存在于社會生活中[23-25].由此,在代價敏感學習下對多標記高維數據進行特征選擇值得進一步研究.同時,在現實生活應用存在大量的連續(xù)型、不完備性多標記高維數據.若需對連續(xù)型數據進行離散化處理以及缺失數據進行填充處理,將會影響數據計算的精度和增加數據計算的復雜性.

    為此,本文提出了一種面向代價敏感的多標記不完備鄰域數據特征選擇算法,首先,算法在粗糙集模型上通過距離度量公式計算多標記不完備數據下的鄰域粒度,并根據多標記不完備數中特征的標準差和特征參數計算出合理的鄰域閾值,然后,通過均勻分布和正態(tài)分布為每個特征生成特征代價,在特征選擇過程中,根據歸一化后的正域和特征代價,提出了一種度量特征的重要性計算方法,并在特征核的基礎上,根據特征的重要性設計了啟發(fā)式的特征選擇算法;最后,在Mulan數據集上利用五個多標記分類器對考慮代價和不考慮代價的多標記特征選擇進行實驗比較和結果分析,實驗結果表明,本文算法解決了多標記連續(xù)型不完備數據在考慮代價情況下的特征選擇問題,可選擇出代價總和相對較低的特征子集,這為基于代價敏感的多標記不完備高維數據的分析提供了一種可借鑒的方法.

    2 相關知識

    在粒計算理論中,多標記數據可表示成一個多標記決策表MDT=(U,A∪D,V,f)中,U為對象集{x1,x2,…,xn},也稱為論域,A為條件特征集{a1,a2,…,am},D為多標記決策特征{l1,l2,…,lk},且A∩D=?.V為全特征集的值域,其中V=∪Va,a∈A∪D,Va表示特征a的值域,f是U×(A∪D)→V的信息函數.

    定義1.當多標記決策表中存在缺失值時,記缺失值為“*”,即至少存在a∈A,x∈U,使得f(x,a)=*,此時數據稱為多標記不完備決策表IMDT=(U,A∪D,V,f).

    定義2.給定多標記不完備決策表IMDT=(U,A∪D,V,f),對于任意特征子集B?A,定義特征子集B的容差關系T(B):

    T(B)={(xi,xj)|(xi,xj)∈U×U,?at∈B?f(xi,at)=f(xj,at)∨f(xi,at)=*∨f(xj,at)=*}

    定義3.對于N維的實數空間Ω中,Δ=RN×RN→R,?xi,xj∈RN,則稱Δ為RN上的一個度量,(Ω,Δ)為度量空間,Δ(xi,xj)為距離函數,表示元xi和xj之間的距離:

    當p=1時,稱為曼哈頓距離.當p=2時,稱為歐氏距離.

    3 問題描述

    由于基于粗糙集的粒計算方法主要是處理名義型或符號型數據,但在現實應用領域中多標記數據的數值類型往往較復雜,當需處理數值型數據,須先對數據進行離散化,而對連續(xù)數據離散化將可能導致重要的信息丟失,從而影響分類算法的分類性能,為此需對連續(xù)型數值的多標記不完備數據開展特征選擇的研究.

    定義4.[26]對于多標記不完備鄰域決策表IMDT=(U,A∪D,V,f),若有特征子集B?A,特征子集B上的鄰域粒度為

    δB(xi)={x|x∈U,Δ(x,xi)≤δ}

    其中,δ為鄰域的閾值大小.

    下面以表1為例,若以曼哈頓距離作為鄰域度量標準,根據定義3計算各對象之間的鄰域粒度.

    表1 多標記不完備鄰域決策表Table 1 Incomplete neighborhood multi-label decision table

    利用曼哈頓距離度量公式,若特征a1、a2、a3、a4、a5的鄰域閾值分別為0.21、0.22、0.24、0.18、0.15.根據定義4計算包含所有特征的每個對象的鄰域粒度:

    δA(x1)={x1,x8},δA(x2)={x2,x10},

    δA(x3)={x3,x5,x8},δA(x4)={x4},

    δA(x5)={x3,x5,x7,x8},δA(x6)={x6},

    δA(x7)={x5,x7},δA(x8)={x1,x3,x5,x8},

    δA(x9)={x9},δA(x10)={x2,x10}.

    同理,可計算每個特征下每個對象的鄰域粒度.

    定義5.在多標記不完備鄰域決策表IMDT=(U,A∪D,V,f)中,假設U中包含N個對象空間,對象xi對應的標記集合用yi來表示,N個對象實例所對應的向量用y=(y1,y2,…,yn)來表示.對象xi中所對應的第k個標記值用lk來表示,若lk=1,則表示yi集合中所對應的存在第lk個標記.

    以表1為例,根據定義5可計算每個xi對象所對應的標記集合yi為:

    y1={l2},y2={l1},y3={l2},y4={l1,l2,l3},y5={l1,l3},y6={l2,l3},y7={l1,l2,l3},y8={l1,l2,l3},y9={l1,l2},y10={l3}.

    定義6.在多標記不完備鄰域決策表IMDT=(U,A∪D,V,f)中,對于?lk∈D,分別計算存在標記決策lk所對應的對象集合Dk:

    Dk={[x]lk|x∈U}

    以表1為例,根據定義6可計算存在標記決策lk所對應的對象集合Dk:

    D1={x2,x4,x5,x7,x8,x9}

    D2={x1,x3,x4,x6,x7,x8,x9}

    D3={x4,x5,x6,x7,x8,x10}

    定義7.在多標記不完備鄰域決策表IMDT=(U,A∪D,V,f)中,將擁有類別標記lk的對象集合用Dk表示,將對象xi所具有的標記集合用yi來表示.給定B?C,多標記不完備鄰域粗糙集的上下近似集為:

    定義8.在多標記不完備鄰域決策表IMDT=(U,A∪D,V,f),有特征子集B?A,特征子集B上的正域為:

    以表1為例,根據定義7和定義8可計算特征集A下的正域.具體的計算過程如下:

    由于對象x1所對應的標記是l1,所以只需判斷δA(x1)?D2是否成立,若成立,則對象x1在正域范圍.因為δA(x1)={x1,x8},δA(x1)?D2,所以x1∈POSA(D).同理可得x4∈POSA(D),x6∈POSA(D), x9∈POSA(D).由此可知,POSA(D)={x1,x4,x6,x9}.

    定義9.在多標記不完備鄰域決策表IMDT=(U,A∪D,V,f)中,多標記不完備鄰域決策表基于正區(qū)域核的定義為:

    Core(A)={a|a∈A,POSA-{a}(D)≠POSA(D)}

    以表1為例,根據定義9可計算出特征集A下的核,由計算可知:POSA-{a5}(D)≠POSA(D);由此可知,特征a5為核即Core(A)={a5}.

    定義10.在多標記不完備鄰域決策表IMDT=(U,A∪D,V,f),對于特征子集B?A,特征子集B的特征依賴度為:

    定義11.在多標記不完備鄰域決策表IMDT=(U,A∪D,V,f),特征子集B?A,若特征子集B是多標記不完備鄰域決策表的一個特征選擇結果,則B需滿足:

    1)γB(D)=γA(D)

    2)?at∈B,γB-{at}(D)<γB(D)

    條件1)確保了特征子集B和全特征集A下的正域對象相同,條件2)確保了特征子集B中沒有冗余特征.

    當前,由于在許多現實應用領域中,數據特征值的獲取通常是需要花費金錢、時間或其他資源作為代價成本,為此,基于代價敏感下多標記不完備鄰域數據的特征選擇問題值得進一步研究.

    定義12.當多標記不完備鄰域決策表中的特征需要考慮代價時,則稱該決策表為基于代價敏感的多標記不完備鄰域決策表,其定義為:CIMDT=(U,A∪D,V,f,c),c:A→R+∪{0}是獨立測試代價函數,其中代價為非負數.

    以表1為例,可給出多標記不完備鄰域決策表的測試代價向量,如表2所示.

    表2 測試代價向量表Table 2 Vector of test cost table

    性質1.基于代價敏感的多標記不完備鄰域決策表CIMDT=(U,A∪D,V,f,c),特征子集B?A,對于任意特征at,ai∈A-B,則基于測試代價的特征at的重要度為:

    SIGcost(at,B,D)=POSB∪{at}(D)*-CostB∪{at}(D)*

    為了方便性質1中對測試代價的特征at的重要度計算,先需對基于特征子集的正域個數和測試代價分別進行歸一化處理:

    POSB∪{at}(D)*=

    CostB∪{at}(D)*=

    其中max(|POSB∪{ai}(D)|)、min(|POSB∪{ai}(D)|)分別為特征子集B中加入任意特征后的最大和最小正域個數,max(CostB∪{ai}(D))、min(CostB∪{ai}(D))分別為特征子集B中加入任意特征后所對應的最大代價和最小代價.

    由定義9可知,特征a5為核,因此,先將a5加入到特征子集B中,結合表1和表2 中的數據計算出特征a1、a2、a3、a4基于測試代價的特征重要度分別為:

    SIGcost(a1,B,D)=0.7;

    SIGcost(a2,B,D)=0.85;

    SIGcost(a3,B,D)=0.25;

    SIGcost(a4,B,D)=-0.2;

    由上面計算可知,特征a2的特征重要度最大,由此將a2加入到特征子集B中,通過計算可知,此時POSB(D)=POSA(D),則特征子集B={a2,a5},結合表2中給出的代價可知,此時特征子集B所需花費的測試代價是$18,而整個特征全集下的測試代價為$52.

    4 特征選擇算法

    根據上述分析可知,針對代價敏感的多標記不完備鄰域決策表的特征選擇算法,首先,采用均勻分布和正態(tài)分布兩種分布函數分別為每個特征生成特征代價,根據鄰域的閾值計算基于代價敏感的多標記不完備鄰域決策表中每個對象的鄰域粒度,在此基礎上,得到基于代價敏感的多標記不完備鄰域決策表的正域對象集合.然后,根據基于測試代價特征的重要度計算公式計算除特征核之外的每個條件特征的重要度,每次將特征重要度最大的特征加入當前的特征子集中并更新特征子集中正域對象集,直到特征子集下的正域對象集合等于全特征集下的正域對象集,由此設計了一種面向基于代價敏感多標記不完備鄰域決策表的特征選擇算法,算法描述如下:

    輸入:基于代價敏感的多標記不完備鄰域決策表,δ為鄰域的閾值.

    輸出:特征子集Red.

    Begin:

    Step1.初始化Red←?;

    Step2.對于?xi∈U,計算在特征集A下每個對象的鄰域粒度δA(xi);

    Step3.對于?lk∈D,分別計算每個標記lk下的對象集合Dk;

    Step4.若δA(xi)?Dk,則將對象xi存入正域POSA(D)←POSA(D)∪{xi};

    Step5.對于?aj∈A,分別計算去除每個特征之后對象的正域集合POSA-{aj}(D),若POSA-{aj}(D)≠POSA(D),則將特征aj存入Red, 算法轉至Step7;

    Step6.對于?aj∈A-Red,執(zhí)行操作:

    Step6.1.計算條件特征集Red∪aj下每個對象的鄰域粒度δRed∪aj(xi);

    Step6.2.對于多標記?lk∈D且lk=1,若δRed∪aj(xi)?Dk,則POSRed∪aj(D)←POSRed∪aj(D)∪{xi};

    Step6.3.若at=argmax{SIGCos t(aj,c,D)},則Red←Red∪{at},即計算加入條件特征aj的重要度SIGCos t(aj,c,D), 選擇重要度最大的條件特征at存入Red;

    Step7.若POSRed(D)≠POSA(D),則算法轉至Step6,否則執(zhí)行Step8;

    Step8.輸出特征子集Red,算法結束;

    End

    算法的時間復雜度分析:

    算法Step1初始化一個變量存放特征選擇后的特征子集,其時間復雜度為O(1);算法Step2在整個條件特征集下通過對象之間的比較計算得到每個對象的鄰域粒度,其時間復雜度為O(|C‖U|2);算法Step3分別計算每個標記決策下的對象集合,其時間復雜度為O(|C‖D|);算法Step4計算多標記不完備決策表的正域對象集,其時間復雜度為O(|U|2+|U‖D|);算法Step5計算特征核的時間復雜度為O(|C|);算法Step6對加入的新特征后的特征子集正域集合更新,實現對基于代價敏感的多標記不完備數據的特征選擇,最壞的時間復雜度為O(|C‖U|);算法Step7判斷約簡后的特征子集下正域與整個論域的正域是否一致,最壞的時間復雜度為O(|U|).綜述分析,本文算法的時間復雜度為O(|C‖U|2).

    5 實驗與結果分析

    5.1 數據集及實驗設置

    為了驗證本文中所提出的基于代價敏感多標記不完備數據特征選擇算法的有效性,從Mulan數據集中選取了yeast、emotions、scenes、birds 4個真實數據集,并分別用均勻分布(Uniform Distribution)和正態(tài)分布(Normal Distribution)兩種分布函數(Cumulative Distribution Function,記為CDF)分別為這4個數據集生成測試代價,在對基于測試代價的多標記數據集進行實驗測試和分析,均勻分布的均勻數取值在0~100之間,正態(tài)分布以100為期望值,以30為標準差,4個數據集的相關信息和不同分布函數下4個數據集所對應的測試總代價分別如表3、表4所示.

    本次實驗的硬件配置為CPU為Inter(R)Core(TM)i5-4590s(3.0GHz),內存8.0GB.設計算法所使用的編程語言為Python和Java,使用的開發(fā)工具分別是記事本和Eclipse 4.7.

    表3 多標記數據集表Table 3 Multi-label datasets table

    表4 數據集總測試代價表Table 4 Cost of multi-label datasets table

    5.2 性能指標

    1)代價約簡率是考慮特征代價的特征子集B的代價占全特征集A總代價的比率:

    2)平均精度是指在標記預測序列中,排在相關標記之前的標記仍是相關標記的比率:

    3)漢明損失是指預測出的標記與實際標記的平均差異值:

    其中Δ為Yi、Zi兩個集合之間的對稱差.

    4)覆蓋率是指所有對象實際包含的所有標記所需最大的排序距離:

    5)1錯誤率是指預測出的標記排序最靠前的標記不在實際對象中的比率:

    6)排序損失是指預測出的標記中實際不包含的標記比實際包含的標記排序高的比率:

    其中平均分類精度越大越好,漢明損失、覆蓋率、1錯誤率、排序損失越小越好.

    5.3 實驗分析與比較

    由于文中的多標記數據特征選擇算法是基于代價敏感的,所以在進行實驗測試之前,需先用均勻分布和正態(tài)分布兩種分布函數分別為以上4個數據集的特征生成測試代價,通過比較基于不同分布函數的特征代價來評價測試代價對多標記數據特征選擇算法的影響.同時,文中研究的是不完備數據,因此,需用均勻函數對以上4個數據集進行5%的數據缺失處理.在實驗測試和分析的過程中,為了避免實驗結果的均勻性,采用10倍交叉驗證法對每個數據集的實驗結果進行驗證.在實驗過程中,首先利用曼哈頓距離度量方法計算鄰域粒度,同時,在特征核的基礎上,對每個數據集進行特征選擇.然后比較考慮代價和不考慮代價特征選擇的結果,通過5種多標記分類器(RAkEL、DMLkNN、IBLR_ML、BRkNN、MLkNN)驗證了算法的性能,且通過多標記的五大評價性能指標評估和對比分類器的分類性能.

    5.3.1λ特征參數的確定

    對于基于代價敏感的多標記不完備鄰域決策表,特征選擇的結果與特征代價直接相關,因此,在實驗過程中,對基于均勻分布和正態(tài)分布生成的兩種特征代價獲得的特征選擇結果進行對比,同時,由于鄰域參數的選擇直接關系到特征選擇的結果和分類器的分類性能.為此,在曼哈頓距離度量方法中,鄰域參數的計算方式為δ=stdai/λ,其中stdai通過本文算法進行特征選擇之后的每個特征的標準差,λ的取值直接關系到鄰域參數δ的值[27].通過實驗分析發(fā)現,λ的取值范圍從1.0到2.0的特征選擇結果所對應的分類性能較好,為此,為了詳細分析λ值對特征選擇結果和分類器的分類性能影響,在實驗過程中將λ值每次變化0.1進行實驗分析和結果對比.

    下面將分析不同分布函數隨著λ變化對特征選擇結果以及代價的影響,詳細分析基于不同分布函數生成的測試代價在曼哈頓距離度量標準下λ(在圖中用Lambda表示λ)變化對于特征選擇的個數和特征子集總代價影響.圖中UDASBC、NDASBC分別表示在均勻分布和正態(tài)分布下考慮特征代價的特征選擇個數,UDAS、NDAS分別表示在均勻分布和正態(tài)分布下不考慮特征代價的特征選擇個數,UDCPBC、NDCPBC分別表示在均勻分布和正態(tài)分布下的代價約簡率,即考慮特征代價的特征子集代價占總代價的百分比(由于兩種分布函數生成的代價不同,因此兩種分布函數通過代價百分比分析),UDCP、NDCP分別表示在均勻分布和正態(tài)分布下不考慮特征代價的特征子集代價占總代價的百分比.具體實驗結果如圖1所示.

    圖1 4個數據集在兩種分布函數下特征選擇的個數和代價百分比隨λ值的變化情況Fig.1 Variation of the number of feature selection and the value of the cost percentage for the four datasets under the two distribution functions with λ

    由圖1可知,對于4個數據集來說,隨著λ變化,特征選擇個數和代價百分比都呈下降趨勢.考慮測試代價比不考慮測試代價的特征選擇效果更優(yōu),例如對于圖1(e)和圖1(f)中的scenes數據集,當不考慮測試代價時 ,特征選擇個數最小為39,當考慮測試代價時,均勻分布和正態(tài)分布下特征個數最小分別為17、22,分別占不考慮測試代價特征選擇結果的43%、56%;同時,考慮測試代價的代價百分比不考慮測試代價的代價百分比相對更小,當考慮測試代價時,均勻分布和正態(tài)分布下代價百分比最小分別為0.40%、3.60%,而不考慮測試代價時,均勻分布和正態(tài)分布下代價百分比最小分別為13.26%、13.19%,代價分別減少了12.86%、9.59%.另外,當代價百分比最小時,在均勻分布下代價百分比相差最為顯著的是圖1(a)中的yeast和圖1(e)中的scenes數據集,最小代價百分比相差大于11%,在正態(tài)分布下代價百分比相差較明顯的是圖1(b)中yeast、圖1(d)中的emotions和圖1(f)中的scenes數據集,最小代價百分比相差大于9%.由此可知,對于yeast和scenes數據集來說,考慮代價與不考慮代價的代價百分比的差在均勻分布下比正態(tài)分布下大.當λ取值為1.9或2.0時,特征選擇個數和代價百分比最小.

    綜上可知,考慮代價的特征選擇效果優(yōu)于不考慮代價的特征選擇效果,考慮特征代價的代價百分比小于不考慮特征代價的百分比.

    圖2 4個數據集在兩種分布函數下平均精度隨λ值的變化情況Fig.2 Variation of the average precision with the values of the four datasets under the two distribution functions with λ

    由圖2可知,當λ取值在1.0-2.0之間,在兩種分布函數下,特征選擇的個數都呈下降趨勢.在均勻分布下,對于圖2(a)中的yeast、圖2(e)中的scenes和圖2(g)中的birds數據集來說,隨λ取值的變化,5個分類器的平均分類精度的變化相對不明顯,當λ=2.0時,3個數據集的特征選擇結果和分類性能較優(yōu);對于圖2(c)中的emotions數據集來說,平均精度隨λ取值的變化無明顯規(guī)律,當λ=1.2時,5個分類器的平均精度較優(yōu).在正態(tài)分布下,隨λ取值的變化,圖2(d)中的emotions數據集的平均精度的變化顯著,圖2(b)yeast和圖2(f)scenes數據集的平均精度變化較平緩,圖2(h)中的birds數據集在λ=1.2,除RAKEL分類器外,其他4個分類器的平均精度顯著下降,參數λ在變化到1.2之后的平均精度變化相對平緩.對于yeast、emotions、scenes、birds數據集來說,當λ取值分別為2.0、1.4、1.9、2.0時對應數據集的特征選擇結果和分類性能較優(yōu).

    綜上可知,每個數據集在5個多標記分類器上最優(yōu)的平均分類精度所對應的λ參數不盡相同,參數λ的取值也影響特征選擇的結果.

    5.3.2 實驗結果和討論

    為進一步驗證本文算法的有效性,下面將在4個Mulan數據集上利用兩種分布函數為特征生成測試代價,通過5個多標記性能指標在曼哈頓距離度量下進行實驗對比和分析,實驗結果如表5-表8所示,其中,λ為特征參數,AS為特征選擇的個數,PC為代價百分比,AP為分類器的平均分類精度,HL為漢明損失,Coverage為覆蓋率 、OE為1錯誤率、RL為排序損失,帶有↑的性能指標表示值越大越好,↓性能能指標表示值越小越好.另外,表中分別給出5個分類器的平均精度最優(yōu)時,對應的λ參數、特征子集的大小、特征子集的代價百分比和其他4個分類性能指標的值.

    表5 兩種分布函數下Yeast數據集的分類性能指標比較Table 5 Comparison of classification performance of yeast dataset under two distribution functions

    從表5-表8的實驗結果可知,當分類器的平均分類精度最優(yōu)時,均勻分布與正態(tài)分布相比,4個數據集在均勻分布下,5個分類器的分類性能相對較優(yōu).在均勻分布下,yeast、emotions、scenes和birds這4個數據集所對應的5個分類器的平均特征個數分別是33、27、43、31,分別占原有特征的32.0%、27.2%、14.6%、11.9%;在正態(tài)分布下,這4個數據集所對應的平均特征個數分別是23、20、42、30,分別占原有特征的22.9%、27.8%、14.29%、11.5%.其中,在yeast數據集中,使用均勻分布比正態(tài)分布下的特征選擇算法效果提高了9.1%,而其他4個數據集特征選擇的差異并不明顯.同時,在均勻分布下,yeast、emotions、scenes和birds這4個數據集所對應的五個分類器的特征選擇結果的代價百分比分別是14.60%、33.52%、3.62%、9.94%;在正態(tài)分布下,這4個數據集所對應的特征選擇結果的代價百分比分別是14.45%、20.39%、8.89%、9.22%,由此可知,emotions和scenes數據集在不同分布函數下代價百分比的差異較大.由實驗結果可知,本文的基于代價敏感的特征選擇算法降低了多標記學習的計算時間和空間消耗,且有效地節(jié)省了成本代價.同時,由表5-表8的實驗結果對比發(fā)現,選擇的特征子集直接影響到多標記分類器的分類性能.在上述4個數據集中,由于特征子集的結果不同,導致5種分類器的分類性能也不相同.例如,在均勻分布下,birds數據集在RAkEL分類器下的平均分類精度為75.60%,而在IBLR_ML分類器下的平均分類精度為60.79%,兩個分類器的性能差異超過14%;在正態(tài)分布下,birds數據集在RAkEL分類器下的平均分類精度為76.26%,而在BRkNN分類器下的平均分類精度為58.20 %,兩個分類器的性能差異超過18%.由實驗結果可知,對于yeast數據集來說,IBLR_ML分類器的分類性能優(yōu)于其他4個分類器的分類性能;對于emtions、scenes和birds數據集來說,RAkEL分類器分類性能較其他4個分類器的分類性能更優(yōu).

    表6 兩種分布函數下Emotions數據集的分類性能指標比較Table 6 Comparison of classification performance of Emotions dataset under two distribution functions

    表7 兩種分布函數下Scenes數據集的分類性能指標比較Table 7 Comparison of classification performance of Scenes dataset under two distribution functions

    表8 兩種分布函數下Birds數據集的分類性能指標比較Table 8 Comparison of classification performance of Birds dataset under two distribution functions

    綜上所述,本文算法特征選擇的結果和分類性能與特征代價、λ參數和分類器的選擇相關.通過表5-表8的實驗結果和分析可知,本文算法解決了對代價敏感下多標記不完備鄰域數據的特征選擇問題,有效剔除了數據中的冗余特征,降低特征的代價成本,提高了分類器的分類性能.

    6 結束語

    針對多標記高維數據中的連續(xù)值、缺失值以及特征的測試代價等問題,從代價敏感學習的視角,提出了一種面向不完備特征鄰域決策表的多標記特征選擇算法,算法利用均勻分布和正態(tài)分布兩種分布函數分別為每個數據特征生成代價,分析特征代價對特征選擇的影響;算法可直接對不完備連續(xù)型數據進行處理,無需對缺失數據進行填充及對連續(xù)數據進行離散化.算法通過距離度量對不完備特征鄰域決策表進行鄰域粒化,并根據正域計算出核特征,在此基礎上,采用啟發(fā)式搜索策略對多標記不完備決策表進行特征選擇,在實驗結果中通過對考慮特征代價和不考慮特征代價的數據集的特征選擇結果進行實驗和分析驗證了算法的有效性.由于現實生活中除需要考慮測試代價之外,還需考慮誤分類代價,下一步工作將研究基于測試代價和誤分類代價的多標記數據特征選擇問題.

    猜你喜歡
    決策表特征選擇子集
    由一道有關集合的子集個數題引發(fā)的思考
    基于決策表相容度和屬性重要度的連續(xù)屬性離散化算法*
    拓撲空間中緊致子集的性質研究
    關于奇數階二元子集的分離序列
    Kmeans 應用與特征選擇
    電子制作(2017年23期)2017-02-02 07:17:06
    聯合互信息水下目標特征選擇算法
    正反轉電機缺相保護功能的實現及決策表分析測試
    每一次愛情都只是愛情的子集
    都市麗人(2015年4期)2015-03-20 13:33:22
    基于特征選擇和RRVPMCD的滾動軸承故障診斷方法
    基于二元搭配詞的微博情感特征選擇
    計算機工程(2014年6期)2014-02-28 01:26:36
    一区二区三区乱码不卡18| 欧美日韩视频精品一区| 精品人妻在线不人妻| 热99国产精品久久久久久7| 男女边吃奶边做爰视频| 国产精品.久久久| 国产成人精品一,二区| 久久精品夜色国产| av卡一久久| 2018国产大陆天天弄谢| 亚洲美女黄色视频免费看| 肉色欧美久久久久久久蜜桃| 性高湖久久久久久久久免费观看| 欧美变态另类bdsm刘玥| 香蕉精品网在线| 亚洲精品日本国产第一区| 国产片内射在线| 国产熟女午夜一区二区三区| av网站免费在线观看视频| 精品酒店卫生间| 国产av一区二区精品久久| 女性被躁到高潮视频| 欧美日韩视频高清一区二区三区二| 少妇的丰满在线观看| 97在线视频观看| 精品少妇内射三级| 日韩成人av中文字幕在线观看| 久久精品国产自在天天线| 久久精品人人爽人人爽视色| 欧美变态另类bdsm刘玥| 久久国产精品男人的天堂亚洲| 久久久久久久国产电影| 五月天丁香电影| 久久韩国三级中文字幕| 天美传媒精品一区二区| 亚洲综合色网址| av免费在线看不卡| 国产熟女午夜一区二区三区| 超碰97精品在线观看| 男男h啪啪无遮挡| 午夜日韩欧美国产| 久久韩国三级中文字幕| 我要看黄色一级片免费的| 精品少妇一区二区三区视频日本电影 | 国产亚洲一区二区精品| 美女福利国产在线| 人人澡人人妻人| 各种免费的搞黄视频| 国产精品人妻久久久影院| 国产极品天堂在线| 精品国产乱码久久久久久男人| 久久精品人人爽人人爽视色| 18禁国产床啪视频网站| 在线观看一区二区三区激情| 妹子高潮喷水视频| 国产老妇伦熟女老妇高清| 在线观看美女被高潮喷水网站| 国产精品免费大片| 菩萨蛮人人尽说江南好唐韦庄| 国产 一区精品| 叶爱在线成人免费视频播放| 久久亚洲国产成人精品v| 波多野结衣av一区二区av| 国产精品久久久久久精品古装| 国产精品久久久久久精品古装| a 毛片基地| 国产精品香港三级国产av潘金莲 | 亚洲一码二码三码区别大吗| 国产福利在线免费观看视频| 肉色欧美久久久久久久蜜桃| 90打野战视频偷拍视频| 日韩,欧美,国产一区二区三区| 人人妻人人爽人人添夜夜欢视频| h视频一区二区三区| 亚洲国产精品999| 交换朋友夫妻互换小说| 麻豆av在线久日| 成人毛片a级毛片在线播放| 黑丝袜美女国产一区| 成年动漫av网址| 欧美97在线视频| 一个人免费看片子| 日韩欧美一区视频在线观看| 亚洲精品一区蜜桃| 老熟女久久久| 免费少妇av软件| 少妇的逼水好多| 亚洲精品一二三| 亚洲精品一二三| 国产成人一区二区在线| 亚洲视频免费观看视频| 国产精品国产av在线观看| 久久久欧美国产精品| 午夜福利一区二区在线看| 日韩电影二区| 老女人水多毛片| 老女人水多毛片| 久久久久久人妻| 亚洲美女黄色视频免费看| 新久久久久国产一级毛片| 丝瓜视频免费看黄片| 波多野结衣av一区二区av| 80岁老熟妇乱子伦牲交| 欧美黄色片欧美黄色片| 成人午夜精彩视频在线观看| 精品视频人人做人人爽| 一区福利在线观看| 久久毛片免费看一区二区三区| 男女无遮挡免费网站观看| 综合色丁香网| 国产成人精品婷婷| av片东京热男人的天堂| 国产一区二区在线观看av| 日韩中字成人| 国产欧美日韩综合在线一区二区| 亚洲中文av在线| 纯流量卡能插随身wifi吗| 亚洲久久久国产精品| 欧美 日韩 精品 国产| 免费黄网站久久成人精品| 亚洲国产精品一区三区| 亚洲av电影在线观看一区二区三区| 国产精品亚洲av一区麻豆 | 亚洲一级一片aⅴ在线观看| 久久精品久久久久久噜噜老黄| 国产 一区精品| 少妇被粗大猛烈的视频| 汤姆久久久久久久影院中文字幕| 天天躁夜夜躁狠狠久久av| 纵有疾风起免费观看全集完整版| 久久久国产精品麻豆| 国产 精品1| 日韩三级伦理在线观看| av又黄又爽大尺度在线免费看| 一区二区三区精品91| 91aial.com中文字幕在线观看| 国产精品一国产av| 五月伊人婷婷丁香| 午夜av观看不卡| 国产精品偷伦视频观看了| 国产熟女欧美一区二区| 国产高清不卡午夜福利| 精品国产一区二区三区久久久樱花| 午夜日本视频在线| 婷婷色麻豆天堂久久| 国产成人精品久久二区二区91 | 美女xxoo啪啪120秒动态图| 男女边吃奶边做爰视频| 天堂8中文在线网| 久久韩国三级中文字幕| 啦啦啦视频在线资源免费观看| videossex国产| 国产精品99久久99久久久不卡 | 亚洲一区中文字幕在线| 五月天丁香电影| 五月天丁香电影| 久久久久国产精品人妻一区二区| 亚洲国产欧美日韩在线播放| 亚洲精品国产av蜜桃| 国产野战对白在线观看| 午夜福利一区二区在线看| 国产探花极品一区二区| 99精国产麻豆久久婷婷| 岛国毛片在线播放| 90打野战视频偷拍视频| 久久人妻熟女aⅴ| 中文天堂在线官网| 老鸭窝网址在线观看| 亚洲一区二区三区欧美精品| 日韩中字成人| 在线观看三级黄色| 黑人欧美特级aaaaaa片| 久久97久久精品| 9热在线视频观看99| 久久精品久久久久久久性| 欧美日韩亚洲高清精品| 如何舔出高潮| tube8黄色片| 欧美老熟妇乱子伦牲交| 亚洲中文av在线| 亚洲人成77777在线视频| 久久精品国产亚洲av高清一级| 精品福利永久在线观看| 欧美精品一区二区大全| 永久网站在线| 只有这里有精品99| 久久久久久伊人网av| 免费av中文字幕在线| 精品一区在线观看国产| 丰满迷人的少妇在线观看| 久久99热这里只频精品6学生| 热99国产精品久久久久久7| 亚洲精品成人av观看孕妇| 在线亚洲精品国产二区图片欧美| 日本91视频免费播放| h视频一区二区三区| 欧美+日韩+精品| 日本-黄色视频高清免费观看| 满18在线观看网站| 国产成人免费观看mmmm| 免费观看性生交大片5| 欧美 亚洲 国产 日韩一| 一边摸一边做爽爽视频免费| 久久久久久久国产电影| 欧美在线黄色| 色94色欧美一区二区| 91aial.com中文字幕在线观看| 最近最新中文字幕免费大全7| 欧美另类一区| 91在线精品国自产拍蜜月| 不卡av一区二区三区| 日韩中文字幕欧美一区二区 | 国产成人精品婷婷| 在线观看免费高清a一片| 亚洲一区中文字幕在线| 欧美 亚洲 国产 日韩一| 18禁观看日本| 一本一本久久a久久精品综合妖精 国产伦在线观看视频一区 | freevideosex欧美| av网站在线播放免费| 毛片一级片免费看久久久久| 久久精品久久久久久久性| 一个人免费看片子| 日韩,欧美,国产一区二区三区| 久久99蜜桃精品久久| 国产一区亚洲一区在线观看| 天堂8中文在线网| 下体分泌物呈黄色| 新久久久久国产一级毛片| 欧美日韩综合久久久久久| 中文欧美无线码| 国产黄频视频在线观看| 亚洲av.av天堂| 国产成人免费无遮挡视频| 国产一级毛片在线| 国产精品.久久久| 日韩伦理黄色片| 我要看黄色一级片免费的| 老女人水多毛片| 国产免费现黄频在线看| 中国三级夫妇交换| av女优亚洲男人天堂| 亚洲精品一二三| 亚洲av欧美aⅴ国产| 2018国产大陆天天弄谢| 欧美日韩精品网址| 精品人妻在线不人妻| 老鸭窝网址在线观看| 夫妻午夜视频| 国产 精品1| 一区福利在线观看| 国产精品国产av在线观看| 亚洲精品日韩在线中文字幕| 黑人欧美特级aaaaaa片| 久久久久久人人人人人| 老司机影院毛片| 五月伊人婷婷丁香| 国产精品av久久久久免费| 可以免费在线观看a视频的电影网站 | 最近2019中文字幕mv第一页| 国产毛片在线视频| 久久精品国产自在天天线| 亚洲精品国产av成人精品| 国产亚洲精品第一综合不卡| 国产熟女欧美一区二区| 亚洲精品国产一区二区精华液| 国产精品久久久久成人av| 久久精品国产鲁丝片午夜精品| 男的添女的下面高潮视频| 久久韩国三级中文字幕| 18+在线观看网站| 日本午夜av视频| 亚洲av免费高清在线观看| 两个人免费观看高清视频| 亚洲国产av影院在线观看| 一二三四在线观看免费中文在| av有码第一页| 国产一区二区在线观看av| 免费日韩欧美在线观看| 亚洲欧美成人精品一区二区| 久久久久久伊人网av| 亚洲一区中文字幕在线| 国产精品.久久久| 国产成人精品婷婷| 香蕉精品网在线| 成人亚洲欧美一区二区av| www.精华液| 韩国精品一区二区三区| 久久久久久久久久久久大奶| 国产免费视频播放在线视频| 巨乳人妻的诱惑在线观看| 男女边摸边吃奶| 色播在线永久视频| 精品亚洲成国产av| 久久99一区二区三区| 丰满迷人的少妇在线观看| 女人高潮潮喷娇喘18禁视频| 日韩人妻精品一区2区三区| 综合色丁香网| 十八禁高潮呻吟视频| 免费观看在线日韩| av一本久久久久| 少妇熟女欧美另类| 国产精品一区二区在线观看99| 中文字幕色久视频| 久久久久国产精品人妻一区二区| 欧美激情极品国产一区二区三区| 亚洲成国产人片在线观看| 女性被躁到高潮视频| 久久亚洲国产成人精品v| 久久精品久久久久久噜噜老黄| 美国免费a级毛片| 久久久欧美国产精品| 少妇被粗大猛烈的视频| 久久国内精品自在自线图片| 日韩电影二区| 亚洲精品,欧美精品| 国语对白做爰xxxⅹ性视频网站| 十八禁高潮呻吟视频| 大陆偷拍与自拍| 免费久久久久久久精品成人欧美视频| 亚洲国产欧美日韩在线播放| 狠狠婷婷综合久久久久久88av| 欧美另类一区| 久热久热在线精品观看| 叶爱在线成人免费视频播放| 久久人人爽av亚洲精品天堂| 国产精品久久久久久久久免| 人妻 亚洲 视频| 韩国高清视频一区二区三区| 日韩,欧美,国产一区二区三区| 国产成人免费观看mmmm| 麻豆精品久久久久久蜜桃| 亚洲国产日韩一区二区| 久久久久久伊人网av| 亚洲国产精品成人久久小说| 另类亚洲欧美激情| 亚洲熟女精品中文字幕| av卡一久久| 一区福利在线观看| 99热国产这里只有精品6| av女优亚洲男人天堂| 精品酒店卫生间| 啦啦啦在线观看免费高清www| 纯流量卡能插随身wifi吗| 边亲边吃奶的免费视频| 国产成人免费无遮挡视频| 天天影视国产精品| 日产精品乱码卡一卡2卡三| 中文字幕av电影在线播放| 91成人精品电影| a级毛片在线看网站| 在线观看免费高清a一片| 国产成人精品一,二区| 男的添女的下面高潮视频| 黄片播放在线免费| 男人舔女人的私密视频| 熟女电影av网| 久久久久人妻精品一区果冻| 在线观看www视频免费| 亚洲人成77777在线视频| 多毛熟女@视频| 午夜精品国产一区二区电影| 最近最新中文字幕大全免费视频 | 男人添女人高潮全过程视频| 中文欧美无线码| 国产精品久久久久成人av| 1024香蕉在线观看| 少妇被粗大猛烈的视频| a级毛片黄视频| 欧美成人午夜精品| 捣出白浆h1v1| 一级片'在线观看视频| 国产成人欧美| 国产av码专区亚洲av| www.熟女人妻精品国产| 丁香六月天网| 中文字幕人妻熟女乱码| 久久国内精品自在自线图片| 久久精品国产亚洲av涩爱| 国产精品免费大片| 国产无遮挡羞羞视频在线观看| 在线天堂最新版资源| 日日撸夜夜添| 一区二区三区激情视频| 国产av码专区亚洲av| av一本久久久久| 亚洲第一av免费看| 久久久久精品久久久久真实原创| 777久久人妻少妇嫩草av网站| 黑丝袜美女国产一区| 综合色丁香网| h视频一区二区三区| 只有这里有精品99| 亚洲国产最新在线播放| 秋霞伦理黄片| 免费播放大片免费观看视频在线观看| 免费日韩欧美在线观看| 国产伦理片在线播放av一区| 各种免费的搞黄视频| 丰满饥渴人妻一区二区三| 国产熟女欧美一区二区| 日韩成人av中文字幕在线观看| 丝袜喷水一区| 成人黄色视频免费在线看| 日韩 亚洲 欧美在线| 国产精品.久久久| 欧美另类一区| videos熟女内射| 欧美精品一区二区免费开放| 亚洲av免费高清在线观看| 女性生殖器流出的白浆| 伦理电影免费视频| 亚洲国产精品国产精品| 如日韩欧美国产精品一区二区三区| 99久久精品国产国产毛片| 国产一区二区三区综合在线观看| 啦啦啦在线观看免费高清www| 三上悠亚av全集在线观看| 一级,二级,三级黄色视频| 日韩欧美精品免费久久| 欧美激情 高清一区二区三区| 中文字幕色久视频| 亚洲国产成人一精品久久久| 男女边摸边吃奶| 春色校园在线视频观看| 欧美老熟妇乱子伦牲交| 大码成人一级视频| 国产在线一区二区三区精| 91aial.com中文字幕在线观看| 久久久久网色| 国产探花极品一区二区| www.精华液| 久久久a久久爽久久v久久| av福利片在线| 韩国av在线不卡| 免费观看av网站的网址| 久久99热这里只频精品6学生| 热99久久久久精品小说推荐| 菩萨蛮人人尽说江南好唐韦庄| 建设人人有责人人尽责人人享有的| 国产成人精品无人区| 日韩成人av中文字幕在线观看| 久久久精品免费免费高清| 免费不卡的大黄色大毛片视频在线观看| 欧美日韩亚洲高清精品| 最新的欧美精品一区二区| 国产在视频线精品| videosex国产| 丰满迷人的少妇在线观看| 精品国产一区二区三区四区第35| 观看av在线不卡| 国产精品一二三区在线看| 亚洲一码二码三码区别大吗| 丝袜美足系列| 老汉色av国产亚洲站长工具| 伦理电影免费视频| 国产xxxxx性猛交| 一区二区av电影网| 久久久精品区二区三区| 边亲边吃奶的免费视频| 国语对白做爰xxxⅹ性视频网站| 成年美女黄网站色视频大全免费| 国产探花极品一区二区| 高清av免费在线| 18禁观看日本| 国产精品成人在线| 日韩 亚洲 欧美在线| 日本免费在线观看一区| 亚洲国产欧美网| 日韩熟女老妇一区二区性免费视频| 久久影院123| 国产又爽黄色视频| 精品久久久久久电影网| 久热久热在线精品观看| 欧美亚洲 丝袜 人妻 在线| 曰老女人黄片| 亚洲一码二码三码区别大吗| 咕卡用的链子| 国产有黄有色有爽视频| 亚洲色图综合在线观看| 免费在线观看完整版高清| 国产精品欧美亚洲77777| 欧美97在线视频| 大片电影免费在线观看免费| 国产亚洲av片在线观看秒播厂| 波多野结衣一区麻豆| 精品国产超薄肉色丝袜足j| 一区二区三区精品91| 在现免费观看毛片| 1024香蕉在线观看| 亚洲精品乱久久久久久| 伊人久久国产一区二区| 五月伊人婷婷丁香| 久热久热在线精品观看| 日韩人妻精品一区2区三区| 亚洲色图综合在线观看| 欧美变态另类bdsm刘玥| 一本—道久久a久久精品蜜桃钙片| 免费日韩欧美在线观看| 美女高潮到喷水免费观看| 日本爱情动作片www.在线观看| 久久久欧美国产精品| 国产亚洲最大av| 亚洲精华国产精华液的使用体验| 2018国产大陆天天弄谢| av在线app专区| 色吧在线观看| 久久精品国产鲁丝片午夜精品| 少妇人妻 视频| 伊人久久大香线蕉亚洲五| 久久这里只有精品19| 一级爰片在线观看| 亚洲欧美成人综合另类久久久| 丝袜在线中文字幕| 久久精品亚洲av国产电影网| 日韩中文字幕欧美一区二区 | 色婷婷久久久亚洲欧美| 肉色欧美久久久久久久蜜桃| 美国免费a级毛片| 叶爱在线成人免费视频播放| 久久精品国产综合久久久| 熟女电影av网| 国产精品久久久久成人av| 亚洲第一区二区三区不卡| 免费日韩欧美在线观看| 最近中文字幕2019免费版| 国产免费一区二区三区四区乱码| 国产精品一区二区在线观看99| 午夜福利视频精品| 国产免费现黄频在线看| 丝袜美足系列| 欧美日韩综合久久久久久| videossex国产| 国产男女超爽视频在线观看| 丰满少妇做爰视频| 香蕉丝袜av| 色婷婷久久久亚洲欧美| 边亲边吃奶的免费视频| 久久99热这里只频精品6学生| 伦精品一区二区三区| 男女高潮啪啪啪动态图| 1024香蕉在线观看| 黄片播放在线免费| 老汉色av国产亚洲站长工具| 国产av国产精品国产| 国产欧美亚洲国产| 国产免费视频播放在线视频| 午夜福利在线免费观看网站| 王馨瑶露胸无遮挡在线观看| 精品国产乱码久久久久久男人| 亚洲综合精品二区| 午夜福利在线观看免费完整高清在| 午夜福利影视在线免费观看| 国产免费福利视频在线观看| 久久久久精品性色| 成人毛片a级毛片在线播放| a级毛片黄视频| 视频在线观看一区二区三区| 亚洲精品在线美女| 99热国产这里只有精品6| 亚洲美女搞黄在线观看| 久久精品久久久久久噜噜老黄| 亚洲美女搞黄在线观看| 日韩制服骚丝袜av| 免费黄频网站在线观看国产| 亚洲精品乱久久久久久| 国产av一区二区精品久久| 观看美女的网站| 久久女婷五月综合色啪小说| 人妻人人澡人人爽人人| 成年美女黄网站色视频大全免费| 亚洲国产精品成人久久小说| 亚洲av国产av综合av卡| 超碰97精品在线观看| 美女主播在线视频| 精品亚洲乱码少妇综合久久| 欧美精品国产亚洲| 国产av一区二区精品久久| 青青草视频在线视频观看| 久久精品人人爽人人爽视色| 夜夜骑夜夜射夜夜干| 男的添女的下面高潮视频| 国产乱来视频区| 在线天堂最新版资源| 9热在线视频观看99| 18在线观看网站| 18禁动态无遮挡网站| 99热网站在线观看| 免费少妇av软件| 国产片内射在线| 亚洲精品美女久久久久99蜜臀 | 久久精品国产亚洲av高清一级| 丝袜脚勾引网站| 免费人妻精品一区二区三区视频| 欧美日韩亚洲高清精品| 最近最新中文字幕免费大全7| 午夜免费观看性视频| 在线观看美女被高潮喷水网站| 亚洲成色77777| 五月天丁香电影| 在线观看免费日韩欧美大片| 18禁动态无遮挡网站| 国产97色在线日韩免费| 精品国产一区二区三区四区第35| 久久ye,这里只有精品| 九草在线视频观看| 亚洲综合精品二区| 一级片免费观看大全| 亚洲精品中文字幕在线视频| 亚洲欧洲国产日韩| 国产精品麻豆人妻色哟哟久久| 国产精品欧美亚洲77777| 久久鲁丝午夜福利片| 好男人视频免费观看在线|