• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于概率矩陣分解的不完整數(shù)據(jù)集特征選擇方法

    2022-06-16 05:24:12范林歌武欣嶸曾維軍
    計算機工程 2022年6期
    關(guān)鍵詞:分類特征效果

    范林歌,武欣嶸,童 瑋,曾維軍

    (中國人民解放軍陸軍工程大學 通信工程學院,南京 210007)

    0 概述

    高維數(shù)據(jù)在實際應(yīng)用中普遍存在,這些數(shù)據(jù)通常被用來構(gòu)建高質(zhì)量的機器學習模型,隨后進行數(shù)據(jù)挖掘分析,但高維數(shù)據(jù)具有計算時間長、存儲成本高等問題[1-2]。為了解決這些問題,研究人員提出特征選擇、主成分分析等降維方法[3-4]。特征選擇是數(shù)據(jù)挖掘過程中的重要步驟,特別是在許多生物信息學任務(wù)中,有效的魯棒特征選擇方法可以提取有意義的特征并且消除有噪聲的特征。

    現(xiàn)有的特征選擇方法大多以數(shù)據(jù)是完整的或幾乎完整的為前提。但在許多實際應(yīng)用中,例如生物信息學[5]和遙感網(wǎng)絡(luò)普遍存在數(shù)據(jù)缺失,現(xiàn)有的特征選擇方法大部分不能直接用于包含缺失值的數(shù)據(jù)集。

    對不完整數(shù)據(jù)集進行特征選擇,最直接的方法是對不完整數(shù)據(jù)集進行一定處理使其保持形式上的完整,然后再做特征選擇。處理缺失數(shù)據(jù)最簡單易行的方法是完整樣本分析(Complete Case Analysis,CCA),即刪除包含缺失值的樣本或特征[6]。該方法雖然簡單易行,但在缺失樣本比例較高和樣本總量較小時有很大的局限性,進而影響后續(xù)機器學習的準確性。對缺失位置進行填充是另一種較為直接的缺失數(shù)據(jù)處理方法,應(yīng)用普遍的是均值填充。均值填充是指以特征觀測值的均值作為缺失值的估計值[7],但該方法會使特征不確定性或方差減小。還有一種基于統(tǒng)計學的缺失填補方法是期望最大化(EM)填補法[8],該方法利用現(xiàn)有數(shù)據(jù)的邊緣分布對缺失數(shù)據(jù)進行極大似然估計,從而得到相應(yīng)的填補值。ZHANG 等[9]提出了k 近鄰填充,該方法基于近鄰樣本的特征值相近的假設(shè),以近鄰樣本的均值作為缺失值的估計值。之后一些改進的k 近鄰填補方法被提出,其引入灰色關(guān)聯(lián)分析和互信息來更進一步地提高分類精度和填補效果[10-13]。近鄰填充的關(guān)鍵在于準確地度量近鄰關(guān)系,這也帶來了一些不足:不同的特征在相似度度量中的重要性是不同的,而k近鄰填充中的距離計算將所有特征同等對待;當數(shù)據(jù)特征數(shù)目較多即在高維特征空間中時,樣本分布趨于均勻,此時距離并不能反映樣本相似性。

    在不填充直接進行特征研究方面,LOU 等[14]提出基于類間隔的不完整數(shù)據(jù)特征選擇(Feature Selection in Incomplete Data,SID)方法,定義了基于類間隔的目標函數(shù),對其優(yōu)化使每個樣本在其相關(guān)子空間中的類間隔最大化,以權(quán)重范數(shù)比為系數(shù)降低缺失樣本對于類間隔計算的貢獻,該方法不再將某個樣本的近鄰樣本當作是固定的,而是去計算所有樣本是某個樣本近鄰樣本的概率。SID 特征選擇最終學習出一個特征權(quán)重向量w,w中取值較大的分量對應(yīng)重要特征,取值較小的分量對應(yīng)次要特征,取值為零的分量對應(yīng)無關(guān)特征甚至噪音特征。與基于常用預(yù)處理填充方法(如均值填充、EM 填充、k 近鄰填充)的特征選擇相比,SID 能夠篩除更多無關(guān)特征,以該算法選擇的特征建立的分類模型分類準確率更高,但其沒有考慮異常值的影響。

    本文針對不完整數(shù)據(jù)中含有未被觀察信息和存在異常值的特點,提出一種基于概率矩陣分解(Probability Matrix Decomposition,PMF)技術(shù)的魯棒特征選擇方法,使用指示矩陣并利用不完整數(shù)據(jù)集中的所有信息進行缺失值近似估計。在特征選擇算法上基于魯棒特征選擇(Robust Feature Selection,RFS)方法,在損失函數(shù)和正則化項中聯(lián)合使用?2,1范數(shù)[15-16],將?2,1范數(shù)作為損失函數(shù)可減輕異常值影響,提升特征選擇的魯棒性。

    1 基于矩陣分解的缺失值填充方法

    考慮不完整數(shù)據(jù)集X={(xn,yn|n=1,2,…,N)}∈RM,其中N為樣本數(shù),M為特征數(shù),xn為第n個給定實例,yn為其對應(yīng)的標簽值,yn=1,2,…,T,xn(j)表示第n個樣本的第j個特征,其中j=1,2,…,M。

    由于直接使用不完整數(shù)據(jù)集中所有實例來預(yù)估缺失值計算量較大,本文首先使用原始標簽將原始數(shù)據(jù)集分簇,將相似度較高的樣本分為一簇,假設(shè)第i簇數(shù)據(jù)集為Xi,每一簇數(shù)據(jù)集實例選擇如式(1)所示:

    其包含L個實例,Xi具體表示如式(2)所示:

    其中:q=1,2,…,L,表示第i簇數(shù)據(jù)集中第q個實例的第j個特征。

    本文基于這樣一個假設(shè):同一簇內(nèi)兩個樣本相似度比不同簇的兩個樣本高,以達到在減少計算量的基礎(chǔ)上不降低填充準確性的目的,之后分別對每簇中的缺失值進行估計。

    在計算過程中利用指示矩陣對未觀察到的信息進行過濾,從而達到利用完整和不完整樣本中所有有效信息的目的。對于給定的不完整數(shù)據(jù)集X,定義指示矩陣I,其中In(j)反映第n個實例的第j個特征的缺失情況,元素取值如式(3)所示,當xn(j)可觀測時對應(yīng)位置取1,當xn(j)缺失時對應(yīng)位置取0。

    則第i簇數(shù)據(jù)集Xi對應(yīng)的指示矩陣為Ii。

    1.1 矩陣分解

    尋找第i簇數(shù)據(jù)集Xi的一個近似矩陣,通過求解近似矩陣來代替原始數(shù)據(jù)簇中缺失的值,定義如式(4)所示:

    其中:U∈RL×K;V∈RM×K,矩陣U和V分別表示數(shù)據(jù)集實例和特征特定的潛在特征向量。比如在一個用戶對多部電影評分的數(shù)據(jù)集中,xq(j)表示第q個用戶對第j部電影的評分,此時U和V分別描述用戶的特征(比如年齡段等)和電影的特征(比如年份、中英文等)。

    均方根誤差(RMSE)可以用來衡量真實值與預(yù)估值之前的差距,本文通過計算目標矩陣Xi與近似矩陣的RMSE 來評估模型性能,Xi與的RMSE定義如式(6)所示:

    由式(5)得:

    代入式(6)得:

    RMSE 值越小則表示填補效果越好。本文通過求解一組U和V使相似矩陣與目標矩陣Xi的RMSE 最小,至此該優(yōu)化問題可以表示為:

    至此,將上述問題轉(zhuǎn)化為一個無約束優(yōu)化問題,本文采用梯度下降法[18]迭代計算U和V,首先固定V,對U求導(dǎo),如式(10)所示:

    更新uq,如式(11)所示:

    其中:α為更新速率,表示迭代的步長。

    固定U,對V求導(dǎo)得:

    更新vj,如式(13)所示:

    重復(fù)式(11)與式(13),迭代優(yōu)化U和V,直到RMSE<ξ,ξ為自定義誤差。

    遍歷所有i,對每一簇數(shù)據(jù)進行如上操作,直到Iο等于0 即數(shù)據(jù)集無缺失為止。至此,求出Xi的近似矩陣,用中的數(shù)據(jù)填充Xi中對應(yīng)位置的缺失值。Iο定義如式(14)所示:

    1.2 概率矩陣分解

    為提升算法精度以及降低算法運算復(fù)雜度,本文將上述的矩陣分解擴展為概率矩陣分解。假設(shè)數(shù)據(jù)集第i簇數(shù)據(jù)集Xi,歸一化后服從均值為μ=0,方差為σ2的高斯分布。因此,可定義U和V為一個多變量的零均值球面高斯分布,如式(15)、式(16)所示:

    該先驗概率可使式(11)和式(13)最終的收斂值不會遠離0,從而避免了矩陣U和V出現(xiàn)幅度較大的值。若無該先驗知識,1.1 節(jié)中的矩陣概率分解迭代運算次數(shù)將增加,運算復(fù)雜度提升。

    綜合上述兩個先驗概率,可將數(shù)據(jù)集X上的取值條件概率分布定義為:

    基于式(15)、式(16)、式(17)的概率密度函數(shù),利用經(jīng)典的后驗概率推導(dǎo)可以得到p(U,V|X)=p(X|U,V)p(U)p(V),最大化該后驗概率,就可以通過已有的近似矩陣估計出系統(tǒng)參數(shù)U和V。

    為了計算方便,對后驗概率取對數(shù),在觀測噪聲方差和先驗方差保持固定的情況下,最大化該對數(shù)后驗分布等價于使用二次正則化項使誤差平方和最小。最后,為了限制數(shù)據(jù)集中數(shù)據(jù)的取值范圍,對高斯函數(shù)的均值施加logistic 函數(shù)g(x)=1/(1+exp(-x)),其取值在(0,1)之間。最終的能量函數(shù)為:

    至此,可以使用梯度下降方法,求解Ui、Vj中的每一個元素。

    2 魯棒特征選擇算法

    2.1 魯棒特征選擇

    為增強算法面對異常值時的魯棒性,本文采用基于?2,1范數(shù)的損失函數(shù)來去除異常值,而不使用對異常值敏感的?2范數(shù)損失函數(shù)。以最小二乘回歸為例,使用?2,1魯棒損失函數(shù)后目標函數(shù)如式(19)所示:

    其中:γ為正則化項參數(shù);W∈RM×C。

    將上述目標函數(shù)變?yōu)閹Ъs束的形式,如式(20)所示:

    將上述的問題改寫為:

    使A=[XTγH],B=,其中H∈RN×N為單位矩陣,則目標函數(shù)進一步改寫成式(22):

    RFS 使用一個非常簡單的方法來求解式(22),同時這種方法也很容易應(yīng)用到其他一般的?2,1范數(shù)最小化問題中。

    該算法主要基于拉格朗日方法,構(gòu)造拉格朗日函數(shù)如下:

    求上式對B的偏導(dǎo)并令其為0,得到式(24):

    其中:D是對角矩陣。

    第n個元素為:

    在式(24)兩邊同乘AD-1,并有AB=Y,得式(26):

    將式(26)代入式(24),得:

    由于式(22)中的問題是一個凸問題,當且僅當滿足式(27)時,B是該問題的全局最優(yōu)解。其中,D依賴于B,因此也是一個未知變量。依然使用迭代算法來獲得滿足式(27)的解B:在每次迭代中,用當前的D計算B,然后根據(jù)當前計算的B更新D。不斷重復(fù)迭代過程,直到算法收斂。具體描述如算法1所示。

    2.2 算法分析

    本文提出的算法在每次迭代計算中都單調(diào)地減少式(22)中問題的目標。

    引入以下引理對其進行證明:

    引理1對于任意非零向量b,bt∈Rc,以下不等式成立:

    算法的收斂性總結(jié)為以下定理:

    將式(29)中的v和vt分別帶入,可以得到式(28)。

    定理1算法每次迭代都會單調(diào)地降低式(22)中問題的目標,并收斂于問題的全局最優(yōu)。

    證明可以驗證式(27)是以下問題的解:

    因此在t次迭代中:

    這表明:

    即:

    根據(jù)引理1,對每個i有:

    因此,以下不等式成立:

    結(jié)合式(33)和式(35)可以得到:

    即:

    因此,本文提出的算法在每次迭代中將單調(diào)地降低式(22)中問題的目標。在收斂性上,Bt和Dt滿足式(27),又因為式(22)是一個凸問題,所以滿足等式(27)表示B是式(22)的全局最優(yōu)解,因此,算法將收斂于問題式(22)的全局最優(yōu)。

    3 實驗與結(jié)果分析

    為了檢驗所提算法的有效性,本節(jié)分別在合成數(shù)據(jù)集和真實數(shù)據(jù)集上進行實驗,在不完整數(shù)據(jù)集中比較了本文提出的PMF、SID 算法、傳統(tǒng)的先填充再進行特征選擇算法,其中傳統(tǒng)方法中的填充算法分別為概述中介紹的均值填充(mean)、KNN 填充、EM 填充,特征選擇算法為本文使用的魯棒特征選擇算法RFS 和兩種基于邊緣的特征選擇算法:Simba[19]和Relief[20],分別將以上幾種算法交叉組合形成9 套完整的針對不完整數(shù)據(jù)集進行特征選擇的流程,以評估本文所提算法在高維數(shù)據(jù)上的分類性能。

    本節(jié)使用分類精度(ACC)作為評估指標。ACC表示樣本分類正確的百分比,即:

    其中:N是樣本總數(shù);Nc為正確被分類的樣本個數(shù)。

    3.1 實驗設(shè)置

    本實驗環(huán)境為MATLAB2019a,為了觀察缺失率對算法的影響,本節(jié)人工隨機地向數(shù)據(jù)集注入不同比例的缺失值。缺失率范圍為5%~65%,以10%為間隔遞增,本文缺失率定義為缺失值占所有值的百分比。在此僅考慮缺失機制為完全隨機缺失的情況。為了體現(xiàn)特征選擇算法的效果,具體地,本文會向特征較少的數(shù)據(jù)集中添加一些無關(guān)特征,實驗中向數(shù)據(jù)中添加的無關(guān)特征并不被注入缺失。

    如前所述,K為矩陣U和V的維度,當其取不同值時均方根誤差的收斂速度如圖1 所示,這里分別取K=1,5,10,15,20,可以看到:當K=1,5 時收斂速度較慢并且無法收斂到0,當K=10,15,20 時均方根誤差收斂較快,并且可以收斂到0,可見,K的取值不光影響均方根誤差收斂速度,還會影響最終收斂結(jié)果。為了不增加計算量并且防止過擬合,本文所有實驗均設(shè)置K值取10。

    圖1 不同K 值時均方根誤差隨迭代次數(shù)的變化Fig.1 Variation of root mean square error with iteration times at different K values

    不止K的取值,學習速率α的取值不同也會影響均方根誤差的收斂速度,如圖2 所示,α分別取0.1、0.01、0.001、0.000 1,由圖2 可見,α取0.01 時收斂速度最快,α取0.000 1 時收斂速度最慢,可見步長越小,損失函數(shù)到達底部的時間越長,步長越大,損失函數(shù)收斂越快,但步長并不能無限大,經(jīng)過實驗發(fā)現(xiàn)當α取0.1 時,目標函數(shù)不會收斂,所以在該合成數(shù)據(jù)集上α取0.01。經(jīng)過在不同數(shù)據(jù)集上的實驗也發(fā)現(xiàn),同一個步長并不適用于所有數(shù)據(jù)集,所以要通過多次實驗發(fā)現(xiàn)最適合本數(shù)據(jù)集的步長,本文中所有數(shù)據(jù)集步長設(shè)置均經(jīng)過多次實驗,設(shè)其為最恰當?shù)臄?shù)值。

    圖2 不同α 值均方根誤差隨迭代次數(shù)變化Fig.2 Variation of root mean square error with iteration times at different α values

    3.2 數(shù)據(jù)集合成

    本節(jié)通過設(shè)計合成數(shù)據(jù)集來評價本文算法在存在大量不相關(guān)變量的不完整數(shù)據(jù)中填充缺失值后選擇出相關(guān)特征的能力。合成數(shù)據(jù)集包含500 個實例和100 維特征。其中兩維特征是隨機產(chǎn)生的0、1 序列,將這兩維特征做異或運算,產(chǎn)生結(jié)果即為合成數(shù)據(jù)集的標簽,剩下的98 個特征服從于以0 為均值、1為方差的標準正態(tài)分布。

    本節(jié)以所選擇的無關(guān)特征數(shù)目為標準評價特征選擇方法。為了簡便期間,只比較本文提出的算法與SID 算法,以及使用LBFS 算法作為特征選擇算法的3 種傳統(tǒng)方法,實驗結(jié)果如圖3 所示。

    圖3 無關(guān)特征數(shù)隨缺失率的變化Fig.3 Variation of irrelevant feature number with deletion rate

    由圖3 可以看出,在該數(shù)據(jù)集上,KNN 填充的方法選擇出的無關(guān)特征數(shù)目最多,效果最差,本文提出的算法PMF 效果最好,在缺失比例較高的情況下依然能選擇出較少的無關(guān)特征。SID 算法在缺失率較低的情況下效果較好,但在缺失率較高時不如PMF。

    3.3 真實數(shù)據(jù)集

    本節(jié)分別從LIBSVM 數(shù)據(jù)網(wǎng)站、UCI website[21]、肯特崗生物醫(yī)學數(shù)據(jù)集等網(wǎng)站下載DLBCL、Mnist、Splice、Wpbc、USPS、Arcene 6 個真實數(shù)據(jù)集。由于生物醫(yī)學方面數(shù)據(jù)集往往包含大量冗余特征,更能體現(xiàn)出特征選擇的作用,本節(jié)選用的數(shù)據(jù)集大部分與生物醫(yī)學有關(guān)。DLBCL 為彌漫大B 細胞淋巴瘤基因的相關(guān)數(shù)據(jù)集,Splice 是關(guān)于識別DNA 序列中兩種類型的剪接點的數(shù)據(jù)集,Wpbc 數(shù)據(jù)集則取自威斯康辛大學校醫(yī)院的乳腺癌病例數(shù)據(jù)庫,Arcene 原始數(shù)據(jù)來自于美國國家癌癥研究中心和東維多利亞醫(yī)學院,收集了通過SELDI 技術(shù)采集的癌癥病人和健康人的質(zhì)譜信息,用于癌癥預(yù)測。由于Splice 和Wpbc 數(shù)據(jù)集特征較少,這里人為的向其添加2 000 個無關(guān)特征,無關(guān)特征的特征值均通過從正態(tài)分布N(0,1)中抽樣得到。數(shù)據(jù)集詳細信息如表1所示。

    表1 數(shù)據(jù)集詳細信息Table 1 Datasets detailed information

    對于真實數(shù)據(jù)集,因為無法預(yù)知其中特征的重要性,所以使用分類準確率為標準評價特征選擇方法。在訓(xùn)練集上先進行特征選擇,之后對所選特征進行分類,分類準確率高說明特征選擇的效果越好。

    使用交叉驗證方式[22]選擇最佳參數(shù)組合,將原始數(shù)據(jù)集分為70%的訓(xùn)練集和30%的測試集,其中訓(xùn)練集的類標簽是已知的,假設(shè)測試集的類標簽未知,通過在訓(xùn)練集上訓(xùn)練得到分類器來預(yù)測測試實例的類標簽,比較預(yù)測得到的類標簽與真實的類標簽就可以得到該分類器的分類精度。本實驗使用SVM 分類器進行訓(xùn)練。對于基于KNN 填充進行的特征選擇,本文選取k=5。

    各算法在DLBCL 數(shù)據(jù)集上的分類效果柱狀圖如圖4 所示,其中縱坐標為分類準確率,橫坐標依次展示11 種不同的算法,不同底紋代表不同的缺失率,這里選取了缺失率為25%、35%和55%時的分類結(jié)果,可以看到,本文提出的算法在不同缺失率時準確率都高于其他10 個算法,均值填充的3 種算法在該數(shù)據(jù)集上的整體表現(xiàn)略高于KNN 填充和EM 填充,并且3 種不同的特征選擇算法效果相差不大,SID算法效果僅次于PMF,因為其利用了不完整數(shù)據(jù)集中的全部信息,但該算法沒有考慮異常值的影響。

    圖4 不同缺失率下DLBCL 數(shù)據(jù)集的分類準確率Fig.4 Classification accuracy of DLBCL dataset under different miss rates

    各算法在Mnist 數(shù)據(jù)集上的分類效果如圖5 所示,可以看到,在缺失率較高的情況下,本文提出的算法依然能達到90%的準確率,在該數(shù)據(jù)集中用KNN 填充的3 種算法效果較差,可能是該數(shù)據(jù)集比較稀疏導(dǎo)致近鄰關(guān)系度量不夠準確,EM 填充與SID算法效果相差不大,略高于均值填充。

    圖5 不同缺失率下Mnist 數(shù)據(jù)集的分類準確率Fig.5 Classification accuracy of Mnist dataset under different miss rates

    各算法在Splice 數(shù)據(jù)集上的分類效果柱狀圖如圖6 所示,可以看到,基于KNN 填充的算法效果較差,在缺失率為25%時只可以達到70%左右的準確率,PMF 在相同缺失率時可以達到80%以上的準確率,可見PMF 在該數(shù)據(jù)集上效果有了較大的提升?;诰堤畛涞乃惴ê蚐ID 算法效果較為接近。

    圖6 不同缺失率下Splice 數(shù)據(jù)集的分類準確率Fig.6 Classification accuracy of Splice dataset under different miss rates

    各算法在Wpbc 數(shù)據(jù)集上的分類效果柱狀圖如圖7 所示,可以看到,在該數(shù)據(jù)集上各個算法的分類準確率普遍較低。在該數(shù)據(jù)集上基于KNN 填充的算法效果較差,均值填充在25%缺失率時的效果較好,在KNN 填充和均值填充上RFS 特征選擇算法的效果比Simba 和Relief 略高。相比其他算法,本文提出的算法在該數(shù)據(jù)集上效果依然是最好的。

    圖7 不同缺失率下Wpbc 數(shù)據(jù)集的分類準確率Fig.7 Classification accuracy of Wpbc dataset under different miss rates

    各算法在USPS 數(shù)據(jù)集上的分類效果柱狀圖如圖8 所示,可以看到,本文提出的算法在該數(shù)據(jù)集上效果較好。在缺失率為5%時,所有算法的分類準確率都高達92%左右,但是隨著缺失率增大到55%,其他算法的分類效果有了明顯下降,此時本文提出的算法優(yōu)勢更加明顯。相比之前的基于填充的算法,SID 算法在該數(shù)據(jù)集上并不具有明顯的優(yōu)勢。

    圖8 不同缺失率下USPS 數(shù)據(jù)集的分類準確率Fig.8 Classification accuracy of USPS dataset under different miss rates

    各算法在Arcene 數(shù)據(jù)集上的分類效果如圖9 所示,可以看到,本文提出的算法在該數(shù)據(jù)集上的優(yōu)勢非常明顯,其他10 種算法在所有缺失比例時的準確率基本都在60%左右,然而PMF 算法可以達到90%左右的準確率,可見本文提出的算法非常適用于該數(shù)據(jù)集,這應(yīng)該與數(shù)據(jù)集本身有關(guān)。

    圖9 不同缺失率下Arcene 數(shù)據(jù)集的分類準確率Fig.9 Classification accuracy of Arcene dataset under different miss rates

    3.4 異常值檢測

    本節(jié)使用3.2 節(jié)中的合成數(shù)據(jù)集進行異常值檢測,為了方便展示,人工隨機地向數(shù)據(jù)集注入不同比例的異常值,這里使用固定值來模擬異常值。分別在異常值比率為1%、2%、3%時進行實驗求無關(guān)特征,異常值比率定義為注入異常值的數(shù)量占整個數(shù)據(jù)集的百分比,結(jié)果如表2 所示,本文固定缺失值比率為5%。從表2 的數(shù)據(jù)可以看出,在異常值比例較低時,本算法能篩選出所有的重要特征,隨著異常值比率增加,篩選出的無關(guān)特征數(shù)目有所增加,但仍然保持較低的數(shù)量,可見本文算法可以在一定程度上應(yīng)對不完整數(shù)據(jù)集中異常值帶來的影響。

    表2 不同比例異常值與無關(guān)特征數(shù)目Table 2 Different proportion outliers and irrelevant features number

    綜上所述,基于KNN 填充算法在Mnist 和Splice數(shù)據(jù)集上效果較差,雖然該算法利用樣本近鄰關(guān)系來進行填充,在一定程度上更多地利用了不完整數(shù)據(jù)集的信息,但是近鄰關(guān)系度量的準確性也會對填充效果造成影響?;诰堤畛渌惴ㄅcEM 填充算法效果略高于KNN 填充算法、SID 算法效果僅次于本文算法,因為該算法使用指示矩陣利用了不完整數(shù)據(jù)集中的全部信息,但是它沒有考慮數(shù)據(jù)集中異常值的影響。PMF 算法效果最好,因為其不僅充分利用了不完整數(shù)據(jù)集中的所有有效信息,還使用?2,1范數(shù)作為損失函數(shù),增強了其應(yīng)對異常值的魯棒性,所以與其他算法相比,在所有數(shù)據(jù)集上分類準確率都有所提升。

    4 結(jié)束語

    高維數(shù)據(jù)集中通常包含缺失值和離群值,對其進行降維是數(shù)據(jù)挖掘的重要步驟之一。本文針對不完整數(shù)據(jù)中含有未被觀察信息和存在異常值的特點,提出一種基于概率矩陣分解技術(shù)的魯棒特征選擇方法。該方法引入指示矩陣利用數(shù)據(jù)集中全部信息,對不完整數(shù)據(jù)集進行近似估計,在考慮異常值情形下,利用?2,1范數(shù)對數(shù)據(jù)點中異常值具有魯棒性的特點,將其作為回歸損失函數(shù),實現(xiàn)魯棒特征選擇。實驗結(jié)果表明,該方法能夠充分利用不完整數(shù)據(jù)集中的所有信息,避免繁瑣的距離運算,可有效應(yīng)對不完整數(shù)據(jù)集中異常值帶來的影響。下一步考慮將概率矩陣分解填充拓寬到半監(jiān)督或無監(jiān)督的特征選擇流程上,在數(shù)據(jù)集標簽有缺失甚至無標簽的情況下,提升特征選擇的效果。

    猜你喜歡
    分類特征效果
    按摩效果確有理論依據(jù)
    分類算一算
    如何表達“特征”
    不忠誠的四個特征
    當代陜西(2019年10期)2019-06-03 10:12:04
    分類討論求坐標
    迅速制造慢門虛化效果
    數(shù)據(jù)分析中的分類討論
    抓住“瞬間性”效果
    中華詩詞(2018年11期)2018-03-26 06:41:34
    教你一招:數(shù)的分類
    抓住特征巧觀察
    国产又色又爽无遮挡免费看| 在线免费观看的www视频| 国产精品精品国产色婷婷| 91国产中文字幕| 十分钟在线观看高清视频www| 淫妇啪啪啪对白视频| 色老头精品视频在线观看| 亚洲美女黄片视频| 国产黄色小视频在线观看| 热99re8久久精品国产| 精品国产乱子伦一区二区三区| 亚洲欧美精品综合一区二区三区| 一区福利在线观看| 少妇裸体淫交视频免费看高清 | 久久国产精品影院| 美女午夜性视频免费| 哪里可以看免费的av片| 真人一进一出gif抽搐免费| 精品午夜福利视频在线观看一区| 岛国在线观看网站| 欧美黑人精品巨大| a在线观看视频网站| 一卡2卡三卡四卡精品乱码亚洲| av电影中文网址| 久久欧美精品欧美久久欧美| 国产精品九九99| 1024手机看黄色片| 亚洲av中文字字幕乱码综合 | 两人在一起打扑克的视频| 国产精品野战在线观看| 精品人妻1区二区| 久久久国产精品麻豆| 99精品久久久久人妻精品| 人人澡人人妻人| 熟女电影av网| 免费av毛片视频| 满18在线观看网站| 国产精品永久免费网站| 亚洲三区欧美一区| 日韩三级视频一区二区三区| 午夜激情福利司机影院| 99国产精品99久久久久| 999久久久国产精品视频| 一二三四社区在线视频社区8| www.www免费av| 午夜久久久久精精品| 久热爱精品视频在线9| 国产成人系列免费观看| 啪啪无遮挡十八禁网站| 中文在线观看免费www的网站 | 国产精品久久久人人做人人爽| 亚洲国产精品成人综合色| 中出人妻视频一区二区| 曰老女人黄片| 久久精品国产清高在天天线| 久久香蕉激情| 91老司机精品| 老司机深夜福利视频在线观看| 又黄又爽又免费观看的视频| 日韩精品中文字幕看吧| 国产精品一区二区精品视频观看| 欧美三级亚洲精品| 91字幕亚洲| 中文字幕人成人乱码亚洲影| 在线天堂中文资源库| 1024视频免费在线观看| www.精华液| 美女国产高潮福利片在线看| 久热爱精品视频在线9| 三级毛片av免费| 美女扒开内裤让男人捅视频| 精品国内亚洲2022精品成人| av免费在线观看网站| 日韩免费av在线播放| 男女下面进入的视频免费午夜 | 黄片小视频在线播放| 欧美日韩中文字幕国产精品一区二区三区| 少妇裸体淫交视频免费看高清 | 亚洲av第一区精品v没综合| 免费看日本二区| 少妇熟女aⅴ在线视频| 国产一区在线观看成人免费| 久久九九热精品免费| 日本一本二区三区精品| 男人舔奶头视频| 亚洲av电影在线进入| 国产成人av教育| 欧美日本视频| 久久精品aⅴ一区二区三区四区| 久久天躁狠狠躁夜夜2o2o| 午夜久久久久精精品| 久热爱精品视频在线9| 婷婷亚洲欧美| 在线永久观看黄色视频| 男人舔女人下体高潮全视频| 国产精品,欧美在线| 亚洲精品美女久久久久99蜜臀| 视频区欧美日本亚洲| 免费女性裸体啪啪无遮挡网站| 久久久久国产一级毛片高清牌| 在线观看一区二区三区| 亚洲九九香蕉| 欧美丝袜亚洲另类 | 免费在线观看亚洲国产| 两性午夜刺激爽爽歪歪视频在线观看 | 精品不卡国产一区二区三区| 十八禁网站免费在线| 一进一出抽搐动态| 在线十欧美十亚洲十日本专区| 日本 av在线| 久久精品成人免费网站| 亚洲 欧美一区二区三区| 久久久久久人人人人人| 十八禁网站免费在线| 欧美性猛交╳xxx乱大交人| 在线视频色国产色| 亚洲精品粉嫩美女一区| 日韩欧美免费精品| 国产真实乱freesex| 99热这里只有精品一区 | 久久久久国产精品人妻aⅴ院| 999精品在线视频| 美女免费视频网站| 国产一区二区激情短视频| 久99久视频精品免费| 亚洲av中文字字幕乱码综合 | 高清在线国产一区| 精品国产超薄肉色丝袜足j| 亚洲中文av在线| 老司机午夜十八禁免费视频| 亚洲一区中文字幕在线| 99在线人妻在线中文字幕| 久99久视频精品免费| 精品国产国语对白av| 国产一区在线观看成人免费| 丝袜人妻中文字幕| 国产亚洲精品av在线| www.自偷自拍.com| 免费搜索国产男女视频| 亚洲 欧美一区二区三区| 欧美日本亚洲视频在线播放| 久久久久九九精品影院| 国产精品野战在线观看| 亚洲国产毛片av蜜桃av| 久久午夜亚洲精品久久| 老司机深夜福利视频在线观看| 午夜a级毛片| 国产av又大| 欧美乱码精品一区二区三区| 午夜免费观看网址| 成人国语在线视频| 久久久久久免费高清国产稀缺| 美女高潮到喷水免费观看| 夜夜夜夜夜久久久久| 成年版毛片免费区| 黄色视频不卡| 亚洲国产中文字幕在线视频| 成人国产一区最新在线观看| 男女视频在线观看网站免费 | 中文字幕最新亚洲高清| 欧美乱色亚洲激情| 999久久久国产精品视频| 黄频高清免费视频| 怎么达到女性高潮| 免费观看人在逋| 欧美一级毛片孕妇| 精品国产超薄肉色丝袜足j| 亚洲人成77777在线视频| 99热这里只有精品一区 | 99热这里只有精品一区 | 一级毛片精品| 久久精品夜夜夜夜夜久久蜜豆 | 99久久国产精品久久久| 亚洲五月色婷婷综合| 亚洲第一av免费看| 亚洲精品粉嫩美女一区| 大香蕉久久成人网| 熟女少妇亚洲综合色aaa.| 国产成人av激情在线播放| 国内精品久久久久精免费| 国产亚洲av嫩草精品影院| 午夜福利在线观看吧| 亚洲一卡2卡3卡4卡5卡精品中文| 国产精品 欧美亚洲| 女性被躁到高潮视频| 女人高潮潮喷娇喘18禁视频| 亚洲中文av在线| 午夜精品久久久久久毛片777| 中文资源天堂在线| 亚洲男人天堂网一区| 两人在一起打扑克的视频| 侵犯人妻中文字幕一二三四区| 日韩三级视频一区二区三区| 伦理电影免费视频| 丁香欧美五月| 亚洲色图 男人天堂 中文字幕| 久久精品国产综合久久久| 久久亚洲精品不卡| 成人国语在线视频| 日韩欧美 国产精品| 少妇裸体淫交视频免费看高清 | 国产精品 欧美亚洲| 欧美一区二区精品小视频在线| 日韩欧美免费精品| 黄色毛片三级朝国网站| 国产精品,欧美在线| av片东京热男人的天堂| 免费在线观看影片大全网站| 久久久久国内视频| 香蕉久久夜色| 国产午夜精品久久久久久| 国产亚洲欧美精品永久| 亚洲 国产 在线| 国产精品久久久久久人妻精品电影| 怎么达到女性高潮| 精品国产美女av久久久久小说| 精品一区二区三区四区五区乱码| 精品国产亚洲在线| av超薄肉色丝袜交足视频| 亚洲av中文字字幕乱码综合 | 夜夜躁狠狠躁天天躁| 亚洲国产精品sss在线观看| 一本久久中文字幕| 欧美国产精品va在线观看不卡| 男女床上黄色一级片免费看| 日本三级黄在线观看| 天天躁夜夜躁狠狠躁躁| 欧美成狂野欧美在线观看| 亚洲国产日韩欧美精品在线观看 | 丁香六月欧美| 日韩欧美三级三区| 亚洲国产精品久久男人天堂| 色在线成人网| 中文字幕精品亚洲无线码一区 | 亚洲av熟女| 欧美最黄视频在线播放免费| 亚洲第一青青草原| 十分钟在线观看高清视频www| 亚洲 欧美 日韩 在线 免费| 人成视频在线观看免费观看| 国产免费男女视频| 亚洲人成77777在线视频| 观看免费一级毛片| 国产av一区二区精品久久| 99热6这里只有精品| 亚洲中文字幕日韩| 午夜福利在线观看吧| 国产熟女xx| 国产精品二区激情视频| 日本在线视频免费播放| 中文字幕人成人乱码亚洲影| 女人被狂操c到高潮| 亚洲国产欧美日韩在线播放| 高清毛片免费观看视频网站| 国产乱人伦免费视频| 听说在线观看完整版免费高清| 精品久久久久久久久久免费视频| 久久天堂一区二区三区四区| √禁漫天堂资源中文www| 自线自在国产av| 18禁裸乳无遮挡免费网站照片 | 亚洲人成77777在线视频| 男女那种视频在线观看| 香蕉av资源在线| 成人国语在线视频| 国产av在哪里看| 真人一进一出gif抽搐免费| 亚洲色图av天堂| 听说在线观看完整版免费高清| 欧美一级a爱片免费观看看 | 国产亚洲av嫩草精品影院| 女性被躁到高潮视频| 一个人免费在线观看的高清视频| 日日爽夜夜爽网站| 亚洲久久久国产精品| 99热这里只有精品一区 | 搞女人的毛片| 成人免费观看视频高清| 怎么达到女性高潮| 亚洲成av片中文字幕在线观看| 色综合欧美亚洲国产小说| 天天躁夜夜躁狠狠躁躁| av福利片在线| 12—13女人毛片做爰片一| 18美女黄网站色大片免费观看| 香蕉久久夜色| 听说在线观看完整版免费高清| 人妻丰满熟妇av一区二区三区| 亚洲片人在线观看| 欧美成人免费av一区二区三区| 久久欧美精品欧美久久欧美| 99久久国产精品久久久| 天天躁夜夜躁狠狠躁躁| 久99久视频精品免费| 中文亚洲av片在线观看爽| 人成视频在线观看免费观看| 久久久久国产精品人妻aⅴ院| 黑丝袜美女国产一区| 人妻丰满熟妇av一区二区三区| 色综合亚洲欧美另类图片| 欧美成人免费av一区二区三区| 午夜免费成人在线视频| 日韩一卡2卡3卡4卡2021年| 亚洲一区二区三区色噜噜| 日本 欧美在线| 国产精品乱码一区二三区的特点| 性色av乱码一区二区三区2| 99久久99久久久精品蜜桃| 91麻豆精品激情在线观看国产| 国产亚洲欧美精品永久| 男人舔女人下体高潮全视频| 校园春色视频在线观看| 日韩精品免费视频一区二区三区| 99国产精品99久久久久| 变态另类丝袜制服| 免费在线观看日本一区| 99在线人妻在线中文字幕| 久久国产精品人妻蜜桃| 国产精品久久久av美女十八| 女人被狂操c到高潮| 神马国产精品三级电影在线观看 | 中文字幕av电影在线播放| 88av欧美| 精品国产乱子伦一区二区三区| 男人舔女人下体高潮全视频| 人妻久久中文字幕网| 国产三级在线视频| 最新在线观看一区二区三区| av天堂在线播放| 久久久国产成人免费| 精品一区二区三区视频在线观看免费| 欧美性猛交╳xxx乱大交人| svipshipincom国产片| 在线观看www视频免费| 国产91精品成人一区二区三区| 日韩高清综合在线| 久久久久久久久免费视频了| 动漫黄色视频在线观看| 亚洲av成人av| 亚洲成a人片在线一区二区| 亚洲欧美精品综合一区二区三区| 啦啦啦 在线观看视频| 性欧美人与动物交配| 国产视频一区二区在线看| 色综合站精品国产| 法律面前人人平等表现在哪些方面| 亚洲精品国产区一区二| 嫩草影院精品99| 久久伊人香网站| 12—13女人毛片做爰片一| 亚洲精品中文字幕一二三四区| 成人精品一区二区免费| 色综合站精品国产| 国产亚洲精品av在线| or卡值多少钱| 中文资源天堂在线| 性色av乱码一区二区三区2| 久久精品亚洲精品国产色婷小说| 欧美激情高清一区二区三区| 韩国av一区二区三区四区| 亚洲精品粉嫩美女一区| 久久人妻av系列| 在线观看一区二区三区| 色综合欧美亚洲国产小说| 亚洲精品一区av在线观看| tocl精华| 国产一区二区三区视频了| 中亚洲国语对白在线视频| 亚洲国产欧美网| 亚洲精品美女久久av网站| 精品久久久久久久久久久久久 | 久久精品国产亚洲av高清一级| 一级毛片高清免费大全| 亚洲成av片中文字幕在线观看| 成年免费大片在线观看| netflix在线观看网站| 亚洲国产中文字幕在线视频| 国产免费男女视频| 村上凉子中文字幕在线| 19禁男女啪啪无遮挡网站| 麻豆国产av国片精品| 欧美一级毛片孕妇| 国产乱人伦免费视频| 波多野结衣高清作品| 久久久久精品国产欧美久久久| 久久久国产欧美日韩av| 亚洲欧美激情综合另类| av天堂在线播放| 三级毛片av免费| 日韩欧美 国产精品| 青草久久国产| 一边摸一边做爽爽视频免费| 亚洲精华国产精华精| 欧美日韩瑟瑟在线播放| 满18在线观看网站| 美女国产高潮福利片在线看| 国内毛片毛片毛片毛片毛片| 亚洲国产日韩欧美精品在线观看 | 亚洲av第一区精品v没综合| 女人爽到高潮嗷嗷叫在线视频| 久久精品影院6| 精品第一国产精品| 国产精品免费一区二区三区在线| 久久久久精品国产欧美久久久| 一区二区日韩欧美中文字幕| 欧洲精品卡2卡3卡4卡5卡区| 国产主播在线观看一区二区| √禁漫天堂资源中文www| 午夜a级毛片| 熟女少妇亚洲综合色aaa.| 99re在线观看精品视频| 特大巨黑吊av在线直播 | 亚洲男人的天堂狠狠| 搡老岳熟女国产| 老司机午夜福利在线观看视频| 亚洲自拍偷在线| 欧美黄色淫秽网站| 搡老岳熟女国产| 免费看日本二区| 国产在线观看jvid| 人妻久久中文字幕网| 女人高潮潮喷娇喘18禁视频| 色播亚洲综合网| 级片在线观看| 又黄又爽又免费观看的视频| 黄片小视频在线播放| 午夜精品久久久久久毛片777| 淫妇啪啪啪对白视频| 精品电影一区二区在线| 亚洲七黄色美女视频| 制服人妻中文乱码| 精品国产超薄肉色丝袜足j| 他把我摸到了高潮在线观看| 国产麻豆成人av免费视频| 12—13女人毛片做爰片一| 欧美日韩福利视频一区二区| 91成人精品电影| 亚洲avbb在线观看| 在线免费观看的www视频| 可以在线观看毛片的网站| 成在线人永久免费视频| 免费无遮挡裸体视频| 桃红色精品国产亚洲av| www.自偷自拍.com| 午夜福利成人在线免费观看| 久久精品国产清高在天天线| 久久国产亚洲av麻豆专区| 中文字幕另类日韩欧美亚洲嫩草| 欧美精品亚洲一区二区| 精品欧美国产一区二区三| 日韩精品青青久久久久久| 成年女人毛片免费观看观看9| av欧美777| 欧美大码av| av有码第一页| 老司机深夜福利视频在线观看| 一级片免费观看大全| 久久久久久免费高清国产稀缺| 国产成人av教育| 亚洲第一av免费看| 男女那种视频在线观看| 天天添夜夜摸| 黄色成人免费大全| 在线观看免费午夜福利视频| 欧美av亚洲av综合av国产av| 国产片内射在线| 老汉色av国产亚洲站长工具| 中文资源天堂在线| 1024视频免费在线观看| 18禁观看日本| 久久久久国产一级毛片高清牌| 91成人精品电影| 国产av不卡久久| 欧美日本视频| 18美女黄网站色大片免费观看| 悠悠久久av| 在线av久久热| 黄片小视频在线播放| 精品高清国产在线一区| 嫩草影院精品99| 9191精品国产免费久久| 琪琪午夜伦伦电影理论片6080| 制服人妻中文乱码| 国产av一区二区精品久久| 亚洲第一电影网av| 欧美黑人精品巨大| 久久久久精品国产欧美久久久| 国产私拍福利视频在线观看| 亚洲天堂国产精品一区在线| 日本 av在线| 欧洲精品卡2卡3卡4卡5卡区| 亚洲精品一区av在线观看| 欧美日韩一级在线毛片| 亚洲熟女毛片儿| 99riav亚洲国产免费| 亚洲专区国产一区二区| 51午夜福利影视在线观看| 成人一区二区视频在线观看| 波多野结衣高清作品| 免费在线观看日本一区| 欧美激情极品国产一区二区三区| 一级毛片女人18水好多| 在线天堂中文资源库| 啦啦啦韩国在线观看视频| 国产黄a三级三级三级人| 成人一区二区视频在线观看| 美女高潮到喷水免费观看| 色综合婷婷激情| 国产精品精品国产色婷婷| 久久久久免费精品人妻一区二区 | 亚洲成国产人片在线观看| 在线视频色国产色| 久久久久国产一级毛片高清牌| 日韩 欧美 亚洲 中文字幕| www.精华液| 黄色女人牲交| 亚洲第一电影网av| 免费电影在线观看免费观看| 91大片在线观看| 男女床上黄色一级片免费看| 亚洲在线自拍视频| 国产欧美日韩精品亚洲av| 伦理电影免费视频| 国产精品香港三级国产av潘金莲| 性欧美人与动物交配| 波多野结衣高清无吗| 老司机午夜十八禁免费视频| av中文乱码字幕在线| 一进一出抽搐动态| 日韩欧美 国产精品| 午夜精品在线福利| 亚洲色图av天堂| 国产成人精品久久二区二区91| 激情在线观看视频在线高清| 18禁裸乳无遮挡免费网站照片 | 国产午夜精品久久久久久| 国产成人精品久久二区二区免费| 少妇裸体淫交视频免费看高清 | 搡老熟女国产l中国老女人| 国产成人精品无人区| 麻豆成人av在线观看| 99在线视频只有这里精品首页| 国产亚洲精品第一综合不卡| 亚洲男人的天堂狠狠| 男女床上黄色一级片免费看| 中文字幕av电影在线播放| 91成年电影在线观看| 99国产精品一区二区三区| 1024视频免费在线观看| 一进一出抽搐gif免费好疼| 日本撒尿小便嘘嘘汇集6| 国产不卡一卡二| 亚洲天堂国产精品一区在线| 老汉色av国产亚洲站长工具| 精品国产国语对白av| 日韩欧美免费精品| 国产亚洲精品av在线| 制服丝袜大香蕉在线| 久久久久国产精品人妻aⅴ院| 色精品久久人妻99蜜桃| 亚洲成人免费电影在线观看| 久久性视频一级片| 亚洲熟女毛片儿| 久久性视频一级片| 亚洲精品国产区一区二| 亚洲色图 男人天堂 中文字幕| 国产成人欧美| 国产精品美女特级片免费视频播放器 | 91麻豆精品激情在线观看国产| 级片在线观看| 黄片小视频在线播放| 欧美一级a爱片免费观看看 | 变态另类丝袜制服| 看片在线看免费视频| 欧美日韩中文字幕国产精品一区二区三区| 99国产精品99久久久久| 免费高清在线观看日韩| 一本综合久久免费| 日本a在线网址| 激情在线观看视频在线高清| 亚洲国产欧美一区二区综合| 国产精品免费视频内射| 黄片大片在线免费观看| 麻豆久久精品国产亚洲av| 麻豆成人午夜福利视频| 好男人电影高清在线观看| 老司机午夜十八禁免费视频| 精品久久久久久,| 成人18禁在线播放| 岛国视频午夜一区免费看| 91老司机精品| 成人亚洲精品一区在线观看| 免费在线观看视频国产中文字幕亚洲| 亚洲精华国产精华精| 日韩精品青青久久久久久| 久久热在线av| 亚洲国产精品成人综合色| av天堂在线播放| 精品国产乱子伦一区二区三区| 一个人观看的视频www高清免费观看 | 亚洲成a人片在线一区二区| 国产精品一区二区三区四区久久 | 精品国产乱码久久久久久男人| 国产亚洲av高清不卡| 国产成人欧美在线观看| 国产亚洲欧美在线一区二区| 黄网站色视频无遮挡免费观看| 人妻久久中文字幕网| 国产一区二区三区在线臀色熟女| 日韩中文字幕欧美一区二区| 亚洲av电影不卡..在线观看| 亚洲无线在线观看| 精品国产亚洲在线| 日本三级黄在线观看| 欧美日韩乱码在线|