• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    Hadoop框架下的多標簽傳播算法

    2015-12-26 03:10:27孫霞張敏超馮筠張蕾何緋娟
    西安交通大學(xué)學(xué)報 2015年5期
    關(guān)鍵詞:標簽分類矩陣

    孫霞,張敏超,馮筠,張蕾,何緋娟

    (1.西北大學(xué)信息科學(xué)與技術(shù)學(xué)院,710127,西安;2.西安交通大學(xué)城市學(xué)院,710018,西安)

    ?

    Hadoop框架下的多標簽傳播算法

    孫霞1,張敏超1,馮筠1,張蕾1,何緋娟2

    (1.西北大學(xué)信息科學(xué)與技術(shù)學(xué)院,710127,西安;2.西安交通大學(xué)城市學(xué)院,710018,西安)

    標簽傳播算法的主要思想是利用已標注數(shù)據(jù)的標簽信息預(yù)測未標注數(shù)據(jù)的標簽信息。然而,傳統(tǒng)傳播算法沒有區(qū)別對待未標注數(shù)據(jù)與已標注數(shù)據(jù)相互之間的轉(zhuǎn)移信息,導(dǎo)致算法的收斂速度較慢,影響了算法的性能。針對傳統(tǒng)算法的不足,提出了差異權(quán)重標簽傳播算法,算法按標注信息的重要性賦予不同的權(quán)重。在解決了大規(guī)模特征矩陣相乘問題之后,將提出的差異權(quán)重標簽傳播算法應(yīng)用到Hadoop框架下,采用分布式計算,實現(xiàn)了能夠處理大規(guī)模數(shù)據(jù)的多標簽分類算法(HSML),并將提出的HSML算法與現(xiàn)有主流多標簽分類算法進行了性能比較。實驗結(jié)果表明,HSML算法在多標簽分類的各項性能評測指標和執(zhí)行速度上都是有效的。

    Hadoop;多標簽分類;標簽傳播算法

    傳統(tǒng)分類學(xué)習(xí)問題研究如何將待分類樣本準確地劃分到唯一的某一類中,即單標簽分類。然而,真實世界的對象往往并不只具有唯一的語義。每個對象由多個類別標注,學(xué)習(xí)的目標是將所有合適的類別標注賦予未見對象,即多標簽分類學(xué)習(xí)。

    多標簽分類的研究對多義性對象學(xué)習(xí)模型的建立具有相當重要的意義,現(xiàn)已逐漸成為國際機器學(xué)習(xí)界一個新的研究熱點[1-4]。目前,研究者針對多標簽分類問題提出了基于問題轉(zhuǎn)化和基于算法轉(zhuǎn)化的兩大類解決方法。問題轉(zhuǎn)化法的主要思想是將多標簽分類問題轉(zhuǎn)化為多個單標簽分類,再利用已有的單標簽分類方法完成分類任務(wù)。常見的問題轉(zhuǎn)化法是二元關(guān)系法(BR)[5]、標簽冪集法(LP)[6]等。與問題轉(zhuǎn)化法不同,算法轉(zhuǎn)化法通過直接改進已有的單標簽分類算法進行多標簽分類。有多標簽K近鄰(MLKNN)算法[7]、基于神經(jīng)網(wǎng)絡(luò)的反向傳播多標簽分類算法(BPMLL)[8]、Rank-SVM多標簽分類算法[9]等。

    多標簽學(xué)習(xí)所面臨的最大挑戰(zhàn)在于標簽空間過大。若一個標簽集合具有20個類別,則可能的類別標簽集合數(shù)將超過一百萬(即220)。為了有效應(yīng)對標注集合空間過大所造成的學(xué)習(xí)困難,本文提出了分布式學(xué)習(xí)框架下的多標簽分類算法HSML。

    1 差異權(quán)重的標簽傳播算法

    標簽傳播算法(LPA)[10]是在2002年由Zhu等人提出的一種基于圖的半監(jiān)督學(xué)習(xí)方法,其主要思想是利用已標注數(shù)據(jù)的標簽信息來預(yù)測未標注數(shù)據(jù)的標簽信息。它首先用數(shù)據(jù)間的關(guān)系建立一個關(guān)系完全圖,圖中節(jié)點包含已標注數(shù)據(jù)和未標注數(shù)據(jù),連接兩個頂點的邊用相似度表示,頂點的標簽信息通過轉(zhuǎn)移概率傳遞給其他相鄰頂點,頂點間相似度越大,標簽傳播的信息也就越多,反復(fù)迭代直到收斂。然而,在迭代過程中,傳統(tǒng)傳播算法沒有區(qū)別對待未標注數(shù)據(jù)與已標注數(shù)據(jù)相互之間的轉(zhuǎn)移信息,導(dǎo)致算法的收斂速度較慢,從而影響了算法的性能。針對傳統(tǒng)算法的不足,本文提出了差異權(quán)重的標簽傳播算法。

    1.1 算法思想

    在傳播算法的每次迭代過程中,未標注數(shù)據(jù)都被重新標注。因此,將這些數(shù)據(jù)從未標注數(shù)據(jù)集移到已標注數(shù)據(jù)集中,與初始標注數(shù)據(jù)集構(gòu)成新的標注數(shù)據(jù)集,指導(dǎo)下次迭代,以達到提高分類準確率的目的。初始標簽矩陣F,記為

    (1)

    式中:FL為已標注標簽;FU為未標注標簽。標簽之間的轉(zhuǎn)移概率矩陣為P,有

    (2)

    標注轉(zhuǎn)移過程為:FL以PLL的轉(zhuǎn)移子陣向自身轉(zhuǎn)移,FL以PLU的轉(zhuǎn)移子陣向FU轉(zhuǎn)移,FU以PUU的轉(zhuǎn)移子陣向自身轉(zhuǎn)移,FU以PUL的轉(zhuǎn)移子陣向FL轉(zhuǎn)移。由于FL和FU所含的信息量不同,有標簽數(shù)據(jù)向無標簽數(shù)據(jù)轉(zhuǎn)移的信息要比無標簽數(shù)據(jù)之間的相互轉(zhuǎn)移信息重要的多,更比無標簽數(shù)據(jù)向有標簽數(shù)據(jù)轉(zhuǎn)移的信息重要。若對這些不同子陣間的轉(zhuǎn)移不加以區(qū)分,會出現(xiàn)少量的真實信息被大量的虛假信息淹沒,導(dǎo)致分類效果降低。因此,對于PLU和PUL轉(zhuǎn)移子陣按信息的重要性賦予不同的權(quán)重。

    1.2 算法描述

    差異權(quán)重多標簽傳播算法描述如下。

    輸入:初始標注訓(xùn)練集XL={(x1,y1),(x2,y2),…,(xl,yl)},未標注訓(xùn)練集XU={x1,x2,…,xu}。

    輸出:未標注數(shù)據(jù)的標簽FU。

    步驟1 依據(jù)訓(xùn)練數(shù)據(jù)建立關(guān)系完全圖。

    步驟4 根據(jù)已標注數(shù)據(jù)初始化標注矩陣F=(FL,FU),其中FU每個分量賦值1/C,依據(jù)已標注數(shù)據(jù)的類標注給相應(yīng)的FL賦值。

    步驟6 從W中選出與xui最近鄰的K個已標注樣本,如果這K個樣本中有K*個樣本的標簽相同,則轉(zhuǎn)向步驟7,否則轉(zhuǎn)向步驟4中的下一個xui。

    步驟9 把已標注數(shù)據(jù)的概率分布設(shè)置為類的概率值。

    步驟10 重復(fù)步驟4~9,直到F收斂。

    2 HSML算法

    若將一個有n(n>5)類別的多標簽分類問題中大量的數(shù)據(jù)計算全部投入到單機上,可能造成計算時間過長或者內(nèi)存不足,從而引起分類失敗。為了有效應(yīng)對標注集合空間過大所造成的學(xué)習(xí)困難,本文引入了Hadoop分布式框架[11-12]。Hadoop分布式框架分為Map和Reduce兩個部分,Map對一些獨立元素進行相應(yīng)處理,Reduce是對處理結(jié)果的一個整合。本文把多標簽學(xué)習(xí)問題分解成多個單標簽學(xué)習(xí)問題,利用Map和Reduce構(gòu)建2n個單標簽分類算法,最后整合各分類的結(jié)果,形成最終的多標簽分類結(jié)果。

    2.1 矩陣相乘

    本文采用空間向量模型VSM表示每一個樣本。若每一個樣本用m維特征表示,則樣本集大小為n的訓(xùn)練數(shù)據(jù)可以表示成一個n×m矩陣,通常這樣的矩陣具有高維、稀疏的特點,而高維、稀疏矩陣相乘存在耗時長、占用內(nèi)存高的問題,因此需要尋求高效解決矩陣相乘的方法。

    傳統(tǒng)的矩陣運算是矩陣A中的每一行分別與矩陣B中的每一列相乘。當矩陣規(guī)模增大時,受限于內(nèi)存大小,一臺服務(wù)器已經(jīng)無法處理。稀疏矩陣具有天然可分塊特性,出現(xiàn)了許多基于Hadoop的分塊矩陣計算方法。算法思想是:將矩陣A中的分塊分別與矩陣B相乘,通過Hadoop,每個分塊的矩陣相乘可在不同的計算節(jié)點完成,最后將結(jié)果組合,大大提高了計算速度。

    最小粒度相乘算法具有不受限計算節(jié)點內(nèi)存限制的優(yōu)勢,成為矩陣相乘的主流算法。假設(shè)有兩個超大矩陣A和B,A是一個m×r矩陣,B是一個r×n矩陣,則A中的每個元素Aik與B中第k行元素Bkj依次相乘,計算結(jié)果分別為Cij中的一個組成部分;B中的每個元素Bkj與A中第j列元素Aik依次相乘,計算結(jié)果分別為Cij的一個組成部分。由于Aik×Bkj是獨立的,可由不同計算節(jié)點進行運算,最后依據(jù)(i,j)(記為key值)將運算結(jié)果匯總相加,得到Cij。每個計算節(jié)點計算時只加載兩個數(shù)進行相乘。理論上只要Hadoop的HDFS文件系統(tǒng)足夠大,就可以計算任意規(guī)模的矩陣相乘。然而在實際操作中,Map的每條輸入記錄只被處理一次便不再使用。因此,對于矩陣A中的每個元素,進行乘法運算之前,需要生成n個副本;對于矩陣B中每個元素,需要生成m個副本,并將相應(yīng)位置上的副本相對應(yīng)。例如,對于Aik需生成n個副本,與B中相應(yīng)元素對應(yīng)并以A中元素的行號、B中元素的列號作為key值,矩陣表示為

    i-jAik-Bkj

    (3)

    這種方式勢必增加時間復(fù)雜度,降低可行性。因此,本文提出了改進的基于Hadoop的最小粒度相乘算法。

    2.2 改進的最小粒度相乘算法

    由于key值不具備明顯的區(qū)分度,且Map過程中內(nèi)存不保留矩陣元素,將數(shù)據(jù)組織成式(3)格式是極其困難的,在Map輸入前查詢數(shù)據(jù)庫所耗費的時間也是難以接受的。不難發(fā)現(xiàn),最終結(jié)果CiJ是由r個值相加而成的,第k個組成成分為Aik-Bkj。為了使key值更具有區(qū)分度,將key值修改為

    i-j-kAik,i-j-kBkj

    (4)

    這樣key值所代表的是兩個值相乘,得到了Cij中第k個組成元素。矩陣A與矩陣B在Map階段完成數(shù)據(jù)副本拷貝后,所有的Map數(shù)據(jù)記錄中i-j-k的key值有且至多有兩個。

    由于矩陣A中每個元素理論上都需要被計算n遍,矩陣B中每個元素都需要被計算m遍,因此式(4)中有j=1,2,…,k,…,n;i=1,2,…,k,…,m。每個元素的副本拷貝都是獨立的,可由不同的Map進行計算,故大大加快了拷貝的速度。

    2.3 Hadoop下二元分類器構(gòu)建

    HSML算法是對每個標簽構(gòu)建一個二元分類器,最后再對整個結(jié)果進行組合。Hadoop下的二元分類器構(gòu)建過程如圖1所示。

    (1)首先對數(shù)據(jù)集進行特征選擇。在后面的實驗中,我們使用自建的數(shù)據(jù)集“Pubmed”,該數(shù)據(jù)集所處理的對象是文本數(shù)據(jù),因此選擇詞組作為文本特征。通過統(tǒng)計分析,僅提取DT+NN、JJ+NN、JJ+JJ+NN、JJ+JJ+NN+NNS、JJ+NN+NN、NN等形式的名詞詞組,其中DT是限定詞,JJ是形容詞,NN是單數(shù)名詞、NNS是復(fù)數(shù)名詞。然后,采用信息增益的方法計算詞特征權(quán)重,選擇大于閾值的那些詞表示數(shù)據(jù),同時提取標注數(shù)據(jù)的標簽特征屬性,分別得到特征向量矩陣和類別矩陣。

    圖1 Hadoop下的二元分類器構(gòu)建過程

    (2)第一個MapReduce階段是進行矩陣計算,完成一次標簽傳播過程。采用本文提出的改進的最小粒度相乘算法,充分利用分布式計算特點,實現(xiàn)了快速稀疏矩陣相乘。Reducer函數(shù)的輸出為式(4)的格式。

    (3)第二個MapReduce階段是是采用1.2節(jié)提出的差異權(quán)重的標簽傳播算法,對標簽數(shù)據(jù)進行重構(gòu)。有標簽數(shù)據(jù)向無標簽數(shù)據(jù)轉(zhuǎn)移的信息要比無標簽數(shù)據(jù)之間相互轉(zhuǎn)移的信息重要,更比無標簽數(shù)據(jù)向有標簽數(shù)據(jù)轉(zhuǎn)移的信息重要,因此利用近鄰假設(shè),對各概率轉(zhuǎn)移子陣賦予不同的權(quán)重。在傳播算法過程中,未標注數(shù)據(jù)被重新標注,并將這些數(shù)據(jù)從未標注數(shù)據(jù)集移到已標注數(shù)據(jù)集中,與初始標注數(shù)據(jù)集構(gòu)成新的標注數(shù)據(jù)集,指導(dǎo)下次迭代。

    (4)重復(fù)執(zhí)行上述兩個MapReduce過程,直到算法收斂。

    (5)將最終結(jié)果表示成(標簽,數(shù)據(jù)列表)二元組形式。

    (6)對每個標簽都執(zhí)行上述過程,最后整合結(jié)果完成多標簽分類。

    3 實驗結(jié)果與分析

    本實驗平臺基本配置為HP臺式機,Win7、Linux操作系統(tǒng),Intel酷睿i5處理器,2 GB內(nèi)存,1 TB硬盤,主要使用Matlab和Java編程語言實現(xiàn)。

    3.1 數(shù)據(jù)集描述

    實驗釆用Emotions、Image、Yeast和Pubmed 4個數(shù)據(jù)集。前3個是公開數(shù)據(jù)集,可從數(shù)據(jù)堂[13]下載獲取,Pubmed是本文構(gòu)建的數(shù)據(jù)集。首先向PubMed數(shù)據(jù)庫提交“Lung Cancer”關(guān)鍵字,檢索并收集有關(guān)肺癌文獻摘要,然后提取文獻中的MeSH標注作為該文獻的標簽數(shù)據(jù)。實驗中所使用的數(shù)據(jù)集基本信息如表1所示。

    表1 數(shù)據(jù)集特征描述

    3.2 評價指標

    本文采用的評價指標有Hamming loss、One-error、Coverage、Ranking loss、Average-precision等。Hamming loss、One-error、Coverage、Ranking loss 4個評價指標的值越小,說明多標簽分類器的性能越好,而Average precision的值越大,說明多標簽分類器的性能越好。

    (1)Hamming loss度量多標簽分類器預(yù)測出的標簽與實際標簽之間的差距,即

    (5)

    (2)One-error度量平均對每個樣本的預(yù)測標簽排序中,排在第一位的標簽不在該樣本的相關(guān)標簽集中的概率,即

    ?Yi|

    (6)

    Coverage度量平均對每個樣本的預(yù)測標簽排序中,需要在標簽排序列表中最少查找到第幾位才可以找出所有與該樣本相關(guān)的標簽,即

    (7)

    (3)Ranking loss度量所有樣本的預(yù)測標簽排序中,不相關(guān)標簽排在相關(guān)標簽前面的平均概率

    rankingloss(f)=

    (8)

    (4)Average precision度量所有樣本的預(yù)測標簽排序中,排在相關(guān)標簽前面的是相關(guān)標簽的平均概率,即

    (9)

    3.3 實驗結(jié)果

    表2對比了本文提出的HSML算法與現(xiàn)有主流多標簽分類算法的性能。LIFT、ML-KNN以及BP-MLL算法源代碼可從文獻[14]下載獲取。

    由表2可知,HSML算法在Hamming loss指標上稍遜色于LIFT算法、在Coverage上分類性能比BP-MLL稍低以外,在其他指標上均占優(yōu)勢。尤其是對于已標注數(shù)據(jù)較少的數(shù)據(jù)集,HSML算法具有明顯優(yōu)勢,整體性能優(yōu)于其他3個算法,充分體現(xiàn)了半監(jiān)督算法對標注數(shù)據(jù)量要求不高的優(yōu)點。

    表2 4種多標簽算法的分類性能

    圖2展示了HSML在各數(shù)據(jù)集上的加速比,從而驗證了該算法的執(zhí)行效率。

    圖2 HSML在各數(shù)據(jù)集上的加速比

    從圖2可以看出,當機器數(shù)量越多時,算法的加速比越大,算法的執(zhí)行效率越高。當只有一臺主機時,算法的加速均比小于1,這是因為Hadoop復(fù)制數(shù)據(jù)以及其它內(nèi)部操作消耗時間,默認將數(shù)據(jù)備份2份的緣故。數(shù)據(jù)量越大,隨著主機數(shù)量增加,其加速比越大,這充分體現(xiàn)了HSML算法的優(yōu)勢,即更易處理大數(shù)據(jù)。

    表3對比了各算法在Pubmed數(shù)據(jù)集上的訓(xùn)練與測試時間。從表3可知,HSML算法在Pubmed數(shù)據(jù)集上所花費的時間最少。尤其是與ML-KNN算法相比,HSML算法無論是訓(xùn)練用時還是測試用時都明顯較少。這是由于ML-KNN是一種懶惰學(xué)習(xí)技術(shù),采用在線的方式對測試樣本的類標注進行預(yù)測,因此計算量大。

    表3 各算法在Pubmed數(shù)據(jù)集上的訓(xùn)練與測試時間

    綜上所述,HSML算法具有較好的性能,理論上在主機足夠多的情況下,能處理任意規(guī)模的大數(shù)據(jù)計算問題,充分發(fā)揮了Hadoop的優(yōu)越性。

    4 總 結(jié)

    傳統(tǒng)的標簽傳播算法是一種基于流行假設(shè)的半監(jiān)督學(xué)習(xí)算法,通過迭代將標注信息傳遞給鄰近節(jié)點,由于沒有區(qū)別對待未標注數(shù)據(jù)與已標注數(shù)據(jù)相互之間轉(zhuǎn)移信息,導(dǎo)致算法的收斂速度較慢。本文在迭代過程中將標注數(shù)據(jù)和未標注數(shù)據(jù)的轉(zhuǎn)移概率按重要程度賦予相應(yīng)的權(quán)重,利用近鄰規(guī)則的Depuration數(shù)據(jù)剪輯技術(shù)把每次迭代后準確標注的未標注數(shù)據(jù)加到標注數(shù)據(jù),重構(gòu)標注數(shù)據(jù),提出差異權(quán)重標簽傳播算法,從而加快算法的收斂速度,提高算法性能。將多標簽學(xué)習(xí)問題分解成多個單標簽學(xué)習(xí)問題,造成標簽空間過大。為了有效應(yīng)對這一挑戰(zhàn),在解決大規(guī)模矩陣相乘問題后,將提出的差別權(quán)重標簽傳播算法應(yīng)用到Hadoop框架下,使算法能夠適應(yīng)大規(guī)模數(shù)據(jù)多標簽分類問題。

    [1] ZHANG Minling, ZHOU Zhihua. A review on multi-label learning algorithms [J]. IEEE Transactions on Knowledge & Data Engineering, 2014, 26(8): 1-59.

    [2] XU Miao, LI Yufeng, ZHOU Zhihua. Multi-label learning with pro loss [C]∥Proceedings of the 27th AAAI Conference on Artificial Intelligence. Palo Alto, California, USA: AAAI, 2013: 998-1004.

    [3] SUN Y Y, ZHANG Y, ZHOU Z H. Multi-label learning with weak label [C]∥24th AAAI Conference on Artificial Intelligence. Palo Alto, California, USA: AAAI, 2010:593-598.

    [4] 孔祥南, 黎銘, 姜遠, 等. 一種針對弱標記的直推式多標記分類方法 [J]. 計算機研究與發(fā)展, 2010, 47(8): 1392-1399. KONG Xiangnan, LI Ming, JIANG Yuan, et al. A transductive multi-label classification method for weaklabeling [J]. Journal of Computer Research and Development, 2010, 47(8): 1392-1399.

    [5] BOUTELL M R, LUO J, SHEN X, et al. Learning multi-label scene classification [J]. Pattern Recognition, 2004, 37(9): 1757-1771.

    [6] TSOUMAKAS G, VLAHAVAS I. Random k-labelsets: an ensemble method for multilabel classification [C]∥18th European Conference on Machine Learning. Berlin, Germany: Springer, 2007: 406-417.

    [7] ZHANG Minling, ZHOU Zhihua. ML-kNN: a lazy learning approach to multi-label learning [J]. Pattern Recognition, 2007, 40(7): 2038-2048.

    [8] ZHANG Minling, ZHOU Zhihua. Multilabel neural networks with applications to functional genomics and text categorization [J]. IEEE Transactions on Knowledge and Data Engineering, 2006, 18(10): 1338-1351

    [9] ELISSEEFF A, WESTON J. A kernel method for multi-labelled classification [C]∥Advances in Neural Information Processing Systems. Cambridge, MA, USA: MIT, 2002: 681-687.

    [10]ZHU X J, GHAHRAMANI Z. Learning from labeled and unlabeled data with label propagation, CMU-CALD-02-107 [R]. Pittsburghers, USA: Carnegie Mellon University, 2002.

    [11]Welcome to Apache [EB/OL]. [2013-10-14]. http:∥hadoop.apache.org.

    [12]Hadoop 集群安裝 [EB/OL]. [2013-12-20]. http:∥blog.csdn.net/liou825/article/details/9320745.

    [13]數(shù)據(jù)堂 [EB/OL]. [2014-04-01]. http:∥www.datatang.com/data/list.

    [14]張敏靈個人主頁 [EB/OL]. [2014-04-01]. http:∥cse.seu.edu.cn/people/zhangml/Publication.htm.

    [本刊相關(guān)文獻鏈接]

    馬莉,唐善成,王靜,等.云計算環(huán)境下的動態(tài)反饋作業(yè)調(diào)度算法.2014,48(7):77-82.[doi:10.7652/xjtuxb201407014]

    陳秀真,李生紅,凌屹東,等.面向拒絕服務(wù)攻擊的多標簽IP返回追蹤新方法.2013,47(10):13-17.[doi:10.7652/xjtuxb 201310003]

    劉光輝,任慶昌,孟月波,等.自適應(yīng)先驗馬爾可夫隨機場模型的圖像分割算法.2013,47(10):62-67.[doi:10.7652/xjtuxb201310011]

    杜友田,辛剛,鄭慶華.融合異構(gòu)信息的網(wǎng)絡(luò)視頻在線半監(jiān)督分類方法.2013,47(7):96-101.[doi:10.7652/xjtuxb201307 018]

    艾波,胡軍,張早校,等.含缺陷蒸汽發(fā)生器管道爆破壓力預(yù)測的遺傳-神經(jīng)網(wǎng)絡(luò)算法.2011,45(9):84-89.[doi:10.7652/xjtuxb201109016]

    徐勝軍,韓九強,趙亮,等.用于圖像分割的局部區(qū)域能量最小化算法.2011,45(8):7-12.[doi:10.7652/xjtuxb201108 002]

    溫超,耿國華,李展.構(gòu)建新包空間的多示例學(xué)習(xí)方法.2011,45(8):62-66.[doi:10.7652/xjtuxb201108011]

    余思,桂小林,黃汝維,等.一種提高云存儲中小文件存儲效率的方案.2011,45(6):59-63.[doi:10.7652/xjtuxb201106 011]

    (編輯 趙煒)

    A Label Propagation Algorithm for Multi-Label Classification Using Hadoop Technology

    SUN Xia1, ZHANG Minchao1, FENG Jun1, ZHANG Lei1, HE Feijuan2

    (1. School of Information and Technology, Northwest University, Xi’an 710127, China; 2. Department of Computer Science, Xi’an Jiaotong University City College, Xi’an 710018, China)

    A method of label propagation using Hadoop technology, named HSML, is proposed, to cope with the challenge of exponential-sized output space learning from multi-label data. Label propagation algorithms are graph-based semi-supervised learning methods, and use the label information of labeled data to predict the label information of unlabeled data. Traditional label propagation algorithms do not consider the posterior probability and distinguish information between labeled data and unlabeled data during the label propagation process, hence, the performance of traditional label propagation algorithms is affected. Therefore, a label propagation algorithm with different weights is proposed. After the multiplication problem of large-scale feature matrices is solved, the proposed algorithm is applied to the framework of Hadoop to deal with the problem of multi-label classification learning from big data. Experimental results and comparisons with some well-established multi-label learning algorithms, show that the performance of HSML is superior, and that the bigger test set is the faster HSML runs.

    Hadoop; multi-label classification; label propagation algorithm

    2014-11-18。

    孫霞(1977—),女,副教授。

    國家自然科學(xué)基金資助項目(61202184,61100166);陜西省教育廳資助項目(2013JK1152)。

    10.7652/xjtuxb201505021

    TP391

    A

    0253-987X(2015)05-0134-06

    猜你喜歡
    標簽分類矩陣
    分類算一算
    分類討論求坐標
    無懼標簽 Alfa Romeo Giulia 200HP
    車迷(2018年11期)2018-08-30 03:20:32
    數(shù)據(jù)分析中的分類討論
    不害怕撕掉標簽的人,都活出了真正的漂亮
    海峽姐妹(2018年3期)2018-05-09 08:21:02
    教你一招:數(shù)的分類
    初等行變換與初等列變換并用求逆矩陣
    標簽化傷害了誰
    矩陣
    南都周刊(2015年4期)2015-09-10 07:22:44
    矩陣
    南都周刊(2015年3期)2015-09-10 07:22:44
    亚洲成人久久爱视频| 街头女战士在线观看网站| 日韩av在线免费看完整版不卡| eeuss影院久久| 舔av片在线| 好男人在线观看高清免费视频| 国产爽快片一区二区三区| 国产伦理片在线播放av一区| 欧美精品人与动牲交sv欧美| 亚洲精品色激情综合| 天天躁日日操中文字幕| 日本黄色片子视频| 在线播放无遮挡| 久久热精品热| a级毛片免费高清观看在线播放| 亚洲av免费高清在线观看| 一级片'在线观看视频| 嫩草影院入口| 中文在线观看免费www的网站| 网址你懂的国产日韩在线| 精品久久久久久久久亚洲| 欧美一区二区亚洲| 成年免费大片在线观看| 人妻制服诱惑在线中文字幕| 少妇人妻 视频| 亚洲欧美日韩卡通动漫| 性色av一级| 亚洲精品一二三| 久久久亚洲精品成人影院| 中文精品一卡2卡3卡4更新| 一区二区三区乱码不卡18| 亚洲久久久久久中文字幕| 久久鲁丝午夜福利片| 国产一区二区三区av在线| 久久久精品欧美日韩精品| 久久久色成人| 久久久久网色| 97超视频在线观看视频| 久久久精品94久久精品| 午夜免费鲁丝| 亚洲欧美中文字幕日韩二区| 美女视频免费永久观看网站| 国产精品蜜桃在线观看| 精品99又大又爽又粗少妇毛片| 麻豆精品久久久久久蜜桃| 香蕉精品网在线| 国产精品麻豆人妻色哟哟久久| 国产成人午夜福利电影在线观看| 黄色日韩在线| 伊人久久精品亚洲午夜| 亚洲精品日本国产第一区| 国产精品久久久久久精品古装| av在线老鸭窝| 熟女av电影| www.av在线官网国产| 成人亚洲精品一区在线观看 | 国产美女午夜福利| 人妻系列 视频| 中文字幕制服av| 97在线人人人人妻| 大又大粗又爽又黄少妇毛片口| 精品久久久久久久人妻蜜臀av| 看黄色毛片网站| 久久久久久久久久久免费av| 身体一侧抽搐| 久久99蜜桃精品久久| 亚洲一级一片aⅴ在线观看| 久久韩国三级中文字幕| 老师上课跳d突然被开到最大视频| 九九在线视频观看精品| 亚洲av福利一区| 精品一区二区三区视频在线| 欧美老熟妇乱子伦牲交| 看非洲黑人一级黄片| 欧美zozozo另类| 午夜精品国产一区二区电影 | 在线观看国产h片| 韩国高清视频一区二区三区| 内射极品少妇av片p| 美女主播在线视频| 欧美激情在线99| 一本久久精品| 亚洲国产精品国产精品| 熟女av电影| 国产精品一区二区性色av| 国产国拍精品亚洲av在线观看| 男人爽女人下面视频在线观看| 精品视频人人做人人爽| 男人舔奶头视频| 成人漫画全彩无遮挡| 美女高潮的动态| 伊人久久精品亚洲午夜| 99久久中文字幕三级久久日本| 最近手机中文字幕大全| 青春草视频在线免费观看| 国产高潮美女av| 欧美少妇被猛烈插入视频| 久久人人爽人人片av| 熟女av电影| 亚洲熟女精品中文字幕| 国产精品久久久久久av不卡| 天堂网av新在线| 久久热精品热| 久久人人爽av亚洲精品天堂 | 大香蕉久久网| 久久久久久伊人网av| 亚洲最大成人手机在线| 在线播放无遮挡| 日本午夜av视频| 深爱激情五月婷婷| 狂野欧美白嫩少妇大欣赏| 国产伦精品一区二区三区四那| 午夜福利网站1000一区二区三区| 18禁裸乳无遮挡动漫免费视频 | 成人免费观看视频高清| 国内精品美女久久久久久| 只有这里有精品99| 国产成人免费观看mmmm| 舔av片在线| 国产片特级美女逼逼视频| 免费黄网站久久成人精品| 国产成人a区在线观看| 国产成人一区二区在线| 国产高清不卡午夜福利| 日韩欧美 国产精品| 97人妻精品一区二区三区麻豆| 国产一区亚洲一区在线观看| 最近的中文字幕免费完整| 中国美白少妇内射xxxbb| 国产一区二区在线观看日韩| 国产亚洲av嫩草精品影院| 99久久精品一区二区三区| 欧美亚洲 丝袜 人妻 在线| 校园人妻丝袜中文字幕| 免费少妇av软件| 神马国产精品三级电影在线观看| 免费看av在线观看网站| 天天一区二区日本电影三级| 亚洲av男天堂| a级毛色黄片| www.av在线官网国产| 一级毛片 在线播放| 下体分泌物呈黄色| 国产毛片a区久久久久| 国产成人免费观看mmmm| 久久99热6这里只有精品| 国产精品.久久久| 18禁裸乳无遮挡动漫免费视频 | 男女下面进入的视频免费午夜| 欧美成人一区二区免费高清观看| 秋霞伦理黄片| 九九久久精品国产亚洲av麻豆| 国产亚洲精品久久久com| 欧美变态另类bdsm刘玥| 日本色播在线视频| 国产片特级美女逼逼视频| 亚洲性久久影院| 精品久久久久久电影网| 国产中年淑女户外野战色| 日本熟妇午夜| 国产精品三级大全| 亚洲图色成人| 日日啪夜夜撸| 一本久久精品| 国产成人freesex在线| 成人国产av品久久久| 你懂的网址亚洲精品在线观看| 国产男女内射视频| 亚洲精品乱码久久久v下载方式| 日本黄大片高清| 嫩草影院精品99| 内地一区二区视频在线| 男人舔奶头视频| 一区二区三区四区激情视频| 成人一区二区视频在线观看| 日韩精品有码人妻一区| 久久久久精品性色| .国产精品久久| 国产成人福利小说| av线在线观看网站| 国产精品偷伦视频观看了| 大片免费播放器 马上看| 联通29元200g的流量卡| 欧美日韩视频精品一区| 日本一二三区视频观看| 日本熟妇午夜| 自拍欧美九色日韩亚洲蝌蚪91 | 亚洲欧美一区二区三区国产| 精品国产一区二区三区久久久樱花 | 欧美+日韩+精品| 国产精品久久久久久精品电影| 亚洲成人久久爱视频| 五月开心婷婷网| 一边亲一边摸免费视频| 久久精品国产鲁丝片午夜精品| 男女啪啪激烈高潮av片| 亚洲综合精品二区| 一个人看视频在线观看www免费| 我的女老师完整版在线观看| 欧美日韩亚洲高清精品| 成年女人看的毛片在线观看| 国产av不卡久久| 五月天丁香电影| 大又大粗又爽又黄少妇毛片口| 午夜福利网站1000一区二区三区| 国产精品三级大全| 99久国产av精品国产电影| 亚洲精品中文字幕在线视频 | 中文精品一卡2卡3卡4更新| 亚洲国产最新在线播放| 久久久色成人| 亚洲精品456在线播放app| 亚洲av中文av极速乱| 国产一区亚洲一区在线观看| 成人无遮挡网站| 熟妇人妻不卡中文字幕| 99久久九九国产精品国产免费| 日韩伦理黄色片| 午夜爱爱视频在线播放| 国产av码专区亚洲av| 中国国产av一级| 国产乱人偷精品视频| 亚洲一区二区三区欧美精品 | 亚洲精品自拍成人| 一区二区三区乱码不卡18| 国产伦理片在线播放av一区| 精品久久国产蜜桃| 九九爱精品视频在线观看| 日韩一本色道免费dvd| 大片免费播放器 马上看| 国产精品国产av在线观看| 男女下面进入的视频免费午夜| 国产黄色视频一区二区在线观看| 免费观看av网站的网址| 日本av手机在线免费观看| 日韩视频在线欧美| 成人国产麻豆网| 少妇人妻精品综合一区二区| 两个人的视频大全免费| 国语对白做爰xxxⅹ性视频网站| 91狼人影院| 777米奇影视久久| 欧美日韩亚洲高清精品| 街头女战士在线观看网站| 好男人在线观看高清免费视频| 国产成人精品福利久久| 视频中文字幕在线观看| 欧美高清成人免费视频www| 一级毛片 在线播放| 一级av片app| av在线蜜桃| 91精品伊人久久大香线蕉| 欧美高清成人免费视频www| 一本色道久久久久久精品综合| 干丝袜人妻中文字幕| 在线看a的网站| 亚洲欧美日韩卡通动漫| 特级一级黄色大片| 噜噜噜噜噜久久久久久91| 最近最新中文字幕大全电影3| 国产 一区精品| 国产人妻一区二区三区在| 国产高清不卡午夜福利| 在线观看免费高清a一片| 另类亚洲欧美激情| 国产成人福利小说| 真实男女啪啪啪动态图| 99热网站在线观看| 亚洲精品中文字幕在线视频 | 国产精品人妻久久久久久| 亚洲精品乱久久久久久| 久久久久久久久久久丰满| 久久99蜜桃精品久久| 国产精品久久久久久精品电影小说 | 中文字幕制服av| 欧美精品人与动牲交sv欧美| 久久久久网色| 国内精品美女久久久久久| av卡一久久| 在线精品无人区一区二区三 | 秋霞在线观看毛片| 日韩欧美 国产精品| 一级毛片我不卡| 九草在线视频观看| 嫩草影院新地址| 午夜免费观看性视频| 免费av毛片视频| 嘟嘟电影网在线观看| 日韩人妻高清精品专区| 在线免费十八禁| 国产av码专区亚洲av| 欧美zozozo另类| av在线亚洲专区| 亚洲国产欧美人成| 久久精品熟女亚洲av麻豆精品| 日韩制服骚丝袜av| 又爽又黄无遮挡网站| 22中文网久久字幕| 91久久精品国产一区二区成人| 熟女av电影| 夫妻午夜视频| 秋霞伦理黄片| 国国产精品蜜臀av免费| 成人欧美大片| 色哟哟·www| 成人美女网站在线观看视频| 亚洲精品乱久久久久久| 真实男女啪啪啪动态图| 18禁裸乳无遮挡动漫免费视频 | 一级a做视频免费观看| 国产综合懂色| 色吧在线观看| 国产 一区 欧美 日韩| 国内揄拍国产精品人妻在线| 又爽又黄无遮挡网站| 久久久午夜欧美精品| 国产精品久久久久久精品电影小说 | 中文天堂在线官网| 色婷婷久久久亚洲欧美| 永久免费av网站大全| 日韩免费高清中文字幕av| 成年版毛片免费区| 在线观看免费高清a一片| 免费看光身美女| 偷拍熟女少妇极品色| 国产成人午夜福利电影在线观看| 亚洲最大成人av| 成人欧美大片| 欧美另类一区| 午夜免费男女啪啪视频观看| av一本久久久久| 欧美潮喷喷水| 久久久精品94久久精品| 久久久欧美国产精品| 亚洲内射少妇av| 国产亚洲av片在线观看秒播厂| 亚洲av成人精品一二三区| 成人亚洲精品av一区二区| 亚洲精品日韩av片在线观看| 欧美 日韩 精品 国产| 国产一区二区三区av在线| 三级国产精品片| 亚洲精品自拍成人| 三级国产精品片| 久久久午夜欧美精品| 欧美xxxx性猛交bbbb| 国产女主播在线喷水免费视频网站| 春色校园在线视频观看| 在线天堂最新版资源| 能在线免费看毛片的网站| 网址你懂的国产日韩在线| 91久久精品国产一区二区成人| 免费大片黄手机在线观看| 校园人妻丝袜中文字幕| 精品酒店卫生间| 国产高清有码在线观看视频| 亚洲国产日韩一区二区| 国产成人a∨麻豆精品| 白带黄色成豆腐渣| 性插视频无遮挡在线免费观看| 国产毛片a区久久久久| 国产av国产精品国产| 九草在线视频观看| 亚洲精品影视一区二区三区av| 国产精品一区二区三区四区免费观看| 久久韩国三级中文字幕| 欧美区成人在线视频| 国语对白做爰xxxⅹ性视频网站| 99精国产麻豆久久婷婷| 亚洲综合精品二区| 麻豆久久精品国产亚洲av| 99久国产av精品国产电影| 亚洲欧美一区二区三区黑人 | 麻豆国产97在线/欧美| 乱码一卡2卡4卡精品| 欧美日韩精品成人综合77777| 日韩欧美精品v在线| 亚洲高清免费不卡视频| 97精品久久久久久久久久精品| 白带黄色成豆腐渣| 国国产精品蜜臀av免费| 亚洲av成人精品一区久久| 成人毛片60女人毛片免费| 亚洲aⅴ乱码一区二区在线播放| 免费人成在线观看视频色| 26uuu在线亚洲综合色| 国产亚洲精品久久久com| av专区在线播放| 久久久午夜欧美精品| 亚洲精品久久午夜乱码| 久久精品熟女亚洲av麻豆精品| 日本wwww免费看| 在线免费十八禁| 亚洲成色77777| 久久久精品94久久精品| 亚洲天堂国产精品一区在线| 国产亚洲5aaaaa淫片| 亚洲最大成人手机在线| 国产成人freesex在线| 有码 亚洲区| 涩涩av久久男人的天堂| 哪个播放器可以免费观看大片| 在线 av 中文字幕| 三级经典国产精品| 中文精品一卡2卡3卡4更新| 成年av动漫网址| 国产黄频视频在线观看| 久久国内精品自在自线图片| 人妻制服诱惑在线中文字幕| 国产视频首页在线观看| 丝袜喷水一区| 最新中文字幕久久久久| 啦啦啦啦在线视频资源| 欧美精品人与动牲交sv欧美| 国产在视频线精品| 亚洲成人av在线免费| 大香蕉97超碰在线| 日韩人妻高清精品专区| 婷婷色av中文字幕| 亚洲欧洲国产日韩| 又黄又爽又刺激的免费视频.| 久久久国产一区二区| 久久久欧美国产精品| 欧美日韩视频高清一区二区三区二| 伊人久久精品亚洲午夜| 嫩草影院入口| 在线看a的网站| 久久久久国产精品人妻一区二区| 欧美日韩在线观看h| 亚洲久久久久久中文字幕| av免费在线看不卡| 联通29元200g的流量卡| 偷拍熟女少妇极品色| 精品酒店卫生间| 亚洲va在线va天堂va国产| 亚洲欧美精品自产自拍| 亚洲欧美一区二区三区国产| 哪个播放器可以免费观看大片| 国产久久久一区二区三区| 免费不卡的大黄色大毛片视频在线观看| 欧美一级a爱片免费观看看| 夫妻午夜视频| 亚洲国产日韩一区二区| 亚洲欧美清纯卡通| 日韩人妻高清精品专区| 久热久热在线精品观看| 国产精品一及| 久热这里只有精品99| 美女xxoo啪啪120秒动态图| 久久精品国产亚洲av涩爱| 大片免费播放器 马上看| 午夜福利在线观看免费完整高清在| 亚洲欧美中文字幕日韩二区| 日韩欧美精品v在线| 欧美成人午夜免费资源| 自拍欧美九色日韩亚洲蝌蚪91 | 搡老乐熟女国产| 人妻制服诱惑在线中文字幕| 美女cb高潮喷水在线观看| 成人毛片a级毛片在线播放| 久久人人爽人人片av| 精品久久久久久久久亚洲| 亚洲精品色激情综合| 国产探花在线观看一区二区| 国产成人福利小说| 亚洲欧美日韩东京热| 一区二区三区乱码不卡18| 国产爱豆传媒在线观看| 欧美 日韩 精品 国产| av免费在线看不卡| 国产午夜精品一二区理论片| 91久久精品国产一区二区成人| 肉色欧美久久久久久久蜜桃 | 欧美bdsm另类| tube8黄色片| 亚洲精品国产成人久久av| 一个人看视频在线观看www免费| 成人无遮挡网站| 成人毛片a级毛片在线播放| 亚洲成人一二三区av| 亚洲综合色惰| 小蜜桃在线观看免费完整版高清| 久久6这里有精品| 国产精品久久久久久久电影| 秋霞在线观看毛片| 日韩制服骚丝袜av| 午夜视频国产福利| 久久韩国三级中文字幕| 国产女主播在线喷水免费视频网站| 日本黄色片子视频| 一级毛片 在线播放| 赤兔流量卡办理| 69av精品久久久久久| 制服丝袜香蕉在线| 成人二区视频| 日韩三级伦理在线观看| 国产午夜精品一二区理论片| 天天躁日日操中文字幕| 中文字幕av成人在线电影| 亚洲国产成人一精品久久久| 国产欧美另类精品又又久久亚洲欧美| 国产毛片在线视频| 久久久久九九精品影院| 国内少妇人妻偷人精品xxx网站| 极品教师在线视频| 自拍欧美九色日韩亚洲蝌蚪91 | 赤兔流量卡办理| 丝袜美腿在线中文| 男的添女的下面高潮视频| 特大巨黑吊av在线直播| 国产av不卡久久| 国产一区二区三区综合在线观看 | 美女被艹到高潮喷水动态| 嫩草影院新地址| 欧美xxⅹ黑人| 免费看日本二区| 国产精品国产三级国产av玫瑰| 国产精品国产av在线观看| 毛片一级片免费看久久久久| 男女啪啪激烈高潮av片| 亚洲av在线观看美女高潮| 久久精品综合一区二区三区| 人人妻人人澡人人爽人人夜夜| av女优亚洲男人天堂| av国产免费在线观看| 国产成人精品一,二区| 午夜亚洲福利在线播放| 日本黄大片高清| 国产v大片淫在线免费观看| av又黄又爽大尺度在线免费看| 高清视频免费观看一区二区| 午夜福利视频1000在线观看| 日韩欧美精品v在线| 亚洲av成人精品一区久久| 校园人妻丝袜中文字幕| 我的老师免费观看完整版| 美女视频免费永久观看网站| 一级片'在线观看视频| 人妻制服诱惑在线中文字幕| 午夜爱爱视频在线播放| 亚洲美女视频黄频| 国产成人午夜福利电影在线观看| 性色avwww在线观看| 亚洲精品久久久久久婷婷小说| av在线app专区| 搡老乐熟女国产| 九九在线视频观看精品| 欧美3d第一页| 国产精品人妻久久久影院| 内射极品少妇av片p| 国产精品嫩草影院av在线观看| 日本色播在线视频| 可以在线观看毛片的网站| 亚洲国产精品成人综合色| 22中文网久久字幕| 亚洲av在线观看美女高潮| 中国国产av一级| 免费观看av网站的网址| 欧美成人精品欧美一级黄| 亚洲内射少妇av| 亚洲av二区三区四区| 97精品久久久久久久久久精品| 美女国产视频在线观看| 日日摸夜夜添夜夜添av毛片| 国产亚洲av嫩草精品影院| 免费观看a级毛片全部| 国产探花在线观看一区二区| 青春草亚洲视频在线观看| 亚洲欧美日韩东京热| 一本久久精品| 哪个播放器可以免费观看大片| 国产成人a区在线观看| 亚洲精品国产色婷婷电影| 日韩,欧美,国产一区二区三区| 最近手机中文字幕大全| 亚洲精品成人久久久久久| 美女被艹到高潮喷水动态| 王馨瑶露胸无遮挡在线观看| 亚洲精品,欧美精品| 亚洲在线观看片| 亚洲aⅴ乱码一区二区在线播放| 男女啪啪激烈高潮av片| 国产 一区 欧美 日韩| 久久精品久久精品一区二区三区| 纵有疾风起免费观看全集完整版| 别揉我奶头 嗯啊视频| 欧美性猛交╳xxx乱大交人| 免费观看av网站的网址| 亚洲精品国产av蜜桃| 91久久精品国产一区二区三区| 欧美日韩综合久久久久久| 免费看日本二区| 国产一区二区亚洲精品在线观看| 人体艺术视频欧美日本| 国产精品久久久久久久久免| 欧美少妇被猛烈插入视频| 国产精品久久久久久久电影| 亚洲av不卡在线观看| 亚洲最大成人av| 大话2 男鬼变身卡| 亚洲精品国产av蜜桃| 青春草亚洲视频在线观看| 麻豆久久精品国产亚洲av| 99久久人妻综合| 亚洲av一区综合| 成人毛片a级毛片在线播放| 中文字幕人妻熟人妻熟丝袜美| 日本av手机在线免费观看| 男女边摸边吃奶| 真实男女啪啪啪动态图| 卡戴珊不雅视频在线播放| 亚洲真实伦在线观看| 国产一区有黄有色的免费视频| 丝袜美腿在线中文| 国产精品偷伦视频观看了|