• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于MapReduce編程模型的改進(jìn)KNN分類算法研究

    2017-03-30 08:11:34邱寧佳郭暢楊華民王鵬溫暖
    關(guān)鍵詞:約簡(jiǎn)訓(xùn)練樣本分類

    邱寧佳,郭暢,楊華民,王鵬,溫暖

    (長(zhǎng)春理工大學(xué)計(jì)算機(jī)科學(xué)技術(shù)學(xué)院,長(zhǎng)春 130022)

    基于MapReduce編程模型的改進(jìn)KNN分類算法研究

    邱寧佳,郭暢,楊華民,王鵬,溫暖

    (長(zhǎng)春理工大學(xué)計(jì)算機(jī)科學(xué)技術(shù)學(xué)院,長(zhǎng)春 130022)

    采用一種屬性約簡(jiǎn)算法,將待分類的數(shù)據(jù)樣本進(jìn)行兩次約簡(jiǎn)處理--初次決策表屬性約簡(jiǎn)和基于核屬性值的二次約簡(jiǎn)。通過(guò)屬性約簡(jiǎn)方法來(lái)刪除數(shù)據(jù)集中的冗余數(shù)據(jù),進(jìn)而提高KNN算法的分類精度。在此基礎(chǔ)上應(yīng)用MapReduce并行編程模型,在Hadoop集群環(huán)境上實(shí)現(xiàn)并行化分類計(jì)算實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,改進(jìn)后的算法在集群環(huán)境下執(zhí)行的效率得到很大提升,能夠高效處理實(shí)驗(yàn)數(shù)據(jù)。實(shí)驗(yàn)執(zhí)行的加速比也有明顯提高。

    KNN;屬性約簡(jiǎn);MapReduce編程模型;Hadoop

    隨著信息技術(shù)以及“互聯(lián)網(wǎng)+”的快速發(fā)展,數(shù)據(jù)在大容量、多樣性和高增速方面爆炸式增長(zhǎng),給數(shù)據(jù)的處理和分析帶來(lái)了巨大挑戰(zhàn)[1]。數(shù)據(jù)的分類處理就變得尤為重要,在經(jīng)典分類算法中KNN分類算法操作比較簡(jiǎn)單,在諸多領(lǐng)域都有很廣泛的應(yīng)用。不過(guò)KNN作為一種惰性算法在處理大容量數(shù)據(jù)集時(shí),由于數(shù)據(jù)的屬性較多,會(huì)影響KNN算法的分類效率和分類精度,因此對(duì)KNN分類算法進(jìn)行改進(jìn)是很有必要的。

    國(guó)內(nèi)外的學(xué)者們對(duì)KNN算法已經(jīng)有了一些研究,閆永剛等人提出了將KNN分類算法通過(guò)MapReduce編程模型實(shí)現(xiàn)并行化[2];Papadimitriou等人提出了一重新的聚類分析算法DisCo[3],且這種新算法應(yīng)用在分布式平臺(tái)上進(jìn)行并行化實(shí)驗(yàn)研究;鮑新中等人應(yīng)用了粗糙集權(quán)重確定方法來(lái)解決粗糙集信息上的權(quán)重確定問(wèn)題[4];汪凌等人應(yīng)用了一種基于相對(duì)可辨識(shí)矩陣的決策表屬性約簡(jiǎn)算法[5]來(lái)解決KNN算法中的數(shù)據(jù)冗余問(wèn)題;張著英等人在研究KNN分類算法時(shí)將粗糙集理論應(yīng)用到KNN算法中從而實(shí)現(xiàn)屬性約簡(jiǎn)[6];樊存佳等人提出了一種基于文本分類的新型改進(jìn)KNN分類算法[7],同時(shí)采用聚類算法裁剪對(duì)KNN分類貢獻(xiàn)小的訓(xùn)練樣本,從而減少數(shù)據(jù)冗余;Zhu等人提出了一種基于哈希表的高效分類算法H-c2KNN[8],應(yīng)用在高維數(shù)據(jù)下的KNN分類算法中;Wang等人提出了一種基于內(nèi)核改進(jìn)的屬性約簡(jiǎn)KNN分類算法[9];吳強(qiáng)提出了一種基于概念格的屬性約簡(jiǎn)方法[10],將粗糙集理論的可辨識(shí)矩陣方法應(yīng)用于概念格的約簡(jiǎn),從而提高效率簡(jiǎn)化;魯偉明等人提出了一種基于近鄰傳播的改進(jìn)聚類算法-DisAP[11],并將其應(yīng)用在MapReduce編程框架中;王煜將KNN文本分類算法進(jìn)行了基于決策樹算法的改進(jìn)并進(jìn)行并行化研究[12];梁鮮等人提出了一種全局K-均值算法[13],解決了全局K-均值算法時(shí)間復(fù)雜度大的問(wèn)題;王鵬等人提出了在MapReduce模型基礎(chǔ)上的K-均值聚類算法的實(shí)現(xiàn)問(wèn)題[14]。本文在上述研究的基礎(chǔ)上,對(duì)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行基于決策表和核屬性值的兩次屬性約簡(jiǎn)改造并結(jié)合MapReduce編程框架進(jìn)行KNN分類算法的并行化實(shí)現(xiàn)。

    1 相關(guān)知識(shí)

    1.1 KNN分類算法的基本原理

    K最近鄰(K Nearest Neighbors,KNN)算法是一種基于實(shí)例的學(xué)習(xí)方法。其基本原理如下:通過(guò)將給定的檢驗(yàn)樣本與和它相似的訓(xùn)練樣本進(jìn)行比較來(lái)分析結(jié)果,此為學(xué)習(xí)。訓(xùn)練樣本通常用屬性來(lái)描述,一個(gè)訓(xùn)練樣本包含多個(gè)屬性,每個(gè)屬性則代表n維空間的一個(gè)點(diǎn)。當(dāng)輸入新的訓(xùn)練樣本時(shí),KNN算法即開始進(jìn)行遍歷搜索,得到與新樣本最近鄰的k個(gè)訓(xùn)練樣本,其示例如圖1所示。

    圖1 KNN分類示例

    可以看出,給定的訓(xùn)練樣本共有三種:正方形、圓形和五邊形。每給定一個(gè)新的檢驗(yàn)樣本,就需要計(jì)算與其最近的K個(gè)訓(xùn)練樣本,計(jì)算的方法通常采用歐式距離計(jì)算,再由計(jì)算出的K個(gè)訓(xùn)練樣本的分類情況來(lái)確定新樣本的分類情況。由上圖中心圓所選出的即為離待分類樣本最近的六個(gè)訓(xùn)練樣本,這六個(gè)樣本中有四個(gè)為五邊形,按照分類號(hào)進(jìn)行“投票”,則可以將該訓(xùn)練樣本分類為五邊形。

    1.2 MapReduce框架

    MapReduce是一種面向大數(shù)據(jù)并行處理的計(jì)算模式,它是基于集群的高性能并行計(jì)算平臺(tái),也是并行計(jì)算與運(yùn)行軟件的框架,同時(shí)也是一個(gè)并行程序設(shè)計(jì)的模型。MapReduce框架程序主要由Map函數(shù)和Reduce函數(shù)組成,首先由Map函數(shù)負(fù)責(zé)對(duì)數(shù)據(jù)進(jìn)行分布計(jì)算,即將輸入的數(shù)據(jù)集切分為若干獨(dú)立的數(shù)據(jù)塊,各個(gè)Mapper節(jié)點(diǎn)在工作時(shí)不能夠?qū)崟r(shí)的交互,框架會(huì)將Map輸出的數(shù)據(jù)塊進(jìn)行排序;然后將輸入結(jié)果發(fā)送給Reduce函數(shù),Reduce函數(shù)負(fù)責(zé)對(duì)中間結(jié)果進(jìn)行處理,以得到最終結(jié)果并進(jìn)行結(jié)果輸出,圖2為MapReduce程序執(zhí)行示意圖。

    圖2 MapReduce程序執(zhí)行示意圖

    1.3 屬性約簡(jiǎn)方法

    屬性約簡(jiǎn)即通過(guò)刪除不相關(guān)屬性或者降低屬性維度從而減少數(shù)據(jù)冗余,提高數(shù)據(jù)處理的效率,節(jié)約數(shù)據(jù)計(jì)算成本。屬性約簡(jiǎn)是計(jì)算最小屬性子集的過(guò)程,在此過(guò)程中還要保證其數(shù)據(jù)的分布概率基本保持不變或有較少改動(dòng)。常見的屬性約簡(jiǎn)方法有逐步向前選擇法、合并屬性法、決策樹歸納和主成分分析等方法。主成分分析是一種用于連續(xù)屬性的數(shù)據(jù)降維方法,構(gòu)造了原始數(shù)據(jù)的一個(gè)正交變換,新空間的基底去除了原始空間基底下數(shù)據(jù)的相關(guān)性,這樣較少的新變量能夠刻畫出原始數(shù)據(jù)的絕大部分變異情況。在應(yīng)用中,通常是選出比原始變量個(gè)數(shù)少,能解釋大部分?jǐn)?shù)據(jù)中的幾個(gè)新變量,即主成分來(lái)代替原始變量進(jìn)行建模。

    其計(jì)算步驟如下:

    設(shè)原始變量X1,X2,…,XP的n次觀測(cè)數(shù)據(jù)矩陣為:

    對(duì)觀測(cè)的數(shù)據(jù)矩陣進(jìn)行中心標(biāo)準(zhǔn)化,并將標(biāo)準(zhǔn)化后的數(shù)據(jù)矩陣仍然記為X。

    求相關(guān)系數(shù)矩陣R,R=(rij)p×p,rij的定義為:

    求R的特征方程det(R-λE)=0的特征根λ1≥λ2≥λp>0;

    計(jì)算m個(gè)相應(yīng)的單位特征向量:

    計(jì)算主成分:

    Zi=β1iX1+β2iX2+…+βpiXp,i=1,2,…,m

    再使用主成分分析降維的方法,可以得到特征方程的特征根,對(duì)應(yīng)的特征向量以及各個(gè)成分各自的方差百分比(即貢獻(xiàn)率),貢獻(xiàn)率百分比越大,向量權(quán)重越大。通過(guò)此種方法可以在完成屬性歸約的同時(shí)保存與原始數(shù)據(jù)相配的數(shù)據(jù)信息。

    2 改進(jìn)KNN算法

    2.1 基于屬性約簡(jiǎn)的KNN分類算法

    改進(jìn)后的KNN分類算法即在進(jìn)行KNN分類算法的基礎(chǔ)上利用屬性約簡(jiǎn)的相關(guān)知識(shí),將算法進(jìn)行先基于決策表再基于核屬性值的兩次屬性約簡(jiǎn),將冗余的數(shù)據(jù)進(jìn)行約簡(jiǎn),在不影響結(jié)果的情況下,提高分類的效率,下面給出改進(jìn)后算法的形式化描述:

    輸出:樣本數(shù)據(jù)的類別。

    算法步驟:

    (1)對(duì)輸入的訓(xùn)練數(shù)據(jù)進(jìn)行初次屬性約簡(jiǎn),并計(jì)算出核屬性值;

    (2)根據(jù)樣本屬性進(jìn)行基于核屬性的二次屬性約簡(jiǎn),通過(guò)信息熵理論,計(jì)算核屬性的重要度w(p),若w(p)=0,則認(rèn)為該屬性為冗余屬性,從核屬性中移除該屬性,得到二次約簡(jiǎn)屬性集[4];

    (3)利用分布式處理平臺(tái)對(duì)樣本數(shù)據(jù)進(jìn)行分塊處理,對(duì)每一塊樣本數(shù)據(jù)分別計(jì)算其與訓(xùn)練數(shù)據(jù)屬性之間的距離d(X,Xi),此處的距離采用歐式距離進(jìn)行計(jì)算;

    (4)對(duì)計(jì)算出的距離d(X,Xi)進(jìn)行從小到大的排序,選取排在前K個(gè)訓(xùn)練數(shù)據(jù);

    (5)統(tǒng)計(jì)前K個(gè)訓(xùn)練數(shù)據(jù)的類別,將個(gè)數(shù)最多的類別預(yù)測(cè)為當(dāng)前樣本的類別,進(jìn)行結(jié)果分析。

    2.2 改進(jìn)后的KNN算法的MapReduce并行化

    將改進(jìn)后的KNN算法進(jìn)行MapReduce并行化,主要分為三個(gè)階段來(lái)實(shí)現(xiàn)。

    (1)下載文件系統(tǒng)中的訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集到本地存儲(chǔ)節(jié)點(diǎn)。

    (2)Map函數(shù)將測(cè)試樣本數(shù)據(jù)分塊,計(jì)算出測(cè)試數(shù)據(jù)到訓(xùn)練數(shù)據(jù)的歐式距離,進(jìn)行排序。

    (3)將排序結(jié)果傳送給Reduce函數(shù),Reduce函數(shù)將執(zhí)行KNN分類算法進(jìn)行規(guī)約操作并計(jì)算出分類結(jié)果。因?yàn)镸ap階段的關(guān)鍵為對(duì)應(yīng)待分類樣本在文件中的偏移值,其在Map階段完成時(shí)會(huì)被MapReduce框架自動(dòng)排序,所以Reduce階段輸出的分類號(hào)就對(duì)應(yīng)了待分類樣本在原文件中的順序。本文中的Map函數(shù)和Reduce函數(shù)的算法步驟如下所示:

    表1 Map函數(shù)的算法步驟

    表2 Reduce函數(shù)的算法步驟

    經(jīng)過(guò)上述改進(jìn)后,得出了一個(gè)基于屬性約簡(jiǎn)的改進(jìn)KNN算法,并對(duì)其進(jìn)行MapReduce編程模型的搭建。

    3 實(shí)驗(yàn)分析

    3.1 實(shí)驗(yàn)環(huán)境及數(shù)據(jù)

    實(shí)驗(yàn)運(yùn)行所需的云平臺(tái)由實(shí)驗(yàn)室4臺(tái)電腦組成,每臺(tái)電腦裝有3臺(tái)虛擬機(jī),共12個(gè)節(jié)點(diǎn)。Hadoop分布式云計(jì)算集群采用Centos6.0操作系統(tǒng)、hadoop-1.1.2版本的Hadoop。其中一個(gè)作為Master節(jié)點(diǎn),其余作為Slave節(jié)點(diǎn)。本次實(shí)驗(yàn)采用7個(gè)數(shù)據(jù)節(jié)點(diǎn)來(lái)進(jìn)行實(shí)驗(yàn)。

    實(shí)驗(yàn)數(shù)據(jù)采用標(biāo)準(zhǔn)數(shù)據(jù)集CoverType DataS-et,該數(shù)據(jù)具有54個(gè)屬性變量,58萬(wàn)個(gè)樣本,7個(gè)類別。本文將數(shù)據(jù)分為測(cè)試數(shù)據(jù)(data1)和訓(xùn)練數(shù)據(jù)(data2)兩部分,其中測(cè)試數(shù)據(jù)共20萬(wàn)個(gè)樣本,大小約為500MB,訓(xùn)練數(shù)據(jù)共38萬(wàn)個(gè)樣本,大小約為1000MB。

    3.2 實(shí)驗(yàn)過(guò)程及分析

    本實(shí)驗(yàn)的主要內(nèi)容分為兩部分:

    (1)分析KNN算法在數(shù)據(jù)規(guī)模相同而在數(shù)據(jù)節(jié)點(diǎn)數(shù)目不同的情況下,數(shù)據(jù)執(zhí)行時(shí)間的對(duì)比情況。首先對(duì)給定的訓(xùn)練樣本進(jìn)行初次屬性約簡(jiǎn)和二次基于核屬性值的約簡(jiǎn),以達(dá)到刪除冗余數(shù)據(jù)的效果,然后在Hadoop分布式平臺(tái)上進(jìn)行基于MapReduce的并行化實(shí)驗(yàn),依次導(dǎo)入訓(xùn)練樣本和測(cè)試樣本,實(shí)驗(yàn)數(shù)據(jù)節(jié)點(diǎn)數(shù)目依次從1個(gè)添加到7個(gè),通過(guò)增加節(jié)點(diǎn)數(shù)目來(lái)對(duì)實(shí)驗(yàn)執(zhí)行時(shí)間進(jìn)行比較,得出相應(yīng)結(jié)論;

    (2)研究數(shù)據(jù)在執(zhí)行分類算法的過(guò)程中,不同數(shù)據(jù)節(jié)點(diǎn)數(shù)目所對(duì)應(yīng)的加速比情況。此部分實(shí)驗(yàn)是由實(shí)驗(yàn)(1)的實(shí)驗(yàn)結(jié)果分析而得出的,不用數(shù)據(jù)節(jié)點(diǎn)數(shù)目條件下對(duì)應(yīng)的實(shí)驗(yàn)結(jié)果加速比理論上應(yīng)該是不同的,所以通過(guò)實(shí)驗(yàn)來(lái)做真實(shí)的數(shù)據(jù)分析,得出具體的變化曲線。

    實(shí)驗(yàn)結(jié)果分別如圖3、4所示:

    圖3 數(shù)據(jù)集的時(shí)間對(duì)比圖

    圖3可以看出,兩組數(shù)據(jù)集分別為改進(jìn)前和改進(jìn)后的測(cè)試數(shù)據(jù)和訓(xùn)練數(shù)據(jù),由實(shí)驗(yàn)可以驗(yàn)證每組數(shù)據(jù)在進(jìn)行屬性約簡(jiǎn)改進(jìn)后都其運(yùn)行的時(shí)間都比沒(méi)有改進(jìn)前有明顯減少,訓(xùn)練數(shù)據(jù)約簡(jiǎn)后執(zhí)行時(shí)間平均縮短了2.28min,測(cè)試數(shù)據(jù)的執(zhí)行時(shí)間平均縮減了1.71min,且數(shù)據(jù)量大的訓(xùn)練數(shù)據(jù)時(shí)間減少的更為明顯,通過(guò)對(duì)數(shù)據(jù)進(jìn)行屬性約簡(jiǎn)后其運(yùn)行的效率明顯提高,改進(jìn)的KNN算法在分布式平臺(tái)上能夠高效運(yùn)行,對(duì)于單個(gè)數(shù)據(jù)集而言隨著節(jié)點(diǎn)數(shù)增加數(shù)據(jù)在平臺(tái)上運(yùn)行的時(shí)間相應(yīng)減少,訓(xùn)練數(shù)據(jù)在7個(gè)數(shù)據(jù)節(jié)點(diǎn)條件下執(zhí)行的時(shí)間是單機(jī)條件的58.3%,測(cè)試數(shù)據(jù)僅僅為40%。測(cè)試結(jié)果說(shuō)明改進(jìn)后的KNN算法能滿足實(shí)際并行分布式環(huán)境下大數(shù)據(jù)處理的需求。由此可以看出將算法改造后,能夠很好的提高處理數(shù)據(jù)效率,進(jìn)而降低對(duì)大數(shù)據(jù)的分類工作復(fù)雜度。

    圖4 加速比對(duì)比圖

    圖4看出,兩組數(shù)據(jù)的實(shí)驗(yàn)運(yùn)行加速比曲線都是成正相關(guān)的,即隨著數(shù)據(jù)節(jié)點(diǎn)個(gè)數(shù)的增加實(shí)驗(yàn)運(yùn)行加速比有明顯提高,可以看出分布式平臺(tái)在處理KNN分類算法上有很好的計(jì)算能力,可以看出,當(dāng)數(shù)據(jù)量不夠大時(shí),使用分布式平臺(tái)執(zhí)行任務(wù)沒(méi)有單機(jī)環(huán)境下執(zhí)行效率高,當(dāng)數(shù)據(jù)規(guī)模足夠大時(shí),并且每一個(gè)數(shù)據(jù)分片都在進(jìn)行處理工作時(shí),集群的效率最高,訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)這兩組數(shù)據(jù)的加速比分別提高了140%和100%。實(shí)驗(yàn)通過(guò)對(duì)兩組數(shù)據(jù)的運(yùn)行加速比進(jìn)行研究分析,表明分布式計(jì)算在集群環(huán)境下運(yùn)行效率最高。

    4 結(jié)論

    本文在研究過(guò)程中主要實(shí)現(xiàn)了如下內(nèi)容:對(duì)KNN分類算法的研究與分析,提出了基于決策表和核屬性值的兩次屬性約簡(jiǎn)的改造,對(duì)改造后的KNN算法進(jìn)行MapReduce并行化研究實(shí)驗(yàn)。通過(guò)研究過(guò)程及實(shí)驗(yàn)分析得出了如下結(jié)論:

    (1)實(shí)驗(yàn)通過(guò)對(duì)數(shù)據(jù)進(jìn)行兩次屬性約簡(jiǎn),大大減少了數(shù)據(jù)冗余,提高了實(shí)驗(yàn)的運(yùn)行效率;

    (2)對(duì)改造后的算法使用MapReduce編程模型進(jìn)行實(shí)驗(yàn)設(shè)計(jì),并在Hadoop平臺(tái)上進(jìn)行并行化實(shí)驗(yàn)分析;

    (3)實(shí)驗(yàn)表明在大數(shù)據(jù)環(huán)境下,屬性約簡(jiǎn)后的數(shù)據(jù)在集群環(huán)境下執(zhí)行算法提高了KNN算法的加速比和可擴(kuò)展性,算法效率也隨著集群規(guī)模的擴(kuò)大而變高。

    實(shí)驗(yàn)證實(shí)了通過(guò)對(duì)現(xiàn)有經(jīng)典KNN算法的改進(jìn)可以大大提高其執(zhí)行效率,減少工作量,在下一步的研究過(guò)程中還將對(duì)數(shù)據(jù)量進(jìn)行擴(kuò)大,研究對(duì)比數(shù)據(jù)量變大時(shí)算法的執(zhí)行效率是否會(huì)有所影響,以及再次改良后算法的執(zhí)行情況。

    [1]王元卓,靳小龍,程學(xué)旗.網(wǎng)絡(luò)大數(shù)據(jù):現(xiàn)狀與展望[J].計(jì)算機(jī)學(xué)報(bào),2013,36(6):1125-1138.

    [2]閆永剛,馬廷淮,王建.KNN分類算法的MapReduce并行化實(shí)現(xiàn)[J].南京航空航天大學(xué)學(xué)報(bào),2013,45(4):

    [3]Papadimitriou S,Sun J.DisCo:Distributed Co-clustering with Map-Reduce[C].Data Mining,IEEE International Conference on.IEEE,2015:512-521.

    [4]鮑新中,張建斌,劉澄.基于粗糙集條件信息熵的權(quán)重確定方法[J].中國(guó)管理科學(xué),2009,17(3):131-135.

    [5]汪凌,吳潔,黃丹.基于相對(duì)可辨識(shí)矩陣的決策表屬性約簡(jiǎn)算法[J].計(jì)算機(jī)工程與設(shè)計(jì),2010,31(11):2536-2538.

    [6]張著英,黃玉龍,王翰虎.一個(gè)高效的KNN分類算法[J].計(jì)算機(jī)科學(xué),2008,35(3):170-172.

    [7]樊存佳,汪友生,邊航.一種改進(jìn)的KNN文本分類算法[J].國(guó)外電子測(cè)量技術(shù),2015(12):39-43.

    [8]Zhu P,Zhan X,Qiu W.Efficient k-Nearest neighborssearchinhighdimensionsusingMapReduce[C].Fifth International Conference on Big Data and Cloud Computing.IEEE,2015:23-30.

    [9]Xueli W,Zhiyong J,Dahai Y.An improved KNN algorithm based on kernel methods and attribute reduction[C].Fifth International Conference on Instrumentation and Measurement,Computer,Communication and Control.IEEE,2015.

    [10]吳強(qiáng).采用粗糙集中可辨識(shí)矩陣方法的概念格屬性約簡(jiǎn)[J].計(jì)算機(jī)工程,2004,30(20):141-142.

    [11]魯偉明,杜晨陽(yáng),魏寶剛,等.基于MapReduce的分布式近鄰傳播聚類算法[J].計(jì)算機(jī)研究與發(fā)展,2012,49(8):1762-1772.

    [12]王煜.基于決策樹和K最近鄰算法的文本分類研究[D].天津:天津大學(xué),2006.

    [13]梁鮮,曲福恒,楊勇,等.一種高效的全局K-均值算法[J].長(zhǎng)春理工大學(xué)學(xué)報(bào):自然科學(xué)版,2015,38(3):112-115.

    [14]王鵬,王睿婕.K-均值聚類算法的MapReduce模型實(shí)現(xiàn)[J].長(zhǎng)春理工大學(xué)學(xué)報(bào):自然科學(xué)版,2015,38(3):120-123. wirless channels[C].Rhodes:Vrhicular Technology Conference,2001:680-692.

    The Research of Modified KNN Classification Algorithm Based on MapReduce Model

    QIU Ningjia,GUO Chang,YANG Huamin,WANG Peng,WEN Nuan
    (School of Computer Science and Technology,Changchun University of Science and Technology,Changchun 130022)

    An attribute reduction algorithm is proposed.The algorithm will be classified data samples for the two reduction processing--attribute reduction of the initial decision table and second reduction based on kernel attribute value. The method of attribute reduction is to delete the redundant data,and then to improve the classification accuracy of KNN algorithm.On the basis of the application of the MapReduce parallel programming model,the parallel computing experiments are implemented in the Hadoop cluster environment.The experimental results show that the efficiency of the improved algorithm in the cluster environment has been greatly improved,which can effectively deal with the experimental data.Experimental implementation of the speedup is also significantly improved.

    KNN;attribute reduction;MapReduce programming model;hadoop

    TP391

    A

    1672-9870(2017)01-0110-05

    2016-08-01

    吉林省科技發(fā)展計(jì)劃重點(diǎn)科技攻關(guān)項(xiàng)目(20150204036GX)

    邱寧佳(1984-),男,博士后,講師,E-mail:269212811@qq.com

    猜你喜歡
    約簡(jiǎn)訓(xùn)練樣本分類
    分類算一算
    人工智能
    基于二進(jìn)制鏈表的粗糙集屬性約簡(jiǎn)
    分類討論求坐標(biāo)
    數(shù)據(jù)分析中的分類討論
    實(shí)值多變量維數(shù)約簡(jiǎn):綜述
    教你一招:數(shù)的分類
    基于模糊貼近度的屬性約簡(jiǎn)
    寬帶光譜成像系統(tǒng)最優(yōu)訓(xùn)練樣本選擇方法研究
    融合原始樣本和虛擬樣本的人臉識(shí)別算法
    自线自在国产av| 日韩精品有码人妻一区| 亚洲国产精品一区三区| 欧美xxxx性猛交bbbb| 国产精品麻豆人妻色哟哟久久| 亚洲av在线观看美女高潮| 午夜免费观看性视频| 一级毛片黄色毛片免费观看视频| 伊人亚洲综合成人网| 最近最新中文字幕免费大全7| 伦理电影免费视频| 国产 精品1| 黄色欧美视频在线观看| 99精国产麻豆久久婷婷| 成人国产av品久久久| 久久久久久久精品精品| 麻豆精品久久久久久蜜桃| 黄色欧美视频在线观看| 三级国产精品欧美在线观看| 中文精品一卡2卡3卡4更新| 国精品久久久久久国模美| 国产亚洲一区二区精品| 国产探花极品一区二区| 婷婷色综合大香蕉| 嫩草影院新地址| 天堂俺去俺来也www色官网| 两个人免费观看高清视频 | 免费久久久久久久精品成人欧美视频 | 久久久久久久久久成人| 黄片无遮挡物在线观看| 91在线精品国自产拍蜜月| 热re99久久精品国产66热6| 午夜免费男女啪啪视频观看| 人妻夜夜爽99麻豆av| 一本—道久久a久久精品蜜桃钙片| 日日爽夜夜爽网站| 国产深夜福利视频在线观看| 一级毛片黄色毛片免费观看视频| 久久久久久久久大av| 久久 成人 亚洲| 国产精品久久久久久久久免| 少妇高潮的动态图| 亚洲av男天堂| 夜夜骑夜夜射夜夜干| 极品少妇高潮喷水抽搐| 制服丝袜香蕉在线| 一级片'在线观看视频| 亚洲欧美清纯卡通| 精品视频人人做人人爽| 亚洲精品久久久久久婷婷小说| 大片电影免费在线观看免费| 乱系列少妇在线播放| 在线观看免费视频网站a站| 在线看a的网站| 又粗又硬又长又爽又黄的视频| 欧美日韩国产mv在线观看视频| 久热久热在线精品观看| 五月开心婷婷网| 国产精品无大码| 美女xxoo啪啪120秒动态图| 免费在线观看成人毛片| 国产精品99久久久久久久久| 亚洲天堂av无毛| 久久久久久久精品精品| 亚洲精品456在线播放app| 十八禁网站网址无遮挡 | 欧美日韩亚洲高清精品| 老司机影院毛片| 精品久久久久久电影网| 在线观看av片永久免费下载| 国产亚洲最大av| 在线免费观看不下载黄p国产| 大又大粗又爽又黄少妇毛片口| 99视频精品全部免费 在线| 亚洲欧洲国产日韩| 丰满少妇做爰视频| 成年女人在线观看亚洲视频| 永久网站在线| 久久久久人妻精品一区果冻| 中文字幕制服av| 国产在线免费精品| 97超视频在线观看视频| 久久久久精品性色| 国产成人一区二区在线| 菩萨蛮人人尽说江南好唐韦庄| 免费观看无遮挡的男女| 观看免费一级毛片| 天天操日日干夜夜撸| 久久久国产一区二区| 曰老女人黄片| 色5月婷婷丁香| 国产一区二区三区av在线| 色视频在线一区二区三区| 欧美 日韩 精品 国产| 九草在线视频观看| 亚洲一级一片aⅴ在线观看| 中文字幕精品免费在线观看视频 | 麻豆乱淫一区二区| 一个人看视频在线观看www免费| 男人舔奶头视频| 亚洲国产精品一区三区| 特大巨黑吊av在线直播| 国产有黄有色有爽视频| 日韩三级伦理在线观看| 简卡轻食公司| 在线精品无人区一区二区三| 久久精品久久久久久噜噜老黄| 久久综合国产亚洲精品| 精品亚洲乱码少妇综合久久| 亚洲欧美一区二区三区黑人 | 国产在线一区二区三区精| 插逼视频在线观看| 一边亲一边摸免费视频| 少妇人妻精品综合一区二区| 国产成人freesex在线| 亚洲欧美成人综合另类久久久| 久久综合国产亚洲精品| 性色av一级| 欧美日本中文国产一区发布| 日韩制服骚丝袜av| 高清欧美精品videossex| 亚洲av成人精品一区久久| 欧美三级亚洲精品| 国产高清国产精品国产三级| 国产中年淑女户外野战色| 人妻一区二区av| 亚洲天堂av无毛| 六月丁香七月| 在线观看一区二区三区激情| 免费人妻精品一区二区三区视频| 日韩中文字幕视频在线看片| 国产美女午夜福利| 内射极品少妇av片p| av免费观看日本| 好男人视频免费观看在线| 午夜影院在线不卡| 黄片无遮挡物在线观看| 欧美 亚洲 国产 日韩一| 亚洲丝袜综合中文字幕| 日韩人妻高清精品专区| 视频中文字幕在线观看| 观看免费一级毛片| 国产精品无大码| 亚洲婷婷狠狠爱综合网| 蜜桃在线观看..| 五月伊人婷婷丁香| 在线观看免费高清a一片| 在线观看人妻少妇| 国产精品偷伦视频观看了| 久久韩国三级中文字幕| 久热这里只有精品99| 日韩一本色道免费dvd| 久久人人爽av亚洲精品天堂| 欧美精品高潮呻吟av久久| 精品人妻偷拍中文字幕| 久久韩国三级中文字幕| 国产成人午夜福利电影在线观看| 久久热精品热| 91精品伊人久久大香线蕉| tube8黄色片| 制服丝袜香蕉在线| 青春草亚洲视频在线观看| 欧美日韩亚洲高清精品| 久久免费观看电影| 亚洲成人手机| 97超碰精品成人国产| 亚洲美女视频黄频| 在线免费观看不下载黄p国产| 亚洲精品一区蜜桃| 亚洲av国产av综合av卡| 久久99热这里只频精品6学生| 亚洲va在线va天堂va国产| 在线观看免费视频网站a站| 成人黄色视频免费在线看| 一区二区三区免费毛片| 国产伦理片在线播放av一区| 大码成人一级视频| 美女视频免费永久观看网站| 黑丝袜美女国产一区| 成人国产av品久久久| 麻豆精品久久久久久蜜桃| h日本视频在线播放| 免费久久久久久久精品成人欧美视频 | 91精品一卡2卡3卡4卡| 少妇被粗大猛烈的视频| 下体分泌物呈黄色| 国产在线免费精品| 在线观看国产h片| 晚上一个人看的免费电影| 国产精品久久久久久久电影| 日韩成人av中文字幕在线观看| 插阴视频在线观看视频| 久久久久久久久久成人| 自拍欧美九色日韩亚洲蝌蚪91 | 永久免费av网站大全| 黄色怎么调成土黄色| 一个人免费看片子| 免费人妻精品一区二区三区视频| 一级毛片电影观看| 亚洲图色成人| 亚洲美女黄色视频免费看| 97在线视频观看| 另类精品久久| 欧美精品一区二区大全| 美女福利国产在线| 国产伦精品一区二区三区四那| 亚洲欧美一区二区三区黑人 | 五月开心婷婷网| 国产一区亚洲一区在线观看| 久久精品久久久久久久性| 波野结衣二区三区在线| 丰满迷人的少妇在线观看| 久久精品国产亚洲av天美| 两个人的视频大全免费| 卡戴珊不雅视频在线播放| 精品视频人人做人人爽| 十分钟在线观看高清视频www | 人妻 亚洲 视频| 亚洲精品日韩在线中文字幕| 亚洲精品日本国产第一区| 国产欧美亚洲国产| 欧美性感艳星| 国产精品麻豆人妻色哟哟久久| 国内少妇人妻偷人精品xxx网站| 亚洲精品色激情综合| 嘟嘟电影网在线观看| 你懂的网址亚洲精品在线观看| 成人国产麻豆网| 51国产日韩欧美| 日韩,欧美,国产一区二区三区| 我的女老师完整版在线观看| 中文字幕制服av| 欧美精品一区二区大全| 免费观看的影片在线观看| 伦精品一区二区三区| 各种免费的搞黄视频| 亚洲精品456在线播放app| 成年美女黄网站色视频大全免费 | 精品少妇内射三级| 麻豆成人av视频| 国产欧美另类精品又又久久亚洲欧美| 婷婷色av中文字幕| 午夜日本视频在线| 亚洲欧美中文字幕日韩二区| 国产一区二区三区综合在线观看 | 草草在线视频免费看| 少妇熟女欧美另类| 寂寞人妻少妇视频99o| 校园人妻丝袜中文字幕| 免费看不卡的av| 女人精品久久久久毛片| 亚洲av综合色区一区| 成人毛片60女人毛片免费| 一区二区三区四区激情视频| 伦精品一区二区三区| 国产成人精品婷婷| 精品99又大又爽又粗少妇毛片| 亚洲av二区三区四区| 亚洲精品国产色婷婷电影| 在线观看人妻少妇| 少妇人妻久久综合中文| 久久久久久久大尺度免费视频| 亚洲欧美精品自产自拍| 18禁在线无遮挡免费观看视频| 成年女人在线观看亚洲视频| 五月玫瑰六月丁香| 内地一区二区视频在线| 欧美日韩在线观看h| 国产片特级美女逼逼视频| 国产黄片美女视频| 亚洲欧美日韩卡通动漫| 熟女av电影| www.色视频.com| 97精品久久久久久久久久精品| 国产成人freesex在线| 亚洲内射少妇av| 亚洲精品乱码久久久v下载方式| 九九在线视频观看精品| 综合色丁香网| 尾随美女入室| 噜噜噜噜噜久久久久久91| 又黄又爽又刺激的免费视频.| 亚洲欧美精品专区久久| 亚洲欧美日韩另类电影网站| 日韩一本色道免费dvd| 欧美日韩国产mv在线观看视频| 日韩一区二区视频免费看| 亚洲综合色惰| 国产在线一区二区三区精| 日本与韩国留学比较| 亚洲国产精品成人久久小说| 寂寞人妻少妇视频99o| videossex国产| 国产在线视频一区二区| 日日啪夜夜撸| 日韩成人av中文字幕在线观看| 黄色欧美视频在线观看| 国产精品人妻久久久影院| 一级av片app| 91午夜精品亚洲一区二区三区| 最后的刺客免费高清国语| 岛国毛片在线播放| 91在线精品国自产拍蜜月| 国产精品不卡视频一区二区| 亚洲精品国产色婷婷电影| 大又大粗又爽又黄少妇毛片口| 日韩精品有码人妻一区| 亚洲人成网站在线播| 欧美日韩在线观看h| 99热全是精品| 欧美亚洲 丝袜 人妻 在线| 亚洲欧美中文字幕日韩二区| 亚洲av欧美aⅴ国产| 国产精品久久久久成人av| 三级经典国产精品| 嫩草影院入口| 黑丝袜美女国产一区| 免费观看无遮挡的男女| 女人久久www免费人成看片| 日韩成人av中文字幕在线观看| 日韩一区二区视频免费看| 亚洲国产欧美在线一区| 亚洲三级黄色毛片| 久久久国产一区二区| 久久久a久久爽久久v久久| 亚洲欧美成人综合另类久久久| 国产69精品久久久久777片| 国内少妇人妻偷人精品xxx网站| 99久久综合免费| 大香蕉久久网| 91精品伊人久久大香线蕉| 黄色配什么色好看| 久久精品久久精品一区二区三区| 亚洲,欧美,日韩| 国产亚洲最大av| 久久这里有精品视频免费| 久久人人爽人人爽人人片va| 午夜免费观看性视频| 2018国产大陆天天弄谢| 中文在线观看免费www的网站| 精品久久久久久久久亚洲| 热re99久久精品国产66热6| 免费高清在线观看视频在线观看| 国产成人aa在线观看| 成人毛片60女人毛片免费| 大香蕉97超碰在线| 制服丝袜香蕉在线| av女优亚洲男人天堂| 我的老师免费观看完整版| 热99国产精品久久久久久7| 欧美区成人在线视频| 国产免费一区二区三区四区乱码| 色94色欧美一区二区| 中文字幕av电影在线播放| 欧美激情国产日韩精品一区| 少妇裸体淫交视频免费看高清| 欧美变态另类bdsm刘玥| 国产日韩一区二区三区精品不卡 | 国产美女午夜福利| 一级,二级,三级黄色视频| 国产精品久久久久久精品电影小说| 美女脱内裤让男人舔精品视频| 日日摸夜夜添夜夜爱| 黄色一级大片看看| 男男h啪啪无遮挡| 日韩熟女老妇一区二区性免费视频| 97在线视频观看| 久热这里只有精品99| 欧美国产精品一级二级三级 | 少妇裸体淫交视频免费看高清| 另类亚洲欧美激情| 18禁在线播放成人免费| 不卡视频在线观看欧美| 亚洲欧美日韩卡通动漫| av福利片在线观看| 国产精品久久久久成人av| 国产av码专区亚洲av| 午夜91福利影院| 欧美区成人在线视频| 午夜福利影视在线免费观看| 我的老师免费观看完整版| 曰老女人黄片| 最新的欧美精品一区二区| 韩国av在线不卡| 国产精品国产三级专区第一集| 狂野欧美激情性bbbbbb| 国产极品天堂在线| 丝袜在线中文字幕| 草草在线视频免费看| 高清在线视频一区二区三区| 精品午夜福利在线看| 午夜影院在线不卡| 一级毛片电影观看| 国产精品99久久久久久久久| 午夜福利视频精品| 欧美区成人在线视频| 午夜91福利影院| 熟女电影av网| 久久久久精品性色| 久久99精品国语久久久| 亚洲av不卡在线观看| 看非洲黑人一级黄片| 蜜桃久久精品国产亚洲av| 九九久久精品国产亚洲av麻豆| 三上悠亚av全集在线观看 | 丝袜喷水一区| 精品久久久久久久久av| 91精品一卡2卡3卡4卡| 久久综合国产亚洲精品| 女人久久www免费人成看片| 好男人视频免费观看在线| 在线天堂最新版资源| 99久久精品国产国产毛片| 国产成人精品无人区| 亚洲欧美中文字幕日韩二区| 在线观看免费日韩欧美大片 | 国产午夜精品一二区理论片| 9色porny在线观看| 欧美激情极品国产一区二区三区 | 成人特级av手机在线观看| 亚洲精华国产精华液的使用体验| 亚洲av电影在线观看一区二区三区| 日韩精品免费视频一区二区三区 | 国产永久视频网站| 日韩一区二区三区影片| 精品国产乱码久久久久久小说| 晚上一个人看的免费电影| 日本wwww免费看| av在线app专区| 亚州av有码| 一级毛片aaaaaa免费看小| 狂野欧美激情性xxxx在线观看| 97超碰精品成人国产| 欧美性感艳星| 日韩熟女老妇一区二区性免费视频| 日本av手机在线免费观看| 国产在线免费精品| 久久国内精品自在自线图片| 国产永久视频网站| 免费看日本二区| 九九久久精品国产亚洲av麻豆| 国产在线一区二区三区精| 日韩三级伦理在线观看| 国产精品人妻久久久久久| 在线观看三级黄色| av视频免费观看在线观看| 国产精品女同一区二区软件| 五月开心婷婷网| 夜夜骑夜夜射夜夜干| 国产永久视频网站| 亚洲国产欧美日韩在线播放 | 久久狼人影院| 成人漫画全彩无遮挡| 日本黄色日本黄色录像| 婷婷色综合www| 日韩人妻高清精品专区| 国产精品久久久久久久久免| 亚洲一级一片aⅴ在线观看| 日韩一区二区视频免费看| 美女xxoo啪啪120秒动态图| 女性生殖器流出的白浆| 女性被躁到高潮视频| 亚洲真实伦在线观看| 国产精品蜜桃在线观看| 日韩三级伦理在线观看| 欧美老熟妇乱子伦牲交| 亚洲婷婷狠狠爱综合网| 久久久久久久久久久久大奶| 晚上一个人看的免费电影| 一级毛片 在线播放| 日韩精品免费视频一区二区三区 | 男的添女的下面高潮视频| 性色av一级| 精品久久久久久电影网| 久热这里只有精品99| 久久久久久久精品精品| 欧美三级亚洲精品| 建设人人有责人人尽责人人享有的| 欧美日韩在线观看h| 精品亚洲乱码少妇综合久久| 欧美国产精品一级二级三级 | 能在线免费看毛片的网站| 国产免费一级a男人的天堂| 99热6这里只有精品| av免费观看日本| 丁香六月天网| 在线观看国产h片| h日本视频在线播放| 精品一区二区三区视频在线| 成人黄色视频免费在线看| 日日啪夜夜爽| 男女国产视频网站| 国产黄片美女视频| 精品人妻熟女av久视频| 免费观看a级毛片全部| 国产亚洲av片在线观看秒播厂| 亚洲av.av天堂| 日韩一区二区视频免费看| 最近中文字幕高清免费大全6| 不卡视频在线观看欧美| 欧美 亚洲 国产 日韩一| 国产亚洲5aaaaa淫片| 丝瓜视频免费看黄片| 一边亲一边摸免费视频| 看免费成人av毛片| 2021少妇久久久久久久久久久| 边亲边吃奶的免费视频| 18禁动态无遮挡网站| 97超视频在线观看视频| 久久av网站| 国语对白做爰xxxⅹ性视频网站| 成人毛片a级毛片在线播放| 麻豆乱淫一区二区| 日日撸夜夜添| a级一级毛片免费在线观看| 久久6这里有精品| 久久人妻熟女aⅴ| 亚洲国产色片| 亚洲欧美精品专区久久| 国产精品麻豆人妻色哟哟久久| 国产精品三级大全| 看免费成人av毛片| 亚洲av免费高清在线观看| 国产黄色免费在线视频| 97在线人人人人妻| 在线观看国产h片| 午夜福利,免费看| 欧美日韩国产mv在线观看视频| 欧美区成人在线视频| 99热全是精品| av免费在线看不卡| 色5月婷婷丁香| 最近手机中文字幕大全| 91aial.com中文字幕在线观看| 在线亚洲精品国产二区图片欧美 | 婷婷色综合www| 亚洲欧美精品专区久久| 99热这里只有是精品50| 日本爱情动作片www.在线观看| 熟女电影av网| 亚洲av综合色区一区| av又黄又爽大尺度在线免费看| 国产午夜精品一二区理论片| 99九九在线精品视频 | 中文字幕亚洲精品专区| 国产精品免费大片| 黄色一级大片看看| 欧美精品亚洲一区二区| 极品人妻少妇av视频| 日韩在线高清观看一区二区三区| 亚洲高清免费不卡视频| 国产亚洲5aaaaa淫片| 久久久a久久爽久久v久久| 观看美女的网站| 天堂中文最新版在线下载| 亚洲国产欧美日韩在线播放 | 伦精品一区二区三区| 日本欧美国产在线视频| 欧美bdsm另类| 日韩欧美一区视频在线观看 | 黄色配什么色好看| 老司机影院成人| 99热国产这里只有精品6| 99久久精品一区二区三区| 久久韩国三级中文字幕| 汤姆久久久久久久影院中文字幕| 三上悠亚av全集在线观看 | 精品人妻熟女毛片av久久网站| 亚洲精品国产av成人精品| 日本与韩国留学比较| 国产日韩欧美在线精品| 黄色毛片三级朝国网站 | 欧美 日韩 精品 国产| 色哟哟·www| 久久女婷五月综合色啪小说| 少妇熟女欧美另类| 人人妻人人澡人人看| 两个人免费观看高清视频 | 国内少妇人妻偷人精品xxx网站| 女的被弄到高潮叫床怎么办| 免费av中文字幕在线| 美女脱内裤让男人舔精品视频| 久久精品夜色国产| 成人国产av品久久久| 国产精品偷伦视频观看了| 免费少妇av软件| 久久国产亚洲av麻豆专区| 这个男人来自地球电影免费观看 | av.在线天堂| 亚洲国产成人一精品久久久| 精品一区在线观看国产| 你懂的网址亚洲精品在线观看| 性色av一级| 国产国拍精品亚洲av在线观看| 国产探花极品一区二区| 国产 精品1| av免费在线看不卡| 久久鲁丝午夜福利片| 国产 精品1| 日韩大片免费观看网站| 国产欧美亚洲国产| 少妇熟女欧美另类| 精品午夜福利在线看| 三级经典国产精品| 色视频www国产| 国产精品免费大片| 美女脱内裤让男人舔精品视频| 丰满饥渴人妻一区二区三| 啦啦啦在线观看免费高清www| 免费大片黄手机在线观看| 亚洲精品成人av观看孕妇| 亚洲国产欧美在线一区| 黄色日韩在线| 国产精品久久久久久精品古装| 国产男人的电影天堂91|