• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于Spark并行SVM參數(shù)尋優(yōu)算法的研究

    2019-07-23 01:24:14何經(jīng)緯劉黎志付星堡
    關(guān)鍵詞:內(nèi)存交叉集群

    何經(jīng)緯 ,劉黎志*,彭 貝 ,付星堡

    1.智能機(jī)器人湖北省重點(diǎn)實(shí)驗(yàn)室(武漢工程大學(xué)),湖北 武漢 430205;2.武漢工程大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院,湖北 武漢 430205

    隨著互聯(lián)網(wǎng)的發(fā)展,越來越來的智能設(shè)備被接入到網(wǎng)絡(luò)中來,數(shù)以萬計(jì)的設(shè)備每天都在產(chǎn)生大量的數(shù)據(jù),如何從海量的數(shù)據(jù)中獲取有價(jià)值的信息成為當(dāng)前研究的熱點(diǎn)。支持向量機(jī)[1-5](support vector machine,SVM)算法在參數(shù)設(shè)置合理的情況下,處理小樣本、高維度數(shù)據(jù)集時(shí)表現(xiàn)出很好的性能和準(zhǔn)確率,而不合理的參數(shù)設(shè)置將會(huì)導(dǎo)致糟糕的性能和極低的準(zhǔn)確率,所以參數(shù)的選取是SVM算法中至關(guān)重要的一環(huán)。傳統(tǒng)的SVM參數(shù)尋優(yōu)算法在處理大規(guī)模數(shù)據(jù)集時(shí)往往會(huì)遇到計(jì)算機(jī)性能的瓶頸,計(jì)算機(jī)的處理器資源、內(nèi)存資源全部被占用,在耗費(fèi)相當(dāng)長的時(shí)間后才能得到處理結(jié)果。

    集群環(huán)境下的并行計(jì)算方式為大數(shù)據(jù)的處理提供了新的思路,目前主流的大數(shù)據(jù)處理技術(shù)基本都用到了集群環(huán)境[6-13]。集群環(huán)境并行計(jì)算是提高大規(guī)模數(shù)據(jù)集SVM參數(shù)尋優(yōu)速度的一種有效途徑,多計(jì)算機(jī)并行的SVM參數(shù)尋優(yōu)算法可以有效解決計(jì)算機(jī)單機(jī)計(jì)算能力不足、宕機(jī)等問題。目前主流的集群計(jì)算平臺(tái)有Hadoop和Spark,基于內(nèi)存計(jì)算的Spark目前應(yīng)用非常廣泛,如雅虎、Uber等公司都在使用Spark平臺(tái)處理自己的業(yè)務(wù),所以使用Spark實(shí)現(xiàn)并行化的SVM參數(shù)尋優(yōu)算法是可行的方案。

    劉澤燊等[14]使用Spark實(shí)現(xiàn)了并行的SVM算法,李坤等[15]使用Spark集群建立了SVM參數(shù)并行尋優(yōu)模型,但是他們都忽略了集群Task分配、負(fù)載均衡等方面對參數(shù)尋優(yōu)效率的影響。為了更加合理地利用集群資源,同時(shí)使集群中的Executor達(dá)到負(fù)載均衡,本文對SVM算法最優(yōu)參數(shù)網(wǎng)格搜索的過程以及Spark并行計(jì)算引擎的特點(diǎn)進(jìn)行了分析,調(diào)整優(yōu)化網(wǎng)格搜索算法的結(jié)構(gòu),使用Spark平臺(tái)實(shí)現(xiàn)具體的并行算法,并通過調(diào)節(jié)Task的并行度對Spark的Task分配進(jìn)行優(yōu)化,使集群中各個(gè)Executor達(dá)到負(fù)載均衡,從而大幅度地減少尋優(yōu)時(shí)間。

    1 概述

    1.1 SVM算法

    SVM算法是一種基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化,建立在統(tǒng)計(jì)學(xué)理論上的有監(jiān)督機(jī)器學(xué)習(xí)算法,具有很好的泛化能力,在分類與回歸分析中有著廣泛的應(yīng)用,如人臉識(shí)別、文本分類、手寫字體識(shí)別等方面。

    SVM算法的目的是求解最優(yōu)超平面,本質(zhì)上是一個(gè)凸二次規(guī)劃問題,假設(shè)訓(xùn)練樣本集為,設(shè)超平面系數(shù)為w=(w0,w1,…,wn),截距為b,求解最優(yōu)超平面原問題描述如下:

    式(1)表示在滿足條件yi(w?xi+b)-1≥0的約束下,超平面系數(shù)向量w的模最小,從而使得超平面距離支持向量的物理間距最大。原問題不容易求解,可以通過原問題的對偶問題求解,引入拉格朗日算子并且對參數(shù)求偏導(dǎo),進(jìn)而求出與原問題對應(yīng)的對偶問題,具體對偶問題如下所示:

    式(2)中m為支持向量的個(gè)數(shù),αi為支持向量對應(yīng)的拉格朗日算子,c為懲罰參數(shù),表示對分類錯(cuò)誤樣本點(diǎn)的懲罰代價(jià)。

    由式(2)可以看出,非邊界樣本點(diǎn)對應(yīng)的參數(shù)αi都是0,因此只有支持向量樣本點(diǎn)對問題的求解有用,懲罰參數(shù)c可以剔除樣本集中的一些噪聲點(diǎn)。

    對于樣本集線性可分的情況,最優(yōu)超平面可以很容易求解出來;若樣本集線性不可分,此時(shí)需要引進(jìn)核函數(shù),將低維空間線性不可分問題映射成高維空間線性可分的問題。SVM核函數(shù)主要有四種,分別為線性核函數(shù)(linear Kernel)、多項(xiàng)式核函數(shù)(polynomial kernel)、徑向基核函數(shù)(RBF kernel)、Sigmoid核函數(shù)(sigmoid kernel)。徑向基核函數(shù)也稱高斯核函數(shù),是比較常用的一種核函數(shù),公式為:H(x,x′)=exp(1-g‖x-x′‖2)。其中本文參數(shù)尋優(yōu)涉及的2個(gè)參數(shù)c、g,c代表式(2)中的懲罰參數(shù),g代表徑向基核函數(shù)中的參數(shù)g。

    1.2 Spark

    Apache spark是一種基于內(nèi)存計(jì)算的通用計(jì)算引擎,常用來處理大規(guī)模數(shù)據(jù)集。與Hadoop相同的是,Spark可以執(zhí)行Map、Reduce等操作,但Spark還包含了很多Hadoop不具備的算子,在數(shù)據(jù)處理方面要比Hadoop靈活很多。Spark的各種操作主要集中在內(nèi)存,但Hadoop在數(shù)據(jù)處理過程中需要頻繁讀寫HDFS,造成大量的磁盤I/O和通信開銷,所以在計(jì)算速度上,Spark要比Hadoop快很多。同時(shí)Spark與Hadoop完全兼容,Spark可以使用Hadoop集群上的HDFS做為分布式文件存儲(chǔ)系統(tǒng)。

    Spark的核心部分是彈性分布式數(shù)據(jù)集(resilient distributed datasets,RDD),RDD是一個(gè)基于內(nèi)存具有容錯(cuò)性的分區(qū)只讀記錄集合,通過RDD分區(qū)(partition)來決定集群中Worker的任務(wù)分配。RDD包含轉(zhuǎn)換(transformation)和動(dòng)作(action)兩種算子,轉(zhuǎn)換,如map()、flatmap()、filter()等,它是將一種格式的RDD轉(zhuǎn)換為另外一種格式的RDD;而動(dòng)作,如collect()、count()、take()等,它的功能則是得到具體的結(jié)果。其中轉(zhuǎn)換操作不會(huì)被立即執(zhí)行,只有遇到動(dòng)作時(shí),動(dòng)作之前的轉(zhuǎn)換操作和動(dòng)作才會(huì)被執(zhí)行。

    Spark的運(yùn)行模式有Local、Standalone和Yarn等模式,本文中采用的是Standalone模式,在Standalone模式下,Driver程序可以在Master節(jié)點(diǎn)運(yùn)行也可以在本地的Client端運(yùn)行,本文使用Eclipse向集群提交Application,所以Driver程序運(yùn)行在Client端。

    1.3 支持向量機(jī)軟件包

    支持向量機(jī)軟件包(library for support vector machines,LIBSVM)是臺(tái)灣大學(xué)林智仁教授等開發(fā)的一個(gè)用于SVM快速建模程序包,它提供了大量的API給開發(fā)者進(jìn)行調(diào)用,各個(gè)方法的參數(shù)設(shè)置非常靈活,目前很多SVM算法相關(guān)的研究都是基于LIBSVM的二次開發(fā)。

    在SVM分類模型建立過程中,懲罰參數(shù)c和核函數(shù)參數(shù)g的選取直接影響模型分類的準(zhǔn)確率。由于不能確定使模型分類準(zhǔn)確率最高的參數(shù),為了獲得最優(yōu)的(c,g)參數(shù),通常使用LIBSVM自帶的網(wǎng)格搜索(grid search)算法進(jìn)行參數(shù)尋優(yōu),網(wǎng)格搜索即通過窮舉將所有的參數(shù)組合進(jìn)行交叉驗(yàn)證(cross-validation),找出分類準(zhǔn)確率最高的參數(shù)組合,是一個(gè)非常耗時(shí)的過程。

    2 參數(shù)尋優(yōu)算法并行與優(yōu)化

    2.1 算法并行化的思路

    網(wǎng)格搜索過程中,因?yàn)槊拷M(c,g)參數(shù)組合的交叉驗(yàn)證過程相互獨(dú)立,所以可以通過Spark并行計(jì)算引擎將搜索過程并行化。利用RDD的MapReduce原理,將所有的參數(shù)組合存入RDD中,RDD觸發(fā)動(dòng)作后被分解為很多邏輯相同的Task,這些Task會(huì)被分配到相同或者不同的Executor上并行執(zhí)行。算法將交叉驗(yàn)證的過程放在RDD的Map階段,使交叉驗(yàn)證在各個(gè)Task上并行執(zhí)行,等待所有Executor中的Task完成交叉驗(yàn)證后,利用Reduce動(dòng)作匯總所有結(jié)果并計(jì)算出最高準(zhǔn)確率和參數(shù)組合。算法中使用LIBSVM包提供的交叉驗(yàn)證方法對參數(shù)進(jìn)行交叉驗(yàn)證,由于原生LIBSVM交叉驗(yàn)證算法的輸入輸出不能夠滿足實(shí)驗(yàn)需求,所以實(shí)際算法對svm_train.java的訓(xùn)練集讀取方式以及交叉驗(yàn)證結(jié)果的輸出形式進(jìn)行了改寫,使其能適應(yīng)并行網(wǎng)格搜索的輸入和輸出。交叉驗(yàn)證的基本流程為:

    1)將原始訓(xùn)練集均勻劃分成k份的數(shù)據(jù)集;

    2)選取其中1份數(shù)據(jù)集(未被作為測試集的數(shù)據(jù)集)作為測試集,其他的k-1份作為訓(xùn)練集;

    3)用訓(xùn)練集訓(xùn)練出模型,再用測試集去測試模型的準(zhǔn)確率;

    4)重復(fù)上述第二步和第三步,直到原始訓(xùn)練集中所有的數(shù)據(jù)集都被作為測試集進(jìn)行測試為止;

    5)求出所有測試所得準(zhǔn)確率的均值作為最終準(zhǔn)確率。

    上述步驟即為k折交叉驗(yàn)證(k-fold cross-validation),本文所提到的交叉驗(yàn)證都為k折交叉驗(yàn)證,k折交叉驗(yàn)證的過程中對訓(xùn)練集中所有的數(shù)據(jù)都進(jìn)行了測試,可以有效地避免過擬合和欠擬合問題。

    2.2 廣播變量的使用

    并行網(wǎng)格搜索前,將Driver端讀取的訓(xùn)練集以廣播變量的形式廣播給各個(gè)Executor,每個(gè)Executor保存一份訓(xùn)練集副本;如果Driver端讀取的訓(xùn)練集以List形式保存共享,Executor的每個(gè)Task都會(huì)保存一份訓(xùn)練集副本。

    假設(shè)在1個(gè)Application中分配m個(gè)Executor,每個(gè)Executor中有n個(gè)Task在執(zhí)行,當(dāng)訓(xùn)練集使用廣播變量的形式進(jìn)行廣播時(shí),整個(gè)Application中總共保存m份訓(xùn)練集副本;但當(dāng)訓(xùn)練集使用List形式在Driver端保存共享時(shí),整個(gè)Application中總共保存m·n份訓(xùn)練集副本,所以采用List形式保存共享訓(xùn)練集會(huì)比廣播變量形式多產(chǎn)生m·n-m=(n-1)·m份訓(xùn)練集副本。當(dāng)訓(xùn)練集較大、Task的數(shù)量較多時(shí),重復(fù)保存的(n-1)·m份訓(xùn)練集副本會(huì)占用大量的內(nèi)存,甚至?xí)?dǎo)致內(nèi)存溢出。

    2.3 Task并行度與Executor負(fù)載均衡

    在Spark集群中,根據(jù)Action的不同Application被劃分為不同的Job,Job中的每處寬依賴被劃分一個(gè)Stage,每個(gè)Stage中包含多個(gè)Task,Task是運(yùn)行在Executor處理器內(nèi)核中,執(zhí)行Job的最小邏輯單元。并行網(wǎng)格搜索計(jì)算量最大,最耗時(shí)的交叉驗(yàn)證階段是由Executor中的Task來完成的,為了讓Application中分配的所有Executor能夠發(fā)揮最大效能,本文通過在Map階段控制Task的并行度,讓每個(gè)Executor分配到的Task數(shù)目一致或者接近一致,盡可能的使Executor之間達(dá)到負(fù)載均衡,從而加快搜索的速度。Executor的Task分配情況如圖1的Map階段所示,圖1描述的為理想情況,所有Executor分配的Task數(shù)目一致,此時(shí)的尋優(yōu)速度較快。

    為將Task并行度變?yōu)樽灾骺煽貐?shù),本文把Spark集群配置文件中的spark.default.parallelism參數(shù)提取出來并重寫覆蓋,將其定義為一個(gè)變量(Parallelism),算法中的通過控制Parallelism來控制并行Task的數(shù)量。并行可調(diào)的網(wǎng)格搜索算法主要流程如圖1所示,實(shí)現(xiàn)步驟如下:

    1)輸入Application的Task并行度,c、g參數(shù)數(shù)目,交叉驗(yàn)證折數(shù)。

    2)根據(jù)c、g的數(shù)量和步長自動(dòng)生成參數(shù)組合,并將其存入RDD中。

    3)讀取訓(xùn)練樣本,并將其轉(zhuǎn)換為廣播變量。

    4)根據(jù)輸入的Task并行度以及存儲(chǔ)參數(shù)組合的RDD為每個(gè)Executor分配Task。

    5)對存有c、g參數(shù)組合的RDD執(zhí)行mapToPair()轉(zhuǎn)換,并在轉(zhuǎn)換過程中對廣播變量中的訓(xùn)練樣本進(jìn)行交叉驗(yàn)證,將參數(shù)組合和準(zhǔn)確率以鍵值對的形式返回。

    圖1 并行網(wǎng)格搜索過程Fig.1 Searching process of parallel grid

    6)通過Reduce()動(dòng)作計(jì)算出最優(yōu)參數(shù)組合以及準(zhǔn)確率,Driver計(jì)算出尋優(yōu)總時(shí)間。

    并行可調(diào)網(wǎng)格搜索算法的核心算法:

    Input:TrainDatasetPath,Parallelism,CNum,GNum,K-Fold

    Output:C,G,Accuracy,TotalTime

    1.Application初始化,根據(jù)Parallelism設(shè)置Task并行度;

    2.JavaSparkContext jsc=new JavaSparkContext(spark.sparkContext());

    3.List<String> cgList=new ArrayList<String>();

    4.for(int i=0;i<CNum;i++){for(int j=GNum;j> 0;j--){//生成c,g參數(shù)組合

    5.String sparam=String.valueOf(初始值 +i*步長)+"-"+String.valueOf(初始值+

    j*步長);cgList.add(sparam);}}

    6.JavaRDD<String> lines=jsc.parallelize(cg-List);//RDD形式的c、g參數(shù)

    7.調(diào)用ReadTrainFromHDFS算法

    8.調(diào)用mapToPair算法

    9.調(diào)用reduce算法

    10.Driver計(jì)算出尋優(yōu)總時(shí)間TotalTime;

    并行網(wǎng)格搜索前需要將HDFS中的訓(xùn)練集讀取出來,并轉(zhuǎn)換為廣播變量,ReadTrainFromHDFS算法如下:

    Input:fs-FileSystem對象,pt-訓(xùn)練集HDFS路徑,jsc-JavaSparkContext對象

    Output:broadcastssvRecords

    1.Vector<String> svRecords= new Vector<String>();

    2.if(fs!=null){BufferedReader br=new BufferedReader(new InputStreamReader(fs.open(pt)));

    3.try{String line;while((line=br.readLine())!=null&&line.length()>1){

    4.svRecords.addElement(line);}} finally {br.close();}}//將訓(xùn)練集讀取為 Vector<String>格式

    5. Broadcast<List<String>> broadcastssvRecords=jsc//將訓(xùn)練集轉(zhuǎn)換為廣播變量

    .broadcast(Arrays.asList(svRecords.toArray(new String[svRecords.size()])));

    6.return broadcastssvRecords;

    Map階段的并行Task的數(shù)量即并行交叉驗(yàn)證的數(shù)量由Parallelism決定,mapToPair算法如下:

    Input:s-String類型格式為“c-g”的參數(shù)組合,K-Fold

    Output:Tuple2(s,acc)

    1.String[]svr=(String[])broadcastssvRecords.value().toArray();//使用廣播變量

    2.Double c=Double.valueOf(s.split("-")[0]);3.Double g=Double.valueOf(s.split("-")[1]);

    4.MSSvmTrainer svmTrainer=new MSSvm-Trainer(svr,c,g,K-Fold);

    5.String acc=svmTrainer.do_cross_validation();//交叉驗(yàn)證

    6.return new Tuple2(s,acc);//返回<參數(shù)組合,準(zhǔn)確率>的鍵值對

    Reduce階段主要處理Map階段產(chǎn)生的鍵值對,通過比較準(zhǔn)確率大小,得出最優(yōu)參數(shù)組合,reduce算法如下:

    Input:x,y

    Output:返回x,y鍵值對中準(zhǔn)確率高的鍵值對

    1.if(Double.parseDouble(x._2().replace("%",""))>Double.parseDouble(y._2().replace("%",""))){

    2.return x;}else{return y;}

    3 實(shí)驗(yàn)部分

    3.1 實(shí)驗(yàn)環(huán)境與數(shù)據(jù)

    Spark集群的主要硬件環(huán)境為一臺(tái)戴爾R720服務(wù)器,服務(wù)器配置為兩顆E5-2620V2 6核12線程處理器,主頻2.1 GHz,最大睿頻2.6 GHz,32 GB內(nèi)存,8 TB硬盤,服務(wù)器被虛擬化為4個(gè)節(jié)點(diǎn),一個(gè)Master節(jié)點(diǎn)4個(gè)Worker節(jié)點(diǎn)(Master節(jié)點(diǎn)也是Worker節(jié)點(diǎn)),每個(gè)節(jié)點(diǎn)有3個(gè)內(nèi)核,8 GB內(nèi)存,2 TB硬盤;集群使用的主要軟件有Spark2.1.1、Hadoop2.7.3、JDK1.8等,操作系統(tǒng)為 Ubuntu-16.04.1-Server-amd64。

    實(shí)驗(yàn)采用的是LIBSVM官網(wǎng)提供的a8a二分類數(shù)據(jù)集,該數(shù)據(jù)集大小為1.6 MB,包含22 696個(gè)樣本,每個(gè)樣本有123維特征。

    3.2 實(shí)驗(yàn)結(jié)果及性能分析

    實(shí)驗(yàn)選擇64組(c,g)參數(shù)組合作為測試對象,交叉驗(yàn)證折數(shù)k為4,參數(shù)c、g各8組。參數(shù)c的初始值為0.5,遞增步長為0.25,搜索范圍為0.5~2.25;參數(shù)g的初始值為0.05,遞增步長為0.012 5,搜索范圍為0.05~0.137 5。實(shí)驗(yàn)過程中為Application分配4個(gè)Executor,每個(gè)Executor 3個(gè)內(nèi)核,2 GB內(nèi)存。

    在不設(shè)置并行Task數(shù)量與通常采用的最大并行Task數(shù)量的情況進(jìn)行實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如表1所示。

    表1 兩種Task并行度實(shí)驗(yàn)結(jié)果Tab.1 Experiment results of two parllelisms of tasks

    從表1可以看出,不設(shè)置并行度的情況下只有2個(gè)Task并行執(zhí)行,設(shè)置最大并行度后,64個(gè)Task并行執(zhí)行,尋優(yōu)總時(shí)間極大地減少。從Spark Web UI上的Executors上查詢出,不設(shè)置并行度時(shí)集群中只啟動(dòng)了2個(gè)Executor來執(zhí)行Task,顯然Application沒有使用本次分配的全部集群資源,有一部分資源處于閑置狀態(tài);而設(shè)置最大并行度后,集群使用了分配的全部資源,啟動(dòng)了4個(gè)Executor來執(zhí)行Task。

    為了比較集群并行Task的數(shù)量對尋優(yōu)效率和速度的影響,在實(shí)驗(yàn)中設(shè)置核心算法中的Parallelism參數(shù)分別為 4、8、12、16、20、24進(jìn)行參數(shù)尋優(yōu)的測試,實(shí)驗(yàn)數(shù)據(jù)如表2所示。

    表2 不同Task并行度實(shí)驗(yàn)結(jié)果Tab.2 Experimental results of different parallelisms of tasks

    圖2 不同并行度尋優(yōu)總時(shí)間趨勢圖Fig.2 Trend diagram of total optimization time for different parallelisms

    圖3 三種并行度尋優(yōu)總時(shí)間對比圖Fig.3 Comparison diagram of total optimization time for three parallelisms

    從表2和圖2可以看出,Task的并行度并非設(shè)置越大越好,當(dāng)并行的Task數(shù)量小于12時(shí),訓(xùn)練總時(shí)間隨著并行的Task數(shù)量的增加而降低;但當(dāng)并行的Task數(shù)量超過12時(shí),總訓(xùn)練時(shí)間開始上升,在并行的Task數(shù)量為24時(shí),總訓(xùn)練時(shí)間接近Task并行數(shù)量為12時(shí)。在設(shè)置合理的并行Task數(shù)量后,參數(shù)尋優(yōu)的準(zhǔn)確率基本不變(上下波動(dòng)不超過0.1%),時(shí)間性能提升了(4 890-1 961)/1 961≈149%。從圖3可以看出,在并行的Task數(shù)量為24的時(shí)候,尋優(yōu)的時(shí)間性能相對在不設(shè)置并行度、并行度最大的情況下都有一定的提升,相對在不設(shè)并行度的情況下提升了(6 731-1 961)/1 961≈243%,相對在最大并行度的情況下提升了(2 544-1 961)/1 961≈30%。

    為了進(jìn)一步測試并行Task數(shù)量為12整數(shù)倍對尋優(yōu)總時(shí)間的影響,設(shè)置Parallelism參數(shù)為36再次進(jìn)行測試,結(jié)果如表3所示,并行Task數(shù)量為12或12的整數(shù)倍的時(shí)候,總尋優(yōu)時(shí)間比較接近。

    表3 并行度為12整數(shù)倍的實(shí)驗(yàn)結(jié)果Tab.3 Experimental results of parallelisms in integer multiples of 12

    從表1和表3以及圖2相關(guān)數(shù)據(jù)可以看出,Task并行度的設(shè)置對尋優(yōu)總時(shí)間有很大的影響,進(jìn)一步分析Task并行度對Executor負(fù)載均衡的影響,在程序中設(shè)置標(biāo)簽來統(tǒng)計(jì)每個(gè)Executor完成的Task數(shù)量,將相關(guān)數(shù)據(jù)在Logs輸出,統(tǒng)計(jì)數(shù)據(jù)如表4所示。

    表4 不同并行度各Executor分配Task數(shù)量Tab.4 Numbers of tasks assigned to each executor under different parallelisms 個(gè)

    圖4 不同并行度各Executor分配Task數(shù)量對比圖Fig.4 Comparison diagram of tasks assigned to each executor with different parallelisms

    通過表4和圖2以及圖4可以看出,當(dāng)Task數(shù)量是12或者12的整數(shù)倍的時(shí)候,各個(gè)Executor分配的Task數(shù)量相同,達(dá)到負(fù)載均衡,此時(shí)的尋優(yōu)總時(shí)間也是最短的;當(dāng)Task數(shù)量不是12或者12的整數(shù)倍的時(shí)候,各個(gè)Executor分配的Task數(shù)量不一致,分配Task數(shù)量較多的Executor的交叉驗(yàn)證的總時(shí)間會(huì)相對較長,分配Task數(shù)量較少的Executor在完成交叉驗(yàn)證Task后會(huì)等待分配Task較多的Executor,直到所有Executor完成交叉驗(yàn)證Task,網(wǎng)格搜索結(jié)束,所以網(wǎng)格搜索的總時(shí)間是由交叉驗(yàn)證總用時(shí)最長的那個(gè)Executor決定的。默認(rèn)情況下,Executor的一個(gè)內(nèi)核在同一時(shí)間只處理一個(gè)Task,所以設(shè)置并行Task的數(shù)量為Application的Executor內(nèi)核總數(shù)或總數(shù)的整數(shù)倍可以使各個(gè)Executor分配到的Task數(shù)目相等,達(dá)到負(fù)載均衡,從而使并行網(wǎng)格搜索的速度達(dá)到最快。

    4 結(jié) 語

    SVM大數(shù)據(jù)集參數(shù)尋優(yōu)的計(jì)算量相當(dāng)大,用傳統(tǒng)的單機(jī)參數(shù)尋優(yōu)算法來處理大數(shù)據(jù)集顯然不現(xiàn)實(shí)。本文提出了一種基于Spark通用計(jì)算引擎的并行可調(diào)SVM參數(shù)尋優(yōu)算法,通過分析算法在Task不同并行度下的尋優(yōu)時(shí)間,發(fā)現(xiàn)并非Task并行度設(shè)置的越大尋優(yōu)速度越快,需要根據(jù)Application分配的集群資源,調(diào)整Task的并行度(設(shè)Application的Executor內(nèi)核數(shù)量為m,Executor數(shù)量為n,則Task最優(yōu)并行度為m·n或m·n的整數(shù)倍),使各個(gè)Executor達(dá)到負(fù)載均衡,從而顯著提高尋優(yōu)速度。從集群的角度來看,在Application中每個(gè)Task耗時(shí)相差不大的情況下,Task分配的越均勻,Application的總耗時(shí)越少,當(dāng)Task完全均勻分配時(shí),即負(fù)載均衡的時(shí)候,Application總耗時(shí)最少。

    參數(shù)尋優(yōu)過程中集群內(nèi)存資源的消耗優(yōu)化是今后研究的重點(diǎn)之一,通過動(dòng)態(tài)評估內(nèi)存消耗,給Executor設(shè)置合理的內(nèi)存,在不降低尋優(yōu)速度的前提下,消耗盡可能少的內(nèi)存資源完成SVM參數(shù)尋優(yōu)算法。

    猜你喜歡
    內(nèi)存交叉集群
    海上小型無人機(jī)集群的反制裝備需求與應(yīng)對之策研究
    “春夏秋冬”的內(nèi)存
    “六法”巧解分式方程
    一種無人機(jī)集群發(fā)射回收裝置的控制系統(tǒng)設(shè)計(jì)
    電子制作(2018年11期)2018-08-04 03:25:40
    Python與Spark集群在收費(fèi)數(shù)據(jù)分析中的應(yīng)用
    勤快又呆萌的集群機(jī)器人
    連一連
    基于Fast-ICA的Wigner-Ville分布交叉項(xiàng)消除方法
    雙線性時(shí)頻分布交叉項(xiàng)提取及損傷識(shí)別應(yīng)用
    基于內(nèi)存的地理信息訪問技術(shù)
    草草在线视频免费看| 一级爰片在线观看| 久久鲁丝午夜福利片| 日韩一本色道免费dvd| 爱豆传媒免费全集在线观看| 欧美xxxx黑人xx丫x性爽| 麻豆av噜噜一区二区三区| 成年女人在线观看亚洲视频 | 欧美精品一区二区大全| 日本猛色少妇xxxxx猛交久久| 最近手机中文字幕大全| 丝瓜视频免费看黄片| 欧美激情国产日韩精品一区| 91aial.com中文字幕在线观看| 九色成人免费人妻av| 亚洲综合精品二区| 中文在线观看免费www的网站| 亚洲色图av天堂| 亚洲成人精品中文字幕电影| 国产黄色小视频在线观看| 少妇熟女欧美另类| 欧美人与善性xxx| 国产极品天堂在线| 成人漫画全彩无遮挡| 狂野欧美白嫩少妇大欣赏| 啦啦啦韩国在线观看视频| 欧美日韩一区二区视频在线观看视频在线 | 精品久久久噜噜| 在线播放无遮挡| 久久久午夜欧美精品| 男女边吃奶边做爰视频| 熟女人妻精品中文字幕| 中文资源天堂在线| 亚洲精品成人久久久久久| 国产精品精品国产色婷婷| 午夜激情福利司机影院| 欧美变态另类bdsm刘玥| 亚洲精品aⅴ在线观看| 在线免费观看的www视频| videossex国产| 亚洲美女搞黄在线观看| 免费观看av网站的网址| 久久久久久国产a免费观看| 中文乱码字字幕精品一区二区三区 | 亚洲成人精品中文字幕电影| 日韩av在线大香蕉| 中文字幕制服av| 亚洲最大成人中文| 精品一区二区免费观看| 精品欧美国产一区二区三| 国产成人a区在线观看| 在线天堂最新版资源| 国产精品久久久久久精品电影| 91精品伊人久久大香线蕉| 久久久久久久国产电影| 免费无遮挡裸体视频| 又大又黄又爽视频免费| 亚洲va在线va天堂va国产| 日日啪夜夜爽| 精品一区二区三区人妻视频| 丰满乱子伦码专区| 嘟嘟电影网在线观看| 国产一区二区三区综合在线观看 | 国产精品国产三级专区第一集| 97在线视频观看| 国产黄色视频一区二区在线观看| 久久久久久久久久成人| 久久这里只有精品中国| 久久久色成人| 国产淫语在线视频| 亚洲激情五月婷婷啪啪| 免费观看性生交大片5| 99久国产av精品| 黄色一级大片看看| 爱豆传媒免费全集在线观看| 在线免费观看不下载黄p国产| 人人妻人人看人人澡| 男人舔奶头视频| 日韩强制内射视频| 狠狠精品人妻久久久久久综合| 免费无遮挡裸体视频| www.色视频.com| 国语对白做爰xxxⅹ性视频网站| 亚洲天堂国产精品一区在线| 大话2 男鬼变身卡| 欧美另类一区| 午夜福利成人在线免费观看| 夫妻性生交免费视频一级片| 久久久国产一区二区| 久99久视频精品免费| 亚洲人成网站在线观看播放| 黄片无遮挡物在线观看| 91在线精品国自产拍蜜月| 久久久久久久大尺度免费视频| 国产精品一区二区三区四区免费观看| 亚洲18禁久久av| 久久久久网色| 人人妻人人看人人澡| 国产精品福利在线免费观看| 免费观看无遮挡的男女| 亚洲人成网站高清观看| 国产黄色免费在线视频| 日韩av在线大香蕉| 天堂网av新在线| ponron亚洲| 亚洲av电影在线观看一区二区三区 | 亚洲久久久久久中文字幕| av天堂中文字幕网| 夫妻午夜视频| 蜜桃亚洲精品一区二区三区| 欧美三级亚洲精品| 一级片'在线观看视频| 免费黄色在线免费观看| 亚洲色图av天堂| 日韩大片免费观看网站| 免费黄色在线免费观看| 久久久久久久久久久免费av| 一边亲一边摸免费视频| 久久99热6这里只有精品| 色5月婷婷丁香| 日韩中字成人| 日韩亚洲欧美综合| 搞女人的毛片| 亚洲精品乱久久久久久| 免费在线观看成人毛片| 老司机影院毛片| 黑人高潮一二区| 狂野欧美白嫩少妇大欣赏| 欧美人与善性xxx| 久久精品夜夜夜夜夜久久蜜豆| 欧美日韩国产mv在线观看视频 | 亚洲美女搞黄在线观看| 国内少妇人妻偷人精品xxx网站| 青春草亚洲视频在线观看| 极品教师在线视频| 亚洲av日韩在线播放| a级毛片免费高清观看在线播放| 国产视频内射| 人体艺术视频欧美日本| av在线天堂中文字幕| 中文字幕亚洲精品专区| 国产av码专区亚洲av| 男女边吃奶边做爰视频| 国产在线一区二区三区精| 亚洲av日韩在线播放| 我要看日韩黄色一级片| 天堂影院成人在线观看| 人人妻人人澡欧美一区二区| 男插女下体视频免费在线播放| 日韩一区二区视频免费看| 亚洲乱码一区二区免费版| 男女视频在线观看网站免费| 成人综合一区亚洲| eeuss影院久久| 最近手机中文字幕大全| 国产成人freesex在线| 日日撸夜夜添| 色视频www国产| .国产精品久久| 一边亲一边摸免费视频| 高清毛片免费看| 永久免费av网站大全| 亚洲av电影在线观看一区二区三区 | 日韩国内少妇激情av| 九九久久精品国产亚洲av麻豆| 日本欧美国产在线视频| 免费少妇av软件| 亚洲成色77777| 国产v大片淫在线免费观看| 美女高潮的动态| 亚洲人成网站高清观看| 少妇高潮的动态图| 高清午夜精品一区二区三区| 边亲边吃奶的免费视频| 国内揄拍国产精品人妻在线| 听说在线观看完整版免费高清| 18禁裸乳无遮挡免费网站照片| 成人二区视频| 蜜桃亚洲精品一区二区三区| 精品亚洲乱码少妇综合久久| 大又大粗又爽又黄少妇毛片口| 黄色配什么色好看| 精品国产一区二区三区久久久樱花 | 只有这里有精品99| 亚洲精品乱久久久久久| 最近中文字幕高清免费大全6| 午夜福利视频1000在线观看| 直男gayav资源| 欧美激情久久久久久爽电影| 深夜a级毛片| 插阴视频在线观看视频| 高清视频免费观看一区二区 | 成人午夜精彩视频在线观看| 99热网站在线观看| 欧美成人精品欧美一级黄| 成年女人看的毛片在线观看| 日韩av在线大香蕉| av在线亚洲专区| 最近最新中文字幕免费大全7| 亚洲精品第二区| 伦理电影大哥的女人| 爱豆传媒免费全集在线观看| 亚洲久久久久久中文字幕| 22中文网久久字幕| 国产在视频线精品| 色5月婷婷丁香| 黑人高潮一二区| 一级av片app| 免费观看av网站的网址| av卡一久久| 国产在线男女| 中文精品一卡2卡3卡4更新| 精品人妻熟女av久视频| 一级毛片黄色毛片免费观看视频| 日韩av在线大香蕉| 小蜜桃在线观看免费完整版高清| 国产伦精品一区二区三区视频9| 熟女人妻精品中文字幕| 国产午夜福利久久久久久| 一级毛片久久久久久久久女| 国产在线男女| 国产亚洲91精品色在线| 女的被弄到高潮叫床怎么办| 午夜福利在线在线| 老司机影院成人| 久久精品国产亚洲av涩爱| 亚洲av免费在线观看| 国产精品久久久久久久久免| freevideosex欧美| 国产人妻一区二区三区在| 网址你懂的国产日韩在线| 国产视频首页在线观看| 联通29元200g的流量卡| 欧美bdsm另类| 秋霞在线观看毛片| 人人妻人人澡人人爽人人夜夜 | 搡老妇女老女人老熟妇| 免费看av在线观看网站| 麻豆成人av视频| 亚洲欧美成人综合另类久久久| 久久韩国三级中文字幕| 国产一级毛片在线| 内射极品少妇av片p| 日韩欧美 国产精品| 久久99热这里只有精品18| 一个人免费在线观看电影| 女人被狂操c到高潮| 国产午夜精品论理片| 少妇人妻一区二区三区视频| 免费观看性生交大片5| 欧美丝袜亚洲另类| 精品久久久久久久人妻蜜臀av| 久久久亚洲精品成人影院| 亚洲av成人av| 最近中文字幕高清免费大全6| 一级黄片播放器| 中文字幕av在线有码专区| 国产精品福利在线免费观看| 欧美zozozo另类| 国产伦精品一区二区三区四那| 日韩制服骚丝袜av| 美女高潮的动态| 男的添女的下面高潮视频| 丰满少妇做爰视频| 国产白丝娇喘喷水9色精品| 国产高清国产精品国产三级 | 少妇的逼好多水| 18禁动态无遮挡网站| 在线观看av片永久免费下载| 插阴视频在线观看视频| 日韩,欧美,国产一区二区三区| 男女边吃奶边做爰视频| 免费人成在线观看视频色| 免费播放大片免费观看视频在线观看| 三级国产精品片| 亚洲第一区二区三区不卡| 国产av国产精品国产| 97超碰精品成人国产| 黑人高潮一二区| 免费黄网站久久成人精品| 国产亚洲5aaaaa淫片| 一本一本综合久久| 免费观看av网站的网址| 午夜免费激情av| 伦理电影大哥的女人| 久久综合国产亚洲精品| 国产激情偷乱视频一区二区| 亚洲精品乱久久久久久| 国产大屁股一区二区在线视频| 欧美bdsm另类| 欧美极品一区二区三区四区| 2021天堂中文幕一二区在线观| 在线免费十八禁| 大陆偷拍与自拍| 一区二区三区四区激情视频| 日韩,欧美,国产一区二区三区| 噜噜噜噜噜久久久久久91| 国产 一区 欧美 日韩| 久久精品夜夜夜夜夜久久蜜豆| 日本-黄色视频高清免费观看| 日韩av在线大香蕉| 99久久九九国产精品国产免费| 免费大片18禁| 97超碰精品成人国产| 一级a做视频免费观看| 精品久久久久久久久久久久久| 国产一区二区在线观看日韩| 18禁动态无遮挡网站| 久久99蜜桃精品久久| 国产麻豆成人av免费视频| 国产成人精品久久久久久| 卡戴珊不雅视频在线播放| 91狼人影院| 国产一区二区亚洲精品在线观看| 99热这里只有是精品50| 亚洲一级一片aⅴ在线观看| 内地一区二区视频在线| 97人妻精品一区二区三区麻豆| 国产精品国产三级国产专区5o| 在线观看av片永久免费下载| 午夜爱爱视频在线播放| 国产高潮美女av| 99久久精品国产国产毛片| 人人妻人人澡人人爽人人夜夜 | 国产精品人妻久久久久久| 亚洲国产欧美在线一区| 亚洲在线自拍视频| 亚洲一级一片aⅴ在线观看| 如何舔出高潮| 久久精品久久久久久噜噜老黄| 日韩一区二区三区影片| freevideosex欧美| 韩国高清视频一区二区三区| 国产极品天堂在线| 国产乱来视频区| 国产精品综合久久久久久久免费| 成年人午夜在线观看视频 | 久久韩国三级中文字幕| 欧美不卡视频在线免费观看| 两个人视频免费观看高清| 久久精品国产亚洲av涩爱| 欧美性感艳星| 亚洲,欧美,日韩| 欧美性感艳星| 国产成人freesex在线| 亚洲av一区综合| 人妻一区二区av| 淫秽高清视频在线观看| 中国美白少妇内射xxxbb| 噜噜噜噜噜久久久久久91| 少妇的逼水好多| 一级毛片电影观看| 中文资源天堂在线| 视频中文字幕在线观看| 内射极品少妇av片p| 欧美性猛交╳xxx乱大交人| 午夜免费男女啪啪视频观看| 淫秽高清视频在线观看| 亚洲性久久影院| 乱人视频在线观看| 亚洲无线观看免费| 深爱激情五月婷婷| 欧美激情国产日韩精品一区| 国精品久久久久久国模美| 看免费成人av毛片| 欧美成人a在线观看| 成年版毛片免费区| 性插视频无遮挡在线免费观看| 色综合色国产| 欧美日韩国产mv在线观看视频 | 国产毛片a区久久久久| 久久99热这里只频精品6学生| 久久久久久久久久成人| 亚洲aⅴ乱码一区二区在线播放| 看免费成人av毛片| 美女内射精品一级片tv| 欧美日韩综合久久久久久| 午夜老司机福利剧场| 三级经典国产精品| 能在线免费看毛片的网站| 国产男女超爽视频在线观看| 一区二区三区乱码不卡18| 免费大片黄手机在线观看| 一级a做视频免费观看| 一级片'在线观看视频| 久久久久性生活片| 久久久久久九九精品二区国产| 又粗又硬又长又爽又黄的视频| 亚洲精品乱码久久久v下载方式| 免费高清在线观看视频在线观看| 亚洲av免费高清在线观看| 岛国毛片在线播放| 欧美性猛交╳xxx乱大交人| 最近最新中文字幕大全电影3| 精华霜和精华液先用哪个| 韩国av在线不卡| 两个人的视频大全免费| 丰满少妇做爰视频| 一个人看的www免费观看视频| 五月玫瑰六月丁香| 亚洲图色成人| 深夜a级毛片| 三级毛片av免费| 午夜福利网站1000一区二区三区| 性插视频无遮挡在线免费观看| 中文资源天堂在线| 又粗又硬又长又爽又黄的视频| 日日啪夜夜爽| 亚洲成人中文字幕在线播放| 三级毛片av免费| av天堂中文字幕网| 91在线精品国自产拍蜜月| 亚洲精华国产精华液的使用体验| 2022亚洲国产成人精品| av国产久精品久网站免费入址| 亚洲av中文字字幕乱码综合| 亚洲av福利一区| 日韩欧美国产在线观看| 国产成人精品福利久久| 国产精品精品国产色婷婷| 精品一区二区三卡| 亚洲欧美成人综合另类久久久| 国产成人aa在线观看| 大陆偷拍与自拍| 亚洲欧美日韩卡通动漫| 久久久精品免费免费高清| 精品国产三级普通话版| 天堂俺去俺来也www色官网 | 午夜福利高清视频| 亚洲va在线va天堂va国产| 亚洲,欧美,日韩| 亚洲国产欧美人成| 又爽又黄a免费视频| 91aial.com中文字幕在线观看| 日韩亚洲欧美综合| 国产高清不卡午夜福利| 日韩成人av中文字幕在线观看| 国产免费又黄又爽又色| 久久久久精品久久久久真实原创| 人妻系列 视频| 国内少妇人妻偷人精品xxx网站| 亚洲国产最新在线播放| 国产伦一二天堂av在线观看| 一级a做视频免费观看| 伊人久久国产一区二区| 国产一区二区三区av在线| 乱系列少妇在线播放| 九九在线视频观看精品| 搡老妇女老女人老熟妇| 小蜜桃在线观看免费完整版高清| 亚洲精品自拍成人| 在线观看免费高清a一片| 久久久久免费精品人妻一区二区| 天堂√8在线中文| 精品99又大又爽又粗少妇毛片| 亚洲精品,欧美精品| 国产乱来视频区| 男的添女的下面高潮视频| 插阴视频在线观看视频| 欧美不卡视频在线免费观看| 舔av片在线| 成人午夜精彩视频在线观看| 五月玫瑰六月丁香| 久久精品国产亚洲av天美| 免费看a级黄色片| 简卡轻食公司| 人妻夜夜爽99麻豆av| 女人被狂操c到高潮| 亚洲精品aⅴ在线观看| 欧美zozozo另类| 国产亚洲精品av在线| 一级片'在线观看视频| 国产综合懂色| 少妇被粗大猛烈的视频| 国产69精品久久久久777片| 国产午夜福利久久久久久| 亚洲aⅴ乱码一区二区在线播放| 内射极品少妇av片p| 久久久久久国产a免费观看| 青春草视频在线免费观看| 亚洲精品乱久久久久久| 久久精品国产亚洲av天美| 亚洲精品,欧美精品| 欧美成人a在线观看| 亚洲无线观看免费| 夫妻午夜视频| 日韩一区二区视频免费看| 亚洲av福利一区| 免费黄频网站在线观看国产| 日本与韩国留学比较| 久久精品夜色国产| 国产精品一区二区性色av| 91久久精品国产一区二区成人| 黄色配什么色好看| 91在线精品国自产拍蜜月| 内射极品少妇av片p| 久久综合国产亚洲精品| 免费av观看视频| 国产亚洲午夜精品一区二区久久 | 赤兔流量卡办理| 久久久久久久午夜电影| 美女被艹到高潮喷水动态| 少妇的逼好多水| 成人综合一区亚洲| 国产精品人妻久久久影院| 日韩欧美国产在线观看| 免费av毛片视频| 日日啪夜夜爽| 一级毛片 在线播放| 国产在线一区二区三区精| 成人国产麻豆网| 亚洲精品乱码久久久v下载方式| 亚洲美女视频黄频| 高清在线视频一区二区三区| 婷婷六月久久综合丁香| 国产久久久一区二区三区| 搡女人真爽免费视频火全软件| 麻豆av噜噜一区二区三区| 色网站视频免费| 最近手机中文字幕大全| 国产精品1区2区在线观看.| 最近中文字幕高清免费大全6| 搞女人的毛片| 国产av国产精品国产| 人妻制服诱惑在线中文字幕| 一二三四中文在线观看免费高清| 十八禁网站网址无遮挡 | 99热6这里只有精品| 亚洲精品日韩在线中文字幕| 午夜激情欧美在线| 汤姆久久久久久久影院中文字幕 | 成人高潮视频无遮挡免费网站| 69人妻影院| 黄色一级大片看看| 久久韩国三级中文字幕| 在线a可以看的网站| 最近手机中文字幕大全| 国产av码专区亚洲av| 免费观看的影片在线观看| 大话2 男鬼变身卡| 成年人午夜在线观看视频 | 麻豆国产97在线/欧美| 啦啦啦韩国在线观看视频| 久久久久久国产a免费观看| 国产在线男女| 偷拍熟女少妇极品色| 国产探花极品一区二区| 卡戴珊不雅视频在线播放| 亚洲av二区三区四区| av一本久久久久| 欧美高清成人免费视频www| 狂野欧美激情性xxxx在线观看| 91狼人影院| av在线播放精品| 国产精品人妻久久久久久| 久久久精品94久久精品| 亚洲国产日韩欧美精品在线观看| 乱人视频在线观看| 国产探花极品一区二区| 亚洲aⅴ乱码一区二区在线播放| 国产精品.久久久| 性色avwww在线观看| 亚洲精品aⅴ在线观看| 久久精品夜色国产| 国产三级在线视频| 亚洲av不卡在线观看| 亚洲欧洲国产日韩| 又爽又黄a免费视频| 国产精品人妻久久久影院| 日韩一区二区视频免费看| 亚洲av电影在线观看一区二区三区 | 国产亚洲av嫩草精品影院| 1000部很黄的大片| 非洲黑人性xxxx精品又粗又长| 少妇人妻一区二区三区视频| 18禁动态无遮挡网站| 草草在线视频免费看| 真实男女啪啪啪动态图| 777米奇影视久久| 赤兔流量卡办理| 一夜夜www| 黄色配什么色好看| 性色avwww在线观看| 亚洲第一区二区三区不卡| 成人性生交大片免费视频hd| 亚洲av中文av极速乱| 麻豆精品久久久久久蜜桃| 日韩av在线免费看完整版不卡| 国产人妻一区二区三区在| 免费高清在线观看视频在线观看| 久久99热6这里只有精品| 欧美日韩精品成人综合77777| 亚洲久久久久久中文字幕| 亚洲综合色惰| 啦啦啦韩国在线观看视频| 最近视频中文字幕2019在线8| 亚洲无线观看免费| 欧美zozozo另类| 肉色欧美久久久久久久蜜桃 | 国产亚洲一区二区精品| 久久精品国产自在天天线| 老师上课跳d突然被开到最大视频| 一级片'在线观看视频| 国产亚洲精品av在线| 亚洲国产精品成人综合色| 国产熟女欧美一区二区| 成人性生交大片免费视频hd| 免费看a级黄色片| 国产久久久一区二区三区| 黑人高潮一二区| 久久久欧美国产精品| 日韩成人av中文字幕在线观看| 久久久久久久久久人人人人人人| 男人爽女人下面视频在线观看| 日韩av在线免费看完整版不卡|