• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于Spark的并行ALS協(xié)同過濾算法研究?

    2017-12-18 06:21:49侯敬儒李英娜
    關(guān)鍵詞:內(nèi)存集群分布式

    侯敬儒 吳 晟 李英娜

    (昆明理工大學(xué)信息工程與自動(dòng)化學(xué)院 昆明 650500)

    基于Spark的并行ALS協(xié)同過濾算法研究?

    侯敬儒 吳 晟 李英娜

    (昆明理工大學(xué)信息工程與自動(dòng)化學(xué)院 昆明 650500)

    ALS(最小二乘法)協(xié)同過濾推薦算法是通過矩陣分解進(jìn)行推薦,它通過綜合大量的用戶評(píng)分?jǐn)?shù)據(jù)進(jìn)行計(jì)算,并存儲(chǔ)計(jì)算過程中產(chǎn)生的大量特征矩陣。Hadoop的HA(高可用性)用來解決HDFS分布式文件系統(tǒng)的NameNode單點(diǎn)故障問題。Spark是一種基于內(nèi)存的新型分布式大數(shù)據(jù)計(jì)算框架,具有優(yōu)異的計(jì)算性能。文章基于QJM(Quorum Journal Manager)構(gòu)建了HA下的Hadoop大數(shù)據(jù)平臺(tái),并在Spark計(jì)算框架基礎(chǔ)上研究使用ALS協(xié)同過濾算法,實(shí)現(xiàn)基于ALS協(xié)同過濾算法在Spark上的并行化運(yùn)行;通過和基于Hadoop的MapReduce思想的ALS協(xié)同過濾算法在Netflix數(shù)據(jù)集上的比對(duì)實(shí)驗(yàn)表明,基于Spark平臺(tái)的ALS協(xié)同過濾算法的并行化計(jì)算效率有明顯提升,并且更適合處理海量數(shù)據(jù)。

    ALS;協(xié)同過濾;矩陣分解;High Available;Spark

    1 引言

    當(dāng)前,整個(gè)世界已經(jīng)迎來了大數(shù)據(jù)時(shí)代,在新零售等新興業(yè)態(tài)形式下,互聯(lián)網(wǎng)用戶飛速增長以及互聯(lián)網(wǎng)科技迅猛發(fā)展,在以用戶為中心的信息生產(chǎn)模式下,互聯(lián)網(wǎng)信息爆炸式增長[1],不僅數(shù)據(jù)量越來越大,數(shù)據(jù)類型也越來越大,人們正面臨著嚴(yán)重的“信息過載”問題[2]。目前,解決該問題的技術(shù)主要分為兩類,第一類是信息檢索技術(shù)-搜索引擎,第二類是信息過濾技術(shù)-推薦系統(tǒng)[3]。區(qū)別在于搜索引擎依賴用戶對(duì)信息的準(zhǔn)確描述,而推薦系統(tǒng)則是以用戶歷史行為和數(shù)據(jù)為基點(diǎn),建立相關(guān)數(shù)據(jù)模型從而挖掘出用戶需求和興趣,從而以此為依據(jù)從海量的信息中為用戶篩選出用戶感興趣的信息。由此可見,在用戶需求不明確時(shí),推薦系統(tǒng)的作用顯得尤為重要。

    推薦系統(tǒng)中的協(xié)同過濾推薦技術(shù)簡(jiǎn)單、高效,得到了業(yè)界廣泛的認(rèn)同和應(yīng)用。然而協(xié)同過濾技術(shù)也有缺點(diǎn)和不足,例如可擴(kuò)展的問題、數(shù)據(jù)稀疏的問題、冷啟動(dòng)的問題,這些問題往往會(huì)導(dǎo)致推薦系統(tǒng)的推薦質(zhì)量下降[4]。文章主要介紹的基于Spark的并行ALS協(xié)同過濾推薦算法模型中,通過一組隱性因子來預(yù)測(cè)缺失元素和表達(dá)用戶和商品。其所用的學(xué)習(xí)潛在因子的方法就是交替ALS最小二乘法。

    2 HA(High Available)集群構(gòu)建

    2.1 HA集群特點(diǎn)

    一個(gè)成熟的企業(yè)級(jí)HA集群,在任何時(shí)間,只有一個(gè)NameNode處于活動(dòng)狀態(tài),而另一個(gè)在備份狀態(tài),活動(dòng)狀態(tài)的NameNode會(huì)響應(yīng)集群中所有的客戶端,同時(shí)備份的只是作為一個(gè)副本,保證在必要的時(shí)候提供一個(gè)快速的轉(zhuǎn)移[5]。

    為了使備份的節(jié)點(diǎn)和活動(dòng)的節(jié)點(diǎn)保持一致,兩個(gè)節(jié)點(diǎn)通過一個(gè)特殊的守護(hù)線程相連,這個(gè)線程叫做“JournalNodes”(JNs)。當(dāng)活動(dòng)狀態(tài)的節(jié)點(diǎn)(Active NameNode)因?yàn)樾碌姆植际綉?yīng)用而修改命名空間(NameSpace),它均會(huì)通過線程JNs記錄日志,備用的節(jié)點(diǎn)可以監(jiān)控edit日志的變化,并且通過JNs讀取到變化。備份節(jié)點(diǎn)查看edits可以擁有專門的namespace。在故障轉(zhuǎn)移的時(shí)候備份節(jié)點(diǎn)將在切換至活動(dòng)狀態(tài)前確認(rèn)它從JNs讀取到的所有edits。這個(gè)確認(rèn)的目的是為了保證NameSpace的狀態(tài)和遷移之前是完全同步的。為了提供一個(gè)快速的轉(zhuǎn)移,備份NameNode要求保存著最新的block在集群當(dāng)中的信息。為了能夠得到這個(gè),DataNode都被配置了所有的NameNode的地址,并且發(fā)送block的地址信息和心跳給兩個(gè)node。

    2.2 HA集群配置

    2.2.1 基于QJM(Quorum Journal Manager)配置HA集群原理

    QJM是基于Paxos算法的,如果配置2N+1臺(tái)JournalNode組成的集群,則最多能容忍N(yùn)臺(tái)機(jī)器down機(jī)。QJM的體系結(jié)構(gòu)如圖1所示。

    圖1 QJM體系結(jié)構(gòu)

    用QJM的方式實(shí)現(xiàn)HA的主要好處有以下幾

    點(diǎn):

    1)不再需要單獨(dú)配置Fencing實(shí)現(xiàn),因?yàn)镼JM本身內(nèi)置了Fencing的功能。

    2)不存在單點(diǎn)故障。

    3)系統(tǒng)健壯性的程度是可配置的。

    4)存儲(chǔ)日志的JournalNode不會(huì)因?yàn)槠渲幸慌_(tái)的延遲而影響整體的延遲,也不會(huì)因?yàn)镴ournalNode的數(shù)量增多而影響性能。

    圖2所示為該實(shí)驗(yàn)環(huán)境下由3個(gè)計(jì)算節(jié)點(diǎn),2個(gè)控制節(jié)點(diǎn)組成的HA集群的拓?fù)浣Y(jié)構(gòu)圖例,各個(gè)節(jié)點(diǎn)之間使用局域網(wǎng)連接。

    圖2 集群拓?fù)浣Y(jié)構(gòu)

    2.2.2 環(huán)境配置說明

    ZooKeeper是提供一致性服務(wù)的軟件,它的功能包括:配置維護(hù)、名字服務(wù)、分布式同步、組服務(wù)等[6~7]。該實(shí)驗(yàn)環(huán)境中使用Zookeeper保證Master節(jié)點(diǎn)down機(jī)之后能夠快速切換到StandByMaster,繼續(xù)為集群提供服務(wù),從而使得整個(gè)集群正常工作,同時(shí),也修復(fù)down機(jī)的Master。該環(huán)境部署的HA下的大數(shù)據(jù)實(shí)驗(yàn)平臺(tái)由5臺(tái)機(jī)器構(gòu)成,包括2個(gè)Master節(jié)點(diǎn)和3個(gè)Worker節(jié)點(diǎn),節(jié)點(diǎn)之間局域網(wǎng)連接。

    該環(huán)境以Hadoop的HDFS為基礎(chǔ)存儲(chǔ)框架,主要以Spark為計(jì)算框架,Zookeeper統(tǒng)籌HA下的大數(shù)據(jù)平臺(tái),管理整個(gè)集群配置。具體5個(gè)節(jié)點(diǎn)的具體功能如表1所示。

    表1 節(jié)點(diǎn)功能

    2.2.3 修改Zookeeper配置過程

    1)確定Zookeeper的數(shù)據(jù)存放位置,并且設(shè)定server的端口,響應(yīng)時(shí)間等:

    vim zoo.cfg

    dataDir=/home/sparker/zookeeper-3.4.5/data

    server.1=sparker000:2888:3888

    server.2=sparker001:2888:3888

    server.3=sparker005:2888:3888

    tickTime=2000

    initLimit=5

    syncLimit=2

    clientPort=2181

    2)新建data文件夾:

    /home/sparker000/zookeeper/下新建 data文件夾,然后在該文件夾下新建文件,文件名為myid,向其中加入server.1/2/3中的值,此處填1。

    3)將安裝完的Zookeeper分發(fā)到其他機(jī)器:

    由于我們只在一臺(tái)機(jī)器上安裝了Zookeeper,所以需要將配置好的文件分發(fā)到其他的機(jī)器上,使用scp命令:

    scp/-r/zookeeper-3.4.5 192.168.1.101:/home/sparker001/scp/-r/zookeeper-3.4.5 192.168.1.102:/home/sparker002/

    修改101/102上中/data/myid的值。與server后面的值對(duì)應(yīng)。在101中myid修改為2,在102中myid修改為3。

    4)修改profile文件:

    修改/etc/profile系統(tǒng)環(huán)境變量配置文件,加入zookeeper的環(huán)境變量

    exportZOOKEEPER_HOME=/home/sparker000/zookeeper-3.4.5

    exportPATH=$PATH:$ZOOKEEPER_HOME/bin

    2.3 分布式計(jì)算框架-Spark

    Apache Spark官方的定義為:Spark是一個(gè)通用的大規(guī)模數(shù)據(jù)快速處理引擎[8]??梢院?jiǎn)單理解為Spark就是一個(gè)大數(shù)據(jù)分布式處理框架[8]。相比于傳統(tǒng)的以Hadoop為基石的第一代大數(shù)據(jù)技術(shù)生態(tài)系統(tǒng)而言,Spark無論是性能還是方案的統(tǒng)一性都具有極為顯著的優(yōu)勢(shì)。在Spark中,數(shù)據(jù)集的劃分和任務(wù)的調(diào)度都是系統(tǒng)自動(dòng)完成的,其工作流程如圖3所示。

    圖3 Spark工作流程

    其中,Driver是用戶編寫的Spark程序(用戶編寫的數(shù)據(jù)處理邏輯),這個(gè)邏輯中包含用戶創(chuàng)建的SparkContext。SparkContext是用戶邏輯與Spark集群主要的交互接口,它會(huì)和Cluster Manager交互,包括向它申請(qǐng)計(jì)算資源等。Cluster Manager負(fù)責(zé)集群的資源管理和調(diào)度,現(xiàn)在支持Standalone、Apache Mesos和Hadoop的Yarn。工作節(jié)點(diǎn)(Worker Node)是集群中可以執(zhí)行計(jì)算任務(wù)的節(jié)點(diǎn)。Executor是在一個(gè)工作節(jié)點(diǎn)(Worker Node)上為某分布式應(yīng)用程序啟動(dòng)的一個(gè)負(fù)責(zé)運(yùn)行任務(wù)的進(jìn)程,并且負(fù)責(zé)將所需要的數(shù)據(jù)存在內(nèi)存或者磁盤上。每個(gè)應(yīng)用都有各自獨(dú)立的Executor,計(jì)算最終在計(jì)算節(jié)點(diǎn)的Executor中執(zhí)行[9]。

    3 基于Spark的ALS協(xié)同過濾算法研究

    3.1 ALS協(xié)同過濾算法

    基于矩陣分解模型的協(xié)同過濾推薦算法主要有:SVD(奇異值分解)和ALS[10]。下面就ALS算法理論做一個(gè)介紹。

    對(duì)于Sm×n矩陣,ALS主要是找到2個(gè)低維矩陣Xm×k和Yn×k來近似逼近 Sm×n,即:

    其中Sm×n表示用戶對(duì)產(chǎn)品的偏好評(píng)分矩陣,Xm×k代表用戶對(duì)隱含特征的偏好矩陣,Yn×k表示產(chǎn)品所包含的隱含特征矩陣。通常取k?min(m,n),也就是相當(dāng)于降維了。

    為了找到使矩陣X和Y盡可能地?zé)o限接近S,需要最小化平方誤差損失函數(shù):

    其中 Xi表示用戶i的偏好的隱含特征向量,yj表示商品 j包含的隱含特征向量,sij表示用戶i對(duì)商品 j的偏好評(píng)分,xiyjT是用戶i對(duì)商品 j偏好評(píng)分的近似,λ表示正則化項(xiàng)的系數(shù)。其求解方法如下:

    先固定Y,將誤差損失函數(shù)L(X,Y)對(duì) Xi求偏導(dǎo),并另導(dǎo)數(shù)=0,得到:

    同理固定X,可得:

    其中 xi是S的第i行,xj是S的第 j列,E是k×k的單位矩陣。

    其迭代步驟是:首先隨機(jī)初始化Y,利用式(3)更新得到 X,然后利用式(4)更新Y,直到RMSE(均方根誤差)變化很小或者到達(dá)最大迭代次數(shù)為止[11]。其RMSE的計(jì)算公式如下:

    8)While iter<setValue//依據(jù)設(shè)定的次數(shù)迭代計(jì)算

    9)Update user//更新User的因子矩陣

    10)RDD[(Int,Array[Array[Double]])]?

    11)Update item//更新Item的因子矩陣

    12)End while

    3.2 基于Spark的ALS協(xié)同過濾算法并行化實(shí)現(xiàn)

    輸入:評(píng)分?jǐn)?shù)據(jù)

    輸出:矩陣分解模型

    算法基本邏輯步驟如下:

    1)var partitionNum//設(shè)置分區(qū)數(shù)

    2)var sc=new SparkContext()

    3)讀入數(shù)據(jù)生成

    Ratings:RDD[Rating],Ratings是序列

    <user:Int,Item:Int,rating:Double>

    4)依據(jù)用戶設(shè)置或者默認(rèn)的并行化數(shù)生成RatingsOfUserBlock、RatingsOfItemBlock的

    RatingsOfUserBlock:Rating<u,p,R>—→——map<u,u,p,r>

    RatingsOfItemBlock:Rating<u,p,R><p,p,u,r>

    5)生成基于User或者Item的InLinkRDD(內(nèi)連接信息)和OutLinkRDD(外連接信息)

    6)將內(nèi)外連接信息cache到內(nèi)存中,減少磁盤I/O

    7)初始化用戶-項(xiàng)目因子矩陣

    4 實(shí)驗(yàn)結(jié)果分析

    4.1 實(shí)驗(yàn)數(shù)據(jù)集

    本實(shí)驗(yàn)采用Netflix發(fā)布的電影評(píng)分?jǐn)?shù)據(jù)集(TrainingSet、ProbeSetQualifyingSet)。該數(shù)據(jù)集包括用戶數(shù):480189,電影數(shù):17770,評(píng)分?jǐn)?shù):103297638。其中,評(píng)分值都是整數(shù)值(1~5之間),分?jǐn)?shù)越高則客戶對(duì)相應(yīng)電影的評(píng)分就越高。本實(shí)驗(yàn)分為兩組,第一組使用整個(gè)數(shù)據(jù)集(665MB)為DataSet1;第二組隨機(jī)抽取5000萬條數(shù)據(jù)(330MB)作為DataSet2。將DataSet1、DataSet2分別分成兩部分,其中90%歸為訓(xùn)練數(shù)據(jù)集,10%歸為測(cè)試數(shù)據(jù)集。

    4.2 結(jié)果分析

    文中分別做了兩組實(shí)驗(yàn),即基于ALS的協(xié)同過濾算法分別在基于Hadoop的MapReduce集群上和基于RDD的Spark集群上并行化實(shí)現(xiàn)?;贏LS的協(xié)同過濾算法模型中有兩個(gè)參數(shù):特征個(gè)數(shù)(復(fù)數(shù)范圍內(nèi),矩陣的階數(shù)和特征值個(gè)數(shù)是對(duì)應(yīng)的)、迭代次數(shù)Iteration。

    在第一組實(shí)驗(yàn)中,數(shù)據(jù)集采用DataSet1,設(shè)定默認(rèn)特征個(gè)數(shù)為20,Iteration迭代次數(shù)依次為1、10、20、30、40、50,分別在集群上的實(shí)驗(yàn)結(jié)果如圖4所示。

    圖4 DataSet1

    由圖4可以看出,隨著Iteration的增加,基于ALS的協(xié)同過濾算法分別在兩種集群上的運(yùn)行時(shí)間比例也在增加,當(dāng)?shù)螖?shù)Iteration增加為50時(shí),比例為3.3。由圖4可知,當(dāng)?shù)螖?shù)設(shè)置為1次時(shí),ALS協(xié)同過濾算法在基于Hadoop的MapReduce集群上運(yùn)行時(shí)間比在基于內(nèi)存的Spark集群上的運(yùn)行時(shí)間短,原因是ALS協(xié)同過濾算法在基于內(nèi)存的集群上的第一次迭代與基于Hadoop的MapReduce一樣,需要?jiǎng)?chuàng)建新job,所以在基于內(nèi)存的Spark集群上實(shí)現(xiàn)第一次迭代時(shí)運(yùn)行速度比較慢。據(jù)之前分析,對(duì)基于Hadoop的MapReduce實(shí)現(xiàn)方式,每迭代一次就需要?jiǎng)?chuàng)建一個(gè)新的分布式j(luò)ob,如果迭代次數(shù)越多,需要執(zhí)行的分布式j(luò)ob數(shù)量就越多。所以,隨著迭代次數(shù)的增加,基于內(nèi)存的Spark集群上的實(shí)現(xiàn)方式無需建立新的分布式j(luò)ob的優(yōu)勢(shì)得以發(fā)揮,該算法運(yùn)算效率也提高的更明顯。

    在第二組實(shí)驗(yàn)中,數(shù)據(jù)集采用DataSet2,設(shè)定默認(rèn)特征個(gè)數(shù)為20,Iteration迭代次數(shù)依次為1,10,20,30,40,50,分別在集群上的實(shí)驗(yàn)結(jié)果如圖5所示。

    圖5 DataSet2

    由圖5可以看出,同第一組實(shí)驗(yàn),隨著Iteration的增加,基于ALS的協(xié)同過濾算法分別在兩種集群上的運(yùn)行時(shí)間比例也在增加,當(dāng)?shù)螖?shù)Iteration增加為50時(shí),比例為2∶1。據(jù)之前分析可知,數(shù)據(jù)集越大創(chuàng)建新的分布式j(luò)ob所需要的時(shí)間就越久,基于內(nèi)存的Spark集群實(shí)現(xiàn)方式比基于Hadoop的MapReduce實(shí)現(xiàn)方式優(yōu)勢(shì)更加明顯,而第二組實(shí)驗(yàn)數(shù)據(jù)集DataSet2比第一組實(shí)驗(yàn)數(shù)據(jù)集DataSet1小,故第二組實(shí)驗(yàn)比第一組實(shí)驗(yàn)運(yùn)行效率提高的比例小。

    通過以上兩組實(shí)驗(yàn),可以看出當(dāng)數(shù)據(jù)集越大,算法設(shè)置的迭代次數(shù)Iteration越多,并行ALS協(xié)同過濾算法在基于內(nèi)存的Spark集群上的運(yùn)算效率提高的就越多。

    5 結(jié)語

    文章構(gòu)建了基于QJM的HA下的大數(shù)據(jù)平臺(tái),并通過對(duì)基于ALS即交替最小二乘法的協(xié)同過濾算法進(jìn)行研究,將基于ALS的協(xié)同過濾算法分別在基于Hadoop的MapReduce和基于內(nèi)存的Spark上并行化實(shí)現(xiàn),在Netflix數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),結(jié)果表明通過在基于內(nèi)存的Spark集群上提高了基于ALS協(xié)同過濾算法的分布式計(jì)算效率。

    由于實(shí)驗(yàn)數(shù)據(jù)量還不夠大,還不能看出基于內(nèi)存的Spark對(duì)計(jì)算效率的顯著提升,據(jù)之前的原理分析可知,如果數(shù)據(jù)量越大,基于內(nèi)存的Spark計(jì)算效率的提升就會(huì)越明顯。Spark作為基于內(nèi)存的分布式數(shù)據(jù)處理框架,接下來需要展開的研究如下:1)智能化ALS模型訓(xùn)練參數(shù)的選擇,幫助我們自動(dòng)選擇最優(yōu)參數(shù);2)基于Spark Streaming的ALS協(xié)同過濾算法研究。

    [1]鄧鵬,李枚毅,何誠.Namenode單點(diǎn)故障解決方案研究[J].計(jì)算機(jī)工程,2012,38(21):40-44.DENG Peng,LI Meiyi,HE Cheng.Research on Namenode Single Point of Fault Solution[J].Computer Engineering,2012,38(21):40-44.

    [2]楊帆.Hadoop平臺(tái)高可用性方案的設(shè)計(jì)與實(shí)現(xiàn)[D].北京:北京郵電大學(xué),2012.YANG Fan.Design and Implementation of High Availability Solution for Hadoop[D].Beijing:Beijing University Of Posts And Telecommunications,2012.

    [3]黃強(qiáng),沈奇威,李煒.Hadoop高可用解決方案研究[J].電信技術(shù),2015(11):16-19.HUANG Qiang,SHEN Qiwei,LI Wei.Research on High Availability Solution for Hadoop[J].Telecommunications Technology,2015(11):16-19.

    [4]張宇,程久軍.基于MapReduce的矩陣分解推薦算法研究[J].計(jì)算機(jī)科學(xué),2013,631-632(1):138-141.ZHANG Yu,CHENG Jiujun.Study on Recommendation Algorithm with Matrix Factorization Method Based on MapReduce[J].Computer Science,2013,631-632(1):138-141.

    [5]劉青文.基于協(xié)同過濾的推薦算法研究[D].合肥:中國科學(xué)技術(shù)大學(xué),2013.LIU Qingwen.Research on Recommender Systems based on Collaborative Filtering[D].Hefei:University of Science and Technology of China,2013.

    [6]劉強(qiáng).協(xié)同過濾推薦系統(tǒng)中的關(guān)鍵算法研究[D].杭州:浙江大學(xué),2013.LIU Qiang.Study on key algorithms in Collaborative Filtering Recommender Systems[D].Hangzhou:Zhejiang University,2013.

    [7]原默晗,唐晉韜,王挺.一種高效的分布式相似短文本聚類算法[J].計(jì)算機(jī)與數(shù)字工程,2016,44(5):895-900.YUAN Mohan,TANG Jintao,WANG Ting.An Efficient Distributed Similar Short Texts Clustering Algorithm[J].Computer&Digital Engineering,2016,44(5):895-900.

    [8]孫遠(yuǎn)帥.基于大數(shù)據(jù)的推薦算法研究[D].廈門:廈門大學(xué),2014.SUN Yuanshuai.Recommendation Algorithms in the Big Data Era[D].Xiamen:Xiamen University,2014.

    [9]鄧雄杰.基于Hadoop的推薦系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D].廣州:華南理工大學(xué),2013.DENG Xiongjie.The Design and Implementation of Recommendation System based on Hadoop[D].Guangzhou:South China University of Technology,2013.

    [10]鄭鳳飛,黃文培,賈明正.基于Spark的矩陣分解推薦算法[J].計(jì)算機(jī)應(yīng)用,2015,35(10):2781-2783.ZHENG Fengfei,HUANG Wenpei,JIA Mingzheng.Matrix factorization recommendation algorithm based on Spark[J].Journal of Computer Applications,2015,35(10):2781-2783.

    [11]陳夢(mèng)杰,陳勇旭,賈益斌,等.基于Hadoop的大數(shù)據(jù)查詢系統(tǒng)簡(jiǎn)述[J].計(jì)算機(jī)與數(shù)字工程,2013,41(12):1939-1942.CHEN Mengjie,CHEN Yongxu,JIA Yibin,et al.A Brief Introduction Hadoop—based Big Data Query System[J].Computer& DigitalEngineering,2013,41(12) :1939-1942.

    Research on Parallel Als Algorithm Based on Spark

    HOU Jingru WU Sheng LI Yingna
    (Kunming University of Science and Technology,School of Information Engineering and Automation,Kunming 650500)

    ALS(least square)is a collaborative filtering recommendation algorithm recommended by matrix decomposition,it is calculated by a combination of a large number of user rating data,and stored the calculation process of a large number of characteristic matrix.Hadoop-HA(High Available)is used to solve the problem of the single point of failure of the NameNode.The Spark is a computing framework based on new type of large data come up with distributed memory,at the same time it has excellent computing performance.This study uses the QJM(Quorum Journal Manager)to construct the HA Hadoop big data platform.In this study,uses the ALS collaborative filtering algorithm with the spark coding Framework,at the same time,this study realizes the ALS collaborative filtering algorithm based on the Spark of parallel operation.Through the comparation experiments(the ALS collaborative filtering algorithm based on Hadoop graphs thought and the Netflix data set),the study based on Spark platform of parallel computation is more efficiency.It is more suitable for processing huge amounts of data.

    ALS,collaborative filtering,Matrix decomposition,High Available,Spark

    TP301

    10.3969/j.issn.1672-9722.2017.11.024

    Class Number TP301

    2017年5月12日,

    2017年6月14日

    國家自然科學(xué)基金項(xiàng)目(編號(hào):51467007)資助。

    侯敬儒,男,碩士研究生,研究方向:數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)。

    猜你喜歡
    內(nèi)存集群分布式
    海上小型無人機(jī)集群的反制裝備需求與應(yīng)對(duì)之策研究
    “春夏秋冬”的內(nèi)存
    一種無人機(jī)集群發(fā)射回收裝置的控制系統(tǒng)設(shè)計(jì)
    電子制作(2018年11期)2018-08-04 03:25:40
    分布式光伏熱錢洶涌
    能源(2017年10期)2017-12-20 05:54:07
    分布式光伏:爆發(fā)還是徘徊
    能源(2017年5期)2017-07-06 09:25:54
    Python與Spark集群在收費(fèi)數(shù)據(jù)分析中的應(yīng)用
    勤快又呆萌的集群機(jī)器人
    基于DDS的分布式三維協(xié)同仿真研究
    西門子 分布式I/O Simatic ET 200AL
    基于內(nèi)存的地理信息訪問技術(shù)
    国产精品国产三级国产专区5o| 国产成人午夜福利电影在线观看| 18+在线观看网站| 国产成人精品久久久久久| 久久99精品国语久久久| 免费高清在线观看视频在线观看| 中文字幕色久视频| 免费日韩欧美在线观看| 国产xxxxx性猛交| 久久久国产精品麻豆| 香蕉国产在线看| 成人国语在线视频| 国语对白做爰xxxⅹ性视频网站| 飞空精品影院首页| 99国产精品免费福利视频| 亚洲精品自拍成人| 午夜久久久在线观看| 大片免费播放器 马上看| 婷婷色av中文字幕| 18禁国产床啪视频网站| 中文欧美无线码| 大码成人一级视频| 国产在视频线精品| 日本欧美视频一区| 丝袜美腿诱惑在线| 欧美精品国产亚洲| 欧美日韩av久久| 久久久久久久亚洲中文字幕| 国产免费福利视频在线观看| 国产精品免费大片| 日韩 亚洲 欧美在线| 天天影视国产精品| 成人毛片a级毛片在线播放| 色婷婷av一区二区三区视频| 国产在视频线精品| 精品国产一区二区三区四区第35| 一级片免费观看大全| 久久久国产一区二区| 春色校园在线视频观看| 国产色婷婷99| 人成视频在线观看免费观看| 伦理电影免费视频| 天堂俺去俺来也www色官网| 精品人妻在线不人妻| 天天操日日干夜夜撸| 国产精品人妻久久久影院| 久久精品国产综合久久久| 在线亚洲精品国产二区图片欧美| 18禁国产床啪视频网站| 最黄视频免费看| 国产一区二区 视频在线| 国产精品免费视频内射| 欧美黄色片欧美黄色片| 久久久久精品久久久久真实原创| 精品久久久精品久久久| 男女无遮挡免费网站观看| 寂寞人妻少妇视频99o| 久久久久视频综合| 9热在线视频观看99| av在线老鸭窝| 在线天堂中文资源库| 午夜av观看不卡| 在线观看美女被高潮喷水网站| 亚洲精品第二区| 午夜免费男女啪啪视频观看| 两性夫妻黄色片| 黑人欧美特级aaaaaa片| 久久精品国产亚洲av天美| 伦理电影大哥的女人| 最黄视频免费看| 黄色毛片三级朝国网站| 中文字幕亚洲精品专区| 成人亚洲欧美一区二区av| 国产一区二区在线观看av| 91精品国产国语对白视频| 18禁观看日本| 在线天堂最新版资源| 久久久精品国产亚洲av高清涩受| 午夜91福利影院| 亚洲精品一区蜜桃| 国产福利在线免费观看视频| 国产片内射在线| 在线免费观看不下载黄p国产| 亚洲精华国产精华液的使用体验| 一区在线观看完整版| 综合色丁香网| 熟妇人妻不卡中文字幕| 国产成人精品在线电影| 可以免费在线观看a视频的电影网站 | 看免费成人av毛片| 欧美日韩视频精品一区| 天天躁日日躁夜夜躁夜夜| 精品亚洲成国产av| 午夜福利在线观看免费完整高清在| 爱豆传媒免费全集在线观看| 国产黄色视频一区二区在线观看| 伦精品一区二区三区| 制服诱惑二区| 久久精品国产综合久久久| 久久久国产欧美日韩av| 国产免费福利视频在线观看| 亚洲国产精品一区三区| 日韩中文字幕欧美一区二区 | 久久久久久久亚洲中文字幕| 日韩一本色道免费dvd| 国产精品免费大片| 黄色 视频免费看| 成人免费观看视频高清| 欧美精品国产亚洲| 另类精品久久| 成人亚洲欧美一区二区av| 十分钟在线观看高清视频www| 最近手机中文字幕大全| 18禁国产床啪视频网站| 香蕉国产在线看| xxxhd国产人妻xxx| 丝袜喷水一区| 男女边摸边吃奶| 久久久久人妻精品一区果冻| 三上悠亚av全集在线观看| 老司机影院毛片| 色吧在线观看| 777久久人妻少妇嫩草av网站| 亚洲人成网站在线观看播放| 69精品国产乱码久久久| 一级毛片我不卡| 巨乳人妻的诱惑在线观看| 男的添女的下面高潮视频| 男女国产视频网站| 亚洲精品中文字幕在线视频| 精品国产露脸久久av麻豆| 777米奇影视久久| 欧美日韩精品网址| 精品酒店卫生间| 国产一区二区在线观看av| 高清欧美精品videossex| 精品国产一区二区三区四区第35| 成人黄色视频免费在线看| 在线天堂最新版资源| 99香蕉大伊视频| 2022亚洲国产成人精品| 精品人妻在线不人妻| 国产激情久久老熟女| 国产精品99久久99久久久不卡 | 啦啦啦在线免费观看视频4| 欧美日韩亚洲高清精品| 在线观看免费高清a一片| 多毛熟女@视频| 亚洲av男天堂| 亚洲男人天堂网一区| 丰满迷人的少妇在线观看| 99精国产麻豆久久婷婷| 亚洲av综合色区一区| 视频在线观看一区二区三区| 美女视频免费永久观看网站| 在线观看三级黄色| 久久久精品免费免费高清| 色播在线永久视频| 在线观看免费日韩欧美大片| 在线观看免费视频网站a站| 亚洲欧美一区二区三区久久| 纵有疾风起免费观看全集完整版| 日韩免费高清中文字幕av| 免费女性裸体啪啪无遮挡网站| 麻豆精品久久久久久蜜桃| 免费播放大片免费观看视频在线观看| 波多野结衣av一区二区av| 观看美女的网站| 视频区图区小说| 青春草视频在线免费观看| 免费观看性生交大片5| 亚洲美女黄色视频免费看| 在线观看一区二区三区激情| 精品久久久精品久久久| 国产亚洲欧美精品永久| 美女高潮到喷水免费观看| 日日撸夜夜添| 人体艺术视频欧美日本| 久久久久久久国产电影| 美女xxoo啪啪120秒动态图| 欧美xxⅹ黑人| 久久久久国产精品人妻一区二区| 天堂8中文在线网| 黄片无遮挡物在线观看| 99re6热这里在线精品视频| 2021少妇久久久久久久久久久| 日韩中文字幕视频在线看片| 亚洲欧美精品自产自拍| 乱人伦中国视频| 人妻人人澡人人爽人人| 最近最新中文字幕免费大全7| 国产xxxxx性猛交| av电影中文网址| 91aial.com中文字幕在线观看| 欧美97在线视频| 亚洲综合精品二区| 男女边吃奶边做爰视频| 久久久精品免费免费高清| 最近的中文字幕免费完整| 99热国产这里只有精品6| 人人妻人人澡人人爽人人夜夜| 999精品在线视频| 综合色丁香网| 只有这里有精品99| 成年女人在线观看亚洲视频| 亚洲一区中文字幕在线| 亚洲av福利一区| 天堂中文最新版在线下载| 欧美精品国产亚洲| 亚洲成色77777| 中文字幕人妻丝袜一区二区 | 黑人欧美特级aaaaaa片| av免费在线看不卡| 亚洲av成人精品一二三区| 五月伊人婷婷丁香| 日韩av不卡免费在线播放| 久久久久久久久久久免费av| 国产乱人偷精品视频| 婷婷色av中文字幕| 性色av一级| 妹子高潮喷水视频| 最近中文字幕高清免费大全6| 中文字幕最新亚洲高清| 日韩av免费高清视频| 久久99热这里只频精品6学生| 久久 成人 亚洲| 日本色播在线视频| av在线观看视频网站免费| 寂寞人妻少妇视频99o| 亚洲国产精品一区二区三区在线| 精品国产乱码久久久久久男人| 日韩,欧美,国产一区二区三区| 久久这里有精品视频免费| 韩国精品一区二区三区| 国产日韩欧美亚洲二区| 人妻少妇偷人精品九色| 又黄又粗又硬又大视频| 亚洲国产欧美在线一区| 一本色道久久久久久精品综合| 国产黄频视频在线观看| 永久免费av网站大全| 久久精品国产亚洲av高清一级| 一级片免费观看大全| 中国国产av一级| 性色av一级| 色94色欧美一区二区| 色网站视频免费| 日本av免费视频播放| 国产亚洲最大av| 卡戴珊不雅视频在线播放| 国产精品久久久久成人av| 亚洲三区欧美一区| 国产精品久久久av美女十八| 自线自在国产av| 成人亚洲欧美一区二区av| 精品国产一区二区久久| 久久午夜综合久久蜜桃| 亚洲婷婷狠狠爱综合网| 欧美精品亚洲一区二区| 天天躁夜夜躁狠狠躁躁| 亚洲国产精品999| 人成视频在线观看免费观看| 免费观看av网站的网址| 久久99精品国语久久久| 69精品国产乱码久久久| 国产一区二区在线观看av| 成年女人毛片免费观看观看9 | 国产一区二区三区综合在线观看| tube8黄色片| 亚洲国产日韩一区二区| 日韩,欧美,国产一区二区三区| 国产 一区精品| 亚洲精品乱久久久久久| 午夜免费鲁丝| 亚洲婷婷狠狠爱综合网| 亚洲色图综合在线观看| 亚洲精品国产av成人精品| 国产精品蜜桃在线观看| 亚洲,欧美精品.| 亚洲第一区二区三区不卡| 午夜av观看不卡| 观看美女的网站| 啦啦啦啦在线视频资源| 精品一品国产午夜福利视频| 黑丝袜美女国产一区| 国产深夜福利视频在线观看| 99香蕉大伊视频| 在线观看一区二区三区激情| 亚洲精品一二三| 人体艺术视频欧美日本| 寂寞人妻少妇视频99o| 男人操女人黄网站| 国产一区亚洲一区在线观看| 成人影院久久| 韩国av在线不卡| 国产在线免费精品| 如日韩欧美国产精品一区二区三区| 国产麻豆69| 亚洲 欧美一区二区三区| 久久久久网色| 高清在线视频一区二区三区| 在线天堂最新版资源| 菩萨蛮人人尽说江南好唐韦庄| 在线观看免费高清a一片| 欧美 亚洲 国产 日韩一| 女人高潮潮喷娇喘18禁视频| 日本黄色日本黄色录像| 超色免费av| 亚洲综合色惰| 国语对白做爰xxxⅹ性视频网站| 亚洲三区欧美一区| 国产精品不卡视频一区二区| 纵有疾风起免费观看全集完整版| av片东京热男人的天堂| 国产在视频线精品| 丝瓜视频免费看黄片| 熟女电影av网| 国产亚洲欧美精品永久| 欧美日韩av久久| 久久狼人影院| 伦理电影大哥的女人| 欧美xxⅹ黑人| 日韩三级伦理在线观看| 一本久久精品| 建设人人有责人人尽责人人享有的| 成人二区视频| 中文字幕人妻丝袜一区二区 | 亚洲五月色婷婷综合| 宅男免费午夜| 国产精品国产三级专区第一集| 制服人妻中文乱码| 亚洲精品中文字幕在线视频| 十八禁网站网址无遮挡| 日本wwww免费看| 亚洲国产欧美网| 国产乱人偷精品视频| 久久精品人人爽人人爽视色| 日本色播在线视频| 黄色怎么调成土黄色| 日韩 亚洲 欧美在线| 久久精品aⅴ一区二区三区四区 | 视频区图区小说| av在线播放精品| 超碰97精品在线观看| av视频免费观看在线观看| 母亲3免费完整高清在线观看 | 丰满少妇做爰视频| 久久久久久久大尺度免费视频| 看十八女毛片水多多多| 免费在线观看黄色视频的| xxxhd国产人妻xxx| 国产精品一二三区在线看| 赤兔流量卡办理| 纵有疾风起免费观看全集完整版| 国产男人的电影天堂91| 亚洲av免费高清在线观看| 男女无遮挡免费网站观看| 丝袜美腿诱惑在线| 亚洲av.av天堂| 美国免费a级毛片| 久久久a久久爽久久v久久| 在线天堂最新版资源| 亚洲av福利一区| 美女国产高潮福利片在线看| 久久精品aⅴ一区二区三区四区 | 大码成人一级视频| a级毛片黄视频| 日韩一区二区视频免费看| 久久精品亚洲av国产电影网| 我的亚洲天堂| 国产一级毛片在线| 成人亚洲欧美一区二区av| 777米奇影视久久| 久久人人爽人人片av| 精品酒店卫生间| 成人国语在线视频| 久久久久网色| 青春草视频在线免费观看| 天天躁夜夜躁狠狠久久av| 亚洲av电影在线观看一区二区三区| 欧美成人精品欧美一级黄| 精品国产一区二区三区久久久樱花| av又黄又爽大尺度在线免费看| 免费日韩欧美在线观看| 精品一区二区三卡| 最新的欧美精品一区二区| 久久韩国三级中文字幕| 精品亚洲成国产av| 国产福利在线免费观看视频| 免费av中文字幕在线| 美女视频免费永久观看网站| 亚洲中文av在线| 精品午夜福利在线看| 丰满饥渴人妻一区二区三| 国产男女超爽视频在线观看| 国产激情久久老熟女| 国产精品久久久久久精品古装| 岛国毛片在线播放| 99久久中文字幕三级久久日本| 最近2019中文字幕mv第一页| 国产一区二区三区综合在线观看| 久久久精品国产亚洲av高清涩受| 热99国产精品久久久久久7| 少妇的逼水好多| 久久99蜜桃精品久久| 汤姆久久久久久久影院中文字幕| 色哟哟·www| 久久久精品区二区三区| 久久鲁丝午夜福利片| 两性夫妻黄色片| 欧美日韩国产mv在线观看视频| 国产深夜福利视频在线观看| 成人毛片60女人毛片免费| 成人18禁高潮啪啪吃奶动态图| 免费黄网站久久成人精品| 国产成人精品久久久久久| 欧美另类一区| 中文字幕制服av| 你懂的网址亚洲精品在线观看| 男女国产视频网站| www.自偷自拍.com| 久久免费观看电影| 看免费av毛片| 国产一区有黄有色的免费视频| 视频在线观看一区二区三区| 国精品久久久久久国模美| 免费少妇av软件| 26uuu在线亚洲综合色| 亚洲一区中文字幕在线| 久久鲁丝午夜福利片| 亚洲一级一片aⅴ在线观看| 黄网站色视频无遮挡免费观看| 大话2 男鬼变身卡| 中文字幕av电影在线播放| 天天躁狠狠躁夜夜躁狠狠躁| 男的添女的下面高潮视频| 高清不卡的av网站| 亚洲av在线观看美女高潮| 日韩av在线免费看完整版不卡| 一二三四中文在线观看免费高清| 精品亚洲成a人片在线观看| 日本-黄色视频高清免费观看| 激情五月婷婷亚洲| 国产在线一区二区三区精| 亚洲一区二区三区欧美精品| 亚洲国产最新在线播放| 国产亚洲精品第一综合不卡| 美女大奶头黄色视频| 日日爽夜夜爽网站| 久久精品熟女亚洲av麻豆精品| 精品国产一区二区久久| 免费在线观看视频国产中文字幕亚洲 | 一边摸一边做爽爽视频免费| 美女国产高潮福利片在线看| 捣出白浆h1v1| 亚洲一级一片aⅴ在线观看| 日韩中文字幕欧美一区二区 | 制服人妻中文乱码| 99久久人妻综合| 日韩av在线免费看完整版不卡| 久久韩国三级中文字幕| 80岁老熟妇乱子伦牲交| av免费观看日本| 国产精品熟女久久久久浪| 91精品三级在线观看| 各种免费的搞黄视频| 亚洲av综合色区一区| 亚洲成人av在线免费| 成人18禁高潮啪啪吃奶动态图| 天天躁狠狠躁夜夜躁狠狠躁| 如日韩欧美国产精品一区二区三区| 亚洲欧美清纯卡通| 亚洲第一青青草原| 777米奇影视久久| 自线自在国产av| 这个男人来自地球电影免费观看 | 久久 成人 亚洲| 精品一品国产午夜福利视频| 成人国产麻豆网| 久久人人爽人人片av| 精品国产乱码久久久久久男人| 亚洲国产精品一区三区| 免费黄频网站在线观看国产| 精品人妻偷拍中文字幕| 精品国产国语对白av| 亚洲,欧美精品.| 在线观看三级黄色| 中文字幕亚洲精品专区| 亚洲av国产av综合av卡| 精品国产国语对白av| 不卡视频在线观看欧美| 国产av一区二区精品久久| 国产野战对白在线观看| 制服诱惑二区| 97人妻天天添夜夜摸| 精品国产露脸久久av麻豆| 成人影院久久| 国产一区有黄有色的免费视频| 五月伊人婷婷丁香| 最近2019中文字幕mv第一页| 久久国产精品大桥未久av| 午夜免费鲁丝| 国产午夜精品一二区理论片| 国产男女内射视频| 欧美在线黄色| 国产精品亚洲av一区麻豆 | 老司机影院成人| kizo精华| 大码成人一级视频| 久久久久久人妻| 波多野结衣一区麻豆| 日本欧美国产在线视频| 亚洲中文av在线| 看免费av毛片| 另类亚洲欧美激情| 日韩制服骚丝袜av| 在线观看www视频免费| 永久免费av网站大全| 一二三四中文在线观看免费高清| 免费看不卡的av| 欧美日韩亚洲国产一区二区在线观看 | 巨乳人妻的诱惑在线观看| 国产成人91sexporn| 日日啪夜夜爽| 亚洲av福利一区| 赤兔流量卡办理| 午夜免费鲁丝| videosex国产| 最近手机中文字幕大全| 国产成人精品久久久久久| 亚洲国产精品成人久久小说| 丝袜人妻中文字幕| 国产日韩欧美视频二区| 黄片无遮挡物在线观看| 亚洲精品在线美女| av福利片在线| 伊人久久大香线蕉亚洲五| 青草久久国产| 中文字幕亚洲精品专区| 日本wwww免费看| 高清在线视频一区二区三区| 亚洲欧洲国产日韩| 欧美 日韩 精品 国产| 婷婷色综合大香蕉| 国产亚洲一区二区精品| 国产精品国产三级专区第一集| 九色亚洲精品在线播放| 大话2 男鬼变身卡| 国产精品久久久久成人av| 亚洲成人av在线免费| 大片免费播放器 马上看| 免费高清在线观看日韩| 国精品久久久久久国模美| av有码第一页| 9191精品国产免费久久| 精品国产乱码久久久久久男人| 我要看黄色一级片免费的| 狠狠婷婷综合久久久久久88av| 99久久精品国产国产毛片| 国产福利在线免费观看视频| 不卡av一区二区三区| 高清黄色对白视频在线免费看| 亚洲精品日本国产第一区| 国产成人精品久久久久久| 国产精品久久久久久精品电影小说| 日韩av在线免费看完整版不卡| 建设人人有责人人尽责人人享有的| 国产精品成人在线| 久久久久久人人人人人| 成人国产麻豆网| 久久精品国产亚洲av天美| 免费不卡的大黄色大毛片视频在线观看| 精品亚洲成a人片在线观看| 亚洲国产欧美在线一区| 精品99又大又爽又粗少妇毛片| 精品福利永久在线观看| 久久久久网色| 母亲3免费完整高清在线观看 | 免费在线观看视频国产中文字幕亚洲 | 老女人水多毛片| 最近最新中文字幕免费大全7| 老女人水多毛片| 大码成人一级视频| 亚洲第一av免费看| 国产精品 欧美亚洲| 午夜福利,免费看| 高清不卡的av网站| 国产av精品麻豆| 亚洲av免费高清在线观看| 成人毛片60女人毛片免费| 男人爽女人下面视频在线观看| 国产成人精品久久二区二区91 | 亚洲欧洲精品一区二区精品久久久 | 精品一区在线观看国产| 国产伦理片在线播放av一区| 色视频在线一区二区三区| 成人亚洲精品一区在线观看| 久久国内精品自在自线图片| 亚洲av欧美aⅴ国产| 麻豆乱淫一区二区| 黄片无遮挡物在线观看| 飞空精品影院首页| 菩萨蛮人人尽说江南好唐韦庄| 老女人水多毛片| 国产成人精品婷婷| 热99久久久久精品小说推荐| 成人影院久久| 国产探花极品一区二区| xxxhd国产人妻xxx| 伦理电影大哥的女人| 午夜老司机福利剧场| 永久网站在线| 国产乱来视频区| 日本午夜av视频| 国产在线一区二区三区精|