• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于Spark的矩陣分解與最近鄰融合的推薦算法①

    2017-05-17 10:00:08王振軍黃瑞章貴州大學(xué)計算機(jī)科學(xué)與技術(shù)學(xué)院貴陽55005貴州省公共大數(shù)據(jù)重點(diǎn)實(shí)驗(yàn)室貴陽55005
    關(guān)鍵詞:相似性準(zhǔn)確度物品

    王振軍, 黃瑞章,(貴州大學(xué) 計算機(jī)科學(xué)與技術(shù)學(xué)院, 貴陽 55005)(貴州省公共大數(shù)據(jù)重點(diǎn)實(shí)驗(yàn)室, 貴陽 55005)

    基于Spark的矩陣分解與最近鄰融合的推薦算法①

    王振軍1, 黃瑞章1,21(貴州大學(xué) 計算機(jī)科學(xué)與技術(shù)學(xué)院, 貴陽 550025)2(貴州省公共大數(shù)據(jù)重點(diǎn)實(shí)驗(yàn)室, 貴陽 550025)

    隨著當(dāng)前移動互聯(lián)網(wǎng)的快速發(fā)展, 人們所面臨的信息過載問題變得尤為嚴(yán)重, 大數(shù)據(jù)場景下對特定用戶的個性化推薦面臨著巨大挑戰(zhàn). 為了進(jìn)一步提高推薦的時效性、準(zhǔn)確度以及緩解面臨的大數(shù)據(jù)量. 提出了一種矩陣分解推薦算法在大數(shù)據(jù)環(huán)境下的優(yōu)化算法模型. 該模型通過在傳統(tǒng)矩陣分解推薦算法的基礎(chǔ)上融合了用戶以及物品的相似性計算, 在訓(xùn)練目標(biāo)函數(shù)的過程中, 即融入用戶以及物品的前k個最近鄰居的相似性計算, 增強(qiáng)了算法的推薦準(zhǔn)確度. 利用Spark在內(nèi)存計算以及迭代計算上的優(yōu)勢, 設(shè)計了一種Spark框架下的矩陣分解與最近鄰融合的推薦算法. 通過在經(jīng)典數(shù)據(jù)集—MovieLens數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明, 該算法與傳統(tǒng)的矩陣分解推薦算法相比, 可以很好的緩解數(shù)據(jù)稀疏性, 提高推薦算法的準(zhǔn)確度, 并且在計算效率方面也優(yōu)于現(xiàn)有的矩陣分解推薦算法.

    協(xié)同過濾; 推薦算法; 矩陣分解; 交替最小二乘法; Spark

    協(xié)同過濾技術(shù)(Collaborative Filtering Recommendation, CF)[1]基于用戶或者物品的相似性來產(chǎn)生推薦, 是當(dāng)前推薦系統(tǒng)領(lǐng)域最成功的技術(shù)之一,隨著數(shù)據(jù)挖掘相關(guān)技術(shù)的迅速發(fā)展, 基于隱語義模型(Latent Factor Model, LFM)的推薦算法[2]是一類更加精確高效的協(xié)同過濾技術(shù). 自Netflix Prize大賽[3]以來, LFM算法中很重要的一部分當(dāng)屬矩陣分解范疇, 該方法在文獻(xiàn)[4]中首次提到, 它與其他算法結(jié)合的混合推薦算法最終獲得了Netflix推薦算法大賽大獎.

    近些年來, 矩陣分解在學(xué)術(shù)研究以及商業(yè)應(yīng)用中越來越受到研究人員的青睞. 文獻(xiàn)[5]提出了SVD(singular value decomposition(SVD))模型方法, 其推薦效果優(yōu)于傳統(tǒng)的基于鄰域的推薦算法, 其中心思想是把用戶-物品的評分矩陣進(jìn)行因子分解, 很多方法[6,7]通常會忽略了矩陣中高度的缺失值導(dǎo)致的數(shù)據(jù)稀疏性問題, 傳統(tǒng)的SVD在矩陣稀疏的時候作用是不明確的,而且, 粗暴的處理一些相對已知的條目非常容易產(chǎn)生過度擬合. 文獻(xiàn)[8]提出了一種基于矩陣分解與用戶近鄰模型的推薦算法, 該算法很好的實(shí)現(xiàn)了矩陣分解與用戶近鄰模型的融合, 在一定程度上提高了推薦準(zhǔn)確度, 但是忽略了物品之間的相似性對推薦準(zhǔn)確度的影響, 并且該算法存在模型的過擬合問題. 文獻(xiàn)[9]提出了基于MapReduce的矩陣分解算法, 該算法解決了大規(guī)模評分矩陣在多節(jié)點(diǎn)間的高效共享問題, 實(shí)現(xiàn)了多次迭代計算的并行處理, 但是在基于Mapreduce的編程框架下, 迭代過程中過多的節(jié)點(diǎn)間通信以及I/O讀寫影響了算法的執(zhí)行效率.

    本文圍繞解決上述問題展開研究, 并在已有研究的基礎(chǔ)上, 結(jié)合經(jīng)典的矩陣分解推薦模型, 融合最近鄰模型的相似性計算, 提出了基于Spark的矩陣分解與最近鄰融合的推薦算法. 首先通過評分矩陣計算用戶以及物品之間的相似性, 然后分別應(yīng)用用戶以及物品的前k個近鄰融合矩陣分解模型來達(dá)到預(yù)測特定用戶評分的目的. 實(shí)驗(yàn)表明, 該算法能夠有效的提高推薦算法準(zhǔn)確度以及計算效率.

    1 基礎(chǔ)知識

    1.1 矩陣分解

    假設(shè)用戶-物品評分矩陣為R, 矩陣中每一個元素表示用戶u對物品i的評分, 則由矩陣奇異值分解原理可知, 矩陣R可以分解為幾個矩陣相乘的形式, 矩陣分解的目標(biāo)就是把用戶和物品評分矩陣映射到同一個維數(shù)為f的潛在因子空間, 這樣用戶和項(xiàng)目之間的關(guān)系就可以通過因子空間中的內(nèi)積來建模, 如下公式:

    其中: m表示用戶數(shù)量, n表示物品數(shù)量; P ∈?f×m表示用戶的隱語義屬性參數(shù)(行),表示物品的隱語義屬性參數(shù)(行). 那么, 對于用戶u對物品i的評分的預(yù)測值u, i)=r,可以通過如下公式計算:

    其中: puf=P( U, F), qif=Q( i, f). 那么矩陣分解的目標(biāo)就是計算得到每個用戶的因子向量pu, 每個物品對應(yīng)的因子向量qi, 使得預(yù)測用戶u對物品i的預(yù)測評分r?ui能夠盡可能地接近真實(shí)評分rui. 當(dāng)給定的矩陣不完全時, 此模型容易導(dǎo)致過擬合, 因此, 當(dāng)前的很多研究都建議對存在的評分項(xiàng)進(jìn)行建模, 采用正則化參數(shù)避免過擬合問題, 目標(biāo)函數(shù)定義如下:

    其中: λ參數(shù)用來正則化模型, 成為正則化系數(shù); K表示訓(xùn)練集中存在的評分項(xiàng). 求解上面的模型, 目前常用的方法有兩種: 隨機(jī)梯度下降法(Stochastic Gradient Descent, SGD)和交替最小二乘法(Alternating Least Squares, ALS).

    1.2 最近鄰模型

    最近鄰模型[10]是協(xié)同過濾推薦算法中比較常用的算法模型, 基本上可以分為基于用戶的近鄰模型以及基于物品的近鄰模型. 其中心思想是計算選取用戶或者物品的前k個最近鄰居來模擬主體的行為從而預(yù)測用戶對物品的評分. 這種方法不關(guān)注用戶物品之間的相互關(guān)系,而只關(guān)注用戶之間以及物品之間的相似度就能計算出某用戶對某物品的興趣評分, 從而給出推薦類目.

    1.3 Spark平臺

    Spark[11]由美國加州大學(xué)的伯克利分校的AMP實(shí)驗(yàn)室首次提出的類Hadoop MapReduce的基于內(nèi)存計算的大數(shù)據(jù)并行計算框架. Spark不同于MapReduce的是job的中間結(jié)果不需要再寫入本地的HDFS, 而是直接在內(nèi)存中完成, 可以更好的適用于機(jī)器學(xué)習(xí)以及數(shù)據(jù)挖掘的多次迭代的計算, 近些年來, Spark已經(jīng)被廣泛應(yīng)用到學(xué)術(shù)研究以及商業(yè)計算中.

    Spark最主要的創(chuàng)新點(diǎn)是提出了彈性分布式數(shù)據(jù)集[12](Resilient Distributed Dataset, RDD). RDD本質(zhì)上是一種只讀的分布式共享內(nèi)存模型, 它具備像MapReduce等數(shù)據(jù)流模型的容錯特性, 并且允許開發(fā)人員在大型集群上執(zhí)行內(nèi)存的計算. 彈性表現(xiàn)在若一個RDD分片丟失, Spark可以根據(jù)日志信息重構(gòu)它; 分布式表現(xiàn)在可以用操作本地集合的方式來操作分布式數(shù)據(jù)集. 此外, RDD可以被緩存在內(nèi)存中, 在之后的計算過程中可以直接從內(nèi)存中讀入, 省去了大量的磁盤存取開銷, 適合需要迭代計算尋優(yōu)的矩陣分解算法.圖1 展示了Spark的基本工作流程, 每一個Spark 應(yīng)用程序主要由SaprkContext和Executor兩部分完成, Executor負(fù)責(zé)執(zhí)行任務(wù), 運(yùn)行Executor的機(jī)器稱為Worker節(jié)點(diǎn), SparkContext由用戶程序啟動, 通過資源調(diào)度模塊和Executor通信. 這種運(yùn)行模式有利于進(jìn)行不同應(yīng)用程序之間的資源調(diào)度隔離以及共享.

    圖1 Spark的基本工作流程

    2.1 問題分析

    在前面介紹矩陣分解算法, 在求解隱語義向量的過程中, P和Q矩陣中會丟失用戶或者物品的某些信息, 如用戶之間的相似性以及物品之間的相似性, 通過模型訓(xùn)練后得到的P和Q矩陣求得的用戶或物品之間相似性(皮爾森相關(guān)系數(shù))與由用戶評分矩陣求得的相似性存在出入. 于是, 我們提出一種新的目標(biāo)函數(shù),即融入用戶和物品之間的相似性進(jìn)行模型訓(xùn)練, 這樣,就可以保持訓(xùn)練前后, 它們之間相似性的一致性.

    2.2 優(yōu)化方案

    本文稱這種融合模型推薦算法為Matrix Factori(MF-KNN), 下面是具體步驟.

    1) 通過用戶-物品的歷史評分?jǐn)?shù)據(jù)得到用戶-物品評分矩陣, 經(jīng)過對比研究, 這里, 我們采用皮爾森相似距離計算用戶-用戶, 物品-物品之間的相似度:

    2) 設(shè)計損失函數(shù)時, 為使模型訓(xùn)練前后的用戶以及物品之間的相似性保持一致, 我們將上面計算得到的相似度數(shù)據(jù)融入目標(biāo)函數(shù)中, 再迭代求解最小化目標(biāo)函數(shù), 最后得到最終的P和Q矩陣.

    上述公式中, (i, j)∈I訓(xùn)練集中存在的評分項(xiàng), Ij表示用戶集合, Ii表示物品集合, KNN(ui)表示用戶ui的前K個最近鄰居集合, KNN(mj)表示物品mj的前K個最近鄰居集合, simuiup代表用戶之間的相似度, simmimp代表物品之間的相似度, k表示某一個特征(或隱含因子).

    為求解上述目標(biāo)函數(shù), 我們采用Spark計算方式來求解特征矩陣U和M, 與上一節(jié)中提到求解傳統(tǒng)矩陣分解模型的方法類似, 這里我們采用最小二乘法(ALS), 首先固定U求解M, 然后固定M求解U, 這樣迭代求解. 具體如下:

    以上, 每次迭代求取ui, 同理, 對于mj, 有:

    2 基于Spark的矩陣分解算法優(yōu)化

    我們這樣設(shè)計是因?yàn)榭紤]融合相似性信息進(jìn)損失函數(shù)中, 如果全面考慮計算U和M中用戶或者物品的相似性, 然后與由評分矩陣計算的到的相似性進(jìn)行對比時, 偏導(dǎo)數(shù)的求解很復(fù)雜, 而且計算量過大, 于是設(shè)計為計算用戶或者物品的K近鄰這種方法簡單處理.可以很好的中和K近鄰模型的相似性進(jìn)損失函數(shù), 以期望在矩陣分解后, 能減少用戶或者物品信息的丟失,進(jìn)而提高算法在評分預(yù)測場景下的準(zhǔn)確度.

    2.3 Spark框架下的矩陣分解最最近鄰融合的并行化算法

    輸入: 用戶評分矩陣Ratings

    輸出: 矩陣分解模型

    #Ratings為用戶評分矩陣, U與M為用戶及物品個數(shù), F為隱語義屬性個數(shù)

    1) partitions = N

    2) sc = SparkContext()

    3) 讀入數(shù)據(jù)生成Rating:RDD,#Rating是序列

    <User,Item,rating>

    4) 隨機(jī)生成ms和us矩陣

    W = matrix(rand(m,F))

    U = matrix(rand(u,F))

    Rb = sc.broadcast(R)

    Mb = sc.broadcast(M)

    Ub = sc.broadcast(U)

    5) #相似性計算獲得最近鄰居

    user_sims = Rb.map(lambda

    x:calcSim(x[0],x[1])).map(lambda

    x:keyOnFirstUser(x[0],x[1]))groupByKay().ma

    p(lambda x:nearestNeighbors(x[0],x[1],20))

    item_sims = Rb.map(lambda

    x:calcSim(x[0],x[1])).map(lambda

    x:keyOnFirstItem(x[0],x[1]))groupByKay()

    .map(lambda

    x:nearestNeighbors(x[0],x[1],20)) 6) #按照設(shè)定的迭代值進(jìn)行迭代

    for i in range(ITERATIONS):

    #固定U, 并行化更新M

    M = sc.parallelize(range(m),partisons)

    .map(lambda

    x:update(x,Mb.value[x,:],Ub.value,Rb.val ue))

    .collect()

    M = matrix(np.array(M)[:,:,0])

    Mb = sc.broadcast(M)

    #固定M, 并行化更新U

    U = sc.parallelize(range(u),partition)

    .map(lambda

    x:update(x,Ub.value[x,:],Mb.value,Rb.val ue.T)).collect()

    U = matrix(np.array(U)[:,:,0])

    Ub = sc.broadcast(U)

    error = rmse(R,M,U)

    sc.stop()

    如上述算法所示: 基于Spark的矩陣分解與最近鄰融合算法的尋優(yōu)方式和矩陣分解類似, 算法主要是模型不斷迭代尋優(yōu)的過程, 其中固定U更新M, 然后固定M更新U, 依次循環(huán)迭代, 直到在訓(xùn)練集上計算得到rmse值達(dá)到近似收斂, 即模型達(dá)到了最優(yōu), 最后求得的Ub和Mb分別為用戶和物品的特征矩陣.

    3 實(shí)驗(yàn)分析

    3.1 實(shí)驗(yàn)環(huán)境

    基于上述研究, 本實(shí)驗(yàn)采用3臺搭載CentOS 6.5操作系統(tǒng)的服務(wù)器, 在部署了Hadoop2.6.0基礎(chǔ)上部署了Spark-1.5.0分布式集群, 利用Pycharm作為開發(fā)工具.

    3.2 數(shù)據(jù)集

    為了驗(yàn)證算法效果, 本實(shí)驗(yàn)采用國際經(jīng)典數(shù)據(jù)集—MovieLens數(shù)據(jù)集, 數(shù)據(jù)集包括了943個用戶對大約1500部電影的評分?jǐn)?shù)據(jù), 數(shù)據(jù)條數(shù)為100000. 用戶對電影的評分?jǐn)?shù)值為從1到5. 其中, 1表示最低, 5表示最高, 0代表未評論.

    實(shí)驗(yàn)過程將原始數(shù)據(jù)集以8:2的比例劃分為訓(xùn)練集和測試集.

    3.3 評測標(biāo)準(zhǔn)

    本實(shí)驗(yàn)將采用推薦系統(tǒng)領(lǐng)域最常用的均方根誤差(Root Mean Squared Error, RMSE)作為評測標(biāo)準(zhǔn). 通過計算預(yù)測的用戶評分與實(shí)際的用戶評分之間的誤差來反映評分預(yù)測的準(zhǔn)確性, RMSE越小, 評分預(yù)測準(zhǔn)確度就越高.

    對于測試集中的每一個用戶u和物品i, 令T表示用戶u對物品i的評分集合, rui是用戶u對物品i的實(shí)際評分, 而?uir是推薦算法給出的預(yù)測評分, RMSE的定義公式如下:

    3.4 實(shí)驗(yàn)結(jié)果與分析

    本文通過實(shí)驗(yàn)對比MF-KNN算法在評分預(yù)測問題中的性能. 在該算法中, 重要的模型參數(shù)有3個: 隱含特征個數(shù)F, 近鄰模型鄰居k的個數(shù)以及正則化參數(shù)lambda. 通過多輪試驗(yàn)發(fā)現(xiàn), 隱含特征個數(shù)以及近鄰模型鄰居k的個數(shù)對算法性能影響最大. 算法參數(shù)選擇: 正則化參數(shù)lambda通過交叉驗(yàn)證決定.

    本文統(tǒng)一采用lambda=0.005進(jìn)行實(shí)驗(yàn), 在訓(xùn)練集上迭代次數(shù)選用40次. 控制鄰域范圍k, 通過實(shí)驗(yàn)證明k值越大, 算法精度越高, 因此需要在算法精度與計算代價之間取得平衡.

    實(shí)驗(yàn)1我們首先在Spark環(huán)境下分別對優(yōu)化后的矩陣分解與最近鄰融合的推薦算法(MF-KNN)、傳統(tǒng)的矩陣分解推薦算法(MF)以及基于物品的鄰域模型(ItemNgbr)進(jìn)行對比實(shí)驗(yàn), 計算兩者的評分預(yù)測準(zhǔn)確度指標(biāo)RMSE值.

    對于上組實(shí)驗(yàn)中的的每種模型, 選用最優(yōu)化的參數(shù), 對于基于物品的鄰域模型, 我們選取鄰居大小為50, 而對于矩陣分解與最近鄰融合的模型, 我們分別選取用戶以及物品鄰居大小集合為20. 實(shí)驗(yàn)結(jié)果如圖2所示, 可以得出矩陣分解模型可以很好的優(yōu)于基于鄰域的模型, 進(jìn)而得出, 矩陣分解與最近鄰融合模型可以在很大程度提高矩陣分解的推薦準(zhǔn)確度, 另外,從圖中可以看出, 隨著F值的增加, RMSE值下降速度明顯變緩, 這也從側(cè)面表明了算法每次計算得出的結(jié)果都是最顯著的特征向量.

    其次, 我們進(jìn)一步考慮最近鄰居k的個數(shù)對算法性能的影響. 實(shí)驗(yàn)2我們采用固定F=50, 等差增加k值, 觀測算法迭代耗費(fèi)時間以及預(yù)測誤差的變化.

    圖2 不同F(xiàn)值各模型在MovieLens數(shù)據(jù)集下的RMSE值

    表1 隨著最近鄰居k的增加所獲得的預(yù)測誤差

    表1可以得出, 當(dāng)固定隱特征數(shù)量F=50, 迭代收斂的耗費(fèi)時間隨最近鄰居k值的增加而上升, 當(dāng)達(dá)到k=20時, RMSE值變化幅度微小. 主要是因?yàn)? 在融合最近鄰居相似度信息的時候, 前k個最近鄰居可以基本代表整個主體行為信息. 因此, 針對于不同的應(yīng)用場景, 經(jīng)過多次實(shí)驗(yàn), 才可以獲得本場景下最佳近鄰模型的k值.

    最后, 為驗(yàn)證算法的計算效率, 實(shí)驗(yàn)3在Spark環(huán)境下和非分布式環(huán)境下分別計算本文提出的基于Spark的矩陣分解與最近鄰融合的推薦算法運(yùn)行時間,比較其在相同用戶數(shù)量, 相同硬件條件下的計算效率.圖3表明基于Spark的矩陣分解與最近鄰融合的推薦算法對于同等規(guī)模的數(shù)據(jù)集, Spark框架下的計算方式要比非分布式的計算方式節(jié)約更多的運(yùn)行時間, 并且隨著Spark節(jié)點(diǎn)數(shù)量的增加, 此算法在Spark框架下的耗時增長更趨于平滑, 這體現(xiàn)了Spark基于內(nèi)存計算的實(shí)時性優(yōu)勢. 當(dāng)用戶數(shù)=200時, 一個Saprk節(jié)點(diǎn)與非分布式的計算時間相比耗時要多一些, 這說明, Spark開始計算時, 要啟動整個計算框架分片, 要耗費(fèi)一定時間.

    圖3 不同用戶數(shù)量并行化運(yùn)行時間的比較

    綜上可以得出, 基于Spark的矩陣分解與最近鄰融合的推薦算法無論是在推薦準(zhǔn)確度還是在計算效率方面都要優(yōu)于當(dāng)前大部分的推薦算法.

    4 結(jié)語

    最近幾年, 矩陣分解推薦算法是推薦系統(tǒng)領(lǐng)域中的一個非常熱門的研究課題. 本文針對傳統(tǒng)矩陣分解推薦算法面臨的推薦準(zhǔn)確度以及計算效率方面的問題,結(jié)合傳統(tǒng)的最近鄰算法以及當(dāng)前新興并行化計算框架,提出了基于Spark的矩陣分解與最近鄰融合的推薦算法. 該算法充分利用顯性反饋數(shù)據(jù), 提高了推薦準(zhǔn)確度的同時, 也很大程度上提高了傳統(tǒng)矩陣分解算法的計算效率.

    最后, 本文設(shè)定的主要應(yīng)用場景為只有顯式反饋,雖然這種場景比較普遍, 但在現(xiàn)實(shí)生活中, 顯式反饋與隱式反饋并存, 如何整合這兩種資源以提高推薦質(zhì)量有待進(jìn)一步研究.

    1 Schafer JB, Dan F, Herlocker J, et al. Collaborative filtering recommender systems. The Adaptive Web, Methods and Strategies of Web Personalizationk, 2010: 46–45.

    2 Koren Y. Factorization meets the neighborhood: A multifaceted collaborative filtering model. ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. ACM. 2008. 426–434.

    3 Bennett J, Lanning S, Netflix N. The Netflix Prize// Kdd Cup and Workshop in Conjunction with Kdd. 2009.

    4 Koren Y, Bell R,Volinsky C. Matrix factorization techniques for recommender systems. Computer, 2009, 42(8): 30–37.

    5 Vozalis MG, Margaritis KG. Applying SVD on item-based filtering. International Conference on Intelligent Systems Design and Applications. 2005. 464–469.

    6 Kim D, Yum BJ. Collaborative filtering based on iterative principal component analysis. Expert Systems with Applications, 2005, 28(4): 823–830.

    7 Herlocker JL, Konstan JA, Borchers A, et al. An algorithmic framework for performing collaborative filtering. SIGIR’99: Proc. of the International ACM SIGIR Conference on Research and Development in Information Retrieval. August 15–19, 1999. Berkeley, Ca, Usa. 1999. 230–237.

    8楊陽,向陽,熊磊.基于矩陣分解與用戶近鄰模型的協(xié)同過濾推薦算法.計算機(jī)應(yīng)用,2012,32(2):395–398.

    9 張宇,程久軍.基于MapReduce的矩陣分解推薦算法研究.計算機(jī)科學(xué),2013,40(1):19–21.

    10 Su X, Khoshgoftaar TM. A survey of collaborative filtering techniques. Advances in Artificial Intelligence, 2009, (12).

    11 Zaharia M, Chowdhury M, Franklin MJ, et al. Spark: Cluster computing with working sets. Usenix Conference on Hot Topics in Cloud Computing. USENIX Association. 2010. 1765–1773.

    12 Zaharia M, Chowdhury M, Das T, et al. Resilient distributed datasets: A fault-tolerant abstraction for in-memory cluster computing. Usenix Conference on Networked Systems Design and Implementation. 2012. 141–146.

    Recommendation Algorithm Using Matrix Decomposition and Nearest Neighbor Fusion Based on Spark

    WANG Zhen-Jun1, HUANG Rui-Zhang1,212(School of Computer Science and Technology, Guizhou University, Guiyang 550025, China) (Guizhou Provincial Key Laboratory of Public Big Data, Guiyang 550025, China)

    With the current rapid development of mobile Internet, the information overload problem that people face is particularly serious, which makes it a big challenge to do particular users’ personalized recommendation in the big data scenario. In order to further improve the timeliness, accuracy of recommendation and ease the problem led by large amount of data, we propose a optimized matrix decomposition recommendation algorithm under the environment of big data in this paper. This algorithm integrates users and the similarity computation of items on the basis of the traditional matrix decomposition algorithm. In the process of training objective function, we enhance the recommendation accuracy by taking in account of users and k nearest neighbors’ similarity computation of items. Taking Spark’s advantage on memory computing and iterative computing, we design an algorithm using matrix decomposition and nearest neighbor fusion under the Spark framework. Experiments conducted on the classical MovieLens dataset show that our proposed algorithm can deal with data sparseness well, improve recommendation accuracy to some extent, and has a better computational efficiency in the comparison with traditional matrix decomposition recommendation algorithms.

    collaborative filtering; recommendation algorithm; matrix decomposition; ALS; Spark.

    國家自然科學(xué)基金(61462011,61202089);高等學(xué)校博士學(xué)科專項(xiàng)科研基金(20125201120006);貴州大學(xué)引進(jìn)人才科研項(xiàng)目(2011015);貴州省應(yīng)用基礎(chǔ)研究計劃重大項(xiàng)目(黔科合JZ字[2014]2001-01)

    2016-08-15;收到修改稿時間:2016-09-27

    10.15888/j.cnki.csa.005743

    猜你喜歡
    相似性準(zhǔn)確度物品
    一類上三角算子矩陣的相似性與酉相似性
    稱物品
    “雙十一”,你搶到了想要的物品嗎?
    淺析當(dāng)代中西方繪畫的相似性
    河北畫報(2020年8期)2020-10-27 02:54:20
    誰動了凡·高的物品
    幕墻用掛件安裝準(zhǔn)確度控制技術(shù)
    建筑科技(2018年6期)2018-08-30 03:40:54
    動態(tài)汽車衡準(zhǔn)確度等級的現(xiàn)實(shí)意義
    低滲透黏土中氯離子彌散作用離心模擬相似性
    找物品
    高爐重量布料準(zhǔn)確度的提高
    天津冶金(2014年4期)2014-02-28 16:52:58
    午夜激情欧美在线| 麻豆精品久久久久久蜜桃| 亚洲av男天堂| 免费看a级黄色片| 网址你懂的国产日韩在线| 日韩视频在线欧美| 99久国产av精品国产电影| 99九九线精品视频在线观看视频| 一级片'在线观看视频| 最近最新中文字幕免费大全7| 3wmmmm亚洲av在线观看| 午夜福利高清视频| 日本免费在线观看一区| 三级男女做爰猛烈吃奶摸视频| 天堂网av新在线| 91av网一区二区| 男女啪啪激烈高潮av片| 最近中文字幕2019免费版| 欧美高清成人免费视频www| 精品久久国产蜜桃| 久久久久精品久久久久真实原创| 欧美日韩在线观看h| 日韩欧美精品v在线| 蜜臀久久99精品久久宅男| 国产午夜福利久久久久久| 亚洲成人av在线免费| 日韩,欧美,国产一区二区三区| 国产白丝娇喘喷水9色精品| 日韩国内少妇激情av| 国产午夜精品论理片| 少妇熟女aⅴ在线视频| 伦理电影大哥的女人| 少妇熟女aⅴ在线视频| 精品国产一区二区三区久久久樱花 | 免费播放大片免费观看视频在线观看| 在线观看av片永久免费下载| 国产三级在线视频| 欧美最新免费一区二区三区| 亚洲无线观看免费| 天堂av国产一区二区熟女人妻| 免费少妇av软件| 精品久久久噜噜| 免费黄频网站在线观看国产| 国产一区有黄有色的免费视频 | 成人亚洲精品一区在线观看 | 亚洲怡红院男人天堂| 日韩中字成人| 国内揄拍国产精品人妻在线| 美女大奶头视频| 亚洲真实伦在线观看| 熟女电影av网| 永久网站在线| 国内精品美女久久久久久| av在线蜜桃| 日韩欧美 国产精品| 22中文网久久字幕| 久久热精品热| 永久免费av网站大全| 永久网站在线| 亚洲av中文av极速乱| 男人舔奶头视频| 国产av在哪里看| 汤姆久久久久久久影院中文字幕 | 亚洲国产欧美在线一区| 精品人妻视频免费看| 亚洲精品,欧美精品| 蜜臀久久99精品久久宅男| 久久99蜜桃精品久久| 亚洲精品久久久久久婷婷小说| 亚洲av中文av极速乱| 美女大奶头视频| 日韩精品有码人妻一区| eeuss影院久久| 99久久精品热视频| 国产有黄有色有爽视频| 日本-黄色视频高清免费观看| 免费看a级黄色片| 一级毛片 在线播放| 亚洲精品乱久久久久久| 一本—道久久a久久精品蜜桃钙片 精品乱码久久久久久99久播 | 成年女人在线观看亚洲视频 | 国产在线男女| 天堂av国产一区二区熟女人妻| 午夜免费男女啪啪视频观看| 18+在线观看网站| 亚洲无线观看免费| 免费看光身美女| 大香蕉久久网| 伦理电影大哥的女人| 特级一级黄色大片| 少妇高潮的动态图| 美女脱内裤让男人舔精品视频| 欧美区成人在线视频| 成年女人看的毛片在线观看| 天堂中文最新版在线下载 | 国产在线一区二区三区精| 99热这里只有精品一区| 欧美极品一区二区三区四区| 亚洲av不卡在线观看| 狠狠精品人妻久久久久久综合| 日日啪夜夜爽| 欧美一级a爱片免费观看看| 精品久久久噜噜| 精品久久久久久久人妻蜜臀av| 亚洲欧美成人精品一区二区| 天天一区二区日本电影三级| 亚洲最大成人中文| 国产精品1区2区在线观看.| 精品不卡国产一区二区三区| 天堂中文最新版在线下载 | 一级毛片aaaaaa免费看小| 久久久精品免费免费高清| 国产伦理片在线播放av一区| 看免费成人av毛片| 一个人看的www免费观看视频| 欧美日韩一区二区视频在线观看视频在线 | 国精品久久久久久国模美| 亚洲婷婷狠狠爱综合网| 亚洲国产最新在线播放| 国产精品熟女久久久久浪| 三级毛片av免费| 成年免费大片在线观看| 91精品国产九色| 亚洲人成网站在线播| 亚洲美女搞黄在线观看| 观看免费一级毛片| 97超碰精品成人国产| 高清视频免费观看一区二区 | 色播亚洲综合网| 国产在视频线精品| 人妻少妇偷人精品九色| 干丝袜人妻中文字幕| 晚上一个人看的免费电影| 精品久久久久久久久久久久久| 亚洲人成网站在线观看播放| 日韩一区二区视频免费看| 伦精品一区二区三区| 三级经典国产精品| 欧美xxⅹ黑人| 亚洲av国产av综合av卡| 日本与韩国留学比较| 久久99热这里只有精品18| 天堂√8在线中文| 亚洲精品乱久久久久久| 中国国产av一级| 好男人视频免费观看在线| 亚洲精品国产av成人精品| 非洲黑人性xxxx精品又粗又长| 狠狠精品人妻久久久久久综合| 中文字幕久久专区| 色5月婷婷丁香| 大陆偷拍与自拍| 街头女战士在线观看网站| 国产精品一及| 丰满乱子伦码专区| 两个人视频免费观看高清| 春色校园在线视频观看| 国产人妻一区二区三区在| 亚洲精品国产av蜜桃| 中文在线观看免费www的网站| 可以在线观看毛片的网站| 一级毛片黄色毛片免费观看视频| 久久久午夜欧美精品| 黄片wwwwww| 爱豆传媒免费全集在线观看| 国产精品日韩av在线免费观看| 欧美一区二区亚洲| 日韩欧美精品免费久久| 好男人在线观看高清免费视频| 日韩 亚洲 欧美在线| 中文字幕免费在线视频6| 国产 一区 欧美 日韩| 久久这里有精品视频免费| 69av精品久久久久久| 久久国内精品自在自线图片| 亚洲成人一二三区av| 尤物成人国产欧美一区二区三区| 午夜视频国产福利| 亚洲av二区三区四区| 一区二区三区高清视频在线| 黄片wwwwww| 有码 亚洲区| 亚洲aⅴ乱码一区二区在线播放| 久久久久精品性色| 亚洲国产成人一精品久久久| 欧美一级a爱片免费观看看| 人妻一区二区av| 寂寞人妻少妇视频99o| 2022亚洲国产成人精品| www.色视频.com| 国产高清国产精品国产三级 | 亚洲在线自拍视频| 国产精品爽爽va在线观看网站| 国产激情偷乱视频一区二区| 日韩欧美一区视频在线观看 | 成人av在线播放网站| 韩国av在线不卡| 国产v大片淫在线免费观看| 国产亚洲av片在线观看秒播厂 | 国产熟女欧美一区二区| 久久99蜜桃精品久久| 日韩三级伦理在线观看| 18禁在线播放成人免费| 精品久久久精品久久久| 非洲黑人性xxxx精品又粗又长| 国产91av在线免费观看| 国产免费又黄又爽又色| 亚洲人成网站在线观看播放| 亚洲av二区三区四区| 三级国产精品欧美在线观看| 美女大奶头视频| 国产欧美另类精品又又久久亚洲欧美| 国产黄片视频在线免费观看| av国产久精品久网站免费入址| 一级黄片播放器| 精品久久久久久久久久久久久| 亚洲精品一二三| 国产女主播在线喷水免费视频网站 | 亚洲av男天堂| 少妇的逼好多水| 最近中文字幕高清免费大全6| 在线 av 中文字幕| 国产在线一区二区三区精| 国产高清三级在线| 大又大粗又爽又黄少妇毛片口| 天堂网av新在线| 看黄色毛片网站| 中文资源天堂在线| 欧美人与善性xxx| 人妻一区二区av| 伦理电影大哥的女人| 久久久久久久久久成人| 国内精品一区二区在线观看| 免费看光身美女| 在线a可以看的网站| 全区人妻精品视频| 最近中文字幕2019免费版| 九九在线视频观看精品| 亚洲av二区三区四区| 欧美三级亚洲精品| 熟女电影av网| av在线蜜桃| 亚洲成色77777| 三级经典国产精品| 欧美人与善性xxx| 一级毛片aaaaaa免费看小| 亚洲精品一区蜜桃| 国产91av在线免费观看| 少妇熟女欧美另类| 国产麻豆成人av免费视频| 干丝袜人妻中文字幕| 国产精品久久久久久精品电影小说 | 男女国产视频网站| 国产亚洲午夜精品一区二区久久 | 国产成人freesex在线| 特级一级黄色大片| 80岁老熟妇乱子伦牲交| 亚洲av成人精品一区久久| 18禁动态无遮挡网站| 久99久视频精品免费| av女优亚洲男人天堂| 人妻系列 视频| 99热这里只有是精品在线观看| 一本一本综合久久| 亚洲人与动物交配视频| 亚洲精品第二区| 欧美极品一区二区三区四区| 韩国高清视频一区二区三区| 久久精品久久久久久久性| 精品一区二区三区视频在线| 性色avwww在线观看| 91精品伊人久久大香线蕉| videossex国产| 国产精品一区www在线观看| 久久久久精品性色| 国产片特级美女逼逼视频| 毛片女人毛片| 能在线免费观看的黄片| 亚洲精品第二区| 久久久久精品性色| 高清在线视频一区二区三区| 十八禁网站网址无遮挡 | 97精品久久久久久久久久精品| 熟女人妻精品中文字幕| 精品人妻熟女av久视频| 亚洲四区av| 日韩亚洲欧美综合| av国产久精品久网站免费入址| 搡老妇女老女人老熟妇| 丝瓜视频免费看黄片| av天堂中文字幕网| 免费观看a级毛片全部| 日韩欧美精品v在线| 汤姆久久久久久久影院中文字幕 | 淫秽高清视频在线观看| 我的女老师完整版在线观看| 我的女老师完整版在线观看| 亚州av有码| 一级片'在线观看视频| 在线观看一区二区三区| 亚洲国产精品sss在线观看| 日产精品乱码卡一卡2卡三| 国产黄频视频在线观看| 国产极品天堂在线| 日韩不卡一区二区三区视频在线| 成人国产麻豆网| 亚洲国产av新网站| 91久久精品国产一区二区三区| 美女xxoo啪啪120秒动态图| 综合色av麻豆| 嫩草影院新地址| 91久久精品国产一区二区成人| 欧美xxxx黑人xx丫x性爽| 亚洲欧美清纯卡通| 99久久精品国产国产毛片| 亚洲四区av| 国产淫片久久久久久久久| 男人爽女人下面视频在线观看| 亚洲欧美中文字幕日韩二区| 99热全是精品| 欧美成人精品欧美一级黄| 国产高清三级在线| 麻豆久久精品国产亚洲av| 亚洲欧美成人综合另类久久久| 听说在线观看完整版免费高清| 2021少妇久久久久久久久久久| 成年av动漫网址| 成人欧美大片| 人人妻人人澡人人爽人人夜夜 | 免费播放大片免费观看视频在线观看| 成人特级av手机在线观看| 国产精品嫩草影院av在线观看| 亚洲av不卡在线观看| 午夜免费男女啪啪视频观看| 寂寞人妻少妇视频99o| 亚洲av.av天堂| 啦啦啦中文免费视频观看日本| 成年人午夜在线观看视频 | 亚洲精品一区蜜桃| 国产一区二区三区综合在线观看 | 18禁裸乳无遮挡免费网站照片| 国产精品久久久久久久久免| 亚洲性久久影院| 国内少妇人妻偷人精品xxx网站| xxx大片免费视频| 午夜免费激情av| 国产高清三级在线| h日本视频在线播放| 亚洲熟女精品中文字幕| 91久久精品国产一区二区三区| 麻豆精品久久久久久蜜桃| 日韩在线高清观看一区二区三区| 久久久久精品久久久久真实原创| 99久国产av精品国产电影| 国产成人a区在线观看| 国产精品福利在线免费观看| 久久97久久精品| 亚洲图色成人| 亚洲成人av在线免费| 床上黄色一级片| 午夜爱爱视频在线播放| 免费黄频网站在线观看国产| 91久久精品电影网| 欧美另类一区| 国产精品一二三区在线看| 国内精品一区二区在线观看| 免费播放大片免费观看视频在线观看| 欧美激情在线99| 久久久a久久爽久久v久久| 欧美精品一区二区大全| 国产精品爽爽va在线观看网站| 婷婷色av中文字幕| 免费无遮挡裸体视频| 一本—道久久a久久精品蜜桃钙片 精品乱码久久久久久99久播 | 亚洲欧美精品专区久久| 国精品久久久久久国模美| 亚洲不卡免费看| 插逼视频在线观看| 亚洲国产欧美在线一区| 99久国产av精品| 我的老师免费观看完整版| 男女国产视频网站| 丝袜喷水一区| 欧美精品一区二区大全| 一级毛片电影观看| 国产精品国产三级国产专区5o| 大香蕉久久网| 日日撸夜夜添| 日本欧美国产在线视频| 国产精品人妻久久久久久| 97人妻精品一区二区三区麻豆| 少妇猛男粗大的猛烈进出视频 | 亚洲国产精品国产精品| 欧美区成人在线视频| 国产乱来视频区| 久久精品国产亚洲av涩爱| 久久这里只有精品中国| 一本久久精品| 午夜免费观看性视频| 人人妻人人澡欧美一区二区| 亚洲aⅴ乱码一区二区在线播放| 国产大屁股一区二区在线视频| 国产黄色免费在线视频| 国产精品女同一区二区软件| 久热久热在线精品观看| 国产成人精品福利久久| 搡女人真爽免费视频火全软件| 欧美成人a在线观看| 国产色爽女视频免费观看| 亚洲激情五月婷婷啪啪| 亚洲国产精品成人综合色| 国产一区有黄有色的免费视频 | 亚洲国产欧美在线一区| 亚洲欧美中文字幕日韩二区| 亚洲无线观看免费| 亚洲av成人精品一二三区| 亚洲四区av| 麻豆成人av视频| 国产精品av视频在线免费观看| 最近手机中文字幕大全| 国产午夜精品一二区理论片| 精华霜和精华液先用哪个| 欧美成人一区二区免费高清观看| 中文字幕久久专区| 精品人妻视频免费看| 久久午夜福利片| 亚洲无线观看免费| 国产精品av视频在线免费观看| 国产片特级美女逼逼视频| 少妇熟女aⅴ在线视频| 亚洲熟妇中文字幕五十中出| 超碰97精品在线观看| 欧美区成人在线视频| 夫妻午夜视频| 边亲边吃奶的免费视频| 嫩草影院新地址| 国产淫语在线视频| 国内精品美女久久久久久| 在线免费观看的www视频| 国产人妻一区二区三区在| 免费观看精品视频网站| 黄色欧美视频在线观看| 久久久精品免费免费高清| 五月伊人婷婷丁香| 亚洲最大成人手机在线| 亚洲,欧美,日韩| 欧美精品国产亚洲| 国产精品久久久久久久久免| 亚洲精品aⅴ在线观看| 啦啦啦中文免费视频观看日本| 久久久久久久亚洲中文字幕| 国产极品天堂在线| 亚洲欧美清纯卡通| 美女被艹到高潮喷水动态| 国产黄色免费在线视频| 啦啦啦中文免费视频观看日本| 国产精品麻豆人妻色哟哟久久 | 国产免费视频播放在线视频 | 久久久久久伊人网av| 99热6这里只有精品| 大陆偷拍与自拍| 青青草视频在线视频观看| 亚洲在线观看片| 日韩欧美精品v在线| 成年人午夜在线观看视频 | 神马国产精品三级电影在线观看| 两个人视频免费观看高清| 久久久久久久亚洲中文字幕| 欧美日韩精品成人综合77777| 国产免费视频播放在线视频 | 99久久精品热视频| 国产精品嫩草影院av在线观看| 91狼人影院| 九色成人免费人妻av| 99热这里只有精品一区| 中文字幕av成人在线电影| 美女内射精品一级片tv| 成人午夜精彩视频在线观看| 精品一区二区免费观看| 免费看av在线观看网站| 最近中文字幕2019免费版| 偷拍熟女少妇极品色| 国产成人精品一,二区| 国产极品天堂在线| 春色校园在线视频观看| 欧美+日韩+精品| av又黄又爽大尺度在线免费看| 女人被狂操c到高潮| 精品一区二区三区人妻视频| 欧美zozozo另类| 免费人成在线观看视频色| 久久久久精品久久久久真实原创| 97精品久久久久久久久久精品| 一个人看的www免费观看视频| 我要看日韩黄色一级片| 十八禁国产超污无遮挡网站| 国产午夜精品久久久久久一区二区三区| 午夜精品在线福利| 伦理电影大哥的女人| 国精品久久久久久国模美| 免费av观看视频| 久久久久久久久大av| 超碰97精品在线观看| 纵有疾风起免费观看全集完整版 | 中文字幕制服av| 国产极品天堂在线| 亚洲精品国产av成人精品| av福利片在线观看| 久久久久久久午夜电影| 高清毛片免费看| 国产不卡一卡二| 秋霞在线观看毛片| av在线蜜桃| 午夜老司机福利剧场| 久久久久国产网址| 欧美性猛交╳xxx乱大交人| 成人午夜精彩视频在线观看| 男女那种视频在线观看| 日本色播在线视频| 少妇人妻精品综合一区二区| 亚洲av日韩在线播放| 最近手机中文字幕大全| 看十八女毛片水多多多| 欧美日韩视频高清一区二区三区二| 久久久久久久亚洲中文字幕| 久久精品夜夜夜夜夜久久蜜豆| 国产视频内射| 男人舔奶头视频| 毛片女人毛片| 国产av码专区亚洲av| 六月丁香七月| 免费大片黄手机在线观看| 男女国产视频网站| 欧美潮喷喷水| 国产欧美另类精品又又久久亚洲欧美| 直男gayav资源| 久久精品夜夜夜夜夜久久蜜豆| 国产69精品久久久久777片| 久久精品人妻少妇| 中文乱码字字幕精品一区二区三区 | 麻豆久久精品国产亚洲av| 亚洲国产精品成人综合色| 岛国毛片在线播放| 国产精品爽爽va在线观看网站| 大又大粗又爽又黄少妇毛片口| 亚洲av免费在线观看| 国产在线一区二区三区精| 最新中文字幕久久久久| 如何舔出高潮| 亚洲真实伦在线观看| 日韩 亚洲 欧美在线| 免费观看av网站的网址| 毛片一级片免费看久久久久| 欧美变态另类bdsm刘玥| 少妇的逼好多水| 成人午夜精彩视频在线观看| 日韩大片免费观看网站| 特大巨黑吊av在线直播| 亚洲熟女精品中文字幕| 国产精品蜜桃在线观看| 少妇人妻一区二区三区视频| 久久久久性生活片| 午夜福利在线在线| 国产精品美女特级片免费视频播放器| 两个人的视频大全免费| 能在线免费看毛片的网站| 亚洲av二区三区四区| 国精品久久久久久国模美| 日本熟妇午夜| 国产综合精华液| av在线亚洲专区| 深爱激情五月婷婷| av在线亚洲专区| 国产黄片视频在线免费观看| 中文资源天堂在线| 国产亚洲午夜精品一区二区久久 | 亚洲在线观看片| 亚洲怡红院男人天堂| 丝瓜视频免费看黄片| 久久精品久久久久久噜噜老黄| 如何舔出高潮| 久久99热这里只有精品18| 中文字幕人妻熟人妻熟丝袜美| 亚洲av.av天堂| 伊人久久国产一区二区| 亚洲综合色惰| 精品一区二区三卡| 一级片'在线观看视频| 日韩视频在线欧美| 一边亲一边摸免费视频| 美女被艹到高潮喷水动态| 久久久久久国产a免费观看| 国产成人精品一,二区| 亚洲熟妇中文字幕五十中出| 国产精品麻豆人妻色哟哟久久 | 少妇人妻精品综合一区二区| 午夜日本视频在线| 午夜爱爱视频在线播放| 日日啪夜夜撸| 国产亚洲一区二区精品| 2021天堂中文幕一二区在线观| 极品教师在线视频| 草草在线视频免费看| 欧美成人精品欧美一级黄| 精华霜和精华液先用哪个| 国产精品伦人一区二区| 亚洲精品成人久久久久久| 午夜福利成人在线免费观看| 搡女人真爽免费视频火全软件| 国产久久久一区二区三区| 国产成人免费观看mmmm| 真实男女啪啪啪动态图| 亚洲18禁久久av| 欧美高清成人免费视频www| 免费看美女性在线毛片视频|