張時俊,王永恒
(湖南大學 信息科學與工程學院,湖南 長沙 410082)
基于矩陣分解的個性化推薦系統(tǒng)研究
張時俊,王永恒
(湖南大學 信息科學與工程學院,湖南 長沙 410082)
隨著社交網(wǎng)絡(luò)的快速發(fā)展,用戶在使用社交應(yīng)用時會產(chǎn)生大量有價值的數(shù)據(jù)。通過對社交網(wǎng)絡(luò)進行數(shù)據(jù)挖掘,發(fā)現(xiàn)隱藏在數(shù)據(jù)中關(guān)聯(lián)用戶與物品之間的偏好關(guān)系。然后對用戶建模分析,選擇合適的推薦引擎進行個性化物品推薦,這是一個非常有價值的研究方向。該文重點研究矩陣分解算法對處理大規(guī)模用戶與物品評分矩陣的推薦效果,為了提高推薦的準確度展開了對用戶社交關(guān)系和隱性反饋的研究,在組合預測模型中加入社交關(guān)系、人口統(tǒng)計學信息配置項、用戶的消費記錄等隱因子項,通過實驗驗證了擴展之后的混合預測模型在RMSE值上比SVD算法降低了0.259 475,在推薦性能有較大幅度的提高。
矩陣分解;個性化推薦系統(tǒng);社交網(wǎng)絡(luò);用戶建模
隨著社交網(wǎng)絡(luò)和電子商務(wù)的快速發(fā)展,推薦系統(tǒng)在學術(shù)界和工業(yè)界的研究變得日益火熱。搜索引擎和推薦系統(tǒng)都是解決信息過載問題的有力工具,搜索引擎是一種主動式搜索信息工具,用戶通過關(guān)鍵字在搜索引擎上找到想要的信息。推薦系統(tǒng)是自主的提供信息推薦工具,它學習用戶的歷史行為數(shù)據(jù),獲取用戶的興趣偏好,將物品列表以topN順序推薦給用戶。推薦系統(tǒng)廣泛應(yīng)用于社交網(wǎng)絡(luò)中,近年來越來越多的用戶在使用社交網(wǎng)絡(luò),如國外的Facebook、Twitter國內(nèi)的微博等。據(jù)2014年新浪微博用戶發(fā)展報告可知,微博的月活躍用戶數(shù)為1.67億,用戶每天發(fā)布博文數(shù)量超過1億條。基于社交網(wǎng)絡(luò)如此巨大的用戶和數(shù)據(jù),在本文中將搭建基于社交網(wǎng)絡(luò)的推薦系統(tǒng)平臺。服務(wù)于信息生產(chǎn)者,向信息消費者推薦社交網(wǎng)絡(luò)上對他們有價值的信息流;或者服務(wù)于商品廠家,將商品廠家的產(chǎn)品推薦給潛在感興趣的用戶。推薦系統(tǒng)的任務(wù)就是聯(lián)系用戶和物品,將合適的物品推薦給合適的用戶。本文的課題是基于微博做個性化推薦研究,結(jié)合微博上豐富的上下文信息(如用戶之間的社交關(guān)系、用戶隱性反饋)實現(xiàn)高準確度的個性化物品推薦。
目前基于社交網(wǎng)絡(luò)的推薦研究在國內(nèi)可以分為三類: (1)信息流的會話推薦,如文獻[1]使用推薦系統(tǒng)將用戶可能感興趣的微博靠前放置,幫助用戶更快更好的獲得信息;(2)給用戶推薦好友,增加用戶社交圈子,如文獻[2]主要是為用戶做好友推薦,挖掘出用戶潛在有價值的好友去關(guān)注擴大用戶的社交圈子;(3)利用用戶的社交網(wǎng)絡(luò)信息對用戶進行個性化物品推薦,實現(xiàn)用戶與商家互贏,如在文獻[3]中作者用LDA主題模型[4]向用戶推薦物品,以及文獻[5]中的基于微博營銷,作者用數(shù)據(jù)挖掘相關(guān)技術(shù)推薦物品給潛在用戶。本文著重研究物品推薦,難點在于用戶與物品的規(guī)模較大,評分數(shù)據(jù)稀疏,用戶的反饋數(shù)據(jù)隱藏在海量數(shù)據(jù)中,獲取和建模較難,混合預測模型參數(shù)的學習開銷較大。
在基于矩陣分解的推薦系統(tǒng)研究上,國內(nèi)外的一些研究工作具體如下。如Pu 等人基于SVD 從訓練數(shù)據(jù)中重構(gòu)一個潛在特征的空間,也就是將missing rating 給補上,并用hyper graph模型證明理論[6]。Liu等人將上下文信息作為多維用戶物品評分矩陣,它區(qū)別于一般的二維用戶物品評分矩陣,可提高關(guān)聯(lián)評分的準確度[7]。Pagare等人將用戶社交關(guān)系考慮進來,重新設(shè)計一個目標優(yōu)化函數(shù)[8]。Jamali將社交網(wǎng)絡(luò)中用戶之間的信任度考慮進來,并得到不錯的推薦效果[9]。Ma等人通過考慮社交網(wǎng)絡(luò)中的上下文信息進行更加精準的推薦[10]。這些國內(nèi)外最新的研究成果很大地促進了推薦算法在工業(yè)界和學術(shù)界的發(fā)展。
對于社交推薦系統(tǒng),研究者研究的重點和難點,主要分為三個方面。首先是用戶的興趣偏好和物品的特征提取。在推薦系統(tǒng)中初始用戶的興趣偏好存在初始數(shù)據(jù)不夠多,興趣偏好精度不夠細等問題;其次是研究的多維度問題,在推薦過程中為了提高推薦的準確度,需要考慮各種上下文信息,在不同的維度下推薦的結(jié)果會不一樣,只有充分利用用戶的反饋數(shù)據(jù),以及涉及用戶和物品的上下文信息,才會獲取更加準確的推薦效果;最后是推薦性能評價指標問題,用戶對算法準確度的敏感度、算法對物品的普適度、選擇何種評價指標是推薦系統(tǒng)領(lǐng)域研究的難點。
本文中針對以上重點和難點做了以下幾部分工作。首先基于微博提出了一個離線的推薦系統(tǒng)框架,框架包括用戶興趣建模模塊和推薦引擎模塊;其次基于矩陣分解算法結(jié)合微博系統(tǒng)的上下文特征對矩陣分解模型做了多個部分的擴展,比如對引入的上下文信息,包括人口統(tǒng)計學信息(如年齡、性別)、互相關(guān)注的好友集合、用戶的消費記錄等。本文通過不同方式將不同類型數(shù)據(jù)建模在同一混合預測模型中,充分地優(yōu)化了預測模型的性能。通過實驗驗證了擴展之后的混合預測模型在RMSE值上比SVD算法降低了0.259 475,在推薦性能上有較大幅度的提高。
新浪微博是國內(nèi)最大的微博平臺,數(shù)以億計的用戶在微博上傳播與自身相關(guān)的信息。對用戶建模的目的是獲取一個增量式的用戶配置文件[11](user profile)。通過微博爬蟲系統(tǒng)爬取用戶的微博文本數(shù)據(jù)、用戶的上下文數(shù)據(jù)、用戶的注冊數(shù)據(jù),從而構(gòu)建成用戶的配置文件。由于微博用戶中存在大量的垃圾用戶(僵尸粉、廣告推銷賬號)、各類機構(gòu)認證平臺(包括政府機構(gòu)、高校、新聞平臺、報紙媒介、電視平臺、明星等)。這些用戶在微博平臺主要發(fā)表與本身無關(guān)的信息,如僵尸粉是為了作為成為別的用戶粉絲的一員而存在,它們不會或者很少發(fā)表有關(guān)自身的博文;再如各類機構(gòu)認證平臺(如@湖南大學),這些賬號是為了宣傳各自機構(gòu)的相關(guān)信息,所發(fā)表的信息也不會關(guān)聯(lián)自身與物品的偏好。而普通用戶關(guān)注自己感興趣的賬號,發(fā)表的微博內(nèi)容一部分會關(guān)聯(lián)用戶本身與某些物品之間的信息,還會與自己的社交好友進行互動。所以,我們研究的用戶就是普通用戶。
為了過濾掉垃圾用戶,在對用戶進行數(shù)據(jù)爬取前,需要對用戶進行預處理。用戶預處理[12]可以減少無價值用戶帶來大量數(shù)據(jù)處理所占用的資源。本文系統(tǒng)將用戶活躍度、用戶行為總和作為過濾指標對垃圾用戶處理。對于認證用戶(包括藍V和橙V),經(jīng)過觀察發(fā)現(xiàn),這部分賬號與我們所研究的用戶對象是不相匹配的,也排除在用戶集合之外。得到用戶集合之后,根據(jù)用戶ID爬取與用戶相關(guān)的大量文本信息。在處理這些文本信息時,本文主要要獲取的是基于用戶有價值的信息,包括用戶在過往歷史上發(fā)表的微博內(nèi)容、用戶與其好友在評論上的互動、用戶的注冊信息。通過機器學習算法對微博內(nèi)容分類:(a)用戶消費記錄,(b)用戶對某物的偏好信息,(c)用戶潛在的需求信息,(d)其他。對微博文本分類之后,對文本的處理分為三個部分:中文分詞、特征提取、情感分析。對于a類文本只需要提取用戶與物品消費記錄。對于b類文本需要進行情感分析[13],微博短文本情感分析主要有兩種方法:情感詞典和機器學習方法。對于c類文本的處理等同于a類文本的處理,即提取出用戶與物品之間的需求記錄。d類信息不做處理,無須存儲到用戶的user profile中。
配置每個用戶的user profile,用xml或son文本格式對用戶信息標記存儲。這種半結(jié)構(gòu)化文檔格式在對文檔進行向量化操作時具有簡單、快速的優(yōu)勢。User profile存在增加、修改、刪除、解析等行為。存儲在用戶建模文件中的這些數(shù)據(jù)分為三層:
(1) 評分數(shù)據(jù)構(gòu)成了評分矩陣M的初始數(shù)據(jù)。
(2) 潛在用戶需求數(shù)據(jù)通過評分函數(shù)轉(zhuǎn)化成評分矩陣繼續(xù)存儲到矩陣M中。
(3) 還有一層是用于訓練預測模型,其分為三類: (a)用戶消費記錄,(b)人口統(tǒng)計學信息如年齡、性別等,(c)用戶之間的社交關(guān)系,即互相關(guān)注的好友UID集合。
對用戶的配置文件進行處理,第一層——用戶與物品的偏好信息直接存儲到評分矩陣M中。第二層用戶對物品潛在的需求信息將通過一個評分函數(shù)R[見公式(1)]計算出評分值,也存儲到矩陣M中。評分函數(shù)需要考慮兩個方面,一個是用戶u已經(jīng)評分了的所有物品的平均值,另一個是計算得到用戶與用戶之間的相似度,然后將不同的用戶在同一物品的評分差與這兩個用戶之間的相似度相乘,對該項式進行正規(guī)化。
計算用戶對物品的評分的主要思想是計算與用戶關(guān)聯(lián)的物品集合準確的評分,一般而言是用戶潛在的需求物品。用一個數(shù)組存儲已確認的用戶對物品評分,通過設(shè)計一個評分函數(shù)描述用戶對物品的不確定評分轉(zhuǎn)換為確定評分。在評分函數(shù)中主要的計算量體現(xiàn)在計算用戶之間的相似度。對計算評分函數(shù)的算法描述如算法1所示,其中floor()函數(shù)為向下取整函數(shù),ceil()函數(shù)為向上取整函數(shù):
算法1:計算用戶U對物品I的評分(1-5)1:Input:user_avg_rating[USER_NUM]:存儲每個用戶已經(jīng)評分了的所有物品的平均值。2:ψ:對同一物品I評分的所有用戶集合。3:M:用二維數(shù)組存儲用戶與物品的評分值。從該數(shù)據(jù)結(jié)構(gòu)中讀取出不同用戶對不同物品的評分值。4:Output:RUI:用戶U對物品I的評分值,將其存放到M中5:while(v∈ψ):6:computeKbyEq.37:K?=(RVI-RV)8:endwhile9:computeRUIbyEq.1,對RUI整合如下:RUI=floor(RUI);if(floor((RUI-floor(RUI))×10)<5)ceil(RUI);Otherwise{11:Update:user_avg_rating[USER_NUM],M
矩陣分解算法[15]是近幾年來在推薦系統(tǒng)領(lǐng)域最流行的算法,特別是在Netflix大賽的激勵下許多基于矩陣分解去解決推薦系統(tǒng)問題的論文層出不窮。矩陣分解能充分利用各種因素的影響,如社交關(guān)系、上下文信息等,可以帶來更好的推薦結(jié)果,具有非常優(yōu)秀的可擴展性。矩陣分解通俗來說就是如何通過降維的方法將評分矩陣補全,用戶的評分行為可以表示成一個評分矩陣R,其中R[u][i]就是用戶u對物品I的評分。但是用戶不會對所有物品進行評分,所以這個評分矩陣中很多元素是空的,這些空的元素稱為缺失評分,因此評分預測從某種意義上說就是填空,如果一個用戶對一個物品沒有評過分,那么推薦系統(tǒng)就要預測這個用戶是否會對這個物品進行評分,及會評多少分。
4.1 奇異值分解
矩陣分解一般采取SVD[16]及PCA[17]方法。SVD是一種重要的矩陣分解方法,如公式(4)所示,在實際應(yīng)用中只關(guān)心矩陣的主特征,前10%甚至1%的奇異值之和就占有全部奇異值的90%以上,所以可以忽略較小的奇異值,用一部分較大的奇異值來近似描述矩陣。在應(yīng)用中可以降低運算復雜度,減少存儲內(nèi)存。
k是一個遠遠小于m、n的數(shù)值,右邊的矩陣相乘的結(jié)果是一個近似A的矩陣。SVD常用來降維,在實際應(yīng)用中將輸入評分矩陣映射到一個低緯空間,然后分析潛在的用戶與物品之間的偏好關(guān)系?;贚atentFactorModel[18],通過最小化損失函數(shù)的方式學習用戶特征矩陣和物品特征矩陣。最基礎(chǔ)的分解公式為等式(5),評分矩陣R被分解成兩個低緯矩陣VT∈Rl×m,U∈Rl×n。這兩個矩陣將用戶和物品投影到一個相同的l維度空間,這個空間是不定性的,它可以看成是影響用戶對物品進行評分的各個因素。
加上預測基準的的評分預測模型Bias-SVD,其可表示為公式(6),μ表示全局評分的平均數(shù),bi是物品偏置項,bu是用戶偏置項。實際學習中bi和bu是經(jīng)過學習訓練等式(7)得到的。
4.2 組合預測模型
在每個用戶的userprofile中第三層的a類消費記錄作為隱性反饋加入到預測模型中。我們不管用戶是否對物品進行評價或者評價程度,只需要確定這種消費是否發(fā)生。用一個二值矩陣表示[19],0 表示用戶未對物品消費,1 表示用戶已經(jīng)消費過物品。此時預測模型為公式(8)。其中Ru包含了用戶u評價過的物品以及通過評分函數(shù)獲得的物品集合,yj是一個指示函數(shù)用戶u對物品j消費過則值為1,否則值為0。
(8)
在每個用戶的userprofile中第三層的b類為人口統(tǒng)計學信息,如用戶的年齡,性別,職業(yè)等。這些信息對預測用戶與物品之間的興趣程度也有非常大的影響。在預測模型中應(yīng)該將這些信息加入進去。因此使用雙線性模型[20]對人口統(tǒng)計學信息中的年齡和性別建模。將年齡分為k個組,每個組按照性別分為二類,所以得到2k個組。令g(u)為用戶u所屬的組編號(1<=g(u)<=2k)。eg(u)是單位向量第g(u) 值為1,其余為0.w為參數(shù)矩陣將向量空間映射到一個k維空間。βi為系數(shù)向量。加上雙線性模型之后的預測模型為式(9)。
4.3 預測模型參數(shù)學習
用一個平方損失函數(shù)表示我們需要獲得的學習結(jié)果,該函數(shù)表示如式(11)所示。
然后對該損失函數(shù)求最小解。采用SimonFunk[21]提出的隨機梯度下降法,對訓練集中的所有評分進行循環(huán),對于每一個評分值,計算實際評分與計算評分的誤差[見式(12)],通過求參數(shù)的偏導數(shù)找到最快速的下降方向,迭代優(yōu)化參數(shù)bu、bi、Uu、Vv、W如式(13)~式(17)所示。
其中,r表示學習速率,eui表示真實評測值和預測值之間的偏差。對參數(shù)進行學習的過程,會趨于一個擬合的狀態(tài)。通過迭代能得到預測之后的用戶物品的評分矩陣,通過排序、過濾等操作最終得到一個TopN的物品推薦列表。
實驗基于新浪微博爬取的大量微博數(shù)據(jù),包括用戶所有微博文本、用戶人口統(tǒng)計學信息(如性別年齡等)、用戶的社交關(guān)系(即用戶關(guān)注的好友列表)。因為缺乏合適的數(shù)據(jù)集,在用戶建模階段根據(jù)HTMUNIT開源工具開發(fā)了基于微博的爬蟲系統(tǒng),一共抓取了63 641個用戶,2 484 455條微博內(nèi)容。經(jīng)過預處理得到10 847個用戶,對每個用戶建模分析,將每個用戶的人口統(tǒng)計學信息、社交關(guān)系中關(guān)注的好友列表都存儲在數(shù)據(jù)庫中。數(shù)據(jù)集規(guī)模如表1所示。
表1 數(shù)據(jù)集規(guī)模
采用均方根誤差RMSE和評價絕對誤差MAE對實驗結(jié)果進行評價。這兩個評價指標的值越低表示預測的準確度越高。然后是平均準確率MAP@3,值越大表示越準確。
預測模型在不同規(guī)模訓練集下取得的評測值如表2所示,從表中可以觀察到訓練集的規(guī)模越大,RMSE和MAE值越小,表示預測用戶對物品的評分準確度越高。該實驗K值為100,是固定的,K表示將潛在用戶特征向量及潛在物品特征向量映射到K維的矩陣空間,K也可以理解為選取用于預測的特征數(shù)量。
表2 預測模型在不同規(guī)模訓練集下取得的評測值
圖1和圖2表示在不同K值下,相同的訓練規(guī)模80下的RMSE和MAE值的變化范圍。從圖中可以觀測到選取的K值不是越大越好,而是要選擇最合適的K值才能得到最準確的預測值。在本次實驗中K為60時,推薦的準確度最高。這也反映了矩陣分解算法在推薦系統(tǒng)里對結(jié)果的解釋沒有協(xié)同過濾那么直接。
圖1 預測模型在不同K值下的RMSE值
圖2 預測模型在不同K值下的MAE值
表3表示在相同數(shù)據(jù)集,相同訓練規(guī)模80%下,基于用戶的協(xié)同過濾算法(Based User CF)、基于物品的協(xié)同過濾算法(Based Item CF)、SVD、預測模型(prediction Model)得到的評測值RMSE和MAE。從表3可以看到在數(shù)據(jù)集下,矩陣分解算法預測準確度優(yōu)于協(xié)同過濾算法,預測模型預測準確度優(yōu)于SVD。
表3 不同算法的評測值
另一個實驗評價指標采用平均準確率MAP@3,其值越大表示推薦精度越高即預測模型越準確,表4表示相同數(shù)據(jù)集下,加入不同信息融合的預測模型運行的結(jié)果。從該表中看到實驗號為3到8加入不同類別的建模信息都能有效的提高模型的準確度,其中加入用戶社交關(guān)系信息實驗指標增加的幅度最大,表示用戶社交關(guān)系信息對模型的提高最大。
表4 不同組合預測模型的準確度
本文基于新浪微博系統(tǒng),對普通用戶進行建模分析,獲得用戶非常豐富的人口統(tǒng)計學信息和用戶在歷史文本中表現(xiàn)用戶與物品之間有價值的信息,以及基于用戶的上下文信息(主要包括用戶之間的社交關(guān)系)。預測模型基于SVD算法,通過組合上述數(shù)據(jù)構(gòu)建一個組合預測模型,充分利用了用戶的反饋數(shù)據(jù),比如將用戶的消費記錄作為物品的隱因子加入到預測模型中,通過實驗發(fā)現(xiàn)能較大提高模型的預測精確度。采用雙線性模型對人口統(tǒng)計學信息建模,作為配置項加入到預測模型中。社交關(guān)系是最重要的上下文信息,在現(xiàn)在的推薦系統(tǒng)研究中,上下文信息是研究的重要部分,本文將用戶的社交關(guān)系作為物品的隱因子加入到預測模型中,通過實驗驗證了該預測模型具備更加優(yōu)異的預測準確度。
[1] 慕福楠. 面向微博用戶的推薦多樣性研究[D]. 哈爾濱工業(yè)大學碩士學位論文, 2013.
[2] 石麗麗. 面向微博用戶的內(nèi)容與好友推薦算法研究與實現(xiàn)[D]. 北京郵電大學碩士學位論文, 2014.
[3] 張曉婕. 基于微博用戶興趣模型的個性化廣告推薦研究[D]. 華東師范大學碩士學位論文, 2014.
[4] Blei D M, Ng A Y, Jordan M I. Latent dirichlet allocation[J]. the Journal of machine learning research, 2003, 3: 993-1022.
[5] 王利. 基于數(shù)據(jù)挖掘技術(shù)的微博營銷系統(tǒng)的設(shè)計與實現(xiàn)[D]. 華中科技大學碩士學位論文, 2013.
[6] Pu L, Faltings B. Understanding and improving relational matrix factorization in recommender systems[C]//Proceedings of the 7th ACM conference on Recommender systems. ACM, 2013: 41-48.
[7] Liu X,Aberer K. SoCo: a social network aided context-aware recommender system[C]//Proceedings of the 22nd international conference on World Wide Web. International World Wide Web Conferences Steering Committee, 2013: 781-802.
[8] Pagare R, Patil S A. Social recommender system by embedding social regularization[C]//Proceedings of Advance Computing Conference (IACC), 2014 IEEE International. IEEE, 2014: 471-476.
[9] Jamali M, Ester M. A matrix factorization technique with trust propagation for recommendation in social networks[C]//Proceedings of the fourth ACM conference on Recommender systems. ACM, 2010: 135-142.
[10] Ma H, Zhou T C,Lyu M R, et al. Improving recommender systems by incorporating social contextual information[J]. ACM Transactions on Information Systems (TOIS), 2011, 29(2): 9.
[11] Manzato M G, Goularte R. A multimedia recommender system based on enriched user profiles[C]//Proceedings of the 27th Annual ACM Symposium on Applied Computing. ACM, 2012: 975-980.
[12] 崔春生. 不同推薦系統(tǒng)輸入的聚類實現(xiàn)[J]. 應(yīng)用泛函分析學報, 2014, 16(2): 121-128.
[13] Xiong X B, Zhou G, Huang Y Z, et al. Dynamic evolution of collective emotions in social networks: a case study of Sina weibo[J]. Science China Information Sciences, 2013, 56(7): 1-18.
[14] 項亮. 推薦系統(tǒng)實踐[M]. 北京: 人民郵電出版社, 2012.203-204.
[15] Jamali M, Ester M. A matrix factorization technique with trust propagation for recommendation in social networks[C]//Proceedings of the fourth ACM conference on Recommender systems. ACM, 2010: 135-142.
[16] Rokach L, Shapira B, Kantor P B. Recommender systems handbook[M]. New York: Springer, 2011.
[17] Jolliffe I. Principal component analysis[M]. John Wiley & Sons, Ltd, 2002.
[18] Koren Y, Bell R, Volinsky C. Matrix factorization techniques for recommender systems[J]. Computer, 2009 (8): 30-37.
[19] 余秋宏. 基于因子分解機的社交網(wǎng)絡(luò)關(guān)系推薦研究[D]. 北京郵電大學碩士學位論文, 2013.
[20] Tenenbaum J B, Freeman W T. Separating style and content with bilinear models[J]. Neural computation, 2000, 12(6): 1247-1283.
[21] Funk S. Netflix update: Try this at home[DB/OL], http://sifter.org/simon/;journal/20061211.html(2006).
PersonalizedRecommenderSystemBasedonMatrixFactorization
ZHANG Shijun, WANG Yongheng
(College of Information Science and Engineering Hunan University, Changsha, Hunan 410082, China)
With the development of social network, there is a large amount of valuable information produced by social network users. This paper focused on the personification recommender system based on matrix factorization. In order to improve the recommender systems, we study the user social relationship and the implicit feedback of user. We add in the matrix factorization optimization function by a social regularization, a demographic information configuration item, and the consumer records as item’s latent factor bias. Experiments indicates a decrease in RMSE by 0.259475 achieved by the proposed method than SVD algorithm.
matrix factorization; personalized recommender system; social network; user mode
張時俊(1991—),碩士,主要研究領(lǐng)域為推薦系統(tǒng)、數(shù)據(jù)挖掘。
王永恒(1973—),博士,副教授,主要研究領(lǐng)域為大數(shù)據(jù)、數(shù)據(jù)流處理及人工智能。
1003-0077(2017)03-0134-06
2016-02-21定稿日期: 2016-05-07
國家自然科學基金(61371116)
TP391
: A