摘要:文章介紹了推薦系統(tǒng)的起源以及當前的發(fā)展水平,描述了推薦系統(tǒng)的推薦算法。文章結(jié)合推薦系統(tǒng)現(xiàn)存的局限性提出了改進的方法,以提高其提供的推薦項的質(zhì)量,使推薦系統(tǒng)能夠得到更廣泛的應(yīng)用。這些改進包括:將用戶打分準則進行細分,以減少主觀因素的影響;建立多維推薦模式,以得出更加準確的推薦等。最后,對推薦系統(tǒng)未來的發(fā)展方向進行了展望。
關(guān)鍵詞:子商務(wù);推薦系統(tǒng);推薦算法;多維評分標準
隨著互聯(lián)網(wǎng)的普及和電子商務(wù)的發(fā)展,電子商務(wù)系統(tǒng)在為用戶提供越來越多選擇的同時,其結(jié)構(gòu)也變得更加復(fù)雜,用戶經(jīng)常會迷失在大量的商品信息空間中,無法順利找到自己需要的商品。電子商務(wù)推薦系統(tǒng)直接與用戶交互,模擬商店銷售人員向用戶提供商品推薦,幫助用戶找到所需商品,從而順利完成購買過程。在日趨激烈的競爭環(huán)境下,電子商務(wù)推薦系統(tǒng)能有效保留用戶,防止用戶流失,提高電子商務(wù)系統(tǒng)的銷售。
自從20世紀90年代第一篇協(xié)同過濾的論文發(fā)表以后,推薦系統(tǒng)已經(jīng)成為了一個重要的研究領(lǐng)域。推薦系統(tǒng)主要通過3種途徑提高電子商務(wù)系統(tǒng)的銷售能力:一是將電子商務(wù)系統(tǒng)的瀏覽者轉(zhuǎn)變?yōu)橘徺I者;二是提高電子商務(wù)系統(tǒng)的交叉銷售;三是保留用戶。即分析用戶的購買習慣,根據(jù)用戶需求向用戶提供有價值的商品推薦。然而除了這些優(yōu)點,推薦系統(tǒng)仍有許多需要改進的地方,以使其在實際生活當中得到更廣泛的應(yīng)用。
一、推薦系統(tǒng)描述
推薦系統(tǒng)是從認知科學、近似理論、信息修復(fù)、預(yù)測理論、管理科學、營銷中的消費者選擇模型等相關(guān)科學理論中發(fā)展起來的。它最初作為一門獨立的學科出現(xiàn)是在20世紀90年代中期,最初的推薦系統(tǒng)研究集中于根據(jù)用戶打分做出合理推薦,其關(guān)鍵問題在于預(yù)測出用戶的打分。
推薦問題可敘述如下:c為某一用戶,s為待推薦項(即要向用戶推薦的產(chǎn)品,如書、電影、飯店等)。值得注意的是,s所包含的項的數(shù)量在一般情況下是很大的,通常要達到萬條記錄以上,甚至有可能上百萬。同時,c所包含的用戶的數(shù)量也很大,這就要求我們要選用那些高效率的推薦算法,否則極易引起數(shù)據(jù)堵塞。u是對于某一用戶c來說,項s的可用性,即u:C×S→R。
在推薦系統(tǒng)中,每個推薦項的可用性通常由比率代替,代表某一用戶對某一特定項的喜愛程度,然而在某些情況下,項的可用性也會帶有任意性或利益性,因為用戶在打分的時候不能保證完全從對該項的喜愛程度的角度出發(fā),許多客觀因素都有可能影響用戶的打分行為,例如,某用戶可能本來很喜歡a餐館,但最近一次在該餐館就餐時發(fā)生過不愉快的事情,則用戶在對該餐館打分時極可能給出較低分數(shù),這就使得項的可用性發(fā)生了偏差。
為了解決此類問題,我們提出以下方法:將用戶對項的大類進行細化。仍舊以a餐館為例,將用戶對餐館的打分細分為3項:飯菜質(zhì)量、用餐環(huán)境、餐廳服務(wù)。讓用戶對每一項分別打分,再將3個得分按權(quán)重求和,得出該餐館的可用性u值。這種細分能過最大化的降低客觀因素對用戶打分的影響,使用戶對項的打分較為準確、真實,但數(shù)據(jù)處理量也相應(yīng)增大,且各種分類的權(quán)重較難確定,因此在實施時有一定的困難,還應(yīng)進一步完善。
推薦系統(tǒng)可以根據(jù)推薦算法分為3類.基于內(nèi)容的推薦算法:在啟發(fā)式研究中較常使用的研究方法有:IF-TDF(信息恢復(fù))、聚類等。在基于模型的研究中常使用的方法有:貝葉斯分類、聚類、決策樹、人工智能網(wǎng)絡(luò)等?;趨f(xié)同過濾的推薦算法:在啟發(fā)式研究中較常使用的研究方法有:最近鄰居法(計算兩者間的余弦或相關(guān)性)、聚類、圖論等。在基于模型的研究中常使用的方法有:貝葉斯網(wǎng)、聚類、人工智能網(wǎng)絡(luò)、線性回歸、概率模型等。
混合型推薦算法:在啟發(fā)式研究中較常使用的研究方法有:對預(yù)測值進行現(xiàn)行組合、分析各種打分表、將某種方法的一部分嵌入到其他方法中等。在基于模型的研究中常使用的方法是:將某模型的一部分嵌入到其他模型中,建立一個新的綜合模型。
二、多維的推薦
目前的推薦系統(tǒng)只在二維空間上操作。也就是說,這種推薦系統(tǒng)只是基于用戶和項的信息做出推薦,并沒有考慮額外的相關(guān)信息。而恰是這些額外的相關(guān)信息可能在某些情況下對推薦結(jié)果有著十分重要的影響。在多數(shù)情況下,產(chǎn)品對于用戶的可用性十分依賴于用戶使用該產(chǎn)品的時間(如一年中的某個季度或月份,或一星期中的某一天);它還可能依賴于用戶是與誰一起消費或分享該產(chǎn)品;在什么樣的環(huán)境下等其他相關(guān)因素。此時,僅簡單地將得分最高的項推薦給用戶是不夠的,推薦系統(tǒng)還必須能夠應(yīng)用額外的相關(guān)信息(如時間、地點、用戶的同伴)對用戶提供更加精準的推薦。例如,為用戶推薦旅行箱時,推薦系統(tǒng)也同時應(yīng)該考慮該用戶是在一年中的哪個時段、和誰去旅行;旅程的條件如何;旅途中有哪些限制等。所以,將二維的推薦空間擴展到多維推薦空間是十分必要的,這將極大程度地提高推薦系統(tǒng)的推薦效果。
三、總結(jié)和展望
目前的推薦系統(tǒng)在推薦質(zhì)量上仍有很大的不足,難以較好地滿足用戶的需求。因此,如何進一步改進推薦算法,提高推薦質(zhì)量,是當前推薦系統(tǒng)發(fā)展所要解決的根本問題。同時,由于各種移動終端的快速發(fā)展,移動用戶的數(shù)量也急劇增加,研究出適合在移動終端(如手機)上使用的推薦系統(tǒng)是未來推薦系統(tǒng)的主流發(fā)展方向,其要解決的根本問題在于如何提高推薦算法的效率。
參考文獻:
1、Gediminas Adomavicius,Alexander
Tuzhilin:Toward the Next Generation of Recommender Systems:A Survey of the State-of-the-Art and Possible Extensions.
2、AgrawalR.:R.Srikant.2000.Privacy-preserving data mining.Proc.2000 ACM SIGMOD Internat.Conf[M].Management of Data.ACM Press,2000.
3、蔣良孝,蔡之華.分布式數(shù)據(jù)挖掘研究[J].計算機與現(xiàn)代化,2002(9).
*本文為廣東省自然科學基金資助項目(項目編號:04009492,06201498)。
(作者單位:廣東工業(yè)大學經(jīng)濟管理學院)