王嫣妮
摘要:隨著推薦應用的不斷拓展和深化,多樣性在個性化推薦中得到了越來越多的重視。為了對多樣性推薦有著更加深入且準確的理解,文章對于推薦多樣性研究相關的國內外研究現狀進行綜述,主要從以下兩個方面進行論述:推薦多樣性的定義與度量、提高推薦多樣性的方法,在此基礎上,對多樣性推薦的研究現狀進行梳理與總結。
關鍵詞:個性化推薦系統;推薦多樣性;研究進展
個性化推薦系統是在信息過載的大背景下應運而生的產物。在個性化推薦系統產生之初,學者們的關注焦點落在推薦結果的準確性上,隨著用戶對推薦結果的要求越來越高,推薦的多樣性受到了越來越多的關注。推薦多樣性與用戶的滿意度以及長尾效應密切相關。提高推薦結果的多樣性不僅能提供用戶的滿意度,增加用戶粘性,還能拉動長尾物品的潛在價值,增加商家的收益,因此,其研究意義重大。學者們對個性化推薦系統的多樣性進行了研究并取得了較大的進展。如何在維持一定程度的準確性的基礎上,提高推薦的多樣性就成為了推薦系統研究的重點。為了更好地梳理個性化推薦系統中的多樣性推薦的研究進展,為未來的研究提供參考思路,本文分別從推薦多樣性的定義與度量、提高推薦多樣性的方法兩個維度來對推薦多樣性的研究現狀進行綜述。
一、推薦多樣性的定義與度量
推薦多樣性的定義從提出開始,一直在被不斷完善。Smyth和McClave最先提出了推薦系統的多樣性問題并進行了研究,指出推薦結果除了考慮準確性外還應該考慮新加入的物品與列表中物品間的不相似程度,這也促成了內部多樣性評價指標的提出。不同的研究人員對于多樣性的定義不同,因而采用不同的方式來度量推薦結果的多樣性。在眾多的關于多樣性的定義與度量中,最基礎的還是以推薦列表中兩兩物品間的不相似程度來衡量其多樣性。
在對多樣性進行評估時,不同的研究采用不同的度量標準與方法。比如,Vargas 等認為推薦多樣性是類型覆蓋率與非冗余性的結合,其中類型覆蓋率值推薦列表包含的物品的種類多少,非冗余性指推薦列表中不出現屬于同一類型的物品。因此,該文獻采用兩者的乘積來度量推薦結果的多樣性。此外,從對推薦結果多樣性的不同分類上,有著不同的度量方法。安維等將推薦多樣性分為個體多樣性、總體多樣性、時序多樣性,并總結出以下幾個主要的衡量個性化推薦系統多樣性的指標:ILS(推薦列表中項目的平均兩兩相似性)、海明距離、平均度、SSD(沒有在之前的推薦列表中出現過的推薦項目所占的比重)、集中指數、覆蓋率。王斌和曹菡采用EPD和ILD來衡量旅游推薦系統的新穎性和多樣性。除了以上三種多樣性,有的學者提出分布多樣性,即用以衡量推薦結果在整體分布上的豐富程度。其中,推薦結果的個體多樣性和總體多樣性最為常用。
二、提高推薦多樣性的方法
在對各種提高推薦多樣性的方法進行分類過程中,根據所選擇的標準不同會有不同的分類結果。安維等從信息物理方法、二次優(yōu)化方法、社會網絡方法以及時間感知方法來論述提高推薦多樣性的不同方式。而從提高推薦多樣性的方法所發(fā)生的階段上來看,主要有兩種方式:改善推薦算法和進行二次優(yōu)化。下文分別從這兩個角度來對提高推薦多樣的方法進行綜述。
首先介紹通過改善推薦算法來提高推薦結果的多樣性的研究。改進推薦算法發(fā)生在推薦列表產生過程中。有的研究通過考慮除了評分之外的其他因素來進行改進,比如用戶的多樣性偏好、用戶間的信任等。相似度的計算是推薦算法的核心步驟,因而在相似度的計算上采取一定的措施不失為一個提高多樣性的好思路。而根據現有的研究文獻,對相似度的計算進行改進的方式又大致可以分為以下兩種:對流行性進行懲罰以及改變選擇鄰居用戶的策略。其中前一種方法,對流行性進行懲罰又可以分為兩種:懲罰活躍用戶和懲罰流行物品。其次,提高多樣性的方法是進行二次優(yōu)化,其對面向準確性的推薦列表根據不同的優(yōu)化策略進行二次優(yōu)化操作,從而提高推薦結果的多樣性,而這類方法集中在重排序階段。Adomavicius 和 Kwon引入評分閾值作為參數來對閾值以上的物品進行重新排序。吳穎杰等采用分段推薦法來提高系統的多樣性。此外,有的研究還采用將多樣性推薦問題轉化為其他問題來實現推薦多樣性的提高。比如,Malekzadeh 和 Kaed通過將推薦問題轉化為一個多目標優(yōu)化問題,采用模擬退火算法來進行計算。該方法的三個目標為:個性化多樣性、減少流行物品增加長尾物品以及準確性。劉慧婷和岳可誠將最大化總體多樣性問題轉化為最大化物品分布均勻度的問題。
三、結語
推薦系統作為緩解信息過載的有效手段之一,從出現至今不斷發(fā)展完善。最初,一個好的推薦系統往往聚焦于推薦準確性。隨著推薦系統地不斷發(fā)展,推薦質量的衡量已不僅局限在推薦準確性上,推薦多樣性等其他維度的推薦質量越來越受到重視。推薦多樣性自提出以來,其定義在被不斷完善,對多樣性的度量也不斷豐富。學者們將推薦多樣性進行了分類,主要有個體多樣性、總體多樣性、分布多樣性、時序多樣性等。在提高推薦多樣性上,學者們嘗試了很多方法,主要包括直接改進推薦算法與二次優(yōu)化。對于直接改進推薦算法,主要通過考慮除了評分之外的其他因素來實現,比如用戶對物品進行評分的概率、用戶的多樣性偏好、用戶的好奇心等。另外,對相似度的計算進行改善也有著較好的效果。在二次優(yōu)化方法中,重排序方法是提高推薦多樣性的較為高效簡潔且可擴展性的方法,不同的學者嘗試了不同的重排序方法,比如將物品根據流行性倒排序。
任何拋開推薦準確性的多樣性都會失去原本的意義,面向多樣性的推薦常常需要以面向準確性的推薦算法為基礎。未來,如何在推薦準確性與多樣性之間更好地達到平衡,有著重要的研究意義。
參考文獻:
[1]Bradley K, Smyth B. Improving recommendation diversity[C].2001.
[2]Vargas S, Baltrunas L, Karatzoglou A, et al. Coverage, Redundancy and Size-Awareness in Genre Diversity for Recommender Systems[C].Foster City,Silicon Valley,California,USA:ACM,2014:209-216.
[3]安維,劉啟華,張李義.個性化推薦系統的多樣性研究進展[J].圖書情報工作,2013,57(20):127-135.
[4]王斌,曹菡.基于新穎性和多樣性的旅游推薦模型研究[J].計算機工程與應用,2016,52(06):219-222.
[5]Fleder D M, Hosanagar K. Recommender Systems and their Impact on Sales Diversity[C].San Diego, California,USA: ACM New York,NY,USA,2007:192-199.
[6]鄧明通,劉學軍,李斌.基于用戶偏好和動態(tài)興趣的多樣性推薦方法[J].小型微型計算機系統,2018,39(09):2029-2034.
[7]李吉,黃微,郭蘇琳.一種基于相似度和信任度融合的微博內容推薦方法[J].圖書情報工作,2018(11):112-119.
[8]Karakaya M, Aytekin T. Effective methods for increasing aggregate diversity in recommender systems[J]. Knowledge and Information Systems,2018,56(02):355-372.
[9]Adamopoulos P,Tuzhilin A.On Over-
Specialization and Concentration Bias of Recommendations: Probabilistic Neighborhood Selection in Collaborative Filtering Systems[C].Foster City, Silicon Valley,CA,USA:ACM,2014:153-160.
[10]Yang J X, Wang Z Y. An Improved Top-N Recommendation for Collaborative Filtering[A].Li Y,Xiang G, Lin H, et al. Communications in Computer and Information Science.SINGAPORE: SPRINGER-VERLAG SINGAPORE PTE LTD,2016:233-244.
[11]Zhao X, Niu Z, Chen W. Opinion-Based Collaborative Filtering to Solve Popularity Bias in Recommender Systems[C]Springer-Verlag Berlin Heidelberg, 2013:426-433.
[12]Adomavicius G, Kwon Y. Improving Aggregate Recommendation Diversity Using Ranking-Based Techniques[J].IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING,2012,24(05):896-911.
[13]吳穎杰,徐洪波,康瑞.一種基于協同過濾和排序的多樣性增強的推薦算法[J].電子測量技術,2018,41(08):7-12.
[14]Malekzadeh Hamedani E, Kaedi M. Recommending the long tail items through personalized diversification[J]. Knowledge-Based Systems,2019,164:348-357.
[15]劉慧婷,岳可誠.可提高多樣性的基于推薦期望的top-N推薦方法[J].計算機科學,2014,41(07):270-274.
(作者單位:浙江理工大學管理科學與工程系)