高迎,劉正
(首都經(jīng)濟(jì)貿(mào)易大學(xué),北京 100070)
當(dāng)今時(shí)代是信息網(wǎng)絡(luò)時(shí)代,因此不同行業(yè)產(chǎn)生的數(shù)據(jù)信息數(shù)量已經(jīng)達(dá)到ZB 級(jí)別,這為企業(yè)帶來了很多挑戰(zhàn)?;ヂ?lián)網(wǎng)用戶數(shù)量以一種十分迅猛的趨勢(shì)發(fā)展,對(duì)于各企業(yè)來說,龐大的信息數(shù)據(jù)量為其提出了難題,他們難以很快確定哪些信息與特定的用戶是相關(guān)的,即產(chǎn)生了“信息過載”的問題。
各界學(xué)者逐漸開始研究個(gè)性化推薦這一先進(jìn)的技術(shù)手段以改善這一問題,而其中協(xié)同過濾已被廣泛應(yīng)用在各種類型的企業(yè)中。由于該算法僅通過用戶評(píng)分信息預(yù)測(cè)用戶偏好,推薦效果有待提高。圖是一種表達(dá)節(jié)點(diǎn)及其關(guān)系的基本結(jié)構(gòu),而二部圖以直觀的方式表達(dá)了用戶及項(xiàng)目之間的關(guān)系,因此學(xué)者逐漸將復(fù)雜網(wǎng)絡(luò)的方法與推薦算法進(jìn)行結(jié)合。隨者相關(guān)領(lǐng)域研究的不斷發(fā)展,對(duì)于網(wǎng)絡(luò)結(jié)構(gòu)與推薦算法的研究仍存在許多挑戰(zhàn)需要探索。因此,本文對(duì)相關(guān)領(lǐng)域的理論、研究現(xiàn)狀和關(guān)鍵技術(shù)進(jìn)行總結(jié)與分析,希望能幫助其他學(xué)者了解該領(lǐng)域的研究進(jìn)展與發(fā)展方向。
推薦算法自出現(xiàn)以來受到各界學(xué)者的廣泛關(guān)注,在當(dāng)今學(xué)術(shù)界關(guān)于推薦算法已經(jīng)有大量的研究。推薦系統(tǒng)利用用戶與項(xiàng)目直接的購(gòu)買或選擇關(guān)系,根據(jù)用戶的歷史行為或用戶間的相似關(guān)系為目標(biāo)用戶推薦其感興趣的商品,本文主要對(duì)幾種應(yīng)用較為廣泛的推薦算法進(jìn)行簡(jiǎn)單概述。
協(xié)同過濾推薦通常將評(píng)分矩陣作為算法輸入,該算法通過檢索相似用戶或項(xiàng)目作為評(píng)級(jí)預(yù)測(cè)的基礎(chǔ)。在該算法中,推薦系統(tǒng)以相似度作為衡量的指標(biāo)找到相似的鄰居,最終預(yù)測(cè)評(píng)分并推薦項(xiàng)目。眾所周知,協(xié)同過濾在眾多相關(guān)領(lǐng)域表現(xiàn)得很好,但它也有一定的缺陷,由于其主要處理評(píng)級(jí)矩陣,而評(píng)級(jí)信息是十分稀疏的,這很大程度上影響著推薦質(zhì)量。
基于內(nèi)容的推薦算法通過收集購(gòu)買信息,依據(jù)其中項(xiàng)目的相關(guān)信息選擇內(nèi)容上相似的項(xiàng)目,作為最終結(jié)果,其中項(xiàng)目特征信息主要包含其標(biāo)簽、評(píng)論、屬性等。該算法一般只依賴于用戶自身的特征與行為,不進(jìn)行用戶間相關(guān)關(guān)系的計(jì)算,因此評(píng)分?jǐn)?shù)據(jù)稀疏對(duì)其沒有影響,但該方法僅以項(xiàng)目特征作為基礎(chǔ),沒有很好地挖掘出用戶之間的關(guān)系,影響著推薦精度。
由于以上兩種算法都有其應(yīng)用的優(yōu)勢(shì)和局限性,因此,研究人員通過一定的方法將幾種方法進(jìn)行融合,避免其自身的不足,充分發(fā)揮其各自的優(yōu)勢(shì)。算法的融合主要通過合并各單一推薦算法的結(jié)果和以加權(quán)等方式融合幾種推薦算法這兩種形式?;旌贤扑]算法能夠有效改善獨(dú)立算法運(yùn)行時(shí)的不足,并將各自的優(yōu)勢(shì)集中起來,以獲得更好的推薦效果。
推薦算法最早由國(guó)外學(xué)者開始研究,GOLDBERG 等人(1992)在設(shè)計(jì)郵件過濾系統(tǒng)中第一次采用應(yīng)用協(xié)同過濾推薦算法[1],隨后國(guó)際上開始有學(xué)者對(duì)推薦算法進(jìn)行深入研究。而國(guó)內(nèi)直到21 世紀(jì)才逐漸開始有學(xué)者對(duì)協(xié)同過濾進(jìn)行深入探索,黃創(chuàng)光等人(2010)的研究?jī)?nèi)容為數(shù)據(jù)稀疏對(duì)推薦質(zhì)量的影響研究,所選用的方法是自適應(yīng)選擇目標(biāo)用戶的近鄰對(duì)象,結(jié)果顯示其改進(jìn)是有效的[2]。近幾年,越來越多的學(xué)者對(duì)于改進(jìn)方法提出了自己的見解,鄧存彬等人(2019)則通過將協(xié)同過濾和深度學(xué)習(xí)理論進(jìn)行結(jié)合來擴(kuò)充算法的特征,提出了一種混合的推薦算法改善了電影推薦系統(tǒng)的現(xiàn)有問題[3]。張紫嫣等人(2021)則綜合余弦相似度和類別偏好的優(yōu)勢(shì)改進(jìn)相似度的計(jì)算,從而使得最近鄰計(jì)算更為合理[4]。
在學(xué)者對(duì)推薦算法進(jìn)行改進(jìn)的過程中僅依靠用戶-項(xiàng)目的交互數(shù)據(jù)進(jìn)行改進(jìn),沒有結(jié)合符合其特點(diǎn)的圖結(jié)構(gòu)。研究表明相比傳統(tǒng)的推薦算法,將圖結(jié)構(gòu)與推薦算法進(jìn)行融合在推薦準(zhǔn)確性、多樣性和可擴(kuò)展性等方面有更好的效果。AGGARWAL 等人(1999)在第五屆數(shù)據(jù)挖掘及知識(shí)發(fā)現(xiàn)會(huì)議(KDD)上首次將圖論的思想融入推薦算法,經(jīng)過實(shí)證研究明確了圖結(jié)構(gòu)能夠有效解決推薦系統(tǒng)現(xiàn)有的瓶頸[5]。HUANG 等人(2007)首先通過二部圖結(jié)構(gòu)來刻畫用戶與項(xiàng)目之間的關(guān)系,并從小世界效益來分析其退推薦系統(tǒng)的性能影響[6]。盛俊等人(2020)針對(duì)商品推薦問題,在圖結(jié)構(gòu)上進(jìn)行基于社區(qū)數(shù)據(jù)挖掘和標(biāo)簽傳遞的推薦算法,并通過平均絕對(duì)差和準(zhǔn)確率檢驗(yàn)了算法的運(yùn)算效果[7]。
在當(dāng)前信息過載的時(shí)代,隨著信息技術(shù)的不斷發(fā)展,推動(dòng)了基于二部圖推薦算法的進(jìn)一步的發(fā)展,并取得了一定的成果。但二者領(lǐng)域的融合在未來還有更多可嘗試的地方,以下總結(jié)了該領(lǐng)域未來可能的研究方向。
機(jī)器學(xué)習(xí)能夠通過以往經(jīng)驗(yàn)從數(shù)據(jù)中學(xué)習(xí)最終作出決策,現(xiàn)有推薦算法具有可解釋性強(qiáng)的優(yōu)勢(shì),而這是機(jī)器學(xué)習(xí)在應(yīng)用時(shí)的不足,通過利用機(jī)器學(xué)習(xí)算法構(gòu)建預(yù)測(cè)模型能夠更加準(zhǔn)確地提取用戶與項(xiàng)目的興趣偏好。將現(xiàn)有二部圖推薦算法與機(jī)器學(xué)習(xí)算法相結(jié)合,能夠融合二者的優(yōu)勢(shì),相關(guān)的研究方向在未來也是值得進(jìn)一步深入研究的。
在推薦系統(tǒng)領(lǐng)域,學(xué)術(shù)界越來越傾向于運(yùn)用圖結(jié)構(gòu)解決相應(yīng)問題,而現(xiàn)有的研究主要是通過網(wǎng)絡(luò)中節(jié)點(diǎn)的關(guān)系進(jìn)行興趣偏好的擴(kuò)展與改進(jìn),而對(duì)于圖結(jié)構(gòu)研究的不夠透徹。圖神經(jīng)網(wǎng)絡(luò)是處理二部圖的方法之一。將二部圖推結(jié)構(gòu)作為原始的輸入,通過圖學(xué)習(xí)方法對(duì)原始的用戶項(xiàng)目二部圖進(jìn)行處理,利用圖中的同質(zhì)或異質(zhì)關(guān)系建模用戶的偏好和意圖是一個(gè)很新穎的研究方向。
近年來,互聯(lián)網(wǎng)上的多源異構(gòu)信息越來越豐富,用戶進(jìn)行評(píng)價(jià)項(xiàng)目的意圖與用戶關(guān)系、項(xiàng)目特征、用戶評(píng)論等都有很大的關(guān)系。在二部圖推薦算法中,研究人員通常根據(jù)用戶和項(xiàng)目的選擇關(guān)系進(jìn)行用戶興趣的挖掘,而如何將互聯(lián)網(wǎng)上的多源信息進(jìn)行轉(zhuǎn)換并更好地融入到用戶-項(xiàng)目二部圖中,從而進(jìn)一步挖掘用戶的興趣偏好,解決推薦算法現(xiàn)有的問題,也是相關(guān)領(lǐng)域的重要研究問題。
隨著互聯(lián)網(wǎng)的普及以及互聯(lián)網(wǎng)上用戶對(duì)項(xiàng)目和信息的個(gè)性化需求日益膨脹,推薦系統(tǒng)在電子商務(wù)網(wǎng)購(gòu)平臺(tái)等各個(gè)領(lǐng)域發(fā)揮著很重要的作用,推薦系統(tǒng)是否能夠更好地發(fā)揮它的作用,將是各個(gè)企業(yè)很大的競(jìng)爭(zhēng)力。本文總結(jié)了傳統(tǒng)推薦算法的問題,闡述了二部圖推薦算法的研究進(jìn)展,并提出了未來的研究方向,希望能夠?yàn)槲磥淼难芯咳藛T在相關(guān)領(lǐng)域的嘗試提供幫助。