摘 要:現(xiàn)有的多行為推薦模型忽略了不同行為之間存在的優(yōu)化不平衡問題。為解決這一問題,提出了一種融入自注意力和對比學(xué)習(xí)的多行為推薦模型(multi-behavior recommendation integrating self-attention and contrastive learning,SACL)。首先,根據(jù)用戶與商品的交互行為類型構(gòu)建獨立的交互視圖,通過圖神經(jīng)網(wǎng)絡(luò)挖掘用戶與物品之間的關(guān)聯(lián)關(guān)系,提取用戶的不同行為特征和興趣偏好特征。其次,在行為間與用戶間進行對比學(xué)習(xí),捕捉不同行為下的相同用戶特征,增強輔助行為信息的利用率。然后,基于自注意力機制設(shè)計出一個多行為優(yōu)化模塊,根據(jù)用戶的多行為特征以及對比學(xué)習(xí)特征設(shè)計定義不同的編碼方式,生成具有行為依賴關(guān)系的元知識;設(shè)計了一個自注意多行為損失權(quán)重網(wǎng)絡(luò),根據(jù)元知識平衡不同行為的訓(xùn)練損失權(quán)重,從而區(qū)分對目標(biāo)行為的影響差異并降低輔助行為噪聲。提出的模型在Tmall和IJCAI-Contest數(shù)據(jù)集上進行的實驗表明,相較于最優(yōu)基線DPT,SACL的命中率(HR)平均提升了10%,歸一化折損率(NDCG)平均提升了14%,驗證了SACL模型對平衡優(yōu)化多行為推薦任務(wù)的有效性。
關(guān)鍵詞: 多行為推薦; 自注意力; 對比學(xué)習(xí); 多行為特征; 元知識
中圖分類號: TP391 文獻(xiàn)標(biāo)志碼: A 文章編號: 1001-3695(2025)02-009-0391-07
doi: 10.19734/j.issn.1001-3695.2024.07.0289
Multi-behavior recommendation integrating self-attention and contrastive learning
Zhang Zhiwei, Sun Fuzhen’, Sun Xiujuan, Li Pengcheng, Wang Shaoqing
(School of Computer Science amp; Technology, Shandong University of Technology, Zibo Shandong 255049, China)
Abstract:Existing multi-behavior recommendation models ignore the optimization imbalance problem that exists between different behaviors. To solve this problem, this paper proposed a multi-behavior recommendation model integrating self-attention and contrastive learning (SACL). Firstly, it constructed independent interaction views based on different types of user-item interaction behaviors, and explored correlation relationships between users and items through graph neural networks to extract different behavior characteristics and interest preference features of users. Secondly, it performed contrastive learning between behaviors and users to capture the same user characteristics under different behaviors and enhanced the utilization of auxiliary behavior information. Then, it designed a multi-behavior optimization module based on the self-attention mechanism which defined different encoding methods based on the multi-behavior features and contrastive learning features of users to generate meta-knowledge with behavior dependencies. It designed a self-attentive multi-behavior loss weighting network to balance the training loss weights of different behaviors based on meta-knowledge, thus distinguishing the differences in the impacts on target behavior and reducing the auxiliary behavior noises. Experiments on the Tmall dataset and the IJCAI-Contest dataset show that the proposed model improves the hit rate (HR) of SACL by an average of 10% and the normalized discount rate (NDCG) by an average of 14% compared to the optimal baseline DPT, which verifies the effectiveness of SACL model for balanced optimization of multi-behavior recommendation tasks.
Key words:multi-behavior recommendation; self-attention; contrastive learning; multi-behavior features; meta-knowledge
0 引言
伴隨著互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,當(dāng)前網(wǎng)絡(luò)平臺呈現(xiàn)多樣化、個性化現(xiàn)象,比如電子商務(wù)平臺、音樂、新聞推薦平臺等,而網(wǎng)絡(luò)內(nèi)容的海量增長和多樣性導(dǎo)致了信息過載的問題。推薦系統(tǒng)[1, 2]可以根據(jù)用戶的個性化偏好推薦感興趣的物品,從而緩解信息過載的問題[3]。協(xié)同過濾(CF)[4, 5]是當(dāng)今使用最廣泛的推薦架構(gòu),即根據(jù)用戶的歷史交互信息,分析用戶的目標(biāo)行為偏好,結(jié)合用戶之間的相似性和物品間的關(guān)系為用戶提供個性化的推薦服務(wù)。近年來,基于圖神經(jīng)網(wǎng)絡(luò)的協(xié)同過濾推薦方法[6]取得了不錯的效果。然而當(dāng)出現(xiàn)新用戶和新物品時,由于其歷史交互信息非常稀疏,無法捕捉用戶的興趣偏好,導(dǎo)致無法為新用戶提供準(zhǔn)確的推薦服務(wù),產(chǎn)生了冷啟動問題[7, 8]。為解決冷啟動問題,多行為推薦成為研究熱點,解決思路通常為從用戶的不同行為交互中挖掘輔助信息來學(xué)習(xí)新用戶與新物品的特征表示[9~11]。
為充分利用多行為信息,早期的多行為推薦研究工作主要通過改進矩陣分解[12]或者調(diào)整采樣策略[13]的方法來利用輔助行為信息,但由于結(jié)構(gòu)相對簡單,無法捕捉到不同行為交互間復(fù)雜的依賴關(guān)系?,F(xiàn)有的工作致力于設(shè)計不同的特征提取方案來學(xué)習(xí)不同類型的行為嵌入,提高對用戶多行為交互信息的利用率,并通過設(shè)計不同方式對行為依賴關(guān)系進行建模,以增強對用戶目標(biāo)行為的表示。例如,MGNN[14]在多個圖結(jié)構(gòu)中學(xué)習(xí)節(jié)點表示,通過聚合來自不同圖的多行為特征,增強模型的表達(dá)能力。NMTR[15]在神經(jīng)協(xié)同過濾(NCF)框架的基礎(chǔ)上通過級聯(lián)的方式將對每種行為類型的預(yù)測聯(lián)系起來。MBGCN[16]基于圖卷積網(wǎng)絡(luò)模型設(shè)計了一種行為感知的嵌入傳播層來捕獲與高階鄰居不同行為交互中的多樣化信息。GHCF[17]通過構(gòu)建圖和超圖的結(jié)合結(jié)構(gòu),捕捉更復(fù)雜和高階的行為依賴關(guān)系。MBGMN[18]通過圖結(jié)構(gòu)和元學(xué)習(xí)方法整合并利用用戶多種行為數(shù)據(jù)。
為更好地聚合用戶多行為特征,進一步提高所學(xué)習(xí)用戶特征的準(zhǔn)確度,學(xué)者們開始將注意力機制融入用戶的行為特征提取過程中,通過注意力機制來建模不同行為類型間的依賴關(guān)系。例如,MATN[19]開發(fā)了一個基于Transformer的多行為依賴編碼器,采用自注意力機制對不同交互行為的復(fù)雜語義進行建模。DIPN[20]提出了一種分層注意力機制,分別學(xué)習(xí)行為內(nèi)部以及行為間的依賴關(guān)系。KHGT[21]引入多頭注意力機制,通過計算不同頭的注意力分?jǐn)?shù),來捕捉節(jié)點之間的不同類型的關(guān)系和特征。此外,最近的一項名為CML[22]的研究設(shè)計了一個多行為對比學(xué)習(xí)框架,通過構(gòu)建的對比損失來達(dá)成用戶特定類型行為表征之間的一致性,進一步增強對用戶的行為依賴建模。
綜上,當(dāng)前多行為推薦模型已在不同類型的行為嵌入聚合方案以及行為依賴建模方面取得了進展,但是仍存在兩方面問題:a)現(xiàn)有的多行為推薦模型在訓(xùn)練過程中忽略了輔助行為與目標(biāo)行為之間權(quán)重分配不平衡的問題,導(dǎo)致目標(biāo)推薦任務(wù)的推薦精準(zhǔn)度下降;b)不同類型輔助行為對目標(biāo)行為的貢獻(xiàn)會依據(jù)不同用戶的行為偏好而存在差異,現(xiàn)有的研究沒有針對用戶個體進行細(xì)粒度區(qū)分,導(dǎo)致用戶真實興趣漂移。
針對以上兩方面問題,本文通過計算生成輔助行為和目標(biāo)行為的訓(xùn)練損失權(quán)重來區(qū)分主次關(guān)系,提高目標(biāo)推薦任務(wù)的推薦精度;通過將用戶的個性化行為特征編碼為元知識來捕捉不同用戶之間的偏好差異,訓(xùn)練學(xué)習(xí)用戶的真實興趣。本文提出了融入自注意力和對比學(xué)習(xí)的多行為推薦模型(multi-behavior recommendation integrating self-attention and contrastive learning,SACL),將用戶的每種行為都定義為一種單獨類型的交互視圖,在多層圖卷積網(wǎng)絡(luò)中學(xué)習(xí)每種行為視圖下的用戶特征表示,將同一用戶的不同行為特征進行對比學(xué)習(xí),獲取用戶不同行為所反映的相同興趣偏好,建模用戶個性化偏好,訓(xùn)練生成不同行為任務(wù)的損失權(quán)重,優(yōu)化模型參數(shù)。
本文的主要貢獻(xiàn)總結(jié)如下:a)提出了融入自注意力和對比學(xué)習(xí)的多行為推薦模型SACL,對于每種行為類型構(gòu)建獨立的交互視圖,結(jié)合對比學(xué)習(xí)捕捉用戶的行為特征;b)針對權(quán)重分配不平衡的問題,基于自注意力機制設(shè)計了一個多行為權(quán)重網(wǎng)絡(luò), 計算用戶不同行為模式的注意力得分,通過權(quán)重網(wǎng)絡(luò)生成不同訓(xùn)練任務(wù)的行為損失權(quán)重;c)針對用戶真實興趣漂移的問題,將用戶的興趣特征及行為間的依賴關(guān)系編碼為元知識,訓(xùn)練自注意多行為權(quán)重網(wǎng)絡(luò),細(xì)粒度建模用戶個性化偏好。
1 問題定義及符號
在給定的數(shù)據(jù)集中,定義用戶集U={u1,u2,…,uM}和項目集I={i1,i2,…,iN},其中,M表示用戶的數(shù)量,N表示項目的數(shù)量。定義用戶-項目交互圖為G=(V,E),其中V表示節(jié)點集,包含用戶集U和項目集I,E表示所觀察到交互的邊集。在具有K種行為類型的多行為交互圖中,交互圖G根據(jù)行為類型定義為K個行為子圖{G1,G2,…,GK},并將各個行為子圖下的用戶-項目交互矩陣定義為{1,2,…,K},其中K表示行為類型的數(shù)量。對于交互矩陣k,如果用戶u與項目i在第k種類型的行為下存在交互,元素xku,i=1,反之,元素xku,i=0。
融入自注意力和對比學(xué)習(xí)的多行為推薦模型的任務(wù)可形式化定義為給定用戶-項目交互矩陣{1,2,…,K},生成用戶嵌入eu和項目嵌入ei,在輔助行為k′和目標(biāo)行為k之間進行對比學(xué)習(xí),生成對比損失Lk,1cl,…,Lk,k′cl,…,Lk,Kcl。自注意多行為權(quán)重網(wǎng)絡(luò)根據(jù)反映用戶個性化行為偏好的元知識編碼Zk,k′u生成行為損失權(quán)重ωk,k′u,結(jié)合對比損失Lcl與BPR損失Lbpr聯(lián)合訓(xùn)練優(yōu)化模型參數(shù),為用戶生成推薦列表。
2 SACL模型
為充分利用用戶-項目交互圖中蘊涵的多行為交互信息,解決模型訓(xùn)練過程中目標(biāo)行為與輔助行為優(yōu)化不平衡的問題,本文提出了融入自注意力和對比學(xué)習(xí)的多行為推薦模型SACL。模型框架如圖1所示,由多行為圖卷積神經(jīng)網(wǎng)絡(luò)、多行為對比學(xué)習(xí)、自注意多行為優(yōu)化三個核心模塊組成。多行為圖卷積神經(jīng)網(wǎng)絡(luò)模塊依據(jù)行為類型拆分出不同行為對應(yīng)的用戶-項目交互圖,從不同交互圖中提取用戶的行為特征。
多行為對比學(xué)習(xí)模塊通過在行為間與用戶間進行對比學(xué)習(xí),選擇性地構(gòu)造樣本對,將信息語義從輔助行為傳遞到目標(biāo)行為。自注意多行為優(yōu)化模塊將用戶特征編碼為元知識,建模用戶的個性化行為偏好,通過多行為權(quán)重網(wǎng)絡(luò)為不同行為任務(wù)生成損失權(quán)重,與行為損失函數(shù)聯(lián)合訓(xùn)練優(yōu)化模型參數(shù)。
2.1 多行為圖卷積神經(jīng)網(wǎng)絡(luò)
為更加高效地利用輔助行為信息,提取用戶多行為特征,緩解目標(biāo)行為數(shù)據(jù)稀疏的問題,本文設(shè)計了一個綜合上下文信息傳遞的多行為圖卷積神經(jīng)網(wǎng)絡(luò)。該網(wǎng)絡(luò)通過挖掘不同行為子圖中用戶和項目的交互信息來學(xué)習(xí)用戶和項目的嵌入表示。
首先,為捕捉用戶的多行為交互信息,通過用戶項目之間的交互數(shù)據(jù)構(gòu)建出多行為用戶-項目交互圖,并根據(jù)行為類型將其劃分為不同的行為交互子圖。根據(jù)行為子圖對應(yīng)的用戶-項目交互矩陣k得到鄰接矩陣Ak表示為
Ak=0k
Tk0(1)
然后根據(jù)GCN中的多層信息傳播方式,本文在輕量級的圖架構(gòu)上構(gòu)建了綜合多行為交互信息的傳遞方案來提取用戶行為特征信息,具體流程如圖2所示,可以表示為
X(l+1)k=σ(A^kX(l)kWk)(2)
A^k=D-12k(Ak+Ik)D-12k(3)
其中:A^k是一個具有自連接的歸一化鄰接矩陣;Dk是第k種行為的|U+I|×|U+I|對角矩陣,Dk中的每個條目表示第k種行為鄰接矩陣中第i行向量中非零項的個數(shù);Ik是一個|U+I|×|U+I|單位矩陣;X(l)k是卷積神經(jīng)網(wǎng)絡(luò)第l層中第k種行為下的節(jié)點嵌入矩陣;Wk代表模型訓(xùn)練所需要的參數(shù);σ指的是sigmoid非線性激活函數(shù)。
為了使距離較近的鄰居節(jié)點比距離較遠(yuǎn)的鄰居節(jié)點在生成節(jié)點嵌入時發(fā)揮更大的作用,通過函數(shù)f合并所有層的節(jié)點嵌入矩陣,并表示為
Xk=f(X(l)k)(4)
其中: f函數(shù)在神經(jīng)網(wǎng)絡(luò)模型中通常設(shè)計為僅應(yīng)用最后一層,級聯(lián)操作和對不同網(wǎng)絡(luò)層的節(jié)點嵌入進行加權(quán)求和,本文采用的是對不同網(wǎng)絡(luò)層的節(jié)點嵌入進行加權(quán)求和的方法;Xk表示第k種行為的節(jié)點嵌入矩陣。
然后,根據(jù)所得到的節(jié)點嵌入矩陣將所有行為子圖的用戶嵌入和項目嵌入進行聚合,生成最終的用戶表示eu和項目表示ei:
eu=σ(W·∑Kk=1xukK)(5)
ei=σ(W·∑Kk=1xikK)(6)
其中:σ表示PReLU非線性激活函數(shù);W表示神經(jīng)網(wǎng)絡(luò)權(quán)重;xuk和xik分別表示第k個行為子圖中用戶u和項目i的嵌入表示。
2.2 多行為對比學(xué)習(xí)
為更好地利用多行為圖卷積神經(jīng)網(wǎng)絡(luò)所學(xué)習(xí)到的用戶的輔助行為特征來對用戶的目標(biāo)行為作出推薦,本文將不同行為視圖所生成的用戶特征嵌入進行對比學(xué)習(xí),在輔助行為k′,k′∈{1,2,…,K-1}與目標(biāo)行為k=K之間進行對比學(xué)習(xí)來捕捉該用戶不同行為之間的潛在聯(lián)系。盡管用戶通過不同行為與項目進行交互,但都體現(xiàn)了相同的用戶興趣,在對比學(xué)習(xí)中將其視為正對,表示為{(eku,ek′u)|u∈U}。反之,對于不同用戶的視圖,利用對比損失區(qū)分他們的行為嵌入,加強不同用戶興趣之間的區(qū)別,在對比學(xué)習(xí)中被視為負(fù)對,表示為{(eku,ek′v)|u,v∈U,u≠v}。在所設(shè)計的多行為對比學(xué)習(xí)框架中,使用InfoNCE損失函數(shù)來衡量不同嵌入之間的距離,通過比較兩個樣本間的距離來測量它們之間的相關(guān)性。對所采集到的用戶交互信息,通過最大化對比采樣正對示例之間的一致性和增強區(qū)分負(fù)對示例之間的差異性,從而更好地捕捉數(shù)據(jù)中的相關(guān)性?;贗nfoNCE的對比損失函數(shù)表示如下:
Lk,k′cl=∑u∈U-logexp(?(eku,ek′u)/τ)∑v∈Uexp(?(eku,ek′v)/τ)(7)
其中:τ表示softmax函數(shù)中的溫度超參數(shù);?(·)用來計算兩個嵌入之間的內(nèi)積,以衡量不同嵌入之間的相似性。
通過式(7)計算得到的輔助行為k′和目標(biāo)行為k所構(gòu)成的行為對的對比損失Lk,k′cl加和得到總對比損失,表示如下:
Lcl=Lk,1cl+…+Lk,k′cl+…+Lk,Kcl(8)
2.3 自注意多行為優(yōu)化
為區(qū)分用戶不同類型輔助行為對目標(biāo)行為造成的影響差異,限制輔助行為噪聲對目標(biāo)行為推薦產(chǎn)生的干擾。本文設(shè)計了一個自注意多行為優(yōu)化的功能模塊,包括元知識編碼器和自注意多行為權(quán)重網(wǎng)絡(luò)兩部分。首先使用元知識編碼器對用戶的行為特征進行編碼,捕捉用戶的個性化行為特征。然后自注意多行為權(quán)重網(wǎng)絡(luò)通過元知識訓(xùn)練生成特定行為的損失權(quán)重,細(xì)粒度優(yōu)化用戶多行為損失。
2.3.1 元知識編碼器
為獲得用戶不同行為類型之間的個性化依賴關(guān)系,本文根據(jù)用戶的興趣特征、行為特征以及行為間對比損失定義了兩種不同編碼方式的元知識編碼器來提取具有用戶特定行為偏好特征的元知識,如式(9)(10)所示。
Zk,k′u,1=(d(Lk,k′cl)·γ)‖ek′u‖eu(9)
Zk,k′u,2=Lk,k′cl·(ek′u‖eu)(10)
其中:Zk,k′u,1和Zk,k′u,2表示通過編碼器編碼得到的元知識;d(·)表示能生成與用戶嵌入eu和用戶輔助行為嵌入ek′u維度所對應(yīng)的值向量的函數(shù),這里定義為復(fù)制函數(shù);γ是用來放大值的比例因子;‖表示連接符。
2.3.2 自注意多行為權(quán)重網(wǎng)絡(luò)
針對平衡優(yōu)化輔助行為與目標(biāo)行為訓(xùn)練任務(wù),降低輔助行為噪聲,本文基于自注意力機制設(shè)計了一個用于區(qū)分用戶個性化行為偏好差異的權(quán)重網(wǎng)絡(luò),將通過編碼器編碼得到的反映用戶個性化偏好的元知識映射為損失權(quán)值。鑒于不同的行為之間會通過不同的方式相互交戶,并且行為之間的依賴關(guān)系因用戶不同而有差異,本文利用自注意力機制來建模用戶個性化行為偏好損失,對于不同用戶細(xì)粒度區(qū)分輔助行為對目標(biāo)任務(wù)造成的影響差異。
首先,設(shè)計一個注意力模塊通過所得到的元知識生成表現(xiàn)用戶特定行為模式的注意力得分??s放后的點積注意力定義為
Attention(Q,K,V)=softmax(QKTd)V(11)
其中:Q代表查詢;K代表鍵;V代表值;d表示用來進行縮放的維數(shù),避免在維數(shù)較高的情況下查詢與鍵的內(nèi)積過大。
受最近一些研究提出的使用相同對象生成查詢、鍵和值的自注意方法[23]的影響,本文將編碼得到的元知識作為自注意力模塊的輸入,通過線性投影將其轉(zhuǎn)換為三個矩陣,再對它們進行點積注意力的操作:
Su=SA (Zk,k′u)=Attention(Zk,k′uWQ,Zk,k′uWK,Zk,k′uWV)(12)
其中:WQ,WK,WV∈?d×d,表示用于線性投影的參數(shù)矩陣。這種投影方式可以使模型捕捉到不同行為之間的非對稱交互(如〈查詢ki,鍵kj〉與〈查詢kj,鍵ki〉),更好地學(xué)習(xí)行為間的依賴關(guān)系。通過自注意力機制可以將所有行為類型的元知識進行自適應(yīng)聚合,但它仍然只是一個線性模型,因此進一步設(shè)計了一個轉(zhuǎn)換層使其具有非線性性,并將權(quán)重函數(shù)定義為
F(Su)=PReLU (Su·WF+bF)(13)
其中:WF為d×d矩陣,表示投影層;bF為d維向量,表示偏置項。將該非線性層與PReLU函數(shù)結(jié)合得到具有用戶個性化行為偏好的多行為損失權(quán)重,可表示為
ωk,k′u=ωk,k′u,1+ωk,k′u,2=F(Su,1)+F(Su,2)(14)
其中:ωk,k′u表示對于用戶u的行為偏好,輔助行為k′對于目標(biāo)行為k的依賴關(guān)系權(quán)重。之后基于得到的多行為損失權(quán)重,設(shè)計生成了基于InfoNCE的自監(jiān)督損失和基于貝葉斯個性化推薦排名的目標(biāo)損失兩個損失權(quán)重列表。
2.4 模型訓(xùn)練與優(yōu)化
本文使用貝葉斯個性化損失[24]來學(xué)習(xí)模型參數(shù),將所觀察到的用戶與物品的行為交互視為正對,將未觀察到的交互視為負(fù)對,致力于正確地將觀察到交互過的物品排在未觀察到的物品之前。具體地,具有特定行為屬性的BPR損失被定義為
Lkbpr=∑(u,i+,i-)∈Ok-ln(sigmoid (xku,i+-xku,i-))+λ‖θ‖2(15)
其中:Ok表示用戶u在第k種行為類型下的訓(xùn)練樣本對;(u,i+)∈R+表示所觀察到的用戶u與物品i的交互;(u,i-)∈R-表示未被觀察到的交互;θ表示可以學(xué)習(xí)的模型參數(shù),并引用L2正則化來緩解過擬合的問題。受文獻(xiàn)[25]所使用的模型訓(xùn)練策略的影響,本文使用了一種新的方式來對模型進行訓(xùn)練優(yōu)化,通過三個階段訓(xùn)練更新多行為圖卷積神經(jīng)網(wǎng)絡(luò)與自注意多行為權(quán)重網(wǎng)絡(luò)的參數(shù),優(yōu)化過程表示為
θG=argminθ=Δ∑Kk=1 ∑Bb=1(W((Ltrain∪weightcl,k,X,Xk);θW)·Ltraincl,k+W((Ltrain∪weightbpr,k,X,Xk);θW)·Ltrainbpr,k)(16)
其中:θG表示多行為圖卷積神經(jīng)網(wǎng)絡(luò)的參數(shù);θW表示自注意多行為權(quán)重網(wǎng)絡(luò)的參數(shù);K表示用戶行為類型數(shù)量;B表示訓(xùn)練批次大??;X表示用戶所學(xué)習(xí)到的交叉類型的行為矩陣;Xk表示用戶所學(xué)習(xí)到的特定類型的行為矩陣。在模型訓(xùn)練的第一階段,使用整個訓(xùn)練數(shù)據(jù)集對多行為圖卷積神經(jīng)網(wǎng)絡(luò)與自注意多行為權(quán)重網(wǎng)絡(luò)進行聯(lián)合訓(xùn)練,學(xué)習(xí)初始的模型參數(shù)。在第二階段,使用元編碼器編碼得到的元知識數(shù)據(jù)對自注意多行為權(quán)重網(wǎng)絡(luò)進行參數(shù)更新,生成多行為損失權(quán)重。最后,通過更新后的權(quán)重網(wǎng)絡(luò)參數(shù)結(jié)合多行為損失權(quán)重更新圖卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)。通過上述三階段訓(xùn)練方式,加快參數(shù)更新速度,提高模型訓(xùn)練效率。
2.5 SACL算法偽代碼
算法1 SACL算法
輸入:K種行為類型;用戶集U與項目集I之間K種類型的行為交互矩陣{1,2,…,K};學(xué)習(xí)率lr;網(wǎng)絡(luò)層數(shù)l;網(wǎng)絡(luò)維度d。
輸出:經(jīng)過算法計算后得到的用戶u的top-k推薦。
a) 初始化模型,對數(shù)據(jù)進行采樣
b) for i=1~k do //多行為圖卷積神經(jīng)網(wǎng)絡(luò)生成嵌入
for j=1~l do
根據(jù)式(1)~(3)計算當(dāng)前層第k種行為對應(yīng)的節(jié)點嵌入矩陣
end for
根據(jù)式(4)合并所有層的節(jié)點嵌入
end for
根據(jù)式(5)(6)聚合得到用戶嵌入eu和項目嵌入ei
c) for i=1~k do
獲取每個行為對應(yīng)的用戶嵌入和正負(fù)樣本嵌入
根據(jù)式(15)計算Lkbpr
end for
d) 根據(jù)式(7)(8)計算Lcl //多行為對比學(xué)習(xí)提取用戶特征
e) for u=1~m do //自注意多行為權(quán)重網(wǎng)絡(luò)分配損失權(quán)重
for i=1~k do
根據(jù)式(11)~(14)計算BPR行為損失權(quán)重和對比學(xué)習(xí)損失權(quán)重
將損失權(quán)重與Lkbpr和Lk,k′cl相結(jié)合
end for
end for
f) 三階段訓(xùn)練優(yōu)化模型參數(shù),生成eu與ei,計算生成推薦列表
2.6 復(fù)雜度分析
本文從模型主要功能模塊的角度進行復(fù)雜度分析。SACL模型的復(fù)雜度主要表現(xiàn)在多行為圖卷積神經(jīng)網(wǎng)絡(luò)、對比學(xué)習(xí)模塊以及自注意多行為權(quán)重網(wǎng)絡(luò)三部分。其中多行為圖卷積神經(jīng)網(wǎng)絡(luò)部分的復(fù)雜度為O(K×|M+N|×d2×L),K表示行為類型個數(shù),M表示用戶個數(shù),N表示項目個數(shù),d表示特征嵌入維度,L表示神經(jīng)網(wǎng)絡(luò)傳播層數(shù)。對比學(xué)習(xí)模塊通過基于InfoNCE的對比損失函數(shù)進行優(yōu)化學(xué)習(xí),每個epoch的時間復(fù)雜度為O(K×|X+k|×S×d),|X+k|表示在第k類行為下用戶-項目交互矩陣中的非零元素個數(shù),S為進行對比學(xué)習(xí)的樣本數(shù)量,用于降低時間復(fù)雜度。自注意多行為權(quán)重網(wǎng)絡(luò)部分的時間復(fù)雜度為O(K×|X+k|×d2)。模型總體計算復(fù)雜度是上述三部分的代數(shù)和,與當(dāng)下多行為推薦算法(如MBGCN、KHGT、EHCF、CML)具有相當(dāng)?shù)臅r間復(fù)雜度。
3 實驗與結(jié)果分析
3.1 數(shù)據(jù)集介紹
本文在Tmall和IJCAI-Contest兩個數(shù)據(jù)集上進行實驗,以評估模型性能,表1中給出了兩個數(shù)據(jù)集的數(shù)據(jù)信息。Tmall是一個廣泛用于電子商務(wù)研究的大規(guī)模數(shù)據(jù)集,包含四種類型的行為信息,分別為瀏覽、收藏、添加到購物車和購買。IJCAI-Contest數(shù)據(jù)集由IJCAI15 Challenge提供,所收集的是零售系統(tǒng)中的用戶活動信息,包含四種類型的行為信息,即點擊、收藏、添加到購物車和購買,與Tmall數(shù)據(jù)集具有相同的行為類型,從不同角度反映用戶對商品的不同意圖。
3.2 指標(biāo)設(shè)置
對于模型的性能評估,選取推薦研究中的兩個代表性研究指標(biāo),即命中率(hit rate, HR)以及歸一化折損累計增益(normalized discounted cumulative gain, NDCG)。測試階段所報告評價結(jié)果均取自10次實驗的平均值。
命中率用于衡量模型成功識別正例(true positive)的能力,即在所給出的推薦列表中,模型成功預(yù)測為正例的比例。
HR@N=1N∑Ni=1 hit(i)(17)
其中:hit()函數(shù)用來判斷模型是否成功識別正例,若為正例,則hit()的值為1,反之為0。歸一化折損累計增益用于衡量排序模型返回的結(jié)果在排名、相關(guān)性和多樣性方面的質(zhì)量。NDCG的值在0~1,其中1表示最佳性能,0表示最差性能。較高的NDCG表示模型在排序結(jié)果中更好地考慮了項目的相關(guān)性和排名。
NDCG@N=∑Ni=11log(ranki+1)(18)
其中:rank表示模型推薦的正例在推薦列表中的位置。
3.3 實驗基線
本文將所提出的SACL模型與以下五組最先進的模型進行了比較:單行為推薦模型、異構(gòu)圖神經(jīng)網(wǎng)絡(luò)推薦模型、多行為推薦模型、基于注意力的多行為推薦模型以及個性化多行為推薦模型。為了體現(xiàn)模型的先進性,保證實驗的有效性,均使用基線模型的默認(rèn)參數(shù)。
1)單行為推薦模型
NGCF[26]:該模型結(jié)合了協(xié)同過濾技術(shù)和圖神經(jīng)網(wǎng)絡(luò),通過顯示建模用戶與項目之間的高階連通關(guān)系來優(yōu)化消息傳遞,更好地捕捉用戶偏好。
LightGCN[27]:該模型是對圖卷積神經(jīng)網(wǎng)絡(luò)推薦模型進行的一種輕量級簡化推薦模型,去除了非線性激活函數(shù)以及特征變換操作。
2)異構(gòu)圖神經(jīng)網(wǎng)絡(luò)推薦模型
HGT[28]:該模型結(jié)合了圖神經(jīng)網(wǎng)絡(luò)和Transformer的優(yōu)勢,基于元關(guān)系建模節(jié)點和邊的異構(gòu)性,并將時間信息加入到網(wǎng)絡(luò)中進行學(xué)習(xí)。
HeCo[29]:該模型從網(wǎng)絡(luò)模式視圖和元路徑視圖對節(jié)點進行編碼,創(chuàng)造性地引入了視圖掩碼機制,使這兩個視圖相互補充和監(jiān)督。
3)多行為推薦模型
NMTR[15]:該模型結(jié)合了多任務(wù)學(xué)習(xí)和協(xié)同過濾技術(shù),并通過預(yù)先設(shè)定的多行為級聯(lián)關(guān)系來學(xué)習(xí)用戶交互。
MBGCN[16]:該模型將圖卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于多行為用戶項目交互圖上,在信息傳播過程中學(xué)習(xí)各行為的權(quán)重,捕捉用戶的行為偏好。
4)基于注意力的多行為推薦模型
MATN[19]:該模型顯示地對多行為依賴關(guān)系進行編碼,將跨類型的用戶-項目交互的協(xié)作信號注入嵌入過程,并通過注意力機制發(fā)現(xiàn)特定類型的行為語義。
KHGT[21]:該模型設(shè)計層級圖注意力網(wǎng)絡(luò),將時間信息融入到多行為建模中,并對跨類型行為的層次依賴關(guān)系進行編碼,區(qū)分特定類型的貢獻(xiàn)。
5)個性化多行為推薦模型
EHCF[30]:該模型將每個行為的預(yù)測以一種遷移的方式關(guān)聯(lián)起來,捕捉不同行為之間的復(fù)雜關(guān)系,不進行采樣,從整個異質(zhì)數(shù)據(jù)中學(xué)習(xí)模型參數(shù)。
CML[22]:該模型將對比學(xué)習(xí)應(yīng)用于多行為推薦之中,通過有效利用輔助行為數(shù)據(jù)緩解目標(biāo)行為數(shù)據(jù)稀疏的問題,并使用元學(xué)習(xí)建模用戶的個性化行為偏好。
DPT[31]:該模型通過三階段學(xué)習(xí)范式來減弱輔助行為對目標(biāo)行為推薦的負(fù)面影響,緩解目標(biāo)行為推薦中多類型行為之間的語義差距。
3.4 參數(shù)設(shè)置
實驗使用Xavier初始化模型參數(shù),使用Adam作為優(yōu)化器,結(jié)合周期學(xué)習(xí)率(CyclicLR)策略優(yōu)化模型參數(shù),驗證集上HR和NDCG指標(biāo)在連續(xù)50個epoch內(nèi)沒有提升時停止訓(xùn)練,模型超參數(shù)的推薦效果在測試集上進行驗證。學(xué)習(xí)率在{0.6E-3,1E-3,2E-3,5E-3}中進行測試,行為感知圖神經(jīng)網(wǎng)絡(luò)的消息傳播層數(shù)在{1,2,3,4}中調(diào)整,特征維度在{4,8,16,32,64,128}中調(diào)整,L2正則化權(quán)重在{1E-3,5E-3,1E-2}中調(diào)整。
3.5 對比實驗性能分析
表2為本文方法在不同數(shù)據(jù)集上與其他模型的性能比較,其中本文模型結(jié)果用粗體表示,下畫線所表示的是最優(yōu)基線的結(jié)果。由表中數(shù)據(jù)可以發(fā)現(xiàn),SACL模型在不同數(shù)據(jù)集上始終優(yōu)于所有基線模型。具體地說,對于HR@10和NDCG@10兩個評價指標(biāo),在Tmall數(shù)據(jù)集上,本文的方法比基線中最優(yōu)的模型效果提升了6.3%和9.4%,在IJCAI-Contest數(shù)據(jù)集上,更是獲得了14.1%和18.7%的顯著提升?;诒碇械膶嶒灁?shù)據(jù),將SACL模型與所給出的五組模型進行對比分析:
a)多行為推薦模型(NMTR,MBGCN)在推薦任務(wù)上的性能優(yōu)于單行為推薦模型(NGCF,LightGCN),這表明綜合考慮用戶在多種場景下的不同行為,能夠克服單一行為推薦的局限性。通過有效利用多種行為信息,能夠減輕單一行為數(shù)據(jù)稀疏的問題,并且能夠更細(xì)致地挖掘用戶的興趣模式和行為規(guī)律,從而提升推薦精度。
b)融合了注意力機制的多行為推薦模型(MATN,KHGT)又展現(xiàn)出了比多行為推薦模型更好的推薦性能,這表明注意力機制可以細(xì)化行為表示間的差異,能夠個性化建模用戶行為偏好,依據(jù)用戶偏好捕捉不同行為間的關(guān)聯(lián)關(guān)系,提高信息利用率,從而提升模型的推薦性能。
c)SACL模型在所有情況下的推薦性能都遠(yuǎn)超于異構(gòu)神經(jīng)網(wǎng)絡(luò)(HGT,HeCo),由此驗證了SACL模型針對圖協(xié)同過濾框架異構(gòu)編碼的能力,也驗證了根據(jù)多行為交互數(shù)據(jù)對用戶多行為特征建模可以豐富訓(xùn)練數(shù)據(jù)類型,有效緩解數(shù)據(jù)稀疏問題,提高模型的推薦精度。
d)與最近提出的個性化多行為推薦模型(EHCF、CML、DPT)相比,SACL依舊獲得了最好的推薦結(jié)果。這表明SACL能夠更準(zhǔn)確地捕捉用戶偏好,細(xì)粒度區(qū)分不同用戶之間的區(qū)別,為用戶提供更精準(zhǔn)的推薦。
綜上所述,SACL模型取得性能改進的原因取決于以下兩點:
a)本文通過多行為圖卷積神經(jīng)網(wǎng)絡(luò)從用戶的多行為交互中提取輔助信息來緩解目標(biāo)行為信息稀缺的情況,更加全面地捕捉學(xué)習(xí)用戶的特征偏好。通過對比學(xué)習(xí)挖掘不同行為間的潛在聯(lián)系,增強了多行為輔助信息的利用率。
b)元知識編碼有效建模了用戶的個性化行為特征,所設(shè)計的自注意多行為權(quán)重網(wǎng)絡(luò)根據(jù)元知識訓(xùn)練生成行為損失權(quán)重,細(xì)粒度區(qū)分了不同行為之間的差異,提高了模型捕捉用戶特征偏好的準(zhǔn)確度。
3.6 消融和有效性分析
為了進一步探究闡明SACL模型的性能改進,驗證模型的關(guān)鍵功能模塊對模型性能的影響,使用SACL模型的三個變體w/o MCL、w/o MKE、w/o AWN在Tmall和IJCAI-Contest數(shù)據(jù)集上進行消融實驗研究,變體模型如下:
w/o MCL:去除用戶目標(biāo)行為與輔助行為之間的對比學(xué)習(xí),僅通過圖神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)用戶特征。
w/o MKE:取消使用元編碼訓(xùn)練多行為權(quán)重網(wǎng)絡(luò)參數(shù),直接對行為損失進行自注意權(quán)重分配。
w/o AWN:去除自注意多行為權(quán)重網(wǎng)絡(luò),通過統(tǒng)一對各種行為損失平均分配權(quán)重的方式來替代。
圖3給出了模塊消融后模型的對比效果。由圖中數(shù)據(jù)可以看出,SACL的三個變體相較于模型自身的推薦性能均有所降低,表明捕捉用戶多行為交互中的潛在依賴關(guān)系、用戶的個性化行為特征均能提高模型的推薦性能,并且通過自注意多行為權(quán)重網(wǎng)絡(luò)可以有效提高模型對用戶特征的學(xué)習(xí)能力以及降低輔助行為噪聲,優(yōu)化模型對于目標(biāo)行為推薦任務(wù)的能力。具體分析如下:
a)w/o MCL實驗結(jié)果下降的原因在于模型僅通過圖神經(jīng)網(wǎng)絡(luò)來提取用戶特征,沒有學(xué)習(xí)不同行為之間的潛在聯(lián)系、捕獲其所反映的共同興趣偏好,不能有效地利用行為輔助信息。在目標(biāo)行為數(shù)據(jù)稀疏的情況下,容易受到輔助行為特征噪聲的影響,導(dǎo)致提取的用戶興趣特征不準(zhǔn)確。
b)w/o MKE實驗結(jié)果下降的原因在于SACL模型自定義的用戶行為特征元知識編碼包含了用戶的不同行為特征偏好,使用元編碼訓(xùn)練多行為權(quán)重網(wǎng)絡(luò)可以使權(quán)重網(wǎng)絡(luò)細(xì)粒度區(qū)分不同用戶的個性化行為偏好,從而幫助多行為權(quán)重網(wǎng)絡(luò)更好地分配行為損失權(quán)重。
c)w/o AWN實驗結(jié)果下降的原因在于沒有對不同行為的訓(xùn)練任務(wù)進行區(qū)分,在目標(biāo)行為數(shù)據(jù)稀疏時,容易導(dǎo)致輔助行為任務(wù)主導(dǎo)網(wǎng)絡(luò)權(quán)重,并且不同的輔助行為對目標(biāo)行為影響不同,需要區(qū)分不同輔助任務(wù)對目標(biāo)任務(wù)的貢獻(xiàn)。
3.7 圖神經(jīng)網(wǎng)絡(luò)層數(shù)分析
為了研究圖神經(jīng)網(wǎng)絡(luò)層數(shù)對于模型推薦性能的影響,本文在兩個數(shù)據(jù)集上進行了不同網(wǎng)絡(luò)層數(shù)L的對比實驗。圖4和5展示了Tmall和IJCAI-Contest數(shù)據(jù)集上不同超參數(shù)L對評價指標(biāo)HR@10和NDCG@10的影響。由數(shù)據(jù)結(jié)果可以看出,當(dāng)其他參數(shù)保持不變時,圖傳播層數(shù)越多,模型性能越好,這表明模型傳播層數(shù)的增多可以有效捕獲高階鄰居的潛在依賴關(guān)系,當(dāng)圖神經(jīng)網(wǎng)絡(luò)層數(shù)為3時,推薦性能最優(yōu)。當(dāng)傳播層數(shù)進一步增加,可能會對所生成的特征嵌入表示引入噪聲,導(dǎo)致模型性能下降。
3.8 模型維度影響分析
適宜的模型維度能夠使模型更好地學(xué)習(xí)用戶特征與項目特征,為找到適合的模型維度,本文在兩個數(shù)據(jù)集上進行了對于隱藏層嵌入向量維度D的參數(shù)實驗。本文將不同的嵌入層設(shè)置為相同的維度,并在{4,8,16,32,64,128}范圍內(nèi)調(diào)整嵌入向量維度。實驗結(jié)果如圖6和7所示,隨著隱藏層嵌入維度的增加,SACL模型能夠更細(xì)致地捕捉用戶不同行為之間的潛在聯(lián)系,提取用戶特征,并且基于注意力機制的多行為權(quán)重網(wǎng)絡(luò)能夠更好地區(qū)分不同行為之間的差異,降低輔助行為任務(wù)產(chǎn)生的噪聲,使推薦性能不斷提升。但隨著維度的升高,模型性能提升的幅度有所減緩,為綜合考慮推薦效率與推薦性能,本文將隱藏層的最優(yōu)嵌入維度設(shè)置為128。
3.9 案例分析
為了更直觀地理解本文所提模型的推薦方法,以用戶u為例,展示了SACL模型的推薦過程。如圖8所示,其中[i1,i2,…,i5]表示用戶u的歷史交互序列。圖8(a)為用戶u的完整交互序列[i1,…,i5,i3],將購買作為目標(biāo)行為,瀏覽、喜愛以及添加到購物車作為輔助行為,目標(biāo)推薦任務(wù)為給定歷史交互序列[i1,i2,…,i5],對下一個購買物品i3作出預(yù)測推薦。圖8(b)為傳統(tǒng)推薦模型的推薦過程,傳統(tǒng)推薦模型大多為單行為推薦模型,只利用目標(biāo)行為交互數(shù)據(jù)訓(xùn)練模型,預(yù)測下一個交互物品。本案例中,僅對用戶u歷史交互序列中購買的物品T恤衫、筆記本進行了特征學(xué)習(xí),導(dǎo)致所學(xué)習(xí)到的用戶偏好不準(zhǔn)確,錯誤預(yù)測了下一個交互物品。圖8(c)為SACL模型的推薦過程,針對用戶每種行為分配特定權(quán)重,同時利用輔助行為和目標(biāo)行為交互信息生成下一個物品的預(yù)測推薦。本案例中,依據(jù)用戶u的行為特征為瀏覽、喜愛、添加到購物車、購買分配特定的行為權(quán)重,結(jié)合權(quán)重對交互物品進行綜合學(xué)習(xí),最終作出了正確推薦。由此可見,SACL模型能夠更好地利用用戶歷史交互信息,捕獲用戶偏好,并更準(zhǔn)確地生成下一個項目的推薦預(yù)測。這有助于解決僅依靠目標(biāo)行為導(dǎo)致的推薦不準(zhǔn)確的問題。
4 結(jié)束語
考慮到多行為推薦算法中存在多行為任務(wù)優(yōu)化不平衡和用戶真實興趣偏移的問題,本文提出了一種基于自注意力和對比學(xué)習(xí)的多行為推薦模型SACL。該模型依據(jù)行為交互圖建立多行為圖卷積神經(jīng)網(wǎng)絡(luò)來提高多行為信息傳遞的高階連通性。通過多視圖間的對比學(xué)習(xí)捕捉不同行為之間的潛在依賴關(guān)系,將用戶特征整合為元知識,利用自注意多行為權(quán)重網(wǎng)絡(luò)來刻畫行為之間的差異,限制輔助行為噪聲,從而更準(zhǔn)確地捕捉用戶的個性化行為偏好。SACL的實驗結(jié)果優(yōu)于所有基線模型,驗證了所提模型的有效性。
圖8 案例分析Fig.8 Case study
下一步,為了更好地利用輔助信息優(yōu)化目標(biāo)任務(wù),考慮引用Transformer架構(gòu)細(xì)粒度建模多行為依賴關(guān)系,更精準(zhǔn)地捕獲用戶的目標(biāo)行為偏好,從而提升模型性能與泛化能力。
參考文獻(xiàn):
[1]嚴(yán)明時, 程志勇, 孫靜, 等. 基于兩階段學(xué)習(xí)的多行為推薦 [J]. 軟件學(xué)報, 2024, 35(5): 2446-2465. (Yan Mingshi, Cheng Zhiyong, Sun Jing, et al. Two-stage learning for multi-behavior recommendation [J]. Journal of Software, 2024, 35(5): 2446-2465.)
[2]Gao Chen, Zheng Yu, Li Nian, et al. A survey of graph neural networks for recommender systems: challenges, methods, and directions [J]. ACM Trans on Recommender Systems, 2023, 1(1): 1-51.
[3]汪春播, 溫繼文. 基于異構(gòu)信息網(wǎng)絡(luò)的推薦研究綜述 [J]. 計算機工程與科學(xué), 2023, 45(11): 2047-2059. (Wang Chunbo, Wen Jiwen. Review of recommendation based on heterogeneous information network [J]. Computer Engineering amp; Science, 2023, 45(11): 2047-2059.)
[4]Ren Xubin, Xia Lianghao, Zhao Jiashu, et al. Disentangled contrastive collaborative filtering [C]// Proc of the 46th International ACM SIGIR Conference on Research and Development in Information Retrieval. New York:ACM Press, 2023: 1137-1146.
[5]Wu Le, He Xiangnan, Wang Xiang, et al. A survey on accuracy-oriented neural recommendation: from collaborative filtering to information-rich recommendation [J]. IEEE Trans on Knowledge and Data Engineering, 2022, 35(5): 4425-4445.
[6]付峻宇, 朱小棟, 陳晨. 基于圖卷積的雙通道協(xié)同過濾推薦算法 [J]. 計算機應(yīng)用研究, 2023, 40(1): 129-135. (Fu Junyu, Zhu Xiaodong, Chen Chen. Two-channel collaborative filtering recommendation algorithm based on graph convolution [J]. Application Research of Computers, 2023, 40(1): 129-135.)
[7]Zhu Yu, Lin Jinhao, He Shibi, et al. Addressing the item cold-start problem by attribute-driven active learning [J]. IEEE Trans on Knowledge and Data Engineering, 2019, 32(4): 631-644.
[8]Zhou Zhihui, Zhang Lilin, Yang Ning. Contrastive collaborative filtering for cold-start item recommendation [C]// Proc of ACM Web Conference. New York:ACM Press,2023: 928-937.
[9]方陽, 譚真, 陳子陽, 等. 用于冷啟動推薦的異質(zhì)信息網(wǎng)絡(luò)對比元學(xué)習(xí) [J]. 軟件學(xué)報, 2023, 34(10): 4548-4564. (Fang Yang, Tan Zhen, Chen Ziyang, et al. Contrastive meta-learning on heterogeneous information networks for cold-start recommendation [J]. Journal of Software, 2023, 34(10): 4548-4564.)
[10]沈?qū)W利, 張榮凱. 聯(lián)合自監(jiān)督學(xué)習(xí)強化的多行為多任務(wù)推薦算法 [J]. 計算機應(yīng)用研究, 2023, 40(9): 2688-2693. (Shen Xueli, Zhang Rongkai. Multi-behavior multi-task recommendation algorithm integrating self-supervised learning enhancement [J]. Application Research of Computers, 2023, 40(9): 2688-2693.)
[11]Yan Mingshi, Cheng Zhiyong, Gao Chen, et al. Cascading residual graph convolutional network for multi-behavior recommendation [J]. ACM Trans on Information Systems, 2023, 42(1): 1-26.
[12]Tang Liang, Long Bo, Chen B C, et al. An empirical study on re-commendation with multiple types of feedback [C]// Proc of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Datamining. New York:ACM Press,2016: 283-292.
[13]Loni B, Pagano R, Larson M, et al. Bayesian personalized ranking with multi-channel user feedback [C]// Proc of the 10th ACM Confe-rence on Recommender Systems. New York:ACM Press,2016: 361-364.
[14]Gao Jianliang, Lyu Tengfei, Fan Xiong, et al. MGNN: a multimodal graph neural network for predicting the survival of cancer patients [C]// Proc of the 43rd International ACM SIGIR Conference on Research and Development in Information Retrieval. New York:ACM Press, 2020: 1697-1700.
[15]Gao Chen, He Xiangnan, Gan Dahua, et al. Neural multi-task re-commendation from multi-behavior data [C]// Proc of the 35th IEEE International Conference on Data Engineering. Piscataway, NJ: IEEE Press, 2019: 1554-1557.
[16]Jin Bowen, Gao Chen, He Xiangnan, et al. Multi-behavior recommendation with graph convolutional networks [C]// Proc of the 43rd International ACM SIGIR Conference on Research and Development in Information Retrieval. New York:ACM Press,2020: 659-668.
[17]Chen Chong, Ma Weizhi, Zhang Min, et al. Graph heterogeneous multi-relational recommendation [C]// Proc of AAAI Conference on Artificial Intelligence. Palo Alto, CA: AAAI Press, 2021: 3958-3966.
[18]Xia Lianghao, Xu Yong, Huang Chao, et al. Graph meta network for multi-behavior recommendation [C]// Proc of the 44th International ACM SIGIR Conference on Research and Development in Information Retrieval. New York:ACM Press,2021: 757-766.
[19]Xia Lianghao, Huang Chao, Xu Yong, et al. Multiplex behavioral relation learning for recommendation via memory augmented transformer network [C]// Proc of the 43rd International ACM SIGIR Conference on Research and Development in Information Retrieval. New York:ACM Press,2020: 2397-2406.
[20]Guo Long, Hua Lifeng, Jia Rongfei, et al. Buying or browsing?: predicting real-time purchasing intent using attention-based deep network with multiple behavior [C]// Proc of the 25th ACM SIGKDD International Conference on Knowledge Discovery amp; Data Mining. New York:ACM Press,2019: 1984-1992.
[21]Xia Lianghao, Huang Chao, Xu Yong, et al. Knowledge-enhanced hierarchical graph transformer network for multi-behavior recommendation [C]// Proc of AAAI Conference on Artificial Intelligence. Palo Alto, CA: AAAI Press,2021: 4486-4493.
[22]Wei Wei, Huang Chao, Xia Lianghao, et al. Contrastive meta lear-ning with behavior multiplicity for recommendation [C]// Proc of the 15th ACM International Conference on Web Search and Data Mi-ning. New York:ACM Press,2022: 1120-1128.
[23]Chen Deli, Lin Yankai, Li Wei, et al. Measuring and relieving the over-smoothing problem for graph neural networks from the topological view [C]// Proc of AAAI Conference on Artificial Intelligence. Palo Alto, CA: AAAI Press,2020: 3438-3445.
[24]Rendle S, Freudenthaler C, Gantner Z, et al. BPR: Bayesian personalized ranking from implicit feedback [EB/OL]. (2012-05-09). https://arxiv.org/abs/1205.2618.
[25]Shu Jun, Xie Qi, Yi Lixuan, et al. Meta-weight-net: learning an explicit mapping for sample weighting [EB/OL]. (2019-09-27). https://arxiv.org/abs/1902.07379.
[26]Wang Xiang, He Xiangnan, Wang Meng, et al. Neural graph collabo-rative filtering [C]// Proc of the 42nd International ACM SIGIR Conference on Research and Development in Information Retrieval. New York:ACM Press,2019: 165-174.
[27]He Xiangnan, Deng Kuan, Wang Xiang, et al. LightGCN: simplifying and powering graph convolution network for recommendation [C]// Proc of the 43rd International ACM SIGIR Conference on Research and Development in Information Retrieval. New York:ACM Press,2020: 639-648.
[28]Hu Ziniu, Dong Yuxiao, Wang Kuansan, et al. Heterogeneous graph transformer [C]// Proc of Web Conference. New York:ACM Press,2020: 2704-2710.
[29]Wang Xiao, Liu Nian, Han Hui, et al. Self-supervised heterogeneous graph neural network with co-contrastive learning [C]// Proc of the 27th ACM SIGKDD Conference on Knowledge Discovery amp; Data Mi-ning. New York:ACM Press,2021: 1726-1736.
[30]Chen Chong, Zhang Min, Zhang Yongfeng, et al. Efficient heterogeneous collaborative filtering without negative sampling for recommendation [C]// Proc of AAAI Conference on Artificial Intelligence. Palo Alto, CA: AAAI Press,2020: 19-26.
[31]Zhang Chi, Chen Rui, Zhao Xiangyu, et al. Denoising and prompt-tuning for multi-behavior recommendation [C]// Proc of ACM Web Conference. New York:ACM Press,2023: 1355-1363.