馮英杰,張志鴻,賈玉祥
(鄭州大學(xué) 計(jì)算機(jī)與人工智能學(xué)院, 鄭州 450001)
推薦系統(tǒng)基于用戶的歷史行為來學(xué)習(xí)和預(yù)測(cè)用戶偏好[1],在電子商務(wù)中有廣泛的應(yīng)用。社會(huì)化電子商務(wù)中,用戶可以在自己的社交網(wǎng)絡(luò)中分享一件商品,并邀請(qǐng)朋友組隊(duì),以優(yōu)惠的價(jià)格團(tuán)購商品[2]。
現(xiàn)有研究工作大多忽略了用戶與朋友分享利益的差異性,使得推薦結(jié)果產(chǎn)生偏差。例如,一個(gè)用戶可能與同學(xué)在運(yùn)動(dòng)方面有相同的興趣,與家人在食材的購買中具有相同的選擇。簡單來說,不同社會(huì)關(guān)系對(duì)用戶行為的影響是有差異的。為團(tuán)購發(fā)起者推薦合適的商品,對(duì)組團(tuán)成功率以及商品銷量具有重要影響。
為了捕獲這種差異化的影響,設(shè)計(jì)模型時(shí),需要同時(shí)考慮團(tuán)購發(fā)起者的興趣、參與者的興趣以及發(fā)起者對(duì)其他用戶的影響[3]。如何同時(shí)在團(tuán)購行為和社交網(wǎng)絡(luò)中提取關(guān)鍵的信息,并將提取到的信息融合到偏好學(xué)習(xí)中是具有挑戰(zhàn)性的。
針對(duì)上述問題,提出一種雙通道超圖卷積網(wǎng)絡(luò)(dual-channel hypergraph convolutional network for group-buying recommendation,HCGR),通過在團(tuán)購數(shù)據(jù)集上使用圖表示學(xué)習(xí)來解決問題。為了區(qū)分不同角色之間的購買行為,設(shè)計(jì)了超圖卷積網(wǎng)絡(luò)的嵌入-傳播層,以便有效地獲得用戶的潛在偏好。
主要貢獻(xiàn)概括如下:
1) 提出了一種基于雙通道超圖卷積網(wǎng)絡(luò)的團(tuán)購?fù)扑]方法,根據(jù)用戶角色的不同,設(shè)置不同的消息傳遞機(jī)制。將社交關(guān)系融入推薦系統(tǒng)中,更細(xì)粒度地建模用戶的社會(huì)影響力,從而捕獲差異化的社會(huì)影響,使模型具有更好的泛化能力。
2) 在真實(shí)團(tuán)購數(shù)據(jù)集上的實(shí)驗(yàn)表明,HCGR相較于對(duì)比模型,性能提升3.18%~4.46%。通過消融實(shí)驗(yàn)以及數(shù)據(jù)稀疏性實(shí)驗(yàn),進(jìn)一步驗(yàn)證了模型的合理性。
與團(tuán)購?fù)扑]相關(guān)的推薦形式有群組推薦和社會(huì)推薦。群組推薦中的群組是預(yù)先設(shè)定的,而團(tuán)購?fù)扑]中的團(tuán)體是動(dòng)態(tài)生成的。常用的群組推薦方法是基于模型的,進(jìn)一步可分為概率模型和神經(jīng)網(wǎng)絡(luò)模型。概率模型聚合了成員的個(gè)體偏好,基于其對(duì)該組的影響進(jìn)行推薦。Cao等[4]假設(shè)最有影響力的用戶有能力代表群體,對(duì)群體的決策產(chǎn)生較高的影響,從而區(qū)分不同成員對(duì)最終決策的貢獻(xiàn)。為了能夠進(jìn)一步細(xì)化聚合的過程,Vinh 等[5]首次利用自注意力網(wǎng)絡(luò)對(duì)成員的細(xì)粒度交互建模。但是上述模型都過于依賴群體內(nèi)部的用戶信息,并沒有利用群組間用戶的社交關(guān)系。為了解決這個(gè)局限性,Fan等[6]提出了層次傳播的社會(huì)自注意網(wǎng)絡(luò)來模擬社會(huì)影響,將偏好聚合過程設(shè)計(jì)為多個(gè)投票步驟。
社會(huì)推薦本質(zhì)上是將社會(huì)關(guān)系整合到推薦系統(tǒng),一方面緩解數(shù)據(jù)稀疏問題,另一方面用來提升推薦的性能。得益于強(qiáng)大的數(shù)據(jù)建模能力,圖神經(jīng)網(wǎng)絡(luò)(graph neural network,GNN)[7]在社會(huì)推薦上取得了巨大的成功。Fan等[8]首此將GNN引入社會(huì)推薦,將用戶-商品和用戶-用戶建模為圖數(shù)據(jù)。Song等[9]模擬了用戶基于會(huì)話的興趣以及動(dòng)態(tài)的社會(huì)影響。但是上述研究依然是基于經(jīng)典圖,無法對(duì)于一些復(fù)雜的關(guān)系進(jìn)行建模。因此,超圖卷積網(wǎng)絡(luò)(hypergraph convolution network,HCN)[10]被引入推薦系統(tǒng)。Wu等[11]提出了一種雙圖注意力網(wǎng)絡(luò)來協(xié)作學(xué)習(xí)雙重社會(huì)效應(yīng)的表示,以權(quán)衡社會(huì)效應(yīng)的相互作用。模型MHGCN[12]將存在于異質(zhì)信息網(wǎng)絡(luò)中的不同網(wǎng)絡(luò)模體(Motif)轉(zhuǎn)換為由不同超邊構(gòu)成的超圖,并通過在超圖網(wǎng)絡(luò)中加入自環(huán)解決在模型前向傳播過程中對(duì)異質(zhì)信息網(wǎng)絡(luò)覆蓋不足的問題。然而,這些現(xiàn)有的基于超圖的推薦模型都是針對(duì)特定數(shù)據(jù)形式設(shè)計(jì)的,不適用于團(tuán)購?fù)扑]問題。
團(tuán)購?fù)扑]作為一種新型推薦場景,相關(guān)研究相對(duì)較少。Bai等[13]提出一種混合兩階段推薦(HTPR)方法,該方法將離線準(zhǔn)備和在線推薦相結(jié)合,將聚類和協(xié)同過濾技術(shù)相結(jié)合,對(duì)項(xiàng)目進(jìn)行聚類后構(gòu)建用戶-項(xiàng)目類別趨勢(shì)矩陣,然后對(duì)用戶進(jìn)行聚類,再通過協(xié)同過濾進(jìn)行個(gè)性化推薦。Zhang等[3]提出構(gòu)建有向異構(gòu)圖來表示行為數(shù)據(jù)和社交網(wǎng)絡(luò),并設(shè)計(jì)了一種多視角嵌入傳播的圖卷積網(wǎng)絡(luò)模型,分別獲取不同角色的潛在偏好。但上述模型僅利用了用戶的成對(duì)關(guān)系,并未利用用戶間的高階關(guān)系以及購買物品的時(shí)間間隔等信息,本文中所提出的雙通道超圖卷積網(wǎng)絡(luò)模型正是要解決這一問題。
與之前推薦系統(tǒng)方面的研究一致,使用U={u1,u2,…un}表示用戶集(|U|=n),I={j1,j2,…,jm}表示商品集(|I|=m)。|U|=n,|I|=m對(duì)應(yīng)用戶和商品的數(shù)量。用戶、商品及其關(guān)系通常由用戶-商品交互圖和社交圖來表示。S∈Rn×n表示用戶的在線社交關(guān)系,若用戶u1與u2是朋友關(guān)系,則對(duì)應(yīng)下標(biāo) (1,2)的元素值為1,否則值為0。在真實(shí)的場景下,通常是使用B=〈ui,Up,j〉來記錄團(tuán)購行為,其中ui表示團(tuán)購發(fā)起者,Up={up1,up2,…,upn}表示為團(tuán)購的參與者,參與者來源于發(fā)起者ui的在線社交網(wǎng)絡(luò)。在團(tuán)購行為中參與者分為2種角色:具有共同利益的陌生人us和具有相似興趣的朋友uf。為了便于計(jì)算,在存在多個(gè)參與者時(shí)(即|Up|>1),則將此次團(tuán)購拆分為多組o=〈ui,up,j〉的集合來描述。
根據(jù)上述背景和符號(hào),研究的問題描述如下。
輸入:用戶在線社交關(guān)系S以及團(tuán)體購買行為O。
輸出:用戶u成功組隊(duì)購買商品j的概率的非標(biāo)準(zhǔn)化分?jǐn)?shù)。
通過模型為用戶生成目標(biāo)商品的預(yù)測(cè)得分并對(duì)其進(jìn)行排序,然后在候選商品池中生成topK推薦列表。
利用非對(duì)稱超圖譜卷積算子學(xué)習(xí)模型中超圖的嵌入。對(duì)于簡單圖,卷積算子可以表示為Xl+1=σ(A·XlPl),其中A為鄰接矩陣,X為特征矩陣,P為可學(xué)習(xí)權(quán)重矩陣。由于關(guān)聯(lián)矩陣H表示節(jié)點(diǎn)與超邊的關(guān)系,因此用HWHT度量齊次超圖中節(jié)點(diǎn)之間的成對(duì)關(guān)系,其中W是為所有超邊分配權(quán)重的權(quán)重矩陣。因此,超圖卷積算子可以表示為:
Xl+1=σ(HWHT·XlPl)
(1)
傳統(tǒng)的社會(huì)推薦算法大多是構(gòu)建用戶-用戶,用戶-商品的二部圖,這樣雖然可以很好地捕捉用戶的偏好信息,但是卻忽略了圖中的高階交互信息。
為了獲取團(tuán)購行為中不同角色間的高階信息,利用圖中所有類別的行為,首先將用戶的在線社交網(wǎng)絡(luò)圖GS和團(tuán)購行為圖GO對(duì)齊,為了區(qū)別不同角色之間的多重交互,根據(jù)嵌入角色的不同,將超圖GO又分為2種子圖:不存在社交關(guān)系的相似興趣購買行為GP及朋友分享購買行為GF,如圖1所示。
圖1 團(tuán)購中的2種購買行為
為了揭示不同角色的社會(huì)影響,需要設(shè)計(jì)查詢嵌入層來判斷(ui,up)是否存在社交關(guān)系。通過用戶在S以及O中的嵌入,找出超圖中的2種子圖GP和GF:
(2)
式中:NO和NS代表節(jié)點(diǎn);EO和ES代表圖GO與GS的超邊。在實(shí)際編碼時(shí),將發(fā)起者-參與者作為鍵-值對(duì)存儲(chǔ)在字典中,通過字典的運(yùn)算可得到2種子圖。由于字典無法用函數(shù)表示,因此使用集合運(yùn)算替代。
將團(tuán)購行為中發(fā)起者ui,參與者up,商品j構(gòu)建為超邊 (ui,j,up)∈E。因?yàn)槊織l超邊上的節(jié)點(diǎn)數(shù)量相同,所以本文的研究是基于一致超圖的。然后利用從超圖中獲得的用戶表示,預(yù)測(cè)目標(biāo)用戶u與給定商品j之間存在交互的可能性。
用于團(tuán)購?fù)扑]的超圖卷積模型HCGR主要包括3個(gè)模塊:初始嵌入層、超圖卷積層以及模型預(yù)測(cè)與優(yōu)化層,如圖2所示。在初始嵌入層中,根據(jù)用戶的行為將超圖分為2個(gè)子圖。在通道內(nèi),根據(jù)超圖譜理論設(shè)計(jì)圖的卷積操作,引入注意力機(jī)制聚合超邊中不同角色的節(jié)點(diǎn),并通過門控機(jī)制合理分配通道的權(quán)重。然后采用簡單而有效的內(nèi)積來捕獲用戶對(duì)平臺(tái)推薦商品的興趣。最后,結(jié)合朋友的偏好,生成目標(biāo)用戶與商品之間的分?jǐn)?shù),并使用貝葉斯個(gè)性化排序(bayesian personalized ranking,BPR)損失來優(yōu)化模型的參數(shù)。
圖2 HCGR模型架構(gòu)
在該模型中,存在多個(gè)超圖卷積層,因此使用Z∈Rn×d和Q∈Rm×d分別表示在每層學(xué)習(xí)到的特征維度大小為d的用戶嵌入和商品嵌入。注意,這里的用戶嵌入包含了發(fā)起者和參與者,為了便于用戶和商品在相同的空間中表示,這里使用Cl=[Zl;Ql]表示第l層的嵌入,其中C(0)=[Z;Q]。
通過初始時(shí)團(tuán)購行為中用戶和商品的交互,可以得到用戶i在團(tuán)購行為O中的特征Zi,表示用戶在商品空間中的歷史行為統(tǒng)計(jì)。由此可得到社交關(guān)系圖GS中用戶與朋友之間的相似度計(jì)算方法:
(3)
4.2.1 通道內(nèi)超圖卷積
為了從超圖中學(xué)習(xí)用戶和商品的表示,使用超圖卷積來捕獲發(fā)起者、參與者和商品之間的高階關(guān)系。參考式(1),可定義通道GP中的傳播規(guī)則如式(4)所示,這里參照文獻(xiàn)[14]去掉了非線性激活函數(shù)。
(4)
在團(tuán)購行為中,用戶與朋友可能共同購買多次,為了更好地捕獲用戶與朋友的共同偏好,將超邊上發(fā)起者-參與者〈ui,uf〉作為一個(gè)整體,通過行為感知捕獲ui和uf之間的相似性??稍O(shè)置通道GF的傳播規(guī)則為:
η=t(ui,uf)
(5)
由于不同的行為對(duì)最終生成的用戶嵌入具有不同程度的影響。因此,為了動(dòng)態(tài)地聚合不同角色鄰居節(jié)點(diǎn)的影響,在兩通道中引入注意力機(jī)制,由于注意力對(duì)輸入的特征尺度敏感,這里使用雙正規(guī)化[15],分別規(guī)范行和列:
式中:LeakyReLU是非線性激活函數(shù);aT是可訓(xùn)練參數(shù);權(quán)重矩陣P將Cvi和Cej映射到相同的向量空間。通過引入注意力機(jī)制,可以更好地描述超邊內(nèi)節(jié)點(diǎn)的相互影響。
經(jīng)過l層的傳播,可以得到用戶和商品的l個(gè)不同的嵌入{C0,C1,…,Cl},根據(jù)現(xiàn)有的工作,可以連接所有層級(jí),得到局部的用戶和商品特征表示:
(7)
4.2.2 全局特征表示
通過通道內(nèi)超圖卷積,可以從2個(gè)通道中得到朋友分享行為嵌入Cf與陌生人共同購買行為嵌入Cp,為了能夠自適應(yīng)融合2個(gè)通道的表示,采用門控機(jī)制,通過計(jì)算門g得到最終的嵌入表示:
(8)
用戶和商品的嵌入在同一向量空間中表示,因此超圖卷積算子不能直接作用于顯式社交網(wǎng)絡(luò)。例如在圖1中,用戶u1,u4,u5在超圖中分別屬于不同的超邊,且u1,u4,u5是存在社交關(guān)系的,但是在超圖中并沒有對(duì)其進(jìn)行建模。為了解決這個(gè)問題,需要對(duì)用戶社交關(guān)系進(jìn)行編碼,最后形成全面的用戶表示。
在社會(huì)關(guān)系中,用戶之間的聯(lián)系強(qiáng)度并不一致,而且這種強(qiáng)度與用戶之間的相似性相關(guān)聯(lián)。為了獲取用戶的潛在特征,需要從高階鄰居獲取信息。經(jīng)過l層的傳播后,從l階鄰居節(jié)點(diǎn)獲取的用戶嵌入可以表示為:
(9)
結(jié)合用戶在商品空間中的表示,可以得到全面的用戶表示:
(10)
1) 預(yù)測(cè)層:用戶u成功購買商品j的預(yù)測(cè)函數(shù),是通過取其最終表示的內(nèi)積來計(jì)算的:
(11)
2) 優(yōu)化層:為了優(yōu)化模型的參數(shù),采用在隱式推薦系統(tǒng)中廣泛應(yīng)用的BPR損失函數(shù),如下:
(12)
{(i,j,j′)|(i,j)∈Y+,(i,j′)∈Y-}表示帶有負(fù)樣本的成對(duì)訓(xùn)練數(shù)據(jù),Y+與Y-分別表示觀察到的和采樣到未觀察的用戶-商品交互集合。
6.1實(shí)驗(yàn)設(shè)置
6.1.1數(shù)據(jù)集
由于國內(nèi)團(tuán)購網(wǎng)站數(shù)據(jù)的保密性較高,獲取相關(guān)的團(tuán)購數(shù)據(jù)集較為困難,目前只有一個(gè)公開數(shù)據(jù)集Beibei,該數(shù)據(jù)集來自我國最大的母嬰產(chǎn)品電子商務(wù)平臺(tái)——貝貝,包含了平臺(tái)數(shù)據(jù)庫中的團(tuán)購日志以及用戶的社交關(guān)系。表1展示了數(shù)據(jù)集的具體信息。
表1 Beibei數(shù)據(jù)集信息
使用該數(shù)據(jù)集來評(píng)估模型,能夠反映具有代表性的現(xiàn)實(shí)場景。由于該場景已經(jīng)取得顯著成效,例如拼多多,證明我們所研究的問題是具有應(yīng)用價(jià)值的。
將數(shù)據(jù)集劃分為訓(xùn)練集(占80%)和測(cè)試集(占20%)。對(duì)于所有提到的模型,包括基線和HCGR模型都使用推薦系統(tǒng)中常用的損失函數(shù)BPRloss進(jìn)行訓(xùn)練。訓(xùn)練集中隨機(jī)選取8個(gè)與用戶沒有交互過的商品作為負(fù)樣本。對(duì)于所有的測(cè)試集,為每個(gè)用戶隨機(jī)生成800個(gè)未被交互的商品,然后對(duì)測(cè)試商品和采樣商品進(jìn)行排序。
將Adam優(yōu)化器部署在大小為4 096的小批量上,并設(shè)置特征嵌入d=32進(jìn)行擬合,在{1e-1,1e-3,1e-5,2e-3,3e-3}中調(diào)整學(xué)習(xí)率,在{1e-1,1e-2,1e-3,1e-4,1e-5}中搜索L2正則項(xiàng)的系數(shù)。同時(shí)設(shè)置超圖卷積以及圖卷積的層數(shù)為2。
6.1.2 基線和評(píng)價(jià)指標(biāo)
將提出的HCGR模型與幾種具有代表性的模型進(jìn)行比較,包括協(xié)同過濾方法和社會(huì)推薦方法。為了使團(tuán)購數(shù)據(jù)集能適用于下列模型,將發(fā)起者-商品和參與者-商品看作純粹的用戶-商品交互。
LightGCN[16]:通過用戶-商品交互圖線性傳播用戶和商品嵌入進(jìn)行學(xué)習(xí),并使用在所有層上學(xué)習(xí)到的嵌入的加權(quán)和作為最終嵌入結(jié)果。
UltraGCN[17]:通過約束損失替代顯式消息傳遞,同時(shí),分配更合適的邊緣權(quán)重,靈活調(diào)整不同類型關(guān)系之間的相對(duì)重要性。
GraphRec[8]:提供了一種原則性的方法來聯(lián)合捕獲用戶-項(xiàng)目圖中的交互和用戶的興趣,對(duì)二部圖異構(gòu)強(qiáng)度進(jìn)行了一致建模。
GBGCN[3]:從多視角以及交叉視圖的傳播獲取團(tuán)購中用戶交互的復(fù)雜反饋以及社會(huì)影響,是針對(duì)于團(tuán)購個(gè)性化推薦的模型。
Diffnet[18]:一種基于GCN的社會(huì)推薦模型, 提出了一種模擬用戶受到遞歸社交行為傳播的深度影響傳播模型。
SHGCN[19]:將社會(huì)關(guān)系引入“用戶-商品”關(guān)系,使其擴(kuò)展為“用戶-商品-用戶”的三重關(guān)系,并統(tǒng)一使用超圖卷積網(wǎng)絡(luò)建模。
MHCN[20]:基于多通道超圖的卷積網(wǎng)絡(luò),將用戶-商品分為多個(gè)模體,并在學(xué)習(xí)目標(biāo)中增加了自監(jiān)督機(jī)制,用以最大化層次交互信息。
NGCF-EG:NGCF[21]是基于GCN的模型,通過高階連接和傳播注入?yún)f(xié)作信息,將社交網(wǎng)絡(luò)合并到用戶-商品二部圖,從而得到擴(kuò)展圖。
為了全面評(píng)估算法,使用2個(gè)廣泛使用的基于排名的度量,召回率Recall@K和歸一化折扣累計(jì)增益NDCG@K:
(13)
對(duì)于6.1節(jié)中評(píng)價(jià)指標(biāo)Recall@K與NDCG@K,將K值設(shè)置為{5,10},與現(xiàn)有基線的整體推薦性能比較如表2所示。
表2 在Beibei數(shù)據(jù)集上的整體性能
從表2中可以看出,HCGR在Beibei數(shù)據(jù)集上顯著優(yōu)于所有基線,在所有的Recall@K和NDCG@K度量中都優(yōu)于所有基線。在Recall@5、Recall@10、NDCG@5、NDCG@10分別提高了4.46%、3.64%、3.74%、3.18%,并且HCGR在值較小的情況下表現(xiàn)更好,在團(tuán)購的場景下更具有應(yīng)用價(jià)值。隨機(jī)選取5個(gè)種子進(jìn)行重復(fù)訓(xùn)練,取平均結(jié)果,且樣本中的t檢驗(yàn)p值小于0.03,說明HCGR模型是有效且穩(wěn)定的。
在團(tuán)購場景下,用戶和項(xiàng)目之間的關(guān)系是多重的。LightGCN旨在探索用戶-項(xiàng)目二分圖中的協(xié)同過濾信號(hào),無法建模多重關(guān)系。UltraGCN解決了LightGCN顯式消息傳遞以及多層堆疊所存在的問題,因此其性能略優(yōu)于LightGCN,整體性能相對(duì)于UltraGCN提升了2.21%~4.49%。
通常情況下,推薦系統(tǒng)中使用社交網(wǎng)絡(luò)信息表現(xiàn)會(huì)更好,例如,NGCF-EG在Recall@10和NDCG@10上的表現(xiàn)相較于GBGCN分別提升了3.16%、4.03%。一方面,社交關(guān)系的融入能夠?qū)ν扑]系統(tǒng)起到輔助作用,更好地了解用戶的偏好。另一方面,社交關(guān)系能夠有效地緩解推薦系統(tǒng)中常見的數(shù)據(jù)稀疏性問題。
從表2中可以看出,NGCF-EG直接將社交網(wǎng)絡(luò)融入,其推薦效果沒有體現(xiàn)出來,因?yàn)樗荒懿东@不同用戶角色的社交關(guān)系潛在特征。相比而言,HCGR能夠更加充分提取用戶的潛在信息,建模用戶的嵌入。
MHCN模型雖然同樣使用超圖提取用戶之間的高階信息,但是卻有一定的局限性,因?yàn)槠錄]有考慮到商品的交互時(shí)間。雖然考慮到了用戶購買商品的多種方式,但是用戶對(duì)商品的購買是具有先后性的,比如u1與u2雖然在社交關(guān)系中連通且購買了相同的商品,但是u1購買該商品較早,其特征空間可能已經(jīng)發(fā)生變化。從表2中可以看出,MHCN模型在Beibei數(shù)據(jù)集上的表現(xiàn)并不理想。
數(shù)據(jù)稀疏性問題是推薦系統(tǒng)的主要問題,選擇2個(gè)具有代表性的模型Diffnet和SHGCN作為對(duì)比,評(píng)判HCGR模型在稀疏數(shù)據(jù)上的推薦性能。具體來說,根據(jù)測(cè)試集中用戶在訓(xùn)練集中的歷史購買行為記錄,將用戶分為3組,并分別對(duì)3組用戶進(jìn)行評(píng)估。橫軸顯示了用戶組信息,縱軸顯示了L=10的情況下各組的推薦性能。對(duì)于每一組,都取5次訓(xùn)練的平均值,結(jié)果如圖3所示。
圖3 各組稀疏分布及實(shí)驗(yàn)結(jié)果
從圖3(a)可以看出,90.27%的用戶交互次數(shù)不超過10次,幾乎一半以上的用戶交互次數(shù)不超過5次。分別在3組用戶中進(jìn)行試驗(yàn),能很好地體現(xiàn)出模型在稀疏條件下的推薦性能。
由圖3(b)和圖3(c)可以看出,交互次數(shù)在1~5的用戶組中,Diffnet的表現(xiàn)與HCGR的表現(xiàn)是接近的,而SHGCN的表現(xiàn)卻并不是很理想,可能是因?yàn)镈iffnet能夠更好地模擬用戶社交影響的傳播,因此在交互非常稀疏的條件下,Diffnet能夠有較好的表現(xiàn)。在所有分組中,本文模型均優(yōu)于另外2個(gè)模型,雖然在初始時(shí)提升效果并不明顯,但隨著用戶交互次數(shù)的增加,模型Recall的NDCG和性能都迅速提高。相比于SHGCN,提升在6.5%~7.6%,說明了HCGR模型在緩解數(shù)據(jù)稀疏問題上的有效性。
表3 HCGR與其變體的推薦性能
從表3中可以看出,HCGR-G的推薦效果總是比HCGR-DC好,證明了設(shè)置雙通道的有效性,也從側(cè)面說明將用戶分為不同角色進(jìn)行處理的必要性。從結(jié)果上來看,設(shè)置雙通道比單通道的效果提升 2.14%~3.49%。通過HCGR-G與HCGR的對(duì)比可以看出,相較于簡單的拼接,使用門控聚合能夠?qū)⑼扑]性能提升2.60%~3.15%。說明門控聚合可以更好地提取用戶的潛在特征中顯著的部分,進(jìn)行平滑組合。
深度學(xué)習(xí)模型的超參數(shù)選擇一直都是一個(gè)具有挑戰(zhàn)性的問題。使用正則化用來防止過擬合,并在{1e-1,1e-2,1e-3,1e-4,1e-5}選擇正則項(xiàng)。為了探究HCGR層數(shù)對(duì)性能的影響,在{1,2,3,4}范圍內(nèi)改變模型的深度。實(shí)驗(yàn)結(jié)果如圖4所示。
圖4 超參數(shù)對(duì)推薦性能的影響曲線
從圖4(a)可以看出,當(dāng)改變L2正則項(xiàng)時(shí),Recall@10的波動(dòng)在2.2%以內(nèi),NDCG@10的波動(dòng)在2.7%以內(nèi),說明模型性能對(duì)超參數(shù)的設(shè)置并不敏感。從圖4(b)可以看出,當(dāng)層數(shù)為2時(shí),模型的推薦性能達(dá)到最優(yōu),隨著層數(shù)增加,HCGR在數(shù)據(jù)集上的性能下降,可能的原因是HCGR聚合了高階鄰居的信息,隨著深度增加,會(huì)出現(xiàn)過擬合的問題。
對(duì)社會(huì)電子商務(wù)的團(tuán)購?fù)扑]問題進(jìn)行了研究,提出使用超圖來表示團(tuán)購行為,通過社交網(wǎng)絡(luò)對(duì)團(tuán)購中用戶的角色進(jìn)行區(qū)分,建立了雙通道超圖卷積網(wǎng)絡(luò)模型,捕捉朋友之間的細(xì)粒度社會(huì)影響。在真實(shí)的團(tuán)購數(shù)據(jù)集Beibei上的實(shí)驗(yàn)表明,HCGR模型優(yōu)于所有對(duì)比模型,并能很好地緩解數(shù)據(jù)稀疏性問題。
在未來的工作中,計(jì)劃在更多的團(tuán)購場景中測(cè)試模型的有效性,驗(yàn)證模型的泛化能力。利用更多的顯式信息,例如復(fù)雜交互的顯示評(píng)分以及時(shí)間信息,對(duì)用戶的長短期興趣進(jìn)行建模??紤]引入對(duì)比學(xué)習(xí)作為輔助任務(wù),增強(qiáng)模型在更復(fù)雜場景下的推薦性能。