潘亞男 王軍
摘要:針對(duì)電商知識(shí)圖譜鏈接預(yù)測(cè)模型精度較低且存在重復(fù)推薦同類型商品的問題,提出改進(jìn)的關(guān)系縮放(Relation Scale,RS)模型。基于TransE和TuckER模型,判斷三元組頭尾實(shí)體關(guān)系強(qiáng)弱,引入關(guān)系縮放因子,確定所有關(guān)系路徑權(quán)重,以提高模型收斂速度。實(shí)驗(yàn)結(jié)果表明,基于OpenBG500數(shù)據(jù)集,改進(jìn)模型的MRR、Hits@1、Hits@3和Hits@10均有提高;相較于傳統(tǒng)TransE模型,RSTransE的MRR和Hits@10分別提高了47.4%和71.1%;相較于傳統(tǒng)TuckER模型,RSTuckER的MRR和Hits@10分別提高了35.8%和28.4%。RS模型能更準(zhǔn)確預(yù)測(cè)用戶需求,實(shí)現(xiàn)更加個(gè)性化且精準(zhǔn)的推薦結(jié)果。
關(guān)鍵詞:推薦系統(tǒng);關(guān)系縮放;知識(shí)圖譜;鏈接預(yù)測(cè)
中圖分類號(hào):
TP391.1
文獻(xiàn)標(biāo)志碼:A
基于知識(shí)圖譜的商品推薦能夠有效地過濾信息[1],減少用戶獲取信息的時(shí)間,提高用戶處理信息的效率。盡管電商類推薦模型為用戶選擇商品時(shí)帶來極大的便利,但仍存在諸多問題如不能很好地理解用戶需求造成重復(fù)或者過度推薦等。此外,商品間關(guān)系更為復(fù)雜,其關(guān)系路徑也有眾多選擇,如何根據(jù)不同情況迅速選取更優(yōu)關(guān)系路徑亦廣受關(guān)注。電商知識(shí)圖譜(Electronic Commerce Knowledge Graph,ECKG)是推薦系統(tǒng)的分支,由多個(gè)三元組構(gòu)成的知識(shí)表示框架,通過優(yōu)化ECKG改進(jìn)推薦系統(tǒng)提高電商平臺(tái)的營(yíng)銷效果已成為研究熱點(diǎn)之一[2]。然而,現(xiàn)有知識(shí)圖譜嵌入的方法忽略了如實(shí)體類型和關(guān)系路徑等能夠進(jìn)一步提高嵌入精度的額外信息,存在一定局限性[3]。近年來,ECKG鏈接預(yù)測(cè)問題研究逐漸深入,陸續(xù)提出了TransE[4]、TransH[5]、TransD[6]和TuckER[7]等模型,用于預(yù)測(cè)ECKG中的缺失或未來的鏈路;通過引入注意力機(jī)制[8-10]、向量共享交叉訓(xùn)練機(jī)制[11]、多任務(wù)學(xué)習(xí)框架[12]和網(wǎng)絡(luò)節(jié)點(diǎn)創(chuàng)新要素[13]等技術(shù)手段,不斷完善和擴(kuò)展知識(shí)圖譜的內(nèi)容[14],以構(gòu)建規(guī)?;?、高質(zhì)量的ECKG[15]。將知識(shí)圖譜鏈接預(yù)測(cè)應(yīng)用于旅游路線推薦[16]、短文本實(shí)體消歧[17]、供應(yīng)鏈重構(gòu)[18]、企業(yè)關(guān)系可視化[19]和電子商務(wù)[1]等領(lǐng)域,能夠?yàn)槁肪€推薦、商品推薦和企業(yè)決策提供優(yōu)化途徑。其中常用的有經(jīng)典的翻譯嵌入模型TransE和最新的塔克張量分解模型TuckER。TransE模型的參數(shù)較少,能防止欠擬合,梯度下降優(yōu)化方法中的梯度均為可調(diào)整參數(shù),訓(xùn)練耗時(shí)更短。傳統(tǒng)的TransE模型常用于鏈接預(yù)測(cè)領(lǐng)域,處理一對(duì)一關(guān)系時(shí)表現(xiàn)較好,能夠處理知識(shí)圖譜并描述三元組,但在描述頭尾實(shí)體的關(guān)系強(qiáng)弱方面存在不足。TuckER模型采用低秩張量分解的思想,減少了參數(shù)的數(shù)量,能夠在多維度上建模實(shí)體和關(guān)系之間的復(fù)雜關(guān)系,有助于降低模型的復(fù)雜性和提高泛化能力,從而更好地捕捉知識(shí)圖譜中的信息,張量分解使其對(duì)一對(duì)多和多對(duì)多關(guān)系具有更好的建模能力,但是仍然沒有體現(xiàn)關(guān)系的重要程度。目前可通過層縮放技術(shù)[20]描述關(guān)系重要程度。為使推薦模型更好理解用戶行為,本文以TransE模型和TuckER模型為基礎(chǔ),提出關(guān)系縮放(Relation Scale,RS)模型,通過引入關(guān)系縮放因子(Relation Scale Factor,RSF),將原模型改進(jìn)為RSTransE和RSTuckER。
1 RS模型構(gòu)建
知識(shí)圖譜的核心是三元組(h,r,t),h∈Eh代表頭實(shí)體,t∈Et代表尾實(shí)體,r∈Rn代表頭尾實(shí)體兩者之間的關(guān)系,h,r,t均為向量形式,Eh,Rn,Et分別代表與之對(duì)應(yīng)的集合。鏈路預(yù)測(cè)挖掘三元組中實(shí)體之間關(guān)系路徑,以經(jīng)典的TransE或TuckER模型為例,在鏈路預(yù)測(cè)任務(wù)中引入RSF提升關(guān)系描述能力。RSF可以為關(guān)系路徑嵌入同長(zhǎng)度的向量,每個(gè)關(guān)系嵌入向量上有唯一與其對(duì)應(yīng)的RSF,其基本結(jié)構(gòu)如圖1所示。
選擇Adam優(yōu)化器控制關(guān)系集合Ri中嵌入元素的重要程度,依據(jù)關(guān)系強(qiáng)弱獲得相應(yīng)的權(quán)重,通過控制關(guān)系的縮放比例,訓(xùn)練可通過RSF控制關(guān)系強(qiáng)弱,關(guān)系縮放原理如圖2所示,其中Eh表示頭實(shí)體集合,Ri(i=1,…,n)表示尾頭尾實(shí)體之間的關(guān)系集合,Et表示尾實(shí)體集合,RSFj(j=1,…,n)表示關(guān)系縮放因子。
模型中實(shí)體和關(guān)系的所有嵌入方式按照隨機(jī)過程[21]初始化;每次迭代時(shí),嵌入向量歸一化處理,從驗(yàn)證集中采樣少量三元組作為小批量數(shù)據(jù)訓(xùn)練的初始三元組集合,上述三元組采樣獲取單個(gè)缺失三元組。采取具有恒定學(xué)習(xí)速率的梯度下降方法更新參數(shù),根據(jù)模型在驗(yàn)證集上的性能適時(shí)停止迭代。正負(fù)樣本都是均勻劃分到訓(xùn)練集和測(cè)試集上的,處理方式可以參照公開學(xué)術(shù)數(shù)據(jù)集OpenBG500[21]。
1.1 RSTransE模型
處理知識(shí)圖譜時(shí),傳統(tǒng)的TransE模型無法準(zhǔn)確地捕捉到三元組中關(guān)系的強(qiáng)度差異,即在使用TransE模型時(shí),不能有效地表示并推斷知識(shí)圖譜中不同實(shí)體之間關(guān)系的重要性,導(dǎo)致在知識(shí)圖譜的表示中喪失重要的語義信息,從而影響相關(guān)任務(wù)的準(zhǔn)確性。為描述知識(shí)圖譜中頭尾實(shí)體的關(guān)聯(lián)性強(qiáng)弱,將關(guān)系縮放因子用于TransE模型縮放三元組間關(guān)系,以表示它們間的相互作用和影響程度。
RSTransE模型的距離函數(shù)采用L3范數(shù)的平方,表示為
d(h+(RSF×r)2,t)=‖h‖23+‖(RSF×r)2‖23+‖t‖23-2(hTt+((RSF×r)2)T(t-h(huán)))(1)
RSTransE模型的缺失三元組集合為
Q'(h',r,t')=(h',r,t)|h'∈Eh∪(h,r,t')|t'∈Et(2)
其中,上標(biāo)T表示向量轉(zhuǎn)置;‖·‖3表示L3范數(shù);RSF為關(guān)系縮放因子,范圍取0~1,其維度和關(guān)系r的第1維度相同。各個(gè)h,r,t的張量是 (n, D),其中n是每次訓(xùn)練選取的樣本個(gè)數(shù),D是嵌入維度。
RSTransE模型的損失函數(shù)表示為
L=∑(h,r,t)∑(h',r,t')[γ+d(h+r,t)-(h'+r,t')]+(3)
其中,Q'(h',r,t')表示頭或尾實(shí)體存在缺失的三元組集合,超參數(shù)γ是正實(shí)數(shù),是調(diào)節(jié)訓(xùn)練的標(biāo)準(zhǔn)尺度;[x]+為合頁損失函數(shù),把負(fù)樣本正則化,取x的非負(fù)部分,若x≤0,則[x]+=0。
約束條件:對(duì)于已存在的三元組Q(h,r,t)有h+r≈t;對(duì)于不存在的三元組Q(h,r,t),要求h+r與t間隔甚遠(yuǎn);實(shí)體嵌入的L3范數(shù)正則化為L(zhǎng)1范數(shù),而關(guān)系嵌入的范數(shù)沒有任何正則化或范數(shù)的約束,但也可以正則化。
通過最小化損失函數(shù)L完成模型訓(xùn)練,采用隨機(jī)梯度下降法,使已存在三元組中關(guān)系的距離d(h,r,t)盡可能小,使缺失三元組關(guān)系的距離d(h'+r,t')盡可能大。所有實(shí)體和關(guān)系隨機(jī)獲得,做歸一化處理。每次選取一批三元組訓(xùn)練,同時(shí)對(duì)應(yīng)三元組選取存在缺失的實(shí)體,根據(jù)驗(yàn)證集上達(dá)到的效果選擇是否停止。
1.2 RSTuckER模型
引入RSF到TuckER模型,得到RSTuckER模型,用以重新分解TuckER模型,其中頭實(shí)體嵌入矩陣Eh與頭實(shí)體h等價(jià),同理尾實(shí)體嵌入矩陣Et和t等價(jià),即Ε∈Rne×dei且關(guān)系嵌入矩陣R∈Rnr×dri,其中ne和nr分別表示實(shí)體和關(guān)系的個(gè)數(shù),de和dr分別表示實(shí)體和關(guān)系嵌入向量的維數(shù),得分函數(shù)為
φ(es,r,eo)=W×1es×2wRSFr×3eo(4)
wRSFr=RSFj×Ri(5)
其中,es,eo∈Rdei是E中表示頭尾實(shí)體嵌入向量的行;wr∈Rdri是R中表示關(guān)系嵌入向量的行;W∈Rde×dr×dei是核心張量。基于logistic sigmoid函數(shù)得到每個(gè)三元組得分φ(es,r,eo)為預(yù)測(cè)概率p,損失函數(shù)為
L(p,y)=-1ne∑nei=1(y(i)log(p(i))+(1-y(i))log(1-p(i)))(6)
由于W的參數(shù)個(gè)數(shù)只取決于實(shí)體和關(guān)系的嵌入維度,而不取決于實(shí)體或關(guān)系的個(gè)數(shù),因此,其參數(shù)個(gè)數(shù)隨實(shí)體和關(guān)系嵌入維數(shù)de和dr的增加而線性增加。與DistMult、ComplEx和SimplE等簡(jiǎn)單模型將所有知識(shí)編碼到嵌入關(guān)系中有所不同,TuckER使用核心張量W進(jìn)行多任務(wù)學(xué)習(xí),將其中一部分學(xué)到的知識(shí)存儲(chǔ)在該張量中并與所有實(shí)體和關(guān)系共享。TuckER的核心張量可視為一個(gè)共享的“原型”關(guān)系矩陣池,根據(jù)嵌入的每個(gè)關(guān)系中的參數(shù)進(jìn)行線性組合。
2 實(shí)驗(yàn)設(shè)置
2.1 數(shù)據(jù)集
本文基于OpenBG500數(shù)據(jù)集評(píng)估RS模型有效性。OpenBG500由OpenBG中提取,OpenBG是涵蓋產(chǎn)品和消費(fèi)需求的大規(guī)模多模態(tài)數(shù)據(jù)集[1, 21]。OpenBG500是開放的中國(guó)電子商務(wù)和商業(yè)知識(shí)圖譜數(shù)據(jù)集,包含249 743個(gè)實(shí)體,500個(gè)關(guān)系,驗(yàn)證集5 000個(gè)實(shí)體,測(cè)試集5 000個(gè)實(shí)體,改進(jìn)研究均基于驗(yàn)證集完成(圖3)。
2.2 模型測(cè)評(píng)指標(biāo)
實(shí)驗(yàn)采用MRR、Hits@1、Hits@3和Hits@10作為測(cè)評(píng)指標(biāo)[1, 9, 13, 22]。對(duì)于任意三元組(h,r,t),通過更換頭實(shí)體或尾實(shí)體得到存在缺失的三元組,頭實(shí)體缺失的三元組用(?,r,t)表示,尾實(shí)體缺失的三元組用(h,r,?)表示,其中?表示缺失部分。例如,頭部和尾部的集合是固定個(gè)數(shù)(若待替換項(xiàng)有n-1項(xiàng)),針對(duì)生成的三元組集合(n-1個(gè))計(jì)算距離,按照距離由小到大排序。
MRR是鏈接預(yù)測(cè)正確實(shí)體排名倒數(shù)的平均值,對(duì)于(h,r,?),若第1個(gè)正確答案排在第n位,則該次測(cè)評(píng)得分為1/n,由于只計(jì)算前10個(gè)實(shí)體,所以此處n最大為10,如果前10個(gè)實(shí)體中不包含正確答案,則測(cè)評(píng)得分為0,最終對(duì)多次測(cè)評(píng)得分求平均值,計(jì)算公式為
MRR=1Q∑Qi=11ranki(7)
1ranki=1i0(8)
其中,Q為三元組的集合,Q表示測(cè)試的三元組的個(gè)數(shù)。MRR反應(yīng)的是被找到的實(shí)體在所有實(shí)體按推薦順序排列后的位置,表示模型的推薦能力。
Hits@n是指在鏈接預(yù)測(cè)中排名小于n的三元組的平均占比,表示模型能夠正確表示三元組關(guān)系的能力,計(jì)算公式為
Hits@n=1Q∑Qi=1Euclid Math TwoIA@(ranki≤n)(9)
其中,Euclid Math TwoIA@(·)是indicator函數(shù)(若條件真則值為1,否則為0),一般取n等于1、3或10,且該指標(biāo)越大越好。
2.3 參數(shù)設(shè)置
實(shí)驗(yàn)使用一臺(tái)64位操作系統(tǒng)的計(jì)算機(jī),CPU為Intel酷睿i5-1155G7,GPU為NVIDIA GeForce MX450,PyThorch深度學(xué)習(xí)開發(fā)框架,Python作為開發(fā)語言。為保證訓(xùn)練效率和模型性能,將Adam作為訓(xùn)練優(yōu)化器。RSTransE模型中的參數(shù)配置:批量大小batch_size設(shè)置為100 000,迭代次數(shù)epoch為40,margin調(diào)整為1,距離范數(shù)distance_norm調(diào)整為3。RSTuckER模型中的參數(shù)配置:批量大小batch_size設(shè)置為128,迭代次數(shù)epoch為40,margin調(diào)整為1,距離范數(shù)distance_norm調(diào)整為3,學(xué)習(xí)率learning_rate調(diào)整為0.05,衰減率decay_rate調(diào)整為1,實(shí)體嵌入維度篩選為200,輸入層損失為0.3,第1隱藏層的損失為0.4,第2隱藏層的損失為0.4,標(biāo)簽平滑量為0.1。
3 結(jié)果與討論
3.1 關(guān)系嵌入維度實(shí)驗(yàn)
對(duì)于較小規(guī)模的知識(shí)圖譜,嵌入維度在50~200之間,由于RSTransE和RSTuckER模型選取嵌入維度的方式相同,因此,只討論RSTransE模型的關(guān)系嵌入維度的實(shí)驗(yàn),實(shí)驗(yàn)選取4個(gè)常用指標(biāo),RSF為0.4時(shí),其它參數(shù)保持不變,不同嵌入維度下各項(xiàng)指標(biāo)的值如表1所示。
嵌入維度D為50時(shí),單次訓(xùn)練所需時(shí)間最短,但各項(xiàng)指標(biāo)最低;嵌入維度D為200時(shí),Hits@3和Hits@10均最大,但耗時(shí)最長(zhǎng)且超過100 ms,嵌入維度D為100時(shí),各項(xiàng)指標(biāo)較高,單次訓(xùn)練所需時(shí)間也較短;因此,嵌入維度調(diào)整為100。同理,RSTuckER模型選取嵌入維度為200較為合適。
3.2 RSTransE模型結(jié)果
RSF取值范圍調(diào)整為0~1,取值間隔為0.1。經(jīng)過RSTransE模型多次訓(xùn)練后,實(shí)驗(yàn)結(jié)果見表2。RSF取0.4時(shí),MRRmax=0.560 3,Hits@1max= 0.451 4,Hits@10 max= 0.790 2;RSF取0.3時(shí),Hits@3 max=0.641 4。綜上,RSF取0.4時(shí),總體改進(jìn)效果最優(yōu)。
3.3 RSTuckER模型結(jié)果
RSTuckER模型改進(jìn)過程中,RSF取值范圍同RSTransE模型,實(shí)驗(yàn)結(jié)果見表3。RSF取0.2時(shí),MRR max= 0.717 1,Hits@1 max= 0.608 0;RSF取0.5時(shí),Hits@3 max= 0.798 4;RSF取0.9時(shí),Hits@10 max= 0.910 6。因此,考慮全部指標(biāo)或者僅考慮Hits@10時(shí),RSF應(yīng)取0.9;僅考慮Hits@3時(shí),RSF應(yīng)取0.5;考慮Hits@1和MRR,RSF應(yīng)取0.2。
3.4 其他方法對(duì)比分析
經(jīng)過對(duì)TransE、DisMult、ComplEx和TuckER等模型的實(shí)驗(yàn)與對(duì)比分析可知,上述方法中,TransE和TuckER的鏈接預(yù)測(cè)結(jié)果較好。基于原模型,引入RSF調(diào)控三元組關(guān)系強(qiáng)弱。通過RSTransE、RSTuckER和其他方法的對(duì)比實(shí)驗(yàn),驗(yàn)證了RSF對(duì)原模型的改進(jìn)具有有效性與優(yōu)越性(表4)。通過關(guān)系縮放模型能夠更深入地研究知識(shí)圖譜的語義聯(lián)系,增強(qiáng)知識(shí)表達(dá)能力,提升各類任務(wù)中模型的性能。
4 結(jié)論
RS模型能實(shí)現(xiàn)根據(jù)客戶需求變化改變實(shí)體之間關(guān)系的重要程度,從而更準(zhǔn)確地預(yù)測(cè)實(shí)體之間的關(guān)系路徑,有助于改進(jìn)被推薦商品和用戶之間的關(guān)聯(lián)性、重要性。為了更好的驗(yàn)證RS模型的適用性,改進(jìn)經(jīng)典模型TransE和TuckER,得到新的鏈路預(yù)測(cè)模型RSTransE和RSTuckER。實(shí)驗(yàn)結(jié)果表明,在OpenBG500數(shù)據(jù)集上應(yīng)用RS模型,證實(shí)了關(guān)系縮放模型可以更準(zhǔn)確地預(yù)測(cè)缺失的關(guān)系,提高知識(shí)圖譜應(yīng)用的性能和效果,這使得商品推薦的準(zhǔn)確性得到了顯著提高,更加符合用戶的偏好。
參考文獻(xiàn)
[1]ZHANG W,WONG C M, YE G Q, et al. Billion-scale pre-trained e-commerce product knowledge graph model[C]// 2021 IEEE 37th International Conference on Data Engineering (ICDE). Chania, 2021: 2476-2487.
[2]楊東華, 何濤, 王宏志, 等. 面向知識(shí)圖譜的圖嵌入學(xué)習(xí)研究進(jìn)展[J]. 軟件學(xué)報(bào), 2022, 33(9): 3370-3390.
[3]PENG C Y, XIA F, NASERIPARSA M, et al. Knowledge graphs: Opportunities and challenges[J]. Artificial Intelligence Review, 2023, 56: 13071-13102.
[4]BORDES A, USUNIER N, GARCIA-DURAN A, et al. Translating embeddings for modeling multi-relational data[C]// 26th International Conference on Neural Information Processing Systems. Cambridge, 2013: 2787-2795.
[5]WANG Z,ZHANG J W, FENG J L, et al. Knowledge graph embedding by translating on hyperplanes[C]// 28th AAAI Conference on Artificial Intelligence. Québec, 2014:1112-1119.
[6]FUSAR-POLI P. TRANSD recommendations: Improving transdiagnostic research in psychiatry[J]. World Psychiatry, 2019, 18(3): 361-362.
[7]BALAEVIC' I, ALLEN C, HOSPEDALES T M. Tucker: Tensor factorization for knowledge graph completion[C]// 9th International Joint Conference on Natural Language Processing. Hong Kong, 2019: 5185-5194.
[8]WANG X, HE X N, CAO Y X, et al. KGAT: Knowledge graph attention network for recommendation[C]// 25th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. Anchorage, 2019: 950-958.
[9]吳錚, 陳鴻昶, 張建朋. 基于雙曲圖注意力網(wǎng)絡(luò)的知識(shí)圖譜鏈接預(yù)測(cè)方法[J]. 電子與信息學(xué)報(bào), 2022, 44(6): 2184-2194.
[10] ZHANG W,DENG S M, CHEN M Y, et al. Knowledge graph embedding in e-commerce applications: Attentive reasoning, explanations, and transferable rules[C]// 10th International Joint Conference on Knowledge Graphs. Bangkok, 2021: 71-79.
[11] 陳文杰, 文奕, 張?chǎng)危?等. 一種改進(jìn)的基于TransE知識(shí)圖譜表示方法[J]. 計(jì)算機(jī)工程, 2020, 46(5): 63-69+77.
[12] 卞嘉楠, 冒澤慧, 姜斌, 等. 基于知識(shí)圖譜和多任務(wù)學(xué)習(xí)的工業(yè)生產(chǎn)關(guān)鍵設(shè)備故障診斷方法[J]. 中國(guó)科學(xué), 2023, 53(4): 699-714.
[13] 何建佳, 廖耀文, 周洋. 基于產(chǎn)業(yè)互聯(lián)網(wǎng)絡(luò)節(jié)點(diǎn)創(chuàng)新要素的鏈接預(yù)測(cè)方法[J]. 計(jì)算機(jī)應(yīng)用研究, 2023, 40(10): 1-5.
[14] 張?zhí)斐桑?田雪, 孫相會(huì), 等. 知識(shí)圖譜嵌入技術(shù)研究綜述[J]. 軟件學(xué)報(bào), 2023, 34(1): 277-311.
[15] GOMEZ-PEREZ J M, PAN J Z, VETERE G, et al. Enterprise knowledge graph: An introduction[M]. Switzerland: Springer International Publishing, 2017.
[16] 王翊臻, 云紅艷, 李正民. 旅游順承事理圖譜的構(gòu)建及應(yīng)用研究[J]. 青島大學(xué)學(xué)報(bào)(自然科學(xué)版), 2022, 35(1): 34-39+47.
[17] 王榮坤, 賓晟, 孫更新. 融合多特征和由粗到精排序模型的短文本實(shí)體消歧方法[J]. 青島大學(xué)學(xué)報(bào)(自然科學(xué)版), 2022, 35(3): 16-21.
[18] ROLF B, MEBARKI N, LANG S, et al. Using knowledge graphs and human-centric artificial intelligence for reconfigurable supply chains: A research framework[J]. IFAC-PapersOnLine, 2022, 55(10): 1693-1698.
[19] 林莉, 云紅艷, 賀英,等. 基于企業(yè)知識(shí)圖譜構(gòu)建的可視化研究[J]. 青島大學(xué)學(xué)報(bào)(自然科學(xué)版), 2019, 32(1): 55-60.
[20] TOUVRON H, CORD M, SABLAYROLLES A, et al. Going deeper with image transformers[C]// IEEE/CVF International Conference on Computer Vision. Montreal, 2021: 32-42.
[21] XIE X, ZHANG N Y, LI Z B, et al. From discrimination to generation: knowledge graph completion with generative transformer[C]// Companion Proceedings of the Web Conference. Lyon, 2022: 162-165
[22] EBISU T, ICHISE R. TORUSE: Knowledge graph embedding on a lie group[C]// 32th AAAI Conference on Artificial Intelligence. Lousiana, 2018: 1819-1826.
Research on the E-commerce Knowledge Graph Link Prediction Problem
Based on the Relation Scale Model
PAN Ya-nan, WANG Jun
(Business College, Qingdao University, Qingdao 266061, China)
Abstract:
To address the issues of low accuracy in link prediction models for e-commerce knowledge graphs and the repeated recommendation of the same type of products, an improved Relation Scale (RS) model was proposed. The strength of relationships between the head and tail entities of triples was assessed using the TransE and TuckER model. The weights of all relationship paths were determined by introducing a scaling factor, thus enhancing the models convergence speed. Experimental results show that the MRR, Hits@1, Hits@3 and Hits@10 of the improved models are all enhanced based on the OpenBG500 dataset. The MRR and Hits@10 for the RSTransE model increase by 47.4% and 71.1% respectively, compared with the traditional TransE model. The MRR and Hits@10 for the RSTuckER model increase by 35.8% and 28.4% respectively, compared with the traditional TuckER model. These findings indicate that the RS model can more accurately predict user needs and achieve more personalized and precise recommendation results.
Keywords:
referral system; relational scale; knowledge graph; link prediction