在當今信息爆炸的時代,用戶在日常網絡活動中面臨著海量信息的沖擊,這導致了“信息過載”現(xiàn)象的日益嚴重。用戶難以從眾多信息中快速篩選出符合自身需求和興趣的內容,這不僅影響了用戶體驗,也降低了信息平臺的效率和價值[1-2]。為了解決這一問題,個性化推薦系統(tǒng)應運而生。其核心目標是通過分析用戶的過往行為、興趣偏好和社交關系等數(shù)據,為用戶提供精準的內容推薦,從而有效緩解信息過載問題,提升用戶體驗和平臺的運營效果[3]。在社交網絡中,個性化推薦系統(tǒng)可以為用戶推薦好友、興趣小組或相關內容,增強用戶的社交互動和平臺的活躍度。然而,在個性化推薦系統(tǒng)的研究和應用過程中,仍面臨著諸多挑戰(zhàn)和困難。首先,用戶偏好具有復雜性和模糊性,用戶的興趣可能涉及多個領域,且隨時間變化而變化,這使得準確捕捉和預測用戶偏好變得十分困難[4]。例如,一個用戶可能同時對科技、體育和美食感興趣,而且在不同時間對這些領域的關注程度不同,推薦系統(tǒng)需要綜合考慮這些因素才能做出準確的推薦。其次,數(shù)據稀疏性和冷啟動問題是推薦系統(tǒng)中的兩大難題。數(shù)據稀疏性指的是用戶與物品之間的交互數(shù)據非常稀疏,很多用戶只與少量物品有過交互,這導致推薦系統(tǒng)難以獲取足夠的信息來準確建模用戶和物品的關系[5]。在個性化推薦系統(tǒng)的研究中,圖神經網絡作為一種新興的深度學習技術,展現(xiàn)出獨特的優(yōu)勢[6-7]。圖神經網絡通過將數(shù)據表示為圖結構,能夠有效捕捉實體之間的復雜關系。其基本原理是通過圖卷積操作,聚合鄰居節(jié)點的信息,更新節(jié)點的特征表示,從而學習到更加豐富和準確的節(jié)點特征。在個性化推薦系統(tǒng)中,圖神經網絡可以將用戶、物品及其交互關系表示為圖結構,通過學習用戶與物品之間的復雜關系,提高推薦的準確性和多樣性。例如,基于圖神經網絡的推薦系統(tǒng)可以綜合考慮用戶與物品的多維特征及其交互關系,如用戶的社交關系、物品的屬性信息等,從而實現(xiàn)更加精準和個性化的推薦.
針對上述挑戰(zhàn),學術界和工業(yè)界已經提出了多種解決方案。在個性化推薦這一重要研究領域,文獻[8」設計了一種基于微信公眾平臺的景區(qū)個性化推薦系統(tǒng)。該系統(tǒng)首先在數(shù)據收集階段廣泛捕捉景區(qū)的獨特屬性、用戶的個性化特征以及用戶的行為數(shù)據。隨后,這些數(shù)據被精準地傳遞到業(yè)務處理層。該層利用先進的協(xié)同過濾算法與優(yōu)化后的目標分類模型相結合,為用戶精心生成個性化的景區(qū)推薦內容。最終,這些推薦內容通過精心設計的展示層,流暢地展現(xiàn)在微信公眾平臺的用戶界面上,為用戶提供便捷且個性化的景區(qū)探索體驗。然而,該系統(tǒng)在設計過程中所采用的協(xié)同過濾推薦算法仍存在冷啟動問題,即在系統(tǒng)初期或用戶數(shù)量較少時,難以提供準確的推薦結果。文獻[9」設計了一種基于興趣增強的知識概念推薦系統(tǒng)。該系統(tǒng)依據用戶在知識概念上的點擊序列來捕捉用戶的短期興趣,并借助側信息構建一個異構圖。通過基于元路徑指導的圖卷積技術,在精心設計的異構圖架構上,對知識概念與用戶實體進行深入的特征表示學習。在處理用戶實體的特征表示時,系統(tǒng)特別區(qū)分了其與知識概念實體在學習過程中的差異,并創(chuàng)新性地融合了用戶的即時興趣偏好,以此精準評估各個鄰近用戶對目標用戶的影響力強弱。綜合考慮知識概念實體、用戶實體及其即時興趣這三重維度的信息,該系統(tǒng)成功實現(xiàn)了精準的評分預測與個性化推薦服務。然而,在實際應用中,該技術需要綜合運用多種技術,實現(xiàn)難度較大。文獻[10」設計了一種基于數(shù)據挖掘的在線學習平臺個性化推薦系統(tǒng)。該系統(tǒng)通過分析用戶的學習行為和動態(tài)特征,并為每種特征設置權重以挖掘學習需求。通過計算學習者的興趣向量與學習資源特征向量的相似度,系統(tǒng)確定最優(yōu)推薦資源,并將其通過網絡推送給相關用戶。然而,該技術對數(shù)據的依賴性較高,在實際應用中遇到稀疏數(shù)據時,難以保障推薦效果。
針對上述研究的不足,本研究通過圖神經網絡的圖卷積操作,能夠有效利用用戶和物品的局部和全局關系。即使在數(shù)據稀疏的情況下,也能通過鄰居節(jié)點的信息聚合來增強特征表示,從而緩解冷啟動問題。本研究的圖卷積神經網絡模型通過自動學習用戶與項目之間的復雜關系,減少了對先驗知識的依賴,提高了系統(tǒng)的可擴展性和適應性。此外,本研究的模型通過多層圖卷積聚合,能夠從稀疏數(shù)據中提取更豐富的特征,從而提高推薦的準確性和穩(wěn)定性。本文的三個核心貢獻可以總結如下: ① 本文設計了一個由文本特征提取層、圖卷積聚合層和預測層組成的圖卷積神經網絡模型。在文本特征提取層,通過預訓練詞庫和卷積操作,將用戶評論數(shù)據轉化為數(shù)值特征向量,充分挖掘用戶對物品的顯式反饋信息,為后續(xù)的推薦提供堅實基礎。 ② 利用圖卷積操作聚合鄰居節(jié)點的信息,更新節(jié)點的特征表示。這一過程能夠有效捕捉用戶興趣的多樣性和動態(tài)變化,學習到用戶與物品之間的復雜關系,從而顯著提高推薦的準確性和穩(wěn)定性。 ③ 本文通過計算用戶和物品的特征向量的內積,并賦予不同的信任權重,得到用戶對物品的偏好評分,進而實現(xiàn)精準的個性化推薦。這一方法能夠更好地反映用戶的真實偏好,提升推薦系統(tǒng)的整體性能和用戶體驗。
1個性化推薦系統(tǒng)架構設計
為了滿足個性化推薦系統(tǒng)設計需求,搭建系統(tǒng)的總體架構,如下圖1所示:
如圖1所示,本文設計的個性化推薦系統(tǒng)總體架構,其中前端層即用戶端,是直接與用戶接觸的界面,不僅負責展示個性化推薦結果,還承擔著接收用戶交互信息的重任;邏輯層,如同系統(tǒng)的“大腦”,負責處理各種復雜的業(yè)務邏輯,集成了用戶權限管理、日志記錄等功能,以確保系統(tǒng)的安全性和可維護性;在系統(tǒng)的核心構成中,數(shù)據倉儲層負責保管用戶資料、互動日志等關鍵信息,不僅如此,創(chuàng)新性地融合了MySQL與Re-dis兩大數(shù)據庫系統(tǒng),保證數(shù)據的全面無誤??偠灾?,本文所提出的系統(tǒng)架構設計,通過前端交互界面、業(yè)務處理邏輯與數(shù)據倉儲層的緊密配合,旨在向用戶推送精準且個性化的推薦信息,同時確保整個系統(tǒng)在運行過程中的穩(wěn)定性和高效性。
2構建圖卷積神經網絡模型
為了實現(xiàn)個性化推薦功能,本文引入圖卷積神經網絡,構建一個由文本特征提取層、圖卷積聚合層、預測層組成的推薦模型,具體結構如圖2所示。
圖圖倉伏仲紅門組快坐陽構文本特征提取層的主要功能是處理用戶評論數(shù)據,將原始的文本數(shù)據轉化為計算機可理解的數(shù)值特征向量。這些特征向量作為用戶及項目的初始特征表示,隨后被輸人到圖卷積聚合層。圖卷積聚合層的核心任務是通過圖卷積操作學習用戶與項目之間的復雜關系,并生成新的特征向量。圖卷積操作通過聚合鄰居節(jié)點的信息來更新當前節(jié)點的特征表示,能夠捕捉用戶與項目之間的直接和間接關系。例如,在用戶與項目的交互圖中,每個用戶節(jié)點不僅考慮自身的特征(如用戶的基本信息、歷史行為等),還會聚合其鄰居節(jié)點(如用戶交互過的項目、與該用戶有相似興趣的其他用戶等)的特征。這種聚合過程使得用戶節(jié)點的特征表示中融入了與之相關的項目信息,反之亦然。通過堆疊多層圖卷積層,模型能夠學習到用戶與項目之間的復雜關系。每一層圖卷積操作都會更新節(jié)點的特征表示,使其更加豐富和準確。例如,第一層可能捕捉到用戶與直接交互的項目的局部關系,而更高層則能夠捕捉到更廣泛的全局關系。這些通過圖卷積操作學習到的潛在關系最終體現(xiàn)在用戶和項目的特征向量中,進而影響推薦結果。在預測層,用戶和項目的特征向量通過內積計算轉化為用戶對項目的偏好評分。如果用戶與某個項目的鄰居節(jié)點(如相似用戶或相關項目)有較強的關聯(lián),那么這些關聯(lián)會通過圖卷積操作傳遞到用戶和項自的特征向量中,從而影響最終的評分。因此,圖卷積操作不僅能夠捕捉用戶與項目之間的復雜關系,還能夠通過這些關系更準確地預測用戶的偏好,從而提高推薦的準確性和可解釋性。這一設計旨在充分利用用戶評論中的文本信息,通過圖卷積神經網絡的學習能力,捕捉用戶與項目之間的潛在關系,進而實現(xiàn)精準的個性化推薦。
3基于圖卷積神經網絡模型的個性化推薦
根據文中上述內容完成圖卷積神經網絡模型的構建后,即可通過該模型完成個性化推薦。具體來說,本文將用戶評論數(shù)據作為輸人,經過文本特征提取層的處理,得到用戶評論數(shù)據的初始特征表示。在文本特征提取層中,將用戶 h 對所有項目的評論 LIh 拼接在一起,從而獲得一條完整的評論文檔 Lk :
依據式(1)導出的評論文檔 Lh ,本文執(zhí)行了在預訓練詞庫中的查詢操作,以匹配 Lk 中詞匯的詞向量,隨后將這些詞向量集結起來,構建出一個詞嵌入矩陣 R1:nh :
R1:nh=f(Lh)
式(2)中, 1:n 表示詞嵌入矩陣共 n 列,也就是包含 n 個單詞; f(?) 表示查詢函數(shù)。利用固定窗口大小的卷積核 Qj 在詞嵌入矩陣上滑動遍歷,以捕捉文本中的局部特征 Bj ,具體表達式如下所示:
Bj=F(R1:nh*Qj+Zj)
式(3)中, Zj 表示與卷積核 Qj 對應的偏置項; F(?) 表示Relu函數(shù)。將式(3)所提取的局部文本特征組合后從而得到文本特征 B 。最后,本文采用單層感知機制映射獲取最終的用戶 h 的文本評論特征 Xh ,表達式如下所示:
Xh=F(ω×B+z)
式(4)中, ω 表示權值矩陣; z 表示偏置項。根據上述步驟獲得用戶評論數(shù)據的文本特征后,將這些特征傳輸至圖卷積聚合層,通過圖卷積操作學習用戶與項目之間的復雜關系,并生成新的特征向量。在圖卷積聚合層中,本文將節(jié)點ID信息的映射作為圖節(jié)點的嵌入,同時將撒花姑娘書內容提取的文本評論特征作為屬性特征,拼接到節(jié)點向量上,與映射后的ID信息融合。具體表達式如下所示:
式(5)中, Dh(u) 表示第 u 層圖節(jié)點特征;W,ε 分別表示圖卷積聚合層的權值與偏置; ehT 表示用戶-項目交互圖中節(jié)點提供的獨熱向量,其中T 表示維度。根據式(5)獲取節(jié)點特征后,即可進行特征聚合。由于圖卷積層是堆疊的,不同層級的子圖節(jié)點在個性化推薦預測中有不同的貢獻,所以本文在推薦模型中,對各節(jié)點特征進行加權求和,以此獲得最終的特征向量 Dh* 。具體表達式如下所示:
式(6)中, λu 表示第 u 層嵌入的權值; U 表示圖卷積聚合層的層數(shù)。最后,預測層利用圖卷積聚合層生成的特征向量計算用戶對項目的偏好評分,這里本文以用戶和項目最終特征表示的內積形式進行評分計算:
Phk=Dh?sDk?
式(7)中, Phk 表示用戶 h 對項目 k 的偏好評分; s 表示數(shù)據集。為了進一步提高評分的準確性,為每條評分項賦予不同的信任權重 μhk :
式(8)中, φ 表示控制置信等級大小的超參數(shù); Pmax 表示數(shù)據集 s 中評分的最大值?;谑剑?)和式(8),得到最終的用戶偏好評分 P0 為:
P0=μhk?Phk
借助式(9)所定義的方法為每個用戶計算了對不同項目的偏好得分。依據這些得分的排序結果,能夠生成一個定制化的推薦列表,確保將得分較高的項目優(yōu)先推薦給用戶。因此,在本文設計系統(tǒng)中,輸入用戶評論數(shù)據,經過圖卷積神經網絡模型的學習,即可得到并輸出用戶偏好評分,進而實現(xiàn)個性化推薦。
4實驗分析與結果
4.1實驗數(shù)據
為了驗證設計系統(tǒng)的合理性和有效性,本文以該基于圖神經網絡的個性化推薦系統(tǒng)為實驗組,引入文獻[8]設計的基于微信公眾平臺的景區(qū)個性化推薦系統(tǒng)、文獻「9」設計的基于興趣增強的知識概念推薦系統(tǒng)、文獻[10」設計的基于數(shù)據挖掘的在線學習平臺個性化推薦系統(tǒng)作為對照組一、對照組二、對照組三,展開系統(tǒng)測試分析?;谙到y(tǒng)測試需求搭建一個測試環(huán)境,具體參數(shù)配置情況如表1所示:
采用雅虎公司提供的公開的RecSysChallenge2015數(shù)據集作為測試數(shù)據,該數(shù)據集包含以下信息:
采用表2所示數(shù)據集中的訓練樣本分別進行實驗組和對照組系統(tǒng)地訓練。訓練完成后,再采用測試樣本進行各系統(tǒng)的測試,對比分析測試結果。
4.2評價指標
完成實驗組和對照組中各系統(tǒng)的測試后,為客觀且直觀地評價系統(tǒng)測試性能,本文引入RecallQλ(a) 指標和 MRR@ 指標作為系統(tǒng)測試指標,具體計算公式如下式所示:
式中, RQ 表示Recall @0 指標,用于評價各系統(tǒng)下每個用戶偏好預測得分最高的 Q 個商品中是否包含用戶真正感興趣的商品,如果預測正確,其值為1,如果預測錯誤,其值為0,所以該指標數(shù)值越高,表明個性化推薦結果越準確; MQ 表示MRR@Q 指標,用于評價各系統(tǒng)推薦的前 Q 個商品中是否包含真正瀏覽的商品,如果包含,其值為1,如果不包含,其值為0,所以該指標數(shù)值越高,表明個性化推薦結果越準確; P 表示用于實際瀏覽商品在系統(tǒng)推薦得分中所處排名。因此,在本次個性化推薦系統(tǒng)測試中,采用Recall@Q指標和 MRR(aε) 指標作為測試指標。
4.3實驗結果
為避免測試結果的偶然性,將Recall@Q指標和 MRR(a) Q指標中的Q取值分別設置為5\~55。在不同的Q取值條件下,進行實驗組系統(tǒng)和對照組系統(tǒng)的訓練和測試,根據測試數(shù)據,計算各系統(tǒng)的Recall @ Q指標和MRR @ Q指標,作為測試結果,如下圖3與圖4所示。
圖3和圖4中數(shù)據可以看出,在所有Q取值下,實驗組系統(tǒng)在Recall @ Q指標和 MRR@Q 指標上均表現(xiàn)出色,優(yōu)于其他對照組系統(tǒng),說明該系統(tǒng)預測用戶可能感興趣的商品方面具有較高的準確性和排名能力。具體來說,隨著Q值的不斷增加,對照組中各系統(tǒng)所得個性化推薦結果的Re-call@Q指標和 MRR(ωQ 指標均呈上升狀態(tài),說明對照組中各系統(tǒng)在挖掘用戶興趣和商品關聯(lián)方面存在一定不足。而實驗組系統(tǒng)所得個性化推薦結果的Recall@Q指標和 MRR@ Q指標一直處于一個較高的水平上,平均Recall @ Q指標為0.968,平均MRR @ Q指標為0.973,說明實驗組系統(tǒng)在提升個性化推薦結果的準確性和穩(wěn)定性方面取得一定成效。因此,基于圖神經網絡的個性化推薦系統(tǒng)是有效且優(yōu)越的。
5結束語
本文提出一種基于圖神經網絡的個性化推薦系統(tǒng),通過構建包含文本特征提取層、圖卷積聚合層和預測層的圖卷積神經網絡模型,從用戶評論數(shù)據中提取特征并學習用戶與項目之間的復雜關系,有效提高了推薦的準確性、穩(wěn)定性和可解釋性。實驗結果表明,該系統(tǒng)在Recall @ Q和MRR@Q指標上優(yōu)于傳統(tǒng)推薦系統(tǒng),充分證明了其優(yōu)越性。未來,我們將從多個方向進一步優(yōu)化該系統(tǒng)。首先,計劃通過實驗對比不同圖神經網絡架構(如引入多頭注意力機制或新型圖卷積層)來優(yōu)化模型結構,以提升推薦精度并減少計算資源消耗。其次,將探索多源數(shù)據融合,結合用戶的行為數(shù)據、社交關系和內容信息,豐富特征表示以增強推薦多樣性。最后,研究實時推薦技術,設計實時數(shù)據處理框架并優(yōu)化模型推理速度,以提高系統(tǒng)響應速度和用戶體驗。通過這些具體措施,我們期望進一步推動個性化推薦技術的發(fā)展,為用戶提供更精準、高效和多樣化的推薦服務。
參考文獻:
[1]馬俊,王賢來.基于時間編碼和GNN的商品個性化推薦算法研究[J].佳木斯大學學報(自然科學版),2024,42(11):26.
[2]周洋濤,褚華,朱非非,等.基于深度學習的個性化學習資源推薦綜述[J].計算機科學,2024,51(10) :17.
[3]謝楠.內容個性化推薦優(yōu)化探索[J].數(shù)字通信世界,2024,20(1):70.
[4]凌宇,單志龍.基于興趣增強的知識概念推薦系統(tǒng)[J].計算機應用,2023,43(12):3697.
[5]潘蘭,魏嘉銀,盧友軍,等.融合時空信息個性化旅游興趣點推薦算法[J].智能計算機與應用,2023,13(12):120.
[6]曾子文,袁操.基于圖神經網絡的個性化食譜推薦算法[J].武漢輕工大學學報,2024,43(3):82.
[7]靳康杰,王藝源.基于圖神經網絡的個性化推薦系統(tǒng)研究[J].電腦知識與技術,2024,20(13):21.