【中圖分類號(hào)】TP391.3【文獻(xiàn)標(biāo)志碼】A
【文章編號(hào)】1673-1069(2025)04-0086-04
1引言
在當(dāng)今數(shù)字化浪潮下,海量信息與產(chǎn)品充斥著用戶的視野,如何精準(zhǔn)地為用戶推薦其真正感興趣的內(nèi)容或產(chǎn)品,成為互聯(lián)網(wǎng)領(lǐng)域、電子商務(wù)等眾多行業(yè)亟待解決的關(guān)鍵問題。推薦系統(tǒng)作為解決信息過載、提升用戶體驗(yàn)與業(yè)務(wù)轉(zhuǎn)化率的核心工具,其重要性日益凸顯。
傳統(tǒng)的推薦方法往往側(cè)重于單一維度的考量,如僅依據(jù)用戶的歷史行為或項(xiàng)目熱門度進(jìn)行推薦。這種方式忽視了用戶群體存在的內(nèi)在差異,以及項(xiàng)目在不同用戶社群中所呈現(xiàn)出的獨(dú)特屬性。事實(shí)上,不同用戶群體對(duì)項(xiàng)目熱門度的感知與項(xiàng)目質(zhì)量的評(píng)價(jià)存在顯著差異,在某個(gè)用戶群體中備受青睞的熱門優(yōu)質(zhì)項(xiàng)目,在另一群體中可能反響平平。
因此,充分挖掘項(xiàng)目在特定用戶群組內(nèi)的局部熱門度與局部質(zhì)量,對(duì)于提升推薦系統(tǒng)的精準(zhǔn)度與有效性至關(guān)重要。融合局部熱門度和局部質(zhì)量的推薦方法,旨在打破傳統(tǒng)推薦的局限性,深人洞察用戶群組的細(xì)分特征與項(xiàng)目的局部特性,從而為用戶提供更具針對(duì)性、個(gè)性化的推薦服務(wù),助力各行業(yè)在信息洪流中精準(zhǔn)觸達(dá)用戶需求,提升用戶滿意度與業(yè)務(wù)價(jià)值。
2研究現(xiàn)狀與不足
協(xié)同過濾推薦技術(shù)依靠用戶歷史行為數(shù)據(jù)計(jì)算相似性,但存在未顯式建模項(xiàng)目固有屬性對(duì)用戶決策影響的局限。在電商場(chǎng)景下,項(xiàng)目質(zhì)量是影響用戶選擇的關(guān)鍵隱性因素。目前估計(jì)項(xiàng)目質(zhì)量的方法有以下幾類:
① 均值估計(jì)法:侯銀秀利用余弦相似度匹配用戶偏好與項(xiàng)目質(zhì)量;Guan等人用項(xiàng)目平均得分估計(jì)項(xiàng)目質(zhì)量并修正用戶評(píng)分;卜旭松用偏好相似用戶平均評(píng)分度量項(xiàng)目質(zhì)量。
② 離散系數(shù)估計(jì)法:Gong等人提出考慮結(jié)構(gòu)和數(shù)值相似度的協(xié)同過濾法;陸航等人結(jié)合用戶和項(xiàng)目質(zhì)量?jī)?yōu)化相似度;王巖等人改進(jìn)Jaccard和Pearson相似度;鄭瀟等人將項(xiàng)目質(zhì)量等作為隱含特征輸人深度網(wǎng)絡(luò);鄭小楠融合項(xiàng)目質(zhì)量和用戶影響因子修正余弦相似度。
③ 其他方法:焦富森等人用改進(jìn)概率公式計(jì)算項(xiàng)目質(zhì)量;林紅弟[用粗糙集理論決策規(guī)則過濾低質(zhì)商品;何佶星[融合平均次數(shù)和相對(duì)評(píng)價(jià)次數(shù)等度量項(xiàng)目質(zhì)量。這些方法雖有成效,但存在未考慮用戶專業(yè)層次對(duì)項(xiàng)目局部特性評(píng)估誤差、均值度量項(xiàng)目質(zhì)量時(shí)未考慮用戶評(píng)分標(biāo)準(zhǔn)影響等問題。本文通過劃分用戶群計(jì)算局部質(zhì)量和局部熱門度,并用改進(jìn)協(xié)同過濾方法推薦。
3融合項(xiàng)目局部熱門度和局部質(zhì)量的推薦方法
3.1用戶-項(xiàng)目類型偏好的構(gòu)建
獲取用戶對(duì)項(xiàng)目類型的偏好有兩類途徑: ① 注冊(cè)時(shí)系統(tǒng)提供選項(xiàng),用戶直接挑選并填寫信息,此方法簡(jiǎn)單且能明確獲取偏好,但非注冊(cè)用戶無法這樣操作。而且用戶可能隨意或不填寫,導(dǎo)致系統(tǒng)無法獲取真實(shí)偏好,此外當(dāng)偏好改變時(shí)系統(tǒng)也無法更新。 ② 通過分析用戶歷史行為信息來推斷,日志記錄是常見方式,它能記錄用戶在網(wǎng)站的日常行為活動(dòng)(如評(píng)分、轉(zhuǎn)發(fā)、查閱等)并存儲(chǔ)在分布式數(shù)據(jù)倉(cāng)庫(kù)中。
項(xiàng)目的類型可概括其主要內(nèi)容,如電視劇《狂飆》類型可為犯罪、都市和警匪。本文通過用戶對(duì)隸屬于某一項(xiàng)目類型的項(xiàng)目的評(píng)分頻率來衡量用戶對(duì)該項(xiàng)目類型的偏好程度。一般來說,某一用戶對(duì)隸屬于某一項(xiàng)目類型的項(xiàng)目的評(píng)分頻率越高,則表示該用戶對(duì)該項(xiàng)目類型的評(píng)分頻率越高,該用戶越偏好該項(xiàng)目類型。假設(shè) G 為用戶進(jìn)行過評(píng)分的項(xiàng)目類型集合, ?g 為某一項(xiàng)目類型, g∈G ,則用戶對(duì)項(xiàng)目類型偏好度的計(jì)算方式如式(1)所示:
式中, Pug 為用戶 u 對(duì)項(xiàng)目類型 g 的偏好度, Nug 為用戶 Ωu 對(duì)隸屬于項(xiàng)目類型 g 的項(xiàng)目的總評(píng)分次數(shù), Nu 為用戶 u 對(duì)所有項(xiàng)目的總評(píng)分次數(shù)。
3.2局部熱門度和局部質(zhì)量
專家們對(duì)項(xiàng)目熱門度的研究多針對(duì)整體用戶,未考慮不同用戶群中項(xiàng)目熱門度差異對(duì)推薦結(jié)果的影響。以《推薦系統(tǒng)》為例,其在個(gè)性化推薦和機(jī)器視覺領(lǐng)域的項(xiàng)目熱門度不同。直接用所有用戶行為數(shù)據(jù)衡量項(xiàng)目熱門度會(huì)使推薦結(jié)果失準(zhǔn),分別衡量《推薦系統(tǒng)》在不同研究領(lǐng)域的項(xiàng)目熱門度,能提高推薦精度。
定義一:局部熱門度。在用戶群A中,對(duì)項(xiàng)目i進(jìn)行過評(píng)分的用戶數(shù)與該用戶群中總用戶數(shù)的比值即為項(xiàng)目i在該用戶群中的局部熱門度。假設(shè)用戶群A中的項(xiàng)目集合為 IA ,用戶集合為 UA ,則項(xiàng)目 i 對(duì)應(yīng)的局部熱門度 HiA 的具體計(jì)算公式如式(2):
式中, UiA 為在用戶群 A 中,對(duì)項(xiàng)目 i 進(jìn)行過評(píng)分的用戶集合。
3.3局部質(zhì)量
推薦系統(tǒng)為用戶推薦的項(xiàng)目均未被用戶接觸過,所以用戶對(duì)項(xiàng)目質(zhì)量未知,需參考其他用戶的反饋來判斷。由于用戶個(gè)人偏好和認(rèn)知差異,對(duì)同一項(xiàng)目的反饋存在偏差。因此,本文先按用戶歷史行為數(shù)據(jù)聚類,同一用戶群的用戶偏好相似,他們對(duì)項(xiàng)目的反饋更能準(zhǔn)確反映該項(xiàng)目在該群中的局部質(zhì)量。
定義二:局部質(zhì)量。在用戶群 A 中,用戶對(duì)項(xiàng)目i的平均評(píng)分與用戶對(duì)所有項(xiàng)目的平均評(píng)分的比值即為項(xiàng)目i在該用戶群中的局部質(zhì)量。項(xiàng)目 i 在用戶群 A 中對(duì)應(yīng)的局部質(zhì)量 Qi4 計(jì)算公式如式(3):
其中, Rui 為用戶 u 對(duì)項(xiàng)目 i 的評(píng)分。
3.4項(xiàng)目權(quán)重
實(shí)際生活中,用戶常依項(xiàng)目熱門度或項(xiàng)目質(zhì)量選擇項(xiàng)目。但熱門項(xiàng)目的項(xiàng)目質(zhì)量未必高,且項(xiàng)目質(zhì)量依用戶反饋(如評(píng)分)衡量,存在偏差。例如,100位用戶中50位評(píng)項(xiàng)目a ,項(xiàng)目質(zhì)量0.8;僅1位評(píng)項(xiàng)目b,項(xiàng)目質(zhì)量1。若單以項(xiàng)目質(zhì)量度量項(xiàng)目權(quán)重,像項(xiàng)目 b 這樣偶然性大,會(huì)降低推薦效果。融合項(xiàng)目熱門度與項(xiàng)目質(zhì)量度量項(xiàng)目權(quán)重(如項(xiàng)目 αa 權(quán)重0.4,項(xiàng)目 b 權(quán)重0.01),可解釋性更高,能降低結(jié)果偶然性。
定義三:項(xiàng)目權(quán)重。在用戶群 A 中,項(xiàng)目 i 對(duì)應(yīng)的項(xiàng)目權(quán)重即為在該用戶群中,項(xiàng)目i對(duì)應(yīng)的局部熱門度和局部質(zhì)量的乘積。項(xiàng)目 i 在用戶群 A 中對(duì)應(yīng)的項(xiàng)目權(quán)重 WiA 計(jì)算公式如式(4):
Wi1=Hi1×Qi4
其中, HiA?QiA 分別為項(xiàng)目在用戶群 A 中的項(xiàng)目局部熱門度、局部質(zhì)量。
3.5評(píng)分預(yù)測(cè)
基于余弦相似度的度量結(jié)果選取與目標(biāo)用戶最相似的K 個(gè)近鄰,根據(jù)近鄰的評(píng)分預(yù)測(cè)目標(biāo)用戶對(duì)未評(píng)分項(xiàng)目的評(píng)分,然后向目標(biāo)用戶推薦預(yù)測(cè)評(píng)分最高的 N 個(gè)項(xiàng)目。
其中, 分別為用戶
的對(duì)項(xiàng)目 i 的評(píng)分、用戶 u 對(duì)項(xiàng)目 i 的預(yù)測(cè)評(píng)分;
分別為用戶 u 、用戶 v 的平均評(píng)分;WiA 為項(xiàng)目在用戶群 A 中的項(xiàng)目權(quán)重, sin(u,v) 為用戶 Ωu 與用戶 v 的用戶相似度, Nu 為用戶 u 的近鄰集合。
4實(shí)驗(yàn)結(jié)果及分析
4.1數(shù)據(jù)集及評(píng)估指標(biāo)
本文實(shí)驗(yàn)采用美國(guó)明尼蘇達(dá)大學(xué)GroupLens項(xiàng)目組提供的MovieLens100K 數(shù)據(jù)集和MovieLens1M數(shù)據(jù)集,記為 M1 和 M2° 每位用戶至少對(duì)20部電影進(jìn)行過評(píng)分。隨機(jī)抽取80% 作為訓(xùn)練集,剩余 20% 作為測(cè)試集進(jìn)行實(shí)驗(yàn),且本文采用準(zhǔn)確率(Precisioin)、召回率(Recall)和調(diào)和值( F1 值)作為所提方法的評(píng)估指標(biāo)。
4.2參數(shù)設(shè)置與分析
本文方法主要涉及2個(gè)參數(shù)對(duì)實(shí)驗(yàn)結(jié)果的影響,分別是近鄰數(shù) K 和推薦項(xiàng)目數(shù) N 首先對(duì)這兩個(gè)參數(shù)進(jìn)行優(yōu)化實(shí)驗(yàn),然后進(jìn)行相應(yīng)的對(duì)比實(shí)驗(yàn)。
4.2.1近鄰數(shù) K 對(duì)實(shí)驗(yàn)結(jié)果的影響
為驗(yàn)證近鄰數(shù) K 對(duì)實(shí)驗(yàn)結(jié)果的影響,本文將近鄰數(shù)的取值范圍設(shè)置為[5,30],步長(zhǎng)5,在項(xiàng)目推薦數(shù) N=5 時(shí)進(jìn)行相關(guān)實(shí)驗(yàn),圖1、圖2分別展示了近鄰數(shù) K 在數(shù)據(jù)集 M1,M2 上的結(jié)果。Precision隨著近鄰數(shù) K 的增加呈現(xiàn)先增大后減小的趨勢(shì)。當(dāng) K 的取值偏小時(shí),其對(duì)近鄰用戶的選取力度偏小,誤將近鄰用戶歸為非近鄰用戶,導(dǎo)致Precision值偏??;當(dāng) K 的取值偏大時(shí),其對(duì)近鄰用戶的選取力度偏大,誤將非近鄰用戶歸為近鄰用戶,亦導(dǎo)致Precision值偏小。Recall和 F1 也隨著近鄰數(shù)的增加呈現(xiàn)先增大后減少的趨勢(shì),但他們的波動(dòng)幅度小于Precision的波動(dòng)幅度,這是因?yàn)轫?xiàng)目的推薦數(shù) N 穩(wěn)定不動(dòng),隨著近鄰數(shù) K 的增大,推薦列表中的項(xiàng)目具有較高的重復(fù)率,降低了他們的波動(dòng)幅度。
圖1 M1"數(shù)據(jù)集中近鄰數(shù) K 對(duì)實(shí)驗(yàn)結(jié)果的影響
4.2.2推薦項(xiàng)目數(shù) N 對(duì)實(shí)驗(yàn)結(jié)果的影響
為驗(yàn)證推薦項(xiàng)目數(shù) N 對(duì)實(shí)驗(yàn)結(jié)果的影響,本文將近鄰數(shù)的取值范圍設(shè)置為[5,25],步長(zhǎng)5,在近鄰數(shù) K 取最優(yōu)值時(shí)進(jìn)行相關(guān)實(shí)驗(yàn),圖3、圖4分別展示了推薦項(xiàng)目數(shù) N 在數(shù)據(jù)集M1,M2 上的結(jié)果。Precision隨著推薦項(xiàng)目數(shù) N 的增加而減小。當(dāng) N 的取值偏大時(shí),對(duì)于非優(yōu)質(zhì)項(xiàng)目的懲罰力度偏小,導(dǎo)致Precision的值偏小。Recall和 F1 隨著推薦項(xiàng)目數(shù) N 的增加而增加,這是因?yàn)殡S著推薦項(xiàng)目數(shù) N 的增加,推薦列表中符合用戶需求的項(xiàng)目也在不斷增加。
4.2.3對(duì)照實(shí)驗(yàn)及結(jié)果分析
為進(jìn)一步驗(yàn)證所提方法的性能,將本文方法即融合項(xiàng)目局部熱門度和局部質(zhì)量的推薦方法與基于用戶的協(xié)同過濾推薦(UBCF)基于項(xiàng)目的協(xié)同過濾算法(IBCF)和結(jié)合熱門度權(quán)重的用戶協(xié)同過濾推薦算法(W-UBCF)進(jìn)行比較。圖5、圖6、圖7展示了各數(shù)據(jù)集中不同方法的Precision、Recall、F1 的比較結(jié)果。從圖中可以看出,本文方法在Precision、Recall和 F1 指標(biāo)上優(yōu)于對(duì)比方法,進(jìn)一步驗(yàn)證了本文方法的有效性。
5結(jié)語(yǔ)
針對(duì)項(xiàng)目熱門度和質(zhì)量的群組偏差問題,提出融合局部熱門度與質(zhì)量的推薦方法。實(shí)驗(yàn)表明該方法可提高Top-N推薦的Precision和Recall,提升項(xiàng)目度量準(zhǔn)確性。但不足在于劃分用戶群組及度量時(shí)未考慮時(shí)間因素。鑒于用戶偏好動(dòng)態(tài)變化會(huì)影響群組結(jié)構(gòu),未來研究將融入時(shí)間要素,構(gòu)建動(dòng)態(tài)分析模型,捕捉偏好波動(dòng),建立時(shí)間序列下群組動(dòng)態(tài)劃分機(jī)制,結(jié)合項(xiàng)目熱度與質(zhì)量的時(shí)間衰減和周期性規(guī)律,完善評(píng)估體系。
【參考文獻(xiàn)】
【1]侯銀秀.基于在線評(píng)論情感分析的圖書個(gè)性化推薦研究[D].武漢:華中師范大學(xué),2018.
【2]Guan Y,Cai S,Shang M.Recommendation Algorithm based on Item Quality and User Rating Preferences [J].Frontiers of Computer Science,2014,8(2):289-297.
【3】卜旭松.基于物品協(xié)同過濾的個(gè)性化視頻推薦算法改進(jìn)研究[D]銀川:寧夏大學(xué),2015.
【4]Gong L,Wang J.Research on Collaborative Filtering RecommendationAlgorithm forImprovingUserSimilarity Calculation[C]//Proceedingsofthe 2021 1stInternational Conference on Control and Intelligent Robotics,2021:331-336.
【5】陸航,師智斌,劉忠寶.融合用戶興趣和評(píng)分差異的協(xié)同過濾算法[J]計(jì)算機(jī)工程與應(yīng)用,2020,56(07):24-29.
【6】王巖,張杰,許合利.結(jié)合用戶興趣和改進(jìn)的協(xié)同過濾算法[J].小型微型計(jì)算機(jī)系統(tǒng),2020,41(08):1665-1669.
【7]鄭瀟,李樹青,張志旺.基于評(píng)分?jǐn)?shù)值分析的用戶項(xiàng)目質(zhì)量測(cè)度及其在深度推薦模型中的應(yīng)用[J].數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn),2022.6(04):39-48.
【8】鄭小楠.基于用戶偏好的個(gè)性化協(xié)同過濾算法研究[D].重慶:重慶郵電大學(xué),2020.
【9】焦富森,李樹青.基于物品質(zhì)量和用戶評(píng)分修正的協(xié)同過濾算法[J]數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn),2019,3(08):62-67.
【10】林紅弟.電子商務(wù)中基于個(gè)性化推薦的商品質(zhì)量和隱私保護(hù)相關(guān)問題研究[D].青島:山東科技大學(xué),2018.
【11】何佶星.基于平均偏好權(quán)重的混合推薦算法研究[D].成都:西南石油大學(xué),2018.
【12]Zhao X,Niu Z,Chen W.Opinion-based Collaborative Filtering to Solve Popularity Bias in Recommender Systems[C]//Proceedings of International Conference on Databaseand Expert Systems Applications.Berlin:Springer-Verlag,2013:426-433.