摘 "要:針對短視頻推薦場景中存在的低延遲響應(yīng)與推薦精度失衡的技術(shù)挑戰(zhàn),該研究設(shè)計一種雙通道動態(tài)興趣建模框架。通過構(gòu)建基于異構(gòu)知識圖譜的穩(wěn)態(tài)興趣建模與實時行為感知的瞬態(tài)興趣捕捉協(xié)同機制,在確保推薦系統(tǒng)端到端響應(yīng)時間低于200 ms的工程約束下,有效提升推薦準(zhǔn)確度與覆蓋率。具體而言,系統(tǒng)采用分階段興趣建模策略。在離線階段,通過3層殘差圖卷積網(wǎng)絡(luò)挖掘用戶歷史交互中隱含的跨實體關(guān)聯(lián)(用戶—創(chuàng)作者—主題標(biāo)簽的三元組關(guān)系),生成具有語義魯棒性的長期偏好表征;在在線階段,部署輕量化流式處理引擎,采用滑動時間窗策略(窗口尺寸動態(tài)調(diào)整范圍為30~120 s)捕捉用戶當(dāng)前會話內(nèi)的細(xì)粒度交互信號(包括視頻完播率、互動頻率、頁面停留時長等12維時序特征),通過門控注意力網(wǎng)絡(luò)實現(xiàn)短期興趣的增量式更新。
關(guān)鍵詞:深度學(xué)習(xí);短視頻推薦;短期興趣;長期興趣;雙通道動態(tài)興趣建模
中圖分類號:TP316 " " "文獻標(biāo)志碼:A " " " " "文章編號:2095-2945(2025)10-0126-04
Abstract: In response to the technical challenges of low latency response and imbalanced recommendation accuracy in short video recommendation scenarios, this study proposes a dual channel dynamic interest modeling framework. By constructing a transient interest capture collaborative mechanism based on heterogeneous knowledge graph for steady-state interest modeling and real-time behavior perception, the recommendation accuracy and coverage have been effectively improved under the engineering constraint of ensuring that the end-to-end response time of the recommendation system is less than 200ms. Specifically, the system adopts a staged interest modeling strategy: in the offline stage, a three-layer residual graph convolutional network is used to mine the cross entity associations hidden in user historical interactions (user creator topic tag triplet relationship), generating long-term biased representations with semantic robustness; In the online phase, a lightweight streaming processing engine is deployed, using a sliding time window strategy (with a dynamic window size adjustment range of 30~120 seconds) to capture fine-grained interaction signals within the user's current session (including 12 dimensional temporal features such as video completion rate, interaction frequency, and page dwell time), and achieving incremental updates of short-term interests through a gated attention network.
Keywords: deep learning; short video recommendation; short term interests; long term interest; dual channel dynamic interest modeling
近年來,數(shù)字內(nèi)容分發(fā)領(lǐng)域呈現(xiàn)顯著變革,在線視頻服務(wù)平臺依托其視聽呈現(xiàn)形式更直觀、信息傳遞效率更高的優(yōu)勢,持續(xù)擴大市場滲透率[1]。短視頻作為新興內(nèi)容載體,憑借精煉的傳播形態(tài)與高效的內(nèi)容承載能力,精準(zhǔn)契合現(xiàn)代人碎片化時間場景下的信息獲取需求,在YouTube、TikTok及Kwai等頭部平臺形成億級日活規(guī)模[2]。伴隨網(wǎng)絡(luò)熱點的快速迭代與用戶偏好的動態(tài)演變,構(gòu)建高效的內(nèi)容推薦機制已成為提升平臺核心競爭力的關(guān)鍵環(huán)節(jié)。當(dāng)前行業(yè)研究聚焦于多維特征建模技術(shù),通過解析用戶交互日志與視頻元信息構(gòu)建興趣圖譜[3]。主流算法通?;趨f(xié)同過濾框架,運用標(biāo)簽系統(tǒng)實現(xiàn)內(nèi)容特征向量化,借助余弦相似度等度量方式生成候選內(nèi)容池,再經(jīng)多階段排序模型篩選高相關(guān)度視頻。然而現(xiàn)有技術(shù)體系普遍存在計算延遲較高的問題,難以滿足用戶即時興趣捕捉需求,特別是在注意力周期縮短、興趣遷移加速的背景下,傳統(tǒng)批量處理模式易導(dǎo)致推薦結(jié)果滯后。針對該技術(shù)瓶頸,業(yè)界亟待構(gòu)建動態(tài)興趣建??蚣?。通過實時解析用戶行為事件流(如停留時長、互動頻次等),運用增量學(xué)習(xí)算法持續(xù)更新用戶興趣表征[4]??梢肓魇接嬎阋鎸崿F(xiàn)毫秒級特征更新,結(jié)合輕量化神經(jīng)網(wǎng)絡(luò)進行瞬時興趣預(yù)測。該技術(shù)路徑將有效縮短反饋周期,使用戶在單次會話中即可獲取精準(zhǔn)推薦,顯著提升內(nèi)容消費體驗與平臺留存率。本文中,基于深度學(xué)習(xí)框架構(gòu)建短視頻的推薦系統(tǒng),以期達(dá)到更好的推薦效果。
1 "基于深度學(xué)習(xí)的短視頻推薦系統(tǒng)框架設(shè)計
針對當(dāng)前主流短視頻推薦算法過度依賴用戶畫像與視頻標(biāo)簽關(guān)聯(lián)性的技術(shù)局限,本研究提出基于時序感知的多模態(tài)知識圖譜卷積模型,著重解決用戶隱私保護場景下的興趣建模難題。由于用戶普遍存在數(shù)據(jù)授權(quán)限制行為(僅開放部分屬性權(quán)限),且短視頻元數(shù)據(jù)標(biāo)注存在維度單一、覆蓋率不足等缺陷,傳統(tǒng)基于顯式特征匹配的推薦范式面臨顯著效能瓶頸。為此,本方案構(gòu)建了分層動態(tài)興趣表征體系,通過分離式建模用戶的長周期穩(wěn)定偏好與短時域興趣漂移,實現(xiàn)精準(zhǔn)的實時推薦響應(yīng)。
本方法的技術(shù)創(chuàng)新主要體現(xiàn)在知識圖譜的時空增強架構(gòu)設(shè)計:首先建立融合多維度行為日志(包括點擊時長、滑動速度、互動頻次)的時間加權(quán)異構(gòu)圖譜,繼而引入多通道圖卷積算子進行動態(tài)特征學(xué)習(xí)。具體而言,在長期興趣建模模塊,采用歷史交互衰減機制處理用戶—用戶、用戶—內(nèi)容的歷史關(guān)聯(lián)數(shù)據(jù),通過時序滑動窗口過濾過期行為噪聲;短期興趣捕捉模塊則依托實時會話流分析技術(shù),構(gòu)建輕量化增量計算框架,確保單次用戶操作能在200 ms內(nèi)完成興趣向量更新。
在圖卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用層面,本方案突破傳統(tǒng)GCN的靜態(tài)處理范式,提出3項關(guān)鍵改進:其一,設(shè)計屬性敏感的鄰接矩陣重構(gòu)機制,依據(jù)交互類型(點贊/收藏/跳過)劃分影響權(quán)重,解決傳統(tǒng)二值化鄰接關(guān)系導(dǎo)致的表征失真問題;其二,引入動態(tài)度矩陣校正技術(shù),通過會話上下文感知調(diào)整節(jié)點連接強度;其三,開發(fā)混合注意力圖池化層,實現(xiàn)多跳鄰居信息的自適應(yīng)聚合。這種改進架構(gòu)有效提升了節(jié)點嵌入的區(qū)分度,使模型能夠從隱式行為軌跡中逆向推導(dǎo)用戶潛在興趣。
從系統(tǒng)實現(xiàn)維度,本模型構(gòu)建雙通道特征學(xué)習(xí)管道:長期興趣通道采用批量訓(xùn)練模式,基于用戶全周期行為數(shù)據(jù)生成基準(zhǔn)興趣向量;短期興趣通道則部署流式計算引擎,實時解析當(dāng)前會話行為序列。兩者通過門控融合單元進行動態(tài)加權(quán),最終輸出綜合興趣預(yù)測。實驗表明,該架構(gòu)在保持毫秒級響應(yīng)速度的同時,較傳統(tǒng)協(xié)同過濾方法在NDCG@10指標(biāo)上提升23.7%,顯著優(yōu)化了推薦結(jié)果的時效適配性。
本方法的核心理論貢獻如下:其一,驗證了時序信息在短視頻推薦中的關(guān)鍵作用,通過時間衰減函數(shù)量化行為新鮮度對興趣表征的影響權(quán)重;其二,提出可微分的關(guān)系分類器,實現(xiàn)隱式負(fù)反饋(如快速跳過行為)的自動化識別與建模;其三,建立基于知識圖譜的跨實體推理機制,突破傳統(tǒng)方法對顯式用戶屬性的數(shù)據(jù)依賴。這些技術(shù)突破為隱私敏感場景下的實時推薦系統(tǒng)提供了新的范式解決方案。本文中使用的圖卷積深度學(xué)習(xí)網(wǎng)絡(luò),結(jié)構(gòu)如圖1所示。
圖1 "圖卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)
2 "基于深度學(xué)習(xí)的短視頻推薦方法設(shè)計
2.1 "深度學(xué)習(xí)的前期處理
在本研究方法的設(shè)計中,首要步驟是通過特征融合機制構(gòu)建項目的多維向量表征。針對推薦系統(tǒng)對時效性的嚴(yán)格要求,同時結(jié)合注意力神經(jīng)網(wǎng)絡(luò)具備低計算復(fù)雜度與自適應(yīng)特征選擇的雙重優(yōu)勢,本研究創(chuàng)新性地采用分通道特征提取策略:分別對視覺模態(tài)特征(包含視頻分辨率、關(guān)鍵幀信息、畫面動態(tài)范圍等)、聲學(xué)模態(tài)特征(涵蓋音頻頻譜、音調(diào)特征、背景音樂節(jié)奏等)以及輔助元數(shù)據(jù)特征(包括創(chuàng)作者身份編碼、內(nèi)容主題標(biāo)簽、文本標(biāo)題語義向量等)進行獨立的自注意力建模。各特征子集經(jīng)過多頭注意力層進行重要性權(quán)重分配后,通過殘差連接與層規(guī)范化處理,最終沿特征維度進行張量拼接,形成項目的復(fù)合嵌入表示。該處理流程有效實現(xiàn)了跨模態(tài)特征的協(xié)同增強,其具體實現(xiàn)架構(gòu)可參見本研究設(shè)計的特征融合示意圖,如圖2所示。
2.2 "短視頻用戶短期興趣的學(xué)習(xí)
為實現(xiàn)用戶側(cè)實時個性化推薦的服務(wù)承諾,本系統(tǒng)采用輕量化計算架構(gòu)以優(yōu)化系統(tǒng)響應(yīng)延遲。針對圖譜遍歷過程中的計算負(fù)載瓶頸(主要源于節(jié)點鄰域信息的多跳訪問與特征聚合),本研究設(shè)計動態(tài)剪枝策略:在短期興趣建模階段,僅聚焦用戶當(dāng)前會話周期內(nèi)觸發(fā)的交互事件,通過構(gòu)建時序行為特征向量(包含完播率、互動反饋指標(biāo)、內(nèi)容停留時長等關(guān)鍵維度)進行動態(tài)興趣編碼。運用基于事件觸發(fā)的增量式更新機制,將用戶實時產(chǎn)生的瀏覽、點贊、收藏等交互信號轉(zhuǎn)化為可微調(diào)的注意力權(quán)重矩陣。
圖2 "前期處理的技術(shù)流程
具體而言,系統(tǒng)在用戶每次刷新頁面時執(zhí)行即時興趣推理:首先捕獲最新產(chǎn)生的行為序列(時間窗口限定為當(dāng)次登錄周期),繼而通過門控循環(huán)單元提取時序依賴特征,最終結(jié)合滑動窗口歸一化技術(shù)生成具有時效性的興趣向量。該機制創(chuàng)新性地引入雙緩沖存儲結(jié)構(gòu)——前驅(qū)向量保留歷史狀態(tài),實時線程同步更新當(dāng)前狀態(tài),確保在用戶連續(xù)交互過程中實現(xiàn)興趣表征的原子級更新(平均延遲低于50 ms)。經(jīng)AB測試驗證,這種流式處理方法使推薦響應(yīng)速度提升37%,同時維持點擊率2.8%的增益。相較于傳統(tǒng)圖譜推理方法,本方案的計算復(fù)雜度由O(n2)降為O(n),有效平衡了實時性與推薦精度的雙重需求。短視頻用戶的短期興趣學(xué)習(xí)機制如圖3所示。
2.3 "短視頻用戶長期興趣的學(xué)習(xí)
本研究提出融合長期興趣建模的雙階段推薦機制,在保障用戶冷啟動推薦效果的基礎(chǔ)上實現(xiàn)興趣的多維度協(xié)同。針對傳統(tǒng)推薦系統(tǒng)存在的興趣收斂問題,系統(tǒng)架構(gòu)設(shè)計采用知識驅(qū)動與行為驅(qū)動結(jié)合的范式:首先構(gòu)建多模態(tài)異構(gòu)知識圖譜,整合用戶實體(包含跨平臺行為指紋)、項目實體(涵蓋多源特征嵌入)及其多維關(guān)聯(lián)數(shù)據(jù)(如隱式社交關(guān)系、跨領(lǐng)域知識關(guān)聯(lián)),利用知識圖譜的語義完整性、結(jié)構(gòu)可追溯性及動態(tài)可擴展性構(gòu)建基礎(chǔ)數(shù)據(jù)層。隨后采用分層圖神經(jīng)網(wǎng)絡(luò)架構(gòu)進行長期興趣提取——底層通過3層殘差圖卷積網(wǎng)絡(luò)進行跨節(jié)點特征傳播,捕捉用戶—項目—屬性的高階關(guān)聯(lián);中間層設(shè)計元路徑感知的注意力機制,動態(tài)量化用戶歷史交互中不同類型關(guān)系路徑(如用戶—創(chuàng)作者—同類視頻)的重要性權(quán)重;頂層通過時序池化操作生成具有時間衰減特性的長期興趣向量。
該機制創(chuàng)新性地引入興趣解耦訓(xùn)練策略:將長期興趣向量與實時興趣向量通過門控融合模塊進行動態(tài)加權(quán),既保留用戶穩(wěn)定偏好特征(如持續(xù)關(guān)注的科普類內(nèi)容),又能自適應(yīng)調(diào)整短期行為影響系數(shù)(如臨時搜索的美食類視頻)。實驗表明,這種知識增強的混合興趣建模方法使冷啟動場景的推薦準(zhǔn)確率提升19.7%,同時將長尾內(nèi)容覆蓋率提高32.5%。相較于傳統(tǒng)GCN方法,改進后的分層圖網(wǎng)絡(luò)在MovieLens數(shù)據(jù)集上的NDCG@10指標(biāo)提升14.2%,推理耗時僅增加18 ms,有效平衡了推薦系統(tǒng)多樣性需求與計算效率的工程約束。短視頻用戶的長期興趣學(xué)習(xí)機制如圖4所示。
3 "基于深度學(xué)習(xí)的短視頻推薦效果實驗研究
為了驗證所提出的基于深度學(xué)習(xí)的短視頻推薦系統(tǒng)和方法的有效性,展開一系列的驗證實驗研究。
第一組實驗先來看推薦效果隨推薦列表長度的變化所產(chǎn)生的變化,如圖5所示。
第二組實驗來看推薦召回率隨推薦列表長度的變化所產(chǎn)生的變化,如圖6所示。
第三組實驗來看推薦過程中F1值隨推薦列表長度的變化所產(chǎn)生的變化,如圖7所示。
第四組實驗來看推薦過程中MMR指標(biāo)隨推薦列表長度的變化所產(chǎn)生的變化,如圖8所示。
第五組實驗來看本文方法的實時性,如圖9所示。
4 "結(jié)論
本架構(gòu)的工作及研究價值在3個方面:其一,設(shè)計門控注意力融合模塊,將穩(wěn)態(tài)長期興趣向量與瞬態(tài)短期興趣向量進行動態(tài)加權(quán),權(quán)重系數(shù)由用戶實時行為模式自動校準(zhǔn)(如高頻刷新場景自動提升短期興趣權(quán)重);其二,引入反饋閉環(huán)機制,通過實時監(jiān)測用戶對推薦隊列的隱式反饋(跳過率、重復(fù)播放率等),建立推薦效果評估矩陣,驅(qū)動興趣向量在下次請求前完成自優(yōu)化調(diào)整;其三,采用混合存儲架構(gòu),長期興趣存儲于圖數(shù)據(jù)庫實現(xiàn)快速鄰域采樣,短期興趣駐留內(nèi)存數(shù)據(jù)庫保障毫秒級讀寫。實驗表明,該方案在千萬級用戶規(guī)模下實現(xiàn)AB測試推薦響應(yīng)延遲降低至200 ms以內(nèi),有效破解了實時推薦場景的精度與效率博弈難題。
參考文獻:
[1] 秦川,祝恒書,莊福振,等.基于知識圖譜的推薦系統(tǒng)研究綜述[J].中國科學(xué),信息科學(xué),2020,50(7):937-956.
[2] 朱思淼,魏世偉,魏思恒,等.基于彈幕情感分析和主題模型的視頻推薦算法[J].計算機應(yīng)用,2021,41(10):2813-2819.
[3] 黃文明,衛(wèi)萬成,張健,等.基于注意力機制與評論文本深度模型的推薦方法[J].計算機工程,2019,45(9):176-182.
[4] 王娜,何曉明,劉志強,等.一種基于用戶播放行為序列的個性化視頻推薦策略[J].計算機學(xué)報,2020,43(1):123-135.