本文引用格式:,.基于視覺交互的短視頻內(nèi)容推薦機制研究[J」.藝術(shù)科技,2025,38(7):144-146.
中圖分類號:G206文獻標識碼:A
文章編號:1004-9436(2025)07-0144-03
短視頻平臺憑借即時性、直觀性與多樣性內(nèi)容傳播特點,已成為全球數(shù)十億用戶獲取信息的主要渠道。隨著用戶規(guī)模持續(xù)擴張及內(nèi)容體量不斷增長,如何在海量內(nèi)容中實現(xiàn)精準推薦,成為平臺增強用戶黏性的關(guān)鍵競爭點。當前短視頻的主流推薦機制是根據(jù)點贊、評論、收藏等用戶行為判斷用戶興趣點,據(jù)此為用戶推薦高相似度的內(nèi)容[1]。這種方法雖簡單快捷,但難以確認用戶是否對此類內(nèi)容產(chǎn)生足夠的興趣。在用戶觀看短視頻的過程中,用戶的視線軌跡、視線停留時長、視線鎖定點等在很大程度上反映了用戶的關(guān)注點,這些視覺交互行為能夠為理解用戶真實興趣提供參考。
趣相似的視頻,或向用戶推薦與其既往喜歡視頻相似的內(nèi)容。內(nèi)容分析則側(cè)重于視頻本身的屬性,主要利用計算機視覺、自然語言處理、音頻分析等技術(shù)提取視頻的視覺特征、文本特征、音頻特征,基于此構(gòu)建視頻內(nèi)容向量[2]。平臺則通過計算用戶歷史行為數(shù)據(jù),與候選視頻內(nèi)容向量相似度進行比對,借此向用戶推薦內(nèi)容。這兩種方法構(gòu)成了短視頻內(nèi)容推薦基礎(chǔ)層,能夠初步滿足用戶的興趣匹配需求。
1短視頻平臺主流內(nèi)容推薦機制
主流短視頻平臺推薦機制普遍為基于用戶行為分析的協(xié)同過濾和內(nèi)容分析機制。協(xié)同過濾方法主要通過算法挖掘用戶觀看、點贊、評論、分享、關(guān)注、搜索等行為數(shù)據(jù),借此識別用戶之間的相似性。協(xié)同過濾會向目標用戶推薦與其興
2短視頻平臺主流內(nèi)容推薦機制存在的不足
2.1即時需求捕捉能力弱
現(xiàn)有短視頻平臺的主流推薦機制主要依賴用戶點贊、評論、收藏等顯性行為。然而,用戶在觀看短視頻過程中的興趣可能是動態(tài)變化的,常受到視瀕內(nèi)容、情緒狀態(tài)、好奇心、外界刺激等影響。用戶在單次觀看會話中,注意力焦點、興趣強度以及對內(nèi)容的期待都可能隨著視頻播放的每一秒而發(fā)生快速、微妙的變化。這種即時需求捕捉能力的不足,導致推薦系統(tǒng)難以及時響應用戶注意力焦點和興趣的變化,無法在用戶需求產(chǎn)生的瞬間為其提供最契合的內(nèi)容,從而降低了推薦的精準度,導致用戶觀看體驗得不到進一步提升[3]。
2.2潛在興趣挖掘不精準
當前的主流推薦機制在識別用戶潛在興趣方面存在局限性。一方面,短視頻平臺系統(tǒng)過度依賴用戶過去的顯性行為進行預測,導致推薦結(jié)果高度集中于用戶已知興趣領(lǐng)域,從而形成“信息繭房”。這種機制難以有效捕捉用戶未通過顯性行為表達,但實際存在的潛在興趣點。另一方面,算法對用戶觀看過程中表現(xiàn)出的“弱信號”缺乏敏感度,如對視頻中出現(xiàn)的背景、服飾、藝術(shù)元素以及文字等特定內(nèi)容的短暫凝視或短暫暫停,這些未被量化的視覺交互痕跡恰恰是潛在興趣的關(guān)鍵要素。
2.3視覺交互行為分析缺失
當前主流推薦機制對用戶在觀看中產(chǎn)生的深層視覺交互行為缺乏系統(tǒng)性分析。平臺雖能記錄基礎(chǔ)播放行為,卻普遍忽視精細視覺信號的價值。例如,用戶視線在屏幕上的移動軌跡、用戶對關(guān)鍵畫面聚焦時間、用戶觀看視頻的暫停點等,這些均可能伴隨著微表情變化[4]。這些視覺交互數(shù)據(jù)是用戶無意識注意力分配的直接外顯,蘊含著比顯性點擊行為更豐富的潛在需求線索。但短視頻平臺現(xiàn)有推薦機制無法將這些高價值的興趣信號轉(zhuǎn)化為興趣標簽。
3視覺交互在短視頻內(nèi)容推薦中的應用價值
3.1提升用戶興趣識別精度
視覺交互數(shù)據(jù)為短視頻推薦系統(tǒng)突破傳統(tǒng)的用戶行為分析瓶頸、實現(xiàn)用戶興趣的精準刻畫提供了新的思路。而視覺交互行為可通過抓取用戶觀看中的視線軌跡、凝視時長、回看片段內(nèi)容、暫停關(guān)注點等,反映用戶無意識的注意力分配特點。這些毫秒級的行為信號構(gòu)成了用戶興趣的連續(xù)動態(tài)圖譜,使系統(tǒng)能夠捕捉傳統(tǒng)方法無法獲取的用戶需求[5]。
以B站《15天花20萬元用500克黃金敲數(shù)萬錘純手工復原三星堆黃金面具》短視頻為例,部分用戶可能對“三星堆黃金面具”感興趣,部分用戶可能對“復原技術(shù)”感興趣,通過視覺交互,系統(tǒng)可根據(jù)用戶視線是停留在環(huán)境方面還是停留在復原動作上判斷用戶興趣。通過分析,系統(tǒng)能夠?qū)⒂脩粢暰€行為數(shù)據(jù)轉(zhuǎn)化為用戶的興趣表達特征,并識別用戶的興趣強度變化規(guī)律,從而提升修通推薦的語義相關(guān)性與個性化精度。
3.2拓展用戶觀看行為數(shù)據(jù)
傳統(tǒng)的內(nèi)容推薦依賴用戶結(jié)果性行為數(shù)據(jù),如點擊/跳過、點贊/收藏、播放時長等,這些結(jié)果性指標僅能反映用戶的結(jié)果導向,無法還原觀看過程中的細節(jié)行為。而視覺交互分析可通過實時捕獲用戶眼動軌跡、瞳孔變化情況、眨眼頻率等生理反應,以及面部微表情變化,構(gòu)建完整的觀看行為證據(jù)鏈,使系統(tǒng)能夠量化用戶對視頻中非主體元素的關(guān)注度。
以李子柒“紫氣東來”短視頻為例,這是2021年7月4日季子柒更新完《柴米油鹽醬醋茶》后的首個視頻,視頻主要以漆器制作為主,用戶關(guān)注點可能是漆器本身,可能是鄉(xiāng)村背景,可能是山野風光,抑或是溪流與花朵,傳統(tǒng)推薦機制可能將這些用戶偏好歸類于“李子柒”系列視頻,用戶管理行為被限制在單一的“李子柒”標簽方面。而視覺交互則可以根據(jù)獲取用戶的視覺關(guān)注點和微表情變化,將漆器、鄉(xiāng)村、山野風光、溪流、花朵等填充至用戶行為數(shù)據(jù)庫中,極大地豐富了用戶的行為數(shù)據(jù),為推薦模型提供了數(shù)量級更高、語義更豐富的訓練素材。
3.3增強推薦內(nèi)容的針對性
視覺交互分析還可以通過解碼用戶無意識的注意力,使短視頻推薦系統(tǒng)突破傳統(tǒng)標簽匹配模式的限制,使短視頻內(nèi)容與用戶需求精準對接。視覺交互方式可獲取用戶視覺焦點,由此揭示用戶對視頻微觀的興趣強度,系統(tǒng)可據(jù)此構(gòu)建用戶興趣特征庫,為其提供針對性地觀看內(nèi)容。
以《指尖上的傳承》紀錄片中的《玉雕》一集為例,視頻中出現(xiàn)多個栩栩如生的玉雕作品,如花卉類、鳥類、山水類、器物類、人物類等,如某用戶對人物類玉雕感興趣,目光緊隨玉雕變化,面部泛起喜愛表情,通過視覺交互可以獲取該用戶的這些行為變化數(shù)據(jù),從其為其推薦更多人物類玉雕視頻??梢姡谝曈X交互的推薦機制尤其擅長捕捉用戶短暫涌現(xiàn)的需求,使系統(tǒng)能即時響應這類“瞬時興趣”窗口,顯著降低推薦內(nèi)容相關(guān)但非所需的問題。
3.4優(yōu)化內(nèi)容推薦反饋機制
視覺交互還可為短視頻推薦系統(tǒng)構(gòu)建高靈敏度、低延遲的動態(tài)反饋機制,解決推薦因依賴顯性行為導致的反饋延時問題。視覺交互可以對用戶毫秒級眼動軌跡進行追蹤,為系統(tǒng)提供連續(xù)、實時、無感的用戶評估數(shù)據(jù)流。
以《藝韻江南》短視頻為例,該短視頻主要介紹獨具魅力的江南文化,重點講解江南地區(qū)的地緣、人緣和文化。由于內(nèi)容豐富多彩,用戶關(guān)注點不同,因而想要為用戶提供個性化推薦難度較大。而視覺交互的應用可解決這一問題,用戶對江南文化的了解興趣強烈,可能滑動視頻將地緣、人緣部分內(nèi)容略過,重點將目光停留在文化部分,系統(tǒng)通過識別用戶在不同片段中的注視時長、表情變化可自動匹配用戶需求,為用戶在后續(xù)觀看中提供類似內(nèi)容。
4基于視覺交互的短視頻內(nèi)容推薦機制
4.1通過視覺行為挖掘用戶需求
基于視覺交互的短視頻內(nèi)容推薦首先要通過視覺行為挖掘用戶需求,通過視覺交互捕捉用戶觀看過程中無意識流露的即時興趣,解決因行為數(shù)據(jù)稀疏性導致的需求誤判問題。首先,建立多維度視覺行為數(shù)據(jù)庫,系統(tǒng)性采集用戶觀看中的毫秒級交互信號,包括屏幕注視熱力圖、重復回看頻次、滑動速度動態(tài)變化、自然暫停觸發(fā)畫面以及微表情反應等,這些數(shù)據(jù)構(gòu)成用戶觀看過程的連續(xù)記錄。其次,將視覺行為與視頻內(nèi)容關(guān)聯(lián),通過時空對齊技術(shù)解析用戶行為對應的具體內(nèi)容。例如,將多次回看的片段定位到特定語義單元,將滑動減速點關(guān)聯(lián)至場景,這可以將原始的行為轉(zhuǎn)化為可量化的興趣指標。最后,構(gòu)建動態(tài)興趣驅(qū)動模型,基于行為與內(nèi)容關(guān)聯(lián)結(jié)果生成實時的興趣向量,模型主要識別三類關(guān)鍵需求,即顯性需求、潛在需求、即時需求,在下一刷立即推送相似視覺元素的短視頻。該機制能使系統(tǒng)主動響應用戶未言明的探索意圖,并在單次觀看會話內(nèi)完成需求挖掘和內(nèi)容匹配。
4.2基于視覺偏好構(gòu)建用戶畫像
通過視覺交互行為構(gòu)建用戶畫像,可以利用用戶無意識的視覺注意力分配模式,捕捉顯性行為未覆蓋的偏好,解決用戶畫像更新滯后的問題。首先,提取視覺行為衍生的興趣語義單元。系統(tǒng)自動分析用戶聚焦的高頻視覺元素、內(nèi)容主題、場景類別、暫停行為等,這些元素經(jīng)聚類轉(zhuǎn)化為視覺興趣標簽,構(gòu)成畫像的基礎(chǔ)語義。其次,建立多維度偏好量化模型?;谟脩粜袨閺姸扔嬎阌脩魧γ總€語義的興趣,如凝視時長、回看頻率、場景停留時間等,將其作為用戶偏好分析的參考。最后,通過畫像實時驅(qū)動內(nèi)容推薦決策。系統(tǒng)將動態(tài)畫像轉(zhuǎn)化為推薦內(nèi)容:當系統(tǒng)檢測到用戶對某內(nèi)容的視覺停留時長突破閾值時,即時搜索數(shù)據(jù)庫中與該內(nèi)容相關(guān)的視頻,將類似的視頻推送給用戶,然后再通過視覺交互獲取用戶在新視頻中的行為數(shù)據(jù),并與之前視頻的用戶行為數(shù)據(jù)進行對比,總結(jié)用戶的興趣需求,從而進一步優(yōu)化推薦策略。
4.3利用沉浸式交互設計適配內(nèi)容
利用沉浸式交互設計適配內(nèi)容,可使系統(tǒng)主動響應用戶視覺行為,對推薦內(nèi)容進行精準匹配,解決傳統(tǒng)推薦機制中忽視交互情境的問題。首先,設計視覺行為觸發(fā)的動態(tài)內(nèi)容調(diào)節(jié)功能。系統(tǒng)能夠?qū)崟r解析用戶交互強度,如當檢測到高專注度信號時,自動生成關(guān)鍵畫面筆記彈窗、關(guān)聯(lián)知識圖譜延伸推薦;識別到碎片化瀏覽信號則智能提取視頻摘要,并強化字幕呈現(xiàn)。其次,開發(fā)手勢交互表達通道。在傳統(tǒng)滑動操作基礎(chǔ)上新增語義化手勢庫,橫向長按觸發(fā)推送背景知識卡片,畫圈標記自動捕捉畫面主體生成興趣標簽;雙指縮放調(diào)節(jié)信息密度。系統(tǒng)將手勢轉(zhuǎn)化為需求指令,將手勢指令作為推薦指標。最后,構(gòu)建環(huán)境感知適配機制。通過設備傳感器識別使用場景,系統(tǒng)自動調(diào)整視頻時長與音頻輸出、過濾特效、優(yōu)化字體與主體比例。這種方式可將用戶無意識交互行為轉(zhuǎn)化為有意義的內(nèi)容調(diào)控指令,使推薦從單向推送轉(zhuǎn)為雙向?qū)υ挘嬲龑崿F(xiàn)以用戶觀看需求為中心的智能推薦。
4.4基于視覺反饋優(yōu)化推薦機制
基于視覺反饋優(yōu)化推薦機制可解決傳統(tǒng)推薦機制反饋延遲的問題,使系統(tǒng)具有持續(xù)適應能力。在具體設計方面,首先要建立視覺行為評估體系。系統(tǒng)將原始交互信號轉(zhuǎn)化為三類可計算指標,即內(nèi)容價值系數(shù)、興趣衰減指數(shù)、情感傾向值。例如,視覺交互檢測到用戶對某要素集中力較高,自動提升該要素在內(nèi)容庫的權(quán)重。其次,采用動態(tài)策略引擎,系統(tǒng)以視覺反饋為基準實時調(diào)整推薦策略。例如,當用戶對旅行類視頻表現(xiàn)出較高的興趣,會出現(xiàn)反復觀看、點贊收藏、目光凝視等行為,系統(tǒng)根據(jù)這些行為參數(shù)提高旅行類視頻權(quán)重,并增加此類短視頻的推薦比重。最后,構(gòu)建閉環(huán)進化機制。系統(tǒng)通過雙通道持續(xù)升級,一是通過短期自適應通道將當前會話的視覺反饋直接注入推薦鏈,在下一刷即時呈現(xiàn)相似視頻;二是通過長期進化通道聚合海量用戶視覺行為,挖掘隱式規(guī)律,反向優(yōu)化內(nèi)容生產(chǎn)標準與分發(fā)策略。
5結(jié)語
在短視頻傳播競爭日益激烈的當下,視覺交互通過解碼用戶注意力分配、情感波動及行為動機,對用戶真實意圖進行透視,并為用戶提供個性化推薦。本文提出的基于視覺交互的短視頻內(nèi)容推薦機制,不僅能夠顯著提升短視頻內(nèi)容推薦的精準度,還能挖掘用戶的潛在興趣。未來,隨著多模態(tài)感知技術(shù)成熟,基于視覺交互的內(nèi)容推薦機制將逐步進化為理解人類意圖的智能體,為用戶提供更多針對性的短視頻內(nèi)容。
參考文獻:
[1」朱虎韜.面向公眾的AI驅(qū)動健康教育視頻內(nèi)容推薦系統(tǒng)的設計與優(yōu)化[J].辦公自動化,2025,30(7):55-57.
[2」徐靖宜.用戶生成內(nèi)容與算法推薦機制在短視頻平臺上的作用[J].記者搖籃,2025(3):15-17.
[3]戴煜.短視頻內(nèi)容篩選與精準傳播策略[J」.記者觀察,2024(30):53-55.
[4」楊璇,許麗云.用戶體驗視角下可訪問性設計與視覺傳達交互設計的有效融合探討[J].赤峰學院學報(自然科學版),2024,40(10):17-21.
[5」葉大軍.視頻化生存時代短視頻新聞的視覺表達機制探究[J].新聞研究導刊,2023,14(4):86-88.