孫 宜 宋 卿
(中國(guó)傳媒大學(xué),北京 100024)
2019年8月30日,中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC)發(fā)布了第44次《中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》。報(bào)告表明,截止2019年6月,中國(guó)網(wǎng)民數(shù)量達(dá)到8.54億,手機(jī)網(wǎng)民數(shù)量達(dá)到8.47億,網(wǎng)絡(luò)視頻用戶(hù)規(guī)模達(dá)到7.59億,約占我國(guó)人口總數(shù)的54.2%。
個(gè)性化推薦技術(shù)本質(zhì)上是系統(tǒng)主動(dòng)進(jìn)行內(nèi)容和用戶(hù)的匹配,因此內(nèi)容標(biāo)簽和用戶(hù)標(biāo)簽就成為個(gè)性化推薦的基礎(chǔ)。其中,用戶(hù)標(biāo)簽往往也被稱(chēng)為用戶(hù)畫(huà)像技術(shù)。用戶(hù)畫(huà)像近年來(lái)在個(gè)性化推薦領(lǐng)域發(fā)展非常迅速,該技術(shù)可以多維立體地將用戶(hù)的行為偏好抽象成一個(gè)個(gè)標(biāo)簽,用戶(hù)的標(biāo)簽與電影的標(biāo)簽相匹配,再結(jié)合目前常用的協(xié)同過(guò)濾推薦算法,便可以達(dá)到高速有效地為用戶(hù)推薦電影的目的。
對(duì)于電影的個(gè)性化推薦不僅要考慮到算法的準(zhǔn)確度,還要考慮電影的社會(huì)功能。將主流價(jià)值觀(guān)的注入與推薦算法結(jié)合,可以平衡現(xiàn)代互聯(lián)網(wǎng)技術(shù)與大眾文化,為人民群眾所喜聞樂(lè)見(jiàn)。
“個(gè)性化推薦”的概念最早在1995年被提出,美國(guó)卡耐基梅隆大學(xué)的羅伯特·阿姆斯特朗等人在美國(guó)人工智能協(xié)會(huì)上提出的個(gè)性化導(dǎo)航系統(tǒng)采用了“個(gè)性化推薦”的概念。幾乎同時(shí),斯坦福大學(xué)的研究者也提出了一個(gè)個(gè)性化推薦系統(tǒng),拉開(kāi)了個(gè)性化推薦的發(fā)展序幕。
20世紀(jì)90年代,推薦算法開(kāi)始被研究。目前較為常用的推薦算法有基于關(guān)聯(lián)規(guī)則的推薦、基于內(nèi)容的推薦、協(xié)同過(guò)濾推薦和混合推薦等。在電影的個(gè)性化推薦中,協(xié)同過(guò)濾推薦算法使用最為廣泛。
鄧愛(ài)林等提出了一種基于項(xiàng)目評(píng)分預(yù)測(cè)的協(xié)同過(guò)濾推薦算法,通過(guò)對(duì)項(xiàng)目之間相似性的分析,對(duì)未打分的商品進(jìn)行預(yù)測(cè),以解決電子商務(wù)中用戶(hù)評(píng)分極端稀疏情況下傳統(tǒng)推薦系統(tǒng)存在的弊端,顯著提高推薦系統(tǒng)的質(zhì)量;張光衛(wèi)等人將云模型與協(xié)同過(guò)濾算法結(jié)合起來(lái),利用云模型在知識(shí)層面分析用戶(hù)相似度以達(dá)到更好的個(gè)性化推薦效果;范波等人通過(guò)分析用戶(hù)對(duì)多個(gè)不同類(lèi)型項(xiàng)目的評(píng)分相似度,提出了用戶(hù)間多相似度的協(xié)同過(guò)濾算法,有效提高了預(yù)測(cè)用戶(hù)評(píng)分以及個(gè)性化推薦的準(zhǔn)確率;朱磊等提出將用戶(hù)的評(píng)分偏好與時(shí)間因素、物品屬性結(jié)合起來(lái),改進(jìn)相似度的度量公式,有效提高個(gè)性化推薦的準(zhǔn)確度;畢閏芳針對(duì)電影個(gè)性化推薦系統(tǒng)提出了基于SVR的協(xié)同過(guò)濾和用戶(hù)畫(huà)像融合的推薦算法,將用戶(hù)對(duì)電影內(nèi)容的偏好以用戶(hù)畫(huà)像的方式融入到協(xié)同過(guò)濾中,獲得更好的推薦效果。
當(dāng)下,對(duì)于個(gè)性化推薦的研究多是以提高推薦準(zhǔn)確率為目的,誠(chéng)然高準(zhǔn)確度的推薦系統(tǒng)提高了用戶(hù)體驗(yàn),也幫助網(wǎng)站提升了轉(zhuǎn)化率。但完全依賴(lài)于機(jī)器學(xué)習(xí)的推薦系統(tǒng)也漸漸將用戶(hù)困于“信息繭房”中,在算法中加入價(jià)值觀(guān)引導(dǎo)成為不可避免的趨勢(shì)。
用戶(hù)畫(huà)像是對(duì)用戶(hù)的基本信息與行為信息進(jìn)行高度凝練得到的特征標(biāo)簽集合,“貼標(biāo)簽”是構(gòu)建用戶(hù)畫(huà)像最核心的工作。
圖1 用戶(hù)畫(huà)像構(gòu)建流程圖
構(gòu)建用戶(hù)畫(huà)像包括基礎(chǔ)數(shù)據(jù)收集、行為建模、構(gòu)建畫(huà)像三步,畫(huà)像構(gòu)建完畢后對(duì)用戶(hù)進(jìn)行每一次個(gè)性化推薦時(shí),將用戶(hù)的反饋納入到數(shù)據(jù)收集環(huán)節(jié),再次進(jìn)行構(gòu)建用戶(hù)畫(huà)像的流程,如圖1所示,以此循環(huán)可將用戶(hù)畫(huà)像動(dòng)態(tài)化,提高推薦的準(zhǔn)確度。
用戶(hù)數(shù)據(jù)的收集主要分為靜態(tài)數(shù)據(jù)收集與動(dòng)態(tài)數(shù)據(jù)收集兩種。靜態(tài)數(shù)據(jù)主要是用戶(hù)填寫(xiě)的個(gè)人資料,包括姓名、性別、年齡等自然屬性,職業(yè)、學(xué)歷、婚姻狀況等社會(huì)屬性,這些數(shù)據(jù)通常具有較高的穩(wěn)定性,在較長(zhǎng)一段時(shí)間內(nèi)不會(huì)發(fā)生非常大的改變。而動(dòng)態(tài)數(shù)據(jù)主要是從用戶(hù)的行為和偏好中得到的數(shù)據(jù),包括用戶(hù)的瀏覽行為信息數(shù)據(jù)、偏好行為信息數(shù)據(jù)和交易行為信息數(shù)據(jù)。
在獲取了用戶(hù)的基礎(chǔ)靜態(tài)信息和行為信息后,利用自然語(yǔ)言處理、機(jī)器學(xué)習(xí)、聚類(lèi)算法、預(yù)測(cè)算法等技術(shù),抽象出用戶(hù)的個(gè)性化標(biāo)簽,對(duì)用戶(hù)行為進(jìn)行建模。一個(gè)行為模型主要包括時(shí)間、地點(diǎn)、人物、方式、內(nèi)容五要素,具體可以描述為什么用戶(hù)(who)在什么時(shí)間(when)什么地點(diǎn)(where)以什么方式(how)做了什么事(what)。
通過(guò)技術(shù)手段對(duì)用戶(hù)行為進(jìn)行建模后,則可以針對(duì)具體的應(yīng)用場(chǎng)景為用戶(hù)定義多維度的標(biāo)簽體系,以可視化的方式構(gòu)建出用戶(hù)畫(huà)像。
協(xié)同過(guò)濾推薦算法主要通過(guò)用戶(hù)過(guò)去的行為與相似用戶(hù)的行為來(lái)預(yù)測(cè)用戶(hù)未來(lái)可能感興趣的項(xiàng)目,以達(dá)成精準(zhǔn)化、個(gè)性化推薦效果。在實(shí)際應(yīng)用中,基于用戶(hù)的協(xié)同過(guò)濾算法與基于項(xiàng)目的協(xié)同過(guò)濾算法通常是結(jié)合起來(lái)使用的。
基于用戶(hù)的協(xié)同過(guò)濾算法是通過(guò)對(duì)有相似偏好的不同用戶(hù)進(jìn)行交叉推薦,以達(dá)到給用戶(hù)推薦可能感興趣的項(xiàng)目的目的。尋找行為偏好相似的用戶(hù)是使用基于用戶(hù)的協(xié)同過(guò)濾算法的前提,故這一算法的核心是用戶(hù)之間相似度的計(jì)算。使用適用于特定環(huán)境的方法完成對(duì)用戶(hù)相似度的計(jì)算后,可對(duì)用戶(hù)群體進(jìn)行分類(lèi)或聚類(lèi),在未來(lái)的觀(guān)影行為中同類(lèi)的用戶(hù)之間更有可能有相似的喜好,因而可以向用戶(hù)推薦同類(lèi)用戶(hù)觀(guān)看過(guò)而本人未觀(guān)看過(guò)的電影。
基于項(xiàng)目的協(xié)同過(guò)濾算法是通過(guò)分析用戶(hù)以往感興趣的項(xiàng)目,將與之相似的項(xiàng)目推薦給用戶(hù)的推薦算法。與基于用戶(hù)的協(xié)同過(guò)濾算法相似,基于項(xiàng)目的協(xié)同過(guò)濾算法的核心便是判斷項(xiàng)目之間的相似性。除了傳統(tǒng)的相似性判斷方法外,在電影領(lǐng)域,還可以通過(guò)電影的導(dǎo)演、演員等要素對(duì)電影進(jìn)行基于一定權(quán)重的直接劃分,進(jìn)而找到相似的電影進(jìn)行推薦。
電影個(gè)性化推薦算法過(guò)于單一時(shí)容易使用戶(hù)陷于“信息繭房”,視野逐漸窄化。推薦算法的極端情況便是“你喜歡什么,你的世界就只剩下什么”。每天看到相似甚至是相同的電影推薦,漸漸地就會(huì)給用戶(hù)一種“電影都是這樣”的錯(cuò)覺(jué),極大地限制了用戶(hù)的視野,久而久之,便會(huì)在不知不覺(jué)中將用戶(hù)困在興趣的小圈子里,就像是困在一個(gè)“繭房”中。在更極端的情況下,用戶(hù)甚至?xí)霈F(xiàn)“信息異化”的情況,個(gè)人想法被看到的信息所影響,成為被信息支配的奴隸,不再具有作為信息控制主體的能力。若用戶(hù)本身的情感傾向與價(jià)值觀(guān)就與主流價(jià)值觀(guān)相悖,那推薦算法就可能將他引入歧途。
在當(dāng)今的網(wǎng)絡(luò)環(huán)境之下,“流量明星”具有巨大的影響力,這并非健康的網(wǎng)絡(luò)環(huán)境應(yīng)有的特征。為改善這一情況,一方面要對(duì)內(nèi)容加強(qiáng)監(jiān)管,盡量控制流量明星的龐大粉絲群進(jìn)行“控評(píng)”“刷屏”等行為,另一方面也要主動(dòng)出擊,利用個(gè)性化推薦算法來(lái)弘揚(yáng)主流價(jià)值觀(guān)。
電影不同于高度依賴(lài)個(gè)性化推薦的短視頻,短視頻不僅有高度的娛樂(lè)功能,還具有非常重要的教化功能。因此傳統(tǒng)的個(gè)性化推薦算法不能全然照搬到電影推薦領(lǐng)域中,主流價(jià)值觀(guān)的注入成為必然。
基于協(xié)同過(guò)濾的推薦算法不同于以今日頭條為代表的新聞客戶(hù)端所使用的基于內(nèi)容的推薦算法,它將推薦的維度提高,將“人群”作為推薦的基數(shù)數(shù)據(jù),不斷進(jìn)行優(yōu)化和迭代?;趨f(xié)同過(guò)濾的推薦算法相較于基于內(nèi)容的推薦算法擁有更大的靈活性,其推薦的內(nèi)容也更加豐富,可以有效避免用戶(hù)接收到的信息窄化的問(wèn)題,打破“信息繭房”。
個(gè)性化推薦依賴(lài)機(jī)器學(xué)習(xí)與深度學(xué)習(xí),它足夠智能化,卻不夠人性化,而多元化、開(kāi)放式、動(dòng)態(tài)化的推薦算法可以在一定程度上規(guī)避算法帶來(lái)的缺陷。為打破“信息繭房”,需要改進(jìn)算法,使用糾偏技術(shù)。不但要?jiǎng)討B(tài)跟蹤用戶(hù)的使用行為和使用偏好,及時(shí)轉(zhuǎn)變推薦的重心重點(diǎn)內(nèi)容,還要定期給用戶(hù)推薦非計(jì)劃中的電影,找到用戶(hù)可能感興趣但目前還沒(méi)有了解過(guò)的電影,拓寬用戶(hù)的視野,打破“信息繭房”,讓推薦算法更人性化。
在互聯(lián)網(wǎng)上的傳播環(huán)境是一個(gè)逐漸去中心化的系統(tǒng),在這樣的前提下,視頻網(wǎng)站與視頻客戶(hù)端必須把握住意識(shí)形態(tài)的主動(dòng)權(quán)。作為一個(gè)傳播平臺(tái),必須有以多樣化的方式宣揚(yáng)社會(huì)主義核心價(jià)值觀(guān)的意識(shí)和作為。對(duì)主流價(jià)值觀(guān)的注入不僅要依靠集中力量加強(qiáng)人工審核,結(jié)合大數(shù)據(jù)技術(shù)進(jìn)行溯源,把握不良電影和不良畫(huà)面的來(lái)源,從源頭上遏制不良內(nèi)容流出,提高電影質(zhì)量,還要從推薦系統(tǒng)本身入手,拒絕簡(jiǎn)單粗暴的置頂方式,更加人性化地對(duì)價(jià)值觀(guān)進(jìn)行個(gè)性化引導(dǎo)。
電影的推薦本質(zhì)上是對(duì)文化的傳播過(guò)程,這一過(guò)程會(huì)對(duì)用戶(hù)產(chǎn)生潛移默化的作用,進(jìn)一步會(huì)對(duì)整個(gè)社會(huì)的風(fēng)氣和價(jià)值觀(guān)產(chǎn)生巨大的影響。當(dāng)前廣泛使用的用戶(hù)畫(huà)像的標(biāo)簽體系中,通常沒(méi)有主流內(nèi)容的標(biāo)簽維度,而在電影的個(gè)性化推薦中主流內(nèi)容的標(biāo)簽維度是必不可少的。對(duì)于主流內(nèi)容標(biāo)簽,應(yīng)根據(jù)具體情況對(duì)其權(quán)重進(jìn)行適當(dāng)加強(qiáng),在尊重用戶(hù)興趣的前提下,將主流價(jià)值觀(guān)以多樣化的方式傳遞給用戶(hù)。
將用戶(hù)畫(huà)像與協(xié)同過(guò)濾算法結(jié)合不僅可以很好地解決協(xié)同過(guò)濾算法忽略用戶(hù)對(duì)電影內(nèi)容的偏好的問(wèn)題,在用戶(hù)畫(huà)像構(gòu)建過(guò)程中,通過(guò)分析用戶(hù)的行為數(shù)據(jù),特別是對(duì)評(píng)論等文本信息進(jìn)行情感分析,還可以獲得用戶(hù)在一定時(shí)間段內(nèi)的情感傾向,當(dāng)用戶(hù)出現(xiàn)負(fù)面情緒或價(jià)值觀(guān)明顯偏離主流正確價(jià)值觀(guān)方向時(shí),及時(shí)做出反應(yīng),將部分包含正面情緒和主流的正向價(jià)值觀(guān)的內(nèi)容推薦給用戶(hù),改變“算法無(wú)價(jià)值觀(guān)”的現(xiàn)狀。
隨著5G移動(dòng)網(wǎng)絡(luò)的建設(shè)和高清編碼技術(shù)的發(fā)展,會(huì)有越來(lái)越多的用戶(hù)隨時(shí)隨地通過(guò)移動(dòng)終端觀(guān)看4K/8K高清電影。個(gè)性化推薦技術(shù)的引入,恰好能夠幫助我們?cè)诩姺睆?fù)雜的電影資源庫(kù)中快速找到那一部“對(duì)”的電影。
在目前人工智能大發(fā)展、大數(shù)據(jù)技術(shù)大應(yīng)用的背景下,個(gè)性化推薦技術(shù)已經(jīng)成為內(nèi)容傳播行業(yè)的標(biāo)準(zhǔn)配置,也將成為線(xiàn)上電影行業(yè)持續(xù)健康發(fā)展的突破口。用戶(hù)畫(huà)像基于用戶(hù)自身數(shù)據(jù)的采集分析,幫助視頻網(wǎng)站更加懂得用戶(hù)所想,為每一個(gè)用戶(hù)打造與眾不同的觀(guān)影體驗(yàn)。而用戶(hù)畫(huà)像與協(xié)同過(guò)濾算法融合,將“歷史行為”“用戶(hù)分群”“電影內(nèi)容”都作為推薦的基數(shù)數(shù)據(jù),不斷進(jìn)行優(yōu)化和迭代,具有更大的靈活性,其推薦的電影準(zhǔn)確性也會(huì)得到一定的提高,在此過(guò)程中,通過(guò)對(duì)用戶(hù)情緒與價(jià)值觀(guān)的監(jiān)測(cè)并及時(shí)做出反應(yīng),可以有效避免用戶(hù)接收到的信息窄化問(wèn)題,對(duì)用戶(hù)的價(jià)值觀(guān)進(jìn)行及時(shí)的引導(dǎo)。