賈金娜陳罡鄭艾明
(河北傳媒學(xué)院,河北石家莊 050071)
大數(shù)據(jù)時(shí)代網(wǎng)絡(luò)視頻用戶(hù)推薦研究
賈金娜陳罡鄭艾明
(河北傳媒學(xué)院,河北石家莊 050071)
大數(shù)據(jù)時(shí)代,基于海量用戶(hù)信息挖掘用戶(hù)興趣進(jìn)行精確推薦,是網(wǎng)絡(luò)視頻供應(yīng)商亟須解決的核心問(wèn)題。目前有非個(gè)性化推薦、個(gè)性化推薦、相關(guān)推薦、協(xié)同過(guò)濾推薦等不同推薦技術(shù),這些技術(shù)及相關(guān)算法各有其適用之地和不足之處,應(yīng)采用不同策略加以綜合應(yīng)用。大數(shù)據(jù)時(shí)代網(wǎng)絡(luò)視頻推薦技術(shù)的發(fā)展,要強(qiáng)化海量信息存儲(chǔ)加工基礎(chǔ)條件,加強(qiáng)特征化信息提取技術(shù)研究,加快個(gè)性化產(chǎn)品推薦方法研究,廣泛開(kāi)展視頻產(chǎn)品傳播反饋分析,以提升用戶(hù)推薦的精確化、精細(xì)化、精準(zhǔn)化水平。
網(wǎng)絡(luò)影視;視頻推薦;大數(shù)據(jù)
近年來(lái),我國(guó)個(gè)人互聯(lián)網(wǎng)應(yīng)用發(fā)展迅速,網(wǎng)絡(luò)視頻、網(wǎng)絡(luò)應(yīng)用、網(wǎng)絡(luò)購(gòu)物等應(yīng)用用戶(hù)規(guī)模均呈明顯上升趨勢(shì)。我國(guó)“十三五”規(guī)劃建議提出:“實(shí)施國(guó)家大數(shù)據(jù)戰(zhàn)略。把大數(shù)據(jù)作為基礎(chǔ)性戰(zhàn)略資源,全面實(shí)施促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng),加快推動(dòng)數(shù)據(jù)資源共享開(kāi)放和開(kāi)發(fā)應(yīng)用,助力產(chǎn)業(yè)轉(zhuǎn)型升級(jí)和社會(huì)治理創(chuàng)新”[1]。隨著我國(guó)信息化建設(shè)的深入推進(jìn),海量用戶(hù)在各類(lèi)應(yīng)用中不斷生產(chǎn)海量數(shù)據(jù)。正如中國(guó)工程院院士高文所說(shuō):“不管你是否認(rèn)同,大數(shù)據(jù)時(shí)代已經(jīng)來(lái)臨,并將深刻地改變著我們的工作和生活。”[2]在這個(gè)信息數(shù)量飛速增長(zhǎng)的時(shí)代,我國(guó)傳統(tǒng)的網(wǎng)絡(luò)視頻行業(yè)依舊未能擺脫對(duì)資本和流量的訴求,馬太效應(yīng)愈發(fā)凸顯,我國(guó)網(wǎng)絡(luò)視頻網(wǎng)站呈現(xiàn)愛(ài)奇藝、優(yōu)酷土豆、騰訊視頻三足鼎立局面,其他視頻網(wǎng)站與其差距越來(lái)越大。在確保內(nèi)容優(yōu)質(zhì)和版權(quán)合法的前提下,網(wǎng)絡(luò)視頻應(yīng)加強(qiáng)技術(shù)創(chuàng)新,做到在基于大眾熱點(diǎn)強(qiáng)力推薦和基于用戶(hù)興趣精準(zhǔn)推薦等不同策略之間的平衡,使得相關(guān)各類(lèi)面向行業(yè)、面向領(lǐng)域和面向用戶(hù)的推薦能夠更加準(zhǔn)確、科學(xué)、有效,從而不斷提升自身核心競(jìng)爭(zhēng)力。
2016年1月22日,中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC)發(fā)布第37次《中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》。該報(bào)告顯示,截至2015年12月,中國(guó)網(wǎng)民規(guī)模達(dá)6.88億,互聯(lián)網(wǎng)普及率達(dá)到50.3%,半數(shù)中國(guó)人已接入互聯(lián)網(wǎng)。其中,截至2015年12月,中國(guó)網(wǎng)絡(luò)視頻用戶(hù)規(guī)模達(dá)5.04億,較2014年底增加7093萬(wàn),網(wǎng)絡(luò)視頻用戶(hù)使用率為73.2%,較2014年底增加了6.5個(gè)百分點(diǎn),網(wǎng)絡(luò)視頻應(yīng)用緊隨即時(shí)通信、搜索引擎和網(wǎng)絡(luò)新聞,排在第4位,全年增長(zhǎng)率為16.4%[3]。如表1所示。
當(dāng)前網(wǎng)絡(luò)視頻節(jié)目,按照內(nèi)容來(lái)源可分為如下幾類(lèi):(1)電視視頻信號(hào)轉(zhuǎn)播或電視節(jié)目剪輯、回放。網(wǎng)站將電視節(jié)目作為視頻輸入源,在網(wǎng)絡(luò)上提供電視節(jié)目服務(wù),相當(dāng)于電視信號(hào)的網(wǎng)絡(luò)擴(kuò)展,例如中國(guó)網(wǎng)絡(luò)電視臺(tái),以及各類(lèi)視頻終端軟件的直播頻道。(2)電影、電視劇等影像制品在線觀看。網(wǎng)站通過(guò)購(gòu)買(mǎi)在線播放版權(quán),在網(wǎng)絡(luò)上向用戶(hù)提供有償或無(wú)償?shù)囊曨l服務(wù),相當(dāng)于影院和傳統(tǒng)DVD等家用播出設(shè)備在網(wǎng)絡(luò)上的擴(kuò)展,也是國(guó)內(nèi)的優(yōu)酷土豆、愛(ài)奇藝、搜狐視頻、騰訊視頻等主流網(wǎng)絡(luò)視頻服務(wù)提供方,以及國(guó)外Hulu,YouTube的主要線上業(yè)務(wù)。(3)個(gè)人錄制上傳分享的視頻。視頻經(jīng)過(guò)上傳、轉(zhuǎn)碼、內(nèi)容審核到最終發(fā)布,在網(wǎng)絡(luò)上向用戶(hù)提供自主視頻內(nèi)容分享服務(wù),進(jìn)一步豐富了網(wǎng)絡(luò)視頻的內(nèi)容。
表1 2014-2015年中國(guó)網(wǎng)民各類(lèi)互聯(lián)網(wǎng)應(yīng)用的使用率(部分)
這些視頻要想得以長(zhǎng)期生存,必須有相當(dāng)規(guī)模的搜索量和觀看量。以近年來(lái)孔笙執(zhí)導(dǎo)的熱播電視劇《瑯琊榜》(2015年)和《歡樂(lè)頌》(2016年)兩部網(wǎng)絡(luò)熱播視頻為例,對(duì)其在優(yōu)酷土豆網(wǎng)站的日搜索指數(shù)和日播放指數(shù)等網(wǎng)絡(luò)視頻指數(shù)①進(jìn)行分析可發(fā)現(xiàn)如下規(guī)律:(1)一部網(wǎng)絡(luò)視頻的熱播周期只能維持3~6個(gè)月左右;(2)同一導(dǎo)演或劇組的前期成功作品會(huì)對(duì)后繼作品起到極其重要的宣傳作用;(3)取得成功的作品將延續(xù)很長(zhǎng)時(shí)間的“長(zhǎng)尾效應(yīng)”②;(4)主推網(wǎng)絡(luò)視頻開(kāi)播前期的大眾熱點(diǎn)強(qiáng)力推薦是確保開(kāi)播前期2類(lèi)指數(shù)曲線迅速上揚(yáng)的關(guān)鍵保證;(5)過(guò)期網(wǎng)絡(luò)視頻的“長(zhǎng)尾”用戶(hù)的持續(xù)推薦是確保視頻生存的關(guān)鍵保證。
近年來(lái),我國(guó)網(wǎng)絡(luò)娛樂(lè)類(lèi)應(yīng)用穩(wěn)步發(fā)展,它們以?xún)?yōu)質(zhì)內(nèi)容為核心拉動(dòng)了娛樂(lè)應(yīng)用的快速增長(zhǎng)。以知識(shí)產(chǎn)權(quán)為核心的網(wǎng)絡(luò)娛樂(lè)產(chǎn)業(yè)鏈在2015年展現(xiàn)出巨大商業(yè)價(jià)值,由熱門(mén)網(wǎng)絡(luò)文學(xué)作品改編的影視作品屢創(chuàng)收視新高。愛(ài)奇藝、優(yōu)酷土豆、騰訊視頻等主要視頻網(wǎng)站在2015年新增的付費(fèi)用戶(hù)數(shù)超過(guò)之前的積累,用戶(hù)付費(fèi)收入在整體收入中的占比增大,預(yù)計(jì)未來(lái)會(huì)成為視頻網(wǎng)站重要的收入來(lái)源。這種大背景下,互聯(lián)網(wǎng)影視產(chǎn)業(yè)鏈進(jìn)一步加強(qiáng),網(wǎng)絡(luò)視頻作品若要取得成功,必須靠?jī)?yōu)質(zhì)內(nèi)容、精準(zhǔn)推薦來(lái)吸引更多收看者以提升口碑,靠嵌入廣告收費(fèi)或靠視頻付費(fèi)購(gòu)買(mǎi)來(lái)提升收益。
大數(shù)據(jù)時(shí)代,網(wǎng)絡(luò)視頻、網(wǎng)絡(luò)音樂(lè)、網(wǎng)絡(luò)社交等傳媒行業(yè)的變革有目共睹,如按2013年有關(guān)數(shù)據(jù)顯示,F(xiàn)acebook每天有40億條發(fā)布量,網(wǎng)絡(luò)每天日志總額達(dá)35TB,每天吸收逾500TB圖片、視頻等新數(shù)據(jù)[4],YouTube網(wǎng)站目前有數(shù)十億視頻條目在線,用戶(hù)群體規(guī)模達(dá)到數(shù)百萬(wàn),每分鐘用戶(hù)上傳的視頻時(shí)長(zhǎng)超過(guò)24小時(shí)。而Hulu網(wǎng)站擁有超過(guò)400萬(wàn)高級(jí)用戶(hù)和平均每月3000萬(wàn)免費(fèi)用戶(hù),總視頻規(guī)模達(dá)到40億[5]?;ヂ?lián)網(wǎng)的快速發(fā)展給用戶(hù)提供了大量的視頻資源,面對(duì)已經(jīng)過(guò)多的信息,用戶(hù)通常很難找到自己感興趣的內(nèi)容;同時(shí),對(duì)于網(wǎng)絡(luò)視頻網(wǎng)站而言,網(wǎng)站間的競(jìng)爭(zhēng)必將逐漸集中在提升用戶(hù)體驗(yàn)之上,為用戶(hù)提供有效的個(gè)性化推薦服務(wù)勢(shì)在必行。面對(duì)海量用戶(hù),網(wǎng)站必須深入挖掘和分析用戶(hù)的歷史行為信息,預(yù)測(cè)未來(lái)行為,找到不同用戶(hù)的興趣,為他們提供適合的、感興趣的資源,從而提升用戶(hù)的粘滯性和忠誠(chéng)度,以求獲得更多的觀看率和經(jīng)濟(jì)效益。目前的推薦方法種類(lèi)繁多,但不同網(wǎng)絡(luò)視頻網(wǎng)站應(yīng)當(dāng)根據(jù)自身特點(diǎn)和不同類(lèi)別視頻的實(shí)際需求,選擇合適的推薦策略。
(一)非個(gè)性化推薦
這種推薦基于用戶(hù)對(duì)產(chǎn)品的獨(dú)立于用戶(hù)推薦系統(tǒng)的平均評(píng)分,即所有受眾用戶(hù)都會(huì)得到相同的推薦結(jié)果。這種推薦方式做的就是將所有的反饋信息綜合起來(lái)并對(duì)要推薦的產(chǎn)品進(jìn)行排序,從中選擇出當(dāng)前最熱門(mén)的產(chǎn)品進(jìn)行推薦。對(duì)于在線視頻網(wǎng)站來(lái)說(shuō),其往往針對(duì)未登錄的用戶(hù)采用這種推薦方式提供電影、電視劇、體育、綜藝、娛樂(lè)、動(dòng)漫、教育、健康、軍事等熱門(mén)視頻,以期望更多的未登錄用戶(hù)或潛在用戶(hù)觀看,從而提升收看率,確保廣告收入或視頻收費(fèi)增長(zhǎng)。這種推薦方式的缺點(diǎn)非常明顯,非個(gè)性化推薦無(wú)論在未登錄用戶(hù)的體驗(yàn)還是實(shí)際收看數(shù)量上都與個(gè)性化推薦有著很大的差距。這種方式適用于暫時(shí)無(wú)法確定用戶(hù)唯一身份的情況,也被普遍用于網(wǎng)站當(dāng)前重點(diǎn)發(fā)展的熱門(mén)視頻推薦。
(二)個(gè)性化推薦
個(gè)性化視頻推薦就是網(wǎng)站不斷地搜集用戶(hù)搜索、觀看、點(diǎn)評(píng)各類(lèi)視頻的行為,通過(guò)各種算法來(lái)計(jì)算用戶(hù)未來(lái)會(huì)感興趣的視頻,然后將相應(yīng)的結(jié)果推薦給用戶(hù)[6]。個(gè)性化視頻推薦往往會(huì)采用很多種因素來(lái)決策用戶(hù)的行為,如訂閱、評(píng)分、搜索、評(píng)論,以及點(diǎn)擊、一次觀看時(shí)長(zhǎng)、暫停點(diǎn)、回看時(shí)段、重復(fù)觀看次數(shù)等多種行為。個(gè)性化推薦方法通過(guò)綜合計(jì)算用戶(hù)的各種各樣的行為,來(lái)準(zhǔn)確地找出用戶(hù)對(duì)于視頻的興趣點(diǎn)。用戶(hù)的歷史行為往往能從側(cè)面反應(yīng)出用戶(hù)對(duì)視頻的需求方向,因此可以為推薦給用戶(hù)視頻提供很好的參照。例如,目前Youtube、Hulu、愛(ài)奇藝等視頻網(wǎng)站都會(huì)根據(jù)用戶(hù)已觀看、已購(gòu)買(mǎi)的網(wǎng)絡(luò)視頻來(lái)為用戶(hù)推薦新的可能感興趣的視頻。站在用戶(hù)視角,推薦的視頻大多數(shù)都是和用戶(hù)歷史觀看、收藏、購(gòu)買(mǎi)、評(píng)分、瀏覽等行為密切相關(guān)的。由此可見(jiàn),個(gè)性化推薦的可行性還是非常高的。此種方式適用于可掌握海量用戶(hù)視頻操作行為大數(shù)據(jù)的相關(guān)網(wǎng)站。
(三)相關(guān)推薦
相關(guān)推薦就是將與用戶(hù)正在觀看的視頻比較相關(guān)的視頻推薦給當(dāng)前的用戶(hù)?,F(xiàn)有的專(zhuān)業(yè)性視頻網(wǎng)站,如QQ影音、PPS等會(huì)根據(jù)你的選中視頻給你推薦一些結(jié)果。這些結(jié)果通常匹配程度較好,但是相關(guān)推薦通??紤]因素過(guò)分單一,最常見(jiàn)的問(wèn)題就是如果用戶(hù)偶爾訪問(wèn)一些視頻并且再不想觀看,那么根據(jù)這些推薦出的結(jié)果就適得其反。目前,相關(guān)推薦仍然是視頻推薦的重要推薦方式之一,雖然在專(zhuān)業(yè)性視頻網(wǎng)站上普遍已有實(shí)現(xiàn),但是基于生活、社交、興趣等以用戶(hù)為主的非專(zhuān)業(yè)視頻網(wǎng)站上,這方面做得還不夠全面。
(四)協(xié)同過(guò)濾推薦
這種方法也是通過(guò)用戶(hù)視頻操作歷史行為,分析出用戶(hù)的興趣標(biāo)簽,然后對(duì)用戶(hù)做推薦。很多知名網(wǎng)站,如YouTube等視頻網(wǎng)站都采取了協(xié)同過(guò)濾的方式。協(xié)同過(guò)濾的一個(gè)優(yōu)點(diǎn)是可以有很多算法來(lái)供推薦者使用,如鄰域算法、圖算法、矩陣分解算法等等。這種算法的主要缺點(diǎn)是用戶(hù)新加入的視頻不能及時(shí)地融入推薦算法中,必須要有一定的基礎(chǔ)數(shù)據(jù)才能保證算法可以正確執(zhí)行。但是在過(guò)濾的準(zhǔn)確程度上來(lái)講,協(xié)同過(guò)濾比前兩種過(guò)濾方式有明顯優(yōu)勢(shì)。
目前,以上方法中,具體算法有基于內(nèi)容的推薦、協(xié)同過(guò)濾推薦、基于關(guān)聯(lián)規(guī)則的推薦、基于效用的推薦、基于知識(shí)的推薦以及組合推薦方法等多種類(lèi)型[7]。筆者在此綜合分析了各種推薦方法均有其優(yōu)缺點(diǎn)和適用范圍,具體如表2所示。實(shí)際應(yīng)用中應(yīng)根據(jù)網(wǎng)站策略和不同視頻具體特點(diǎn)綜合考慮,采取合適的網(wǎng)絡(luò)視頻推薦策略。
由此可見(jiàn),當(dāng)前各種推薦方法都有優(yōu)缺點(diǎn)和具體應(yīng)用限制。因此,在實(shí)際應(yīng)用中,應(yīng)該考慮若干種算法進(jìn)行組合,如將基于內(nèi)容的推薦和協(xié)同過(guò)濾推薦相結(jié)合組合,即分別用基于內(nèi)容的方法和協(xié)同過(guò)濾推薦方法去產(chǎn)生一個(gè)推薦預(yù)測(cè)結(jié)果,然后用某方法組合其結(jié)果。各類(lèi)技術(shù)的組合,要重復(fù)發(fā)揮各自?xún)?yōu)勢(shì),并避免或彌補(bǔ)各自不足,如通過(guò)加權(quán)(Weight)來(lái)綜合利用多種推薦技術(shù)結(jié)果,通過(guò)變換(Switch)來(lái)適應(yīng)不同問(wèn)題背景和實(shí)際情況,通過(guò)混合(Mixed)同時(shí)采用多種推薦技術(shù)給出多種推薦結(jié)果為用戶(hù)提供參考,通過(guò)特征組合(Feature combination)將不同推薦數(shù)據(jù)源的特征用于另一種推薦算法,通過(guò)層疊算法(Cascade)③分步進(jìn)行逐次精確的推薦,通過(guò)特征擴(kuò)充(Feature augmentation)將一種推薦技術(shù)產(chǎn)生附加的特征信息嵌入到另一種推薦技術(shù)的特征輸入中,通過(guò)元級(jí)別(Meta-level)方法用一種推薦方法產(chǎn)生的模型作為另一種推薦方法的輸入。
大數(shù)據(jù)環(huán)境下,網(wǎng)絡(luò)視頻推薦技術(shù)的發(fā)展面臨著巨大的機(jī)遇和挑戰(zhàn),需要相關(guān)經(jīng)營(yíng)商從管理、技術(shù)兩方面不斷創(chuàng)新。針對(duì)目前情況,筆者給出以下發(fā)展建議。
(一)強(qiáng)化海量信息存儲(chǔ)加工基礎(chǔ)條件,為大數(shù)據(jù)推薦提供硬件能力
隨著網(wǎng)絡(luò)視頻用戶(hù)數(shù)量的暴漲,隨著網(wǎng)站海量日志的飛速上漲(如Facebook每天網(wǎng)絡(luò)日志量已達(dá)幾十TB),要在大數(shù)據(jù)時(shí)代深入挖掘海量數(shù)據(jù)中存在的各種規(guī)律,僅靠傳統(tǒng)的計(jì)算模式和計(jì)算軟硬件平臺(tái)是難以應(yīng)付的。同時(shí),隨著大數(shù)據(jù)時(shí)代的來(lái)臨,網(wǎng)絡(luò)中的信息量呈現(xiàn)指數(shù)式增長(zhǎng),帶來(lái)了信息過(guò)載問(wèn)題,推薦系統(tǒng)是解決信息過(guò)載最有效的方式之一,大數(shù)據(jù)推薦系統(tǒng)已經(jīng)逐漸成為信息領(lǐng)域的研究熱點(diǎn)。為有效進(jìn)行科學(xué)推薦,大數(shù)據(jù)儲(chǔ)存、加工、處理的基礎(chǔ)平臺(tái)必須先行打牢。筆者認(rèn)為各網(wǎng)絡(luò)視頻供應(yīng)商應(yīng)充分預(yù)估未來(lái)3~5年新增數(shù)據(jù)量,制訂數(shù)據(jù)存儲(chǔ)加工策略,建議自身核心數(shù)據(jù)采用自建方式,其余數(shù)據(jù)資源盡量采用IBM、易安信(EMC)、華為等大數(shù)據(jù)存儲(chǔ)服務(wù)商相關(guān)服務(wù),以充分借助他人優(yōu)勢(shì),聚焦業(yè)務(wù)核心發(fā)展需求。
表2網(wǎng)絡(luò)視頻推薦算法對(duì)比表
(二)加強(qiáng)特征化信息提取技術(shù)研究,為精確化推薦提供手段支撐
大數(shù)據(jù)時(shí)代,精確的信息識(shí)別技術(shù)是所有技術(shù)的基礎(chǔ)。在海量網(wǎng)絡(luò)視頻信息中提取具有特定特征的片段,并根據(jù)行為或?qū)傩赃M(jìn)行分類(lèi),從基礎(chǔ)數(shù)據(jù)中提煉與特定需求相關(guān)的數(shù)據(jù)進(jìn)行整理與匹配,分析各類(lèi)網(wǎng)絡(luò)視頻中的個(gè)性化需求,可提供個(gè)性化的信息服務(wù)。例如通過(guò)調(diào)查分析網(wǎng)絡(luò)視頻用戶(hù)觀看喜好等數(shù)據(jù),可為某部電視劇確定觀眾喜好的主角人選;又如,通過(guò)數(shù)據(jù)分析獲取未來(lái)傳媒領(lǐng)域?qū)I(yè)熱點(diǎn)及人才急需,可為某類(lèi)傳媒專(zhuān)業(yè)學(xué)生提供個(gè)性化的教學(xué)資源服務(wù),等等。建議各網(wǎng)絡(luò)視頻供應(yīng)商應(yīng)立足自身實(shí)際推薦核心需求,不斷找出適用于自身需求的各類(lèi)數(shù)據(jù)資源的特征化屬性,創(chuàng)新文本特征信息提取、圖像幀特征信息提取、音樂(lè)特征抽取、用戶(hù)偏好綜合推理、領(lǐng)域知識(shí)推理等技術(shù),做好各類(lèi)資源、各類(lèi)用戶(hù)的直接特征、間接特征的表達(dá)、選擇、組合及分析,從而實(shí)現(xiàn)推薦的精確化,做到在“正確”的時(shí)間、“正確的”環(huán)境下,為“正確的”用戶(hù)推薦“正確的”網(wǎng)絡(luò)視頻。
(三)加快個(gè)性化產(chǎn)品推薦方法研究,為精細(xì)化推薦提供技術(shù)支持
在傳統(tǒng)數(shù)據(jù)時(shí)代,傳媒電商營(yíng)銷(xiāo)投向的精確度不高,網(wǎng)絡(luò)常見(jiàn)的各類(lèi)用戶(hù)根本不感興趣的廣告層出不窮,令人反感。在大數(shù)據(jù)時(shí)代,傳媒電商可以通過(guò)基于Cookie的用戶(hù)偏好采集系統(tǒng),將更加個(gè)性化、精確化、差異化的產(chǎn)品推薦給更感興趣的受眾群體,在提升自身效益的基礎(chǔ)上,也可為相關(guān)受眾群體帶來(lái)更符合需求的選擇項(xiàng)目和更便捷的服務(wù)。如2014年BBC開(kāi)設(shè)了BBS Store,為注冊(cè)用戶(hù)提供最近一年6000小時(shí)左右的節(jié)目和4000小時(shí)存檔節(jié)目,是拓展用戶(hù)對(duì)BBC公共服務(wù)和商業(yè)內(nèi)容的搜索功能,鼓勵(lì)用戶(hù)購(gòu)買(mǎi)個(gè)性化節(jié)目[8]。筆者建議網(wǎng)絡(luò)視頻供應(yīng)商要不斷擴(kuò)展信息收集的深度和廣度,在當(dāng)前及未來(lái)海量數(shù)據(jù)的支持下,不斷細(xì)分市場(chǎng),在更精確的數(shù)據(jù)特征支持下,快速開(kāi)發(fā)形成應(yīng)用個(gè)性化的產(chǎn)品推薦策略,從而實(shí)現(xiàn)推薦的精細(xì)化。
(四)廣泛開(kāi)展視頻產(chǎn)品傳播反饋分析,為精準(zhǔn)化推薦提供閉環(huán)反饋
大數(shù)據(jù)時(shí)代,傳媒行業(yè)的受眾群體可通過(guò)網(wǎng)站、博客、微博、微信等多種渠道、多個(gè)新媒體平臺(tái)針對(duì)媒體的新聞報(bào)道發(fā)表自己的觀點(diǎn)、表明自己的喜好。具體傳媒行業(yè)應(yīng)該廣泛收集與己相關(guān)的各類(lèi)反饋信息,建立符合自身需求的反饋信息大數(shù)據(jù)分析處理系統(tǒng),分析受眾好惡、特征、趨勢(shì)等,及時(shí)調(diào)整自身傳媒戰(zhàn)略和媒體內(nèi)容,形成良性正反饋,不斷擴(kuò)大自身影響度。如Netflix公司利用Cinematch推薦系統(tǒng),每天產(chǎn)生的3000多萬(wàn)個(gè)基于用戶(hù)視頻點(diǎn)播的評(píng)分、播放、快進(jìn)、暫停、觀看持續(xù)時(shí)間、觀看地點(diǎn)、終端類(lèi)型等海量基礎(chǔ)數(shù)據(jù)進(jìn)行分析,計(jì)算用戶(hù)喜好,進(jìn)行個(gè)性化推薦定制。筆者建議網(wǎng)絡(luò)視頻供應(yīng)商在上述各種“正向”推薦的基礎(chǔ)上,要通過(guò)多種技術(shù)手段采集用戶(hù)的瀏覽、點(diǎn)評(píng)、關(guān)注、停留、回看等多種“負(fù)向”反饋信息,并以此調(diào)整修正相應(yīng)的個(gè)性化推薦方法,不斷提升推薦的精準(zhǔn)化水平。
涂子沛《正在到來(lái)的數(shù)據(jù)革命》中指出:“除了上帝,任何人都必須用數(shù)據(jù)說(shuō)話?!碑?dāng)前各種行業(yè)中,大數(shù)據(jù)都意味著巨大的發(fā)展機(jī)遇,如互聯(lián)網(wǎng)視頻領(lǐng)域的YouTube、Netflix等,社交領(lǐng)域的Facebook、Twitter、新浪微博、騰訊微信等,傳統(tǒng)電視紙媒領(lǐng)域巨頭等,都在積極積累海量數(shù)據(jù),創(chuàng)造大數(shù)據(jù)的應(yīng)用環(huán)境,主導(dǎo)大數(shù)據(jù)的應(yīng)用模式。同政府、工業(yè)、商業(yè)等成熟行業(yè)需求一樣,網(wǎng)絡(luò)視頻這一新的傳媒行業(yè)對(duì)大數(shù)據(jù)的需求也非常旺盛,但其用戶(hù)推薦模式還相對(duì)單一。筆者認(rèn)為網(wǎng)絡(luò)視頻供應(yīng)商應(yīng)努力開(kāi)展各類(lèi)數(shù)據(jù)采集、深度加工和廣泛交換應(yīng)用等工作,面對(duì)日益增長(zhǎng)的海量用戶(hù),應(yīng)積極主動(dòng)作為,加快技術(shù)創(chuàng)新,不斷提升各類(lèi)推薦的精確化、精細(xì)化、精準(zhǔn)化水平,促進(jìn)自身競(jìng)爭(zhēng)力的快速形成和長(zhǎng)期保持。
注釋?zhuān)?/p>
①2004年10月,美國(guó)《連線》雜志主編克里斯·安德森(Chris Anderson)首次提出提出長(zhǎng)尾(Long Tail)理論。只要存儲(chǔ)和流通的渠道足夠大,長(zhǎng)尾理論對(duì)傳統(tǒng)“二八法則”的挑戰(zhàn)在于,80%的非主流“長(zhǎng)尾”不是僅占20%的份額,有可能達(dá)到甚至超過(guò)50%。
②視頻指數(shù)可以用于描述視頻播放周期、用戶(hù)核心特征、用戶(hù)播放行為、視頻熱度排行等。本文利用中國(guó)網(wǎng)絡(luò)視頻指數(shù)beta版(http://index.youku.com/)進(jìn)行數(shù)據(jù)采集分析。
③所謂層疊算法,就是先用一種推薦技術(shù)產(chǎn)生一種粗糙的推薦結(jié)果,第二種推薦技術(shù)在此推薦結(jié)果的基礎(chǔ)上進(jìn)一步作出更精確的推薦。
[1]中華人民共和國(guó)國(guó)民經(jīng)濟(jì)和社會(huì)發(fā)展第十三個(gè)五年規(guī)劃綱要[EB/OL].(2016-03-17)[2016-05-21].http://news.xinhuanet.com/politics/2016lh/2016-03/17/c_1118366322.htm.
[2]國(guó)家大數(shù)據(jù)戰(zhàn)略——習(xí)近平與“十三五”十四大戰(zhàn)略[EB/ OL].(2015-11-12)[2016-05-21].http://politics.people.com.cn/ n/2015/1112/c1001-27809382.html.
[3]第37次中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告[EB/OL].(2016-01-22)[2016-05-21].http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/ 201601/P020160122469130059846.pdf.
[4]張國(guó)強(qiáng).大數(shù)據(jù)時(shí)代媒體轉(zhuǎn)型研究——以山東電視業(yè)為例[D].山東財(cái)經(jīng)大學(xué),2015.
[5]ALEKSANDRA KLASNJA MILICEVIC,BOBAN VESIN,MIRJANA IVANOVIC,et a1.Personalization of programming tutoring system using tag-based recommender systems[C].ICALT'12 Proceeding of the 2012 IEEE 12"'International Conference on Advanced Learning Technologies,2012:666-667.
[6]崔昊旻.海量視頻節(jié)目的檢索、推薦與反饋學(xué)習(xí)[D].中國(guó)科學(xué)技術(shù)大學(xué),2014:2-3.
[7]戴思.基于可視化知識(shí)框架的視頻推薦系統(tǒng)研究與實(shí)現(xiàn)[D].中南大學(xué),2014:22-33.
[8]彭錦.歐盟大數(shù)據(jù)政策及其在傳媒業(yè)的應(yīng)用[J].科技與出版,2015(6):14-15.
(責(zé)任編輯:杭長(zhǎng)釗)
2016-05-15
賈金娜,河北傳媒學(xué)院信息技術(shù)與文化管理學(xué)院教師,本科,研究方向:數(shù)字媒體技術(shù);陳罡,河北傳媒學(xué)院信息技術(shù)與文化管理學(xué)院院長(zhǎng),碩士,研究方向:信息技術(shù);鄭艾明,河北傳媒學(xué)院信息技術(shù)與文化管理學(xué)院輔導(dǎo)員,本科,研究方向:多媒體技術(shù)。