陳丹
“當(dāng)前,愛奇藝基于機(jī)器學(xué)習(xí)的多時(shí)間窗口預(yù)測中,電影票房預(yù)測,提前半年方差準(zhǔn)確率為77%;電視劇流量預(yù)測方面,提前半年到1年方差準(zhǔn)確率為88%?!睈燮嫠噭?chuàng)始人、CEO龔宇最近在幾個(gè)不同的場合都提到這組數(shù)據(jù)。
“愛奇藝的愿景是做以科技創(chuàng)新為驅(qū)動(dòng)的偉大娛樂公司,驅(qū)動(dòng)力不僅來自內(nèi)容創(chuàng)意,同時(shí)來自科技創(chuàng)新??萍紕?chuàng)新‘這臺(tái)機(jī)器正大幅提高社會(huì)生產(chǎn)效率,創(chuàng)造巨大的娛樂市場。同時(shí),AI(人工智能)技術(shù)的運(yùn)用也使得愛奇藝深刻理解內(nèi)容、用戶和合作伙伴多方需求?!饼徲畋硎?,人工智能的算法已經(jīng)貫穿愛奇藝劇本創(chuàng)作、選角、流量預(yù)測、審核、編碼、剪輯、運(yùn)營、搜索、推薦、宣發(fā)、熱點(diǎn)預(yù)測、熱點(diǎn)提取、追星、廣告投放、在線交互等諸多環(huán)節(jié)。
助力內(nèi)容決策
愛奇藝首席技術(shù)官湯興告訴《綜藝報(bào)》,針對在愛奇藝平臺(tái)播出的所有內(nèi)容,愛奇藝有一套多時(shí)間窗口預(yù)測模型,時(shí)間窗口通常為半年到1年?!拔覀儧Q定買某個(gè)版權(quán)的時(shí)間通常會(huì)提前半年到一年,需要精確知道這個(gè)劇或者綜藝未來能夠帶來多少流量?!睖d介紹,流量預(yù)測模型參考的因素極多且非常復(fù)雜,包括社會(huì)輿論、對該IP的討論度、粉絲群體的反饋、前期宣發(fā)效果,以及題材、角色和平臺(tái)的擬合度等,甚至排播形式的不同也會(huì)產(chǎn)生不同的模型?!斑@個(gè)模型的數(shù)據(jù)來源也很復(fù)雜,包括觀影數(shù)據(jù)、搜索數(shù)據(jù)、社交行為、輿論監(jiān)督等,我們需要監(jiān)控整個(gè)互聯(lián)網(wǎng)的輿情。”
目前,愛奇藝這套流量預(yù)測系統(tǒng)的準(zhǔn)確率還在持續(xù)上升?!暗降资裁磿r(shí)候達(dá)到極限,我們目前不知道。它得出的是統(tǒng)計(jì)范疇上的準(zhǔn)確度。內(nèi)容上線之后,模型可以快速修正,一星期之后對流量的預(yù)測可以到93%-97%的精準(zhǔn)率。這種預(yù)測能解決的實(shí)際問題是——你做100次決定,我能保證你80次都對,但不能保證你其中某一次肯定對。”湯興表示。
這套算法系統(tǒng)的意義不僅僅在于預(yù)測流量,也為愛奇藝節(jié)目制作提供了參考指標(biāo),能反過來指導(dǎo)節(jié)目策劃。典型的例子是《中國有嘻哈》,愛奇藝在小眾音樂領(lǐng)域,大投入做了這檔音樂節(jié)目,并獲得成功。這在外界看來有“賭”的成分。其實(shí),節(jié)目背后,愛奇藝的數(shù)據(jù)分析系統(tǒng)亦提供了決策幫助。節(jié)目籌備之前,愛奇藝分析了嘻哈在年輕人群中的滲透率——“非常之高”;分析了嘻哈粉絲的受教育程度——同樣“非常之高”,這些特點(diǎn)有助于分析嘻哈這種小眾文化類型在中國的發(fā)展?jié)摿??!斑@個(gè)品類(嘻哈)在中國社會(huì)是有發(fā)展基礎(chǔ)的,這些都是我們后臺(tái)系統(tǒng)分析得出的結(jié)論,利用同樣的邏輯,我們正在準(zhǔn)備三檔大節(jié)目?!饼徲钤诮衲甑陌俣仁澜绱髸?huì)上透露。
提升營銷效率 深度理解用戶
在愛奇藝的營銷側(cè)和用戶側(cè),AI技術(shù)同樣應(yīng)用廣泛。
在營銷領(lǐng)域,愛奇藝?yán)肁I技術(shù)進(jìn)行場景識別和商品識別。譬如,在直播場景中,愛奇藝營銷部門可以把畫面中實(shí)際出現(xiàn)的礦泉水瓶換成另一個(gè)廣告客戶的產(chǎn)品。龔宇說:“這些都能實(shí)時(shí)完成,即使畫面移動(dòng),用戶也看不出這是一個(gè)應(yīng)用了人工智能技術(shù)替換過的產(chǎn)品?!痹倨┤?,愛奇藝曾做過一個(gè)案例,當(dāng)視頻畫面中出現(xiàn)吃飯情景,旁邊就會(huì)出現(xiàn)百度外賣的圖標(biāo),這也得益于AI技術(shù)。
“視頻目前最主要的變現(xiàn)形式是通過信息流,而衡量信息流最重要的一個(gè)標(biāo)準(zhǔn)是精準(zhǔn)度?!睖d告訴《綜藝報(bào)》,現(xiàn)在很多廣告都通過點(diǎn)擊量付費(fèi),單純的廣告展示并不能帶來收入。因此,廣告推送的一定得是用戶感興趣的內(nèi)容,AI技術(shù)需要識別廣告的品類、推送人群的屬性以及附著內(nèi)容的標(biāo)簽。“這三項(xiàng)標(biāo)簽之間匹配度越高,轉(zhuǎn)化率也越高?,F(xiàn)在的信息流廣告非常依賴AI技術(shù)的更新?lián)Q代,算法提高了一個(gè)點(diǎn),轉(zhuǎn)化率就會(huì)提升一個(gè)點(diǎn)?!?/p>
作為愛奇藝首席技術(shù)官的湯興亦是泡泡社區(qū)創(chuàng)始人。經(jīng)過兩年發(fā)展,泡泡社區(qū)目前日活躍用戶最大值為6849萬。AI技術(shù)也深度應(yīng)用于泡泡社區(qū)的日常運(yùn)營。如何基于不同對泡泡圈子(泡泡社區(qū)內(nèi)部不同的社群)分發(fā)適合的內(nèi)容,包括圖文、視頻、評論、新聞資訊等,需要建立清晰的用戶畫像,同時(shí)構(gòu)建推送內(nèi)容的標(biāo)簽體系,這一過程,湯興稱之為“AI驅(qū)動(dòng)的媒體內(nèi)容分發(fā)”。在他看來,目前所謂AI的應(yīng)用,只是對傳統(tǒng)內(nèi)容(例如簡單圖文)的理解,而對視頻內(nèi)容的理解及標(biāo)注對AI技術(shù)提出了更高要求?!叭撕苋菀卓偨Y(jié)一個(gè)視頻講的是什么,這對于機(jī)器卻非常難做到,只有當(dāng)機(jī)器可以總結(jié)一個(gè)視頻的內(nèi)容大意時(shí),才是真正的視頻理解,這是AI最關(guān)鍵或者說最難的一點(diǎn)。”
在百度世界大會(huì)上,龔宇現(xiàn)場演示了愛奇藝AI技術(shù)對于一段視頻的剪輯成果。在長達(dá)一個(gè)半小時(shí)的視頻播放過程中,隨著播放進(jìn)度,視頻下方的播放條也隨之移動(dòng),并基于AI理解自動(dòng)打分,分?jǐn)?shù)越高,視頻越精彩。打分依據(jù)包括識別技術(shù)、語音、隔音分析、觀眾互動(dòng)程度等。與此同時(shí),界面右側(cè)已經(jīng)生成8個(gè)精彩片斷,系統(tǒng)自動(dòng)檢測明星人物,并配上人物簡介。
“用戶喜歡什么?用什么樣的片段能夠吸引用戶實(shí)現(xiàn)導(dǎo)流?AI在視頻領(lǐng)域應(yīng)用的關(guān)鍵在于,對內(nèi)容的識別以及對用戶的識別?!睖d總結(jié)說。
AI團(tuán)隊(duì)構(gòu)建
在愛奇藝內(nèi)部,AI業(yè)務(wù)沒有獨(dú)立的技術(shù)團(tuán)隊(duì),而是由湯興技術(shù)部門下的工程師負(fù)責(zé)體系架構(gòu),為所有有AI需求的業(yè)務(wù)部門提供公共服務(wù)。除此之外,在愛奇藝所有需要應(yīng)用AI技術(shù)的業(yè)務(wù)線內(nèi),都有自己的算法團(tuán)隊(duì),負(fù)責(zé)具體的AI業(yè)務(wù)。
湯興表示,“AI更多是基礎(chǔ)性的技術(shù)框架,所有有可能用到這個(gè)技術(shù)的團(tuán)隊(duì)都需要去掌握。對于未來的工程師而言,AI也將是一門基礎(chǔ)的計(jì)算機(jī)語言。”在愛奇藝內(nèi)部,至少有20多個(gè)環(huán)節(jié)都涉及AI技術(shù)。在湯興看來,讓一個(gè)團(tuán)隊(duì)負(fù)責(zé)所有的AI業(yè)務(wù)并不現(xiàn)實(shí),因?yàn)樨?fù)責(zé)基礎(chǔ)設(shè)施的工程師并不熟悉愛奇藝的具體業(yè)務(wù)。“AI的核心就是數(shù)據(jù)、計(jì)算力,算法要和場景息息相關(guān)。一定要讓每個(gè)業(yè)務(wù)線上基本的工作人員來做AI算法,這樣才能最終有效,最終落地,不然AI技術(shù)只能是鏡中花、水中月?!眅ndprint