陳嘉,鐘宇霆,魏志剛,陳昕
(深圳廣播電影電視集團(tuán)深圳廣信網(wǎng)絡(luò)傳媒有限公司,深圳 518055)
近十年是中國(guó)IPTV從無(wú)到有并快速發(fā)展的時(shí)期。截止2014年底,中國(guó) IPTV用戶已經(jīng)達(dá)到3363.6萬(wàn)戶(數(shù)據(jù)來(lái)源:工信部網(wǎng)站發(fā)布的數(shù)據(jù))。IPTV所采用的各項(xiàng)新技術(shù)為電視行業(yè)帶來(lái)了諸多的發(fā)展變化,這其中之一便是開拓了利用IPTV大數(shù)據(jù)進(jìn)行收視分析的全新領(lǐng)域。
對(duì)于電視臺(tái)、廣告公司等業(yè)界機(jī)構(gòu)和人士來(lái)說(shuō),收視率不是單一的收視數(shù)據(jù),而是他們對(duì)于如何更好地利用收視率數(shù)據(jù)去進(jìn)行收視市場(chǎng)分析、節(jié)目編排和調(diào)整、節(jié)目評(píng)估以及廣告投放決策等的重要參考指標(biāo)。
傳統(tǒng)收視率定義:指在某一時(shí)段內(nèi)收看某一節(jié)目的人數(shù)(或家戶數(shù))占電視觀眾總?cè)藬?shù)(或家戶數(shù))的百分比[1]。一般來(lái)說(shuō),在實(shí)踐中的收視率指?jìng)€(gè)人收視率。
收視率調(diào)查的流程分為樣本抽取、數(shù)據(jù)采集和數(shù)據(jù)處理三大環(huán)節(jié)。
作為收視率調(diào)查的第一個(gè)環(huán)節(jié),所選樣本點(diǎn)與電視觀眾總體是否具有代表性,對(duì)能否保證收視率數(shù)據(jù)的準(zhǔn)確具有十分重要的意義。樣本抽取包含確定調(diào)查總體、確定樣本容量和抽取樣本三個(gè)環(huán)節(jié)。
1)確定調(diào)查總體
調(diào)查總體一般被界定為目標(biāo)區(qū)域內(nèi)所有4歲及以上的電視家庭人口。
2)確定樣本容量
根據(jù)調(diào)查推斷指標(biāo)的不同,抽樣調(diào)查可以分為兩類,一類是平均數(shù)抽樣調(diào)查,另一類是成數(shù)(比率)抽樣調(diào)查。而傳統(tǒng)收視率調(diào)查采用的是后者,樣本量的計(jì)算公式為:
其中,n為樣本量,P為收視率,M為允許誤差,t為概率度。
在收視率調(diào)查樣本容量的計(jì)算中,收視率P一般取50%,概率度t一般取1.96,因此,樣本量n的多少取決于允許誤差M的大小,隨著允許誤差降低,所需樣本量增大。
3)樣本抽取方法
目前常用的樣本抽取方法主要有日記卡法和測(cè)量?jī)x法。
前面提到的樣本抽取方法中,日記卡法是指由樣本戶中所有4歲及以上的家庭成員,將每天收看電視的頻道、時(shí)間段隨時(shí)記錄在日記卡上,以此來(lái)獲取電視觀眾收視信息;而測(cè)量?jī)x法是指用測(cè)量?jī)x(測(cè)量?jī)x主機(jī)或手控器)來(lái)詳細(xì)記錄樣本戶中所有4歲及以上的家庭成員收看電視的情況。
1)原始數(shù)據(jù)輸入計(jì)算機(jī)并進(jìn)行數(shù)據(jù)的凈化(僅針對(duì)日記卡法)。
2)收視數(shù)據(jù)加權(quán)
加權(quán)是收視數(shù)據(jù)處理過(guò)程中的核心環(huán)節(jié)。目的在于對(duì)樣本結(jié)構(gòu)與總體結(jié)構(gòu)的偏差進(jìn)行校正,使總體收視數(shù)據(jù)更加準(zhǔn)確。通過(guò)加權(quán)變量,可以得到相應(yīng)的權(quán)值表,例如,省網(wǎng)A的特定人口的權(quán)值表(千人)如表格1。
表1 省網(wǎng)A中各種特定人口的權(quán)值表(千人)
如7.4103意味著:在該省網(wǎng)中,樣本中一個(gè)年齡在15-24歲、住在城域的男性在總體中代表7.4103千人。
3)收視率的計(jì)算
例如,根據(jù)省網(wǎng)A的收視監(jiān)測(cè)記錄(如表格2),在某一特定時(shí)段內(nèi)收看某一節(jié)目的4歲及以上的樣本人數(shù)為191人,這191人中的每一個(gè)人總可以在權(quán)值表中找到對(duì)應(yīng)的位置,通過(guò)乘以權(quán)值,可以得到在總體中收看了節(jié)目的各類觀眾人數(shù)。假如在收看節(jié)目的191人中有25人是住在城域、15-24歲的男性,則在總體中共有7.4103千人×25=185.26千人收看了該節(jié)目,以此類推計(jì)算總體中收看節(jié)目的各類人數(shù)并匯總,就得到總體中收看該節(jié)目的人數(shù),可以計(jì)算得出加權(quán)后的收看人數(shù)為8119千人,用8119千人除以總體中4歲及以上觀眾總?cè)藬?shù)55312千人,得出該節(jié)目收視率為14.7%。
表2 省網(wǎng)A某節(jié)目收視率計(jì)算表
傳統(tǒng)電視收視分析所采用的日記法和測(cè)量?jī)x法在當(dāng)時(shí)的廣播電視環(huán)境下,只有采用這種方法才能將收視監(jiān)測(cè)研究拓展到中國(guó)100多個(gè)城市,并且建立省網(wǎng)監(jiān)測(cè),在中國(guó)70多個(gè)城市以及17個(gè)省份建立研究樣本,以監(jiān)測(cè)城區(qū)及鄉(xiāng)鎮(zhèn)居民的收視習(xí)慣,是電視分析的必要手段。
IPTV與傳統(tǒng)廣播電視的技術(shù)架構(gòu)不同,是基于IP網(wǎng)絡(luò)的數(shù)字視頻服務(wù)?;?dòng)性和實(shí)時(shí)性是IPTV最大的特點(diǎn)。當(dāng)IPTV用戶需要觀看某一個(gè)節(jié)目時(shí),必須向服務(wù)器發(fā)送請(qǐng)求命令,服務(wù)器在接收到命令后才會(huì)向用戶推送節(jié)目流。利用這一特點(diǎn),通過(guò)數(shù)據(jù)采集系統(tǒng),可以獲取到IPTV全量的、實(shí)實(shí)在在的收視數(shù)據(jù)。因此IPTV的收視分析將會(huì)是基于全網(wǎng)用戶的收視數(shù)據(jù),其結(jié)果具有客觀性和準(zhǔn)確性。
IPTV的收視分析分為數(shù)據(jù)采集、數(shù)據(jù)過(guò)濾、數(shù)據(jù)處理三個(gè)環(huán)節(jié)。
IPTV收視數(shù)據(jù)可以通過(guò)探針技術(shù)來(lái)采集。當(dāng)用戶進(jìn)入直播界面,相關(guān)參數(shù)(用戶賬號(hào)、進(jìn)入直播方式以及直播頻道名稱等)都將會(huì)被記錄下來(lái);同樣,當(dāng)用戶退出直播,相關(guān)參數(shù)也會(huì)被記錄下來(lái),這樣用戶的觀看日志最終會(huì)被完整的記錄下來(lái)。因此IPTV收視數(shù)據(jù)能夠記錄到全網(wǎng)用戶的觀看行為,可以做全量數(shù)據(jù)的分析。直播探針可以捕獲到以下幾個(gè)關(guān)鍵性的字段:UserID(用戶賬號(hào))、Starttime(用戶開始觀看時(shí)間)、EndTime(用戶觀看結(jié)束時(shí)間)、Channalcode(頻道編號(hào))、ChannalName(頻道名稱)[2]。系統(tǒng)采集到的日志如圖1所示:
圖1 IPTV直播數(shù)據(jù)采集日志
IPTV采集到的是全網(wǎng)收視數(shù)據(jù),但同樣也有噪聲數(shù)據(jù),例如用戶換臺(tái)、關(guān)閉電視但未關(guān)必機(jī)頂盒等行為所產(chǎn)生的收視數(shù)據(jù)。凡是不符合正常觀看行為規(guī)律的數(shù)據(jù)都應(yīng)該做過(guò)濾處理。過(guò)濾的基本原則是:保留符合正常用戶觀看規(guī)律的記錄,去除無(wú)實(shí)際觀看意義的數(shù)據(jù)。典型需要過(guò)濾處理的記錄如下:1)單條觀看時(shí)長(zhǎng)超過(guò)6小時(shí)的記錄;2)單次觀看時(shí)長(zhǎng)低于5秒的觀看記錄;3、少量的結(jié)束時(shí)間小于開始時(shí)間的錯(cuò)誤記錄。
將采集到的收視日志放到數(shù)據(jù)庫(kù)中做處理,值得注意的是,數(shù)據(jù)分析并不要求必須建立數(shù)據(jù)倉(cāng)庫(kù)。可先將數(shù)據(jù)經(jīng)過(guò)處理存貯到數(shù)據(jù)庫(kù)中,他們包含了數(shù)據(jù)分析需要的所有數(shù)據(jù)(簡(jiǎn)稱為原始數(shù)據(jù)庫(kù)),然后根據(jù)過(guò)濾的具體需要,靈活的通過(guò)腳本從原始數(shù)據(jù)庫(kù)中提取需要分析的數(shù)據(jù)即可。
1)收視率的定義
行業(yè)對(duì)收視率的定義為:收視率=收視時(shí)長(zhǎng)/(時(shí)間段時(shí)長(zhǎng)*推及人口)。這里以計(jì)算某衛(wèi)視頻道的日收視率為例,如果要計(jì)算該頻道的日收視率,我們需要獲取到這個(gè)頻道當(dāng)日的總收視時(shí)長(zhǎng)、IPTV當(dāng)日的推及人口。
2)收視時(shí)長(zhǎng)的計(jì)算
由于在原始數(shù)據(jù)庫(kù)里已經(jīng)存貯了當(dāng)天全網(wǎng)的收視日志,通過(guò)腳本對(duì)噪聲數(shù)據(jù)做過(guò)濾處理,然后將收視數(shù)據(jù)按照頻道作分類和聚合處理,通過(guò)聚合函數(shù)對(duì)收視時(shí)長(zhǎng)做疊加,最終獲取到各個(gè)頻道在當(dāng)日的收視總時(shí)長(zhǎng)。
3)推及人口的計(jì)算
推及人口即為有條件觀看電視的用戶數(shù)。與傳統(tǒng)收視調(diào)查不同,IPTV不需要做抽樣處理,當(dāng)天的實(shí)際用戶數(shù)就是精準(zhǔn)的推及人口數(shù)據(jù)。
有了以上數(shù)據(jù),就可以方便的計(jì)算出IPTV平臺(tái)上的節(jié)目收視率。通過(guò)IPTV進(jìn)行收視分析,避免了抽樣帶來(lái)的誤差問(wèn)題,直接反映了用戶的真實(shí)收視情況。結(jié)合現(xiàn)有大數(shù)據(jù)技術(shù),能夠“好、快、省”的得到真實(shí)、客觀、準(zhǔn)確的電視收視情況。
IPTV收視分析的優(yōu)勢(shì)在于數(shù)據(jù)源大而全,能夠深度挖掘數(shù)據(jù)含義,更客觀、更及時(shí)、更精細(xì)、更準(zhǔn)確地反映用戶的行為。
在用戶使用IPTV業(yè)務(wù)的過(guò)程中,用戶的每一個(gè)使用動(dòng)作每一個(gè)行為都會(huì)被系統(tǒng)自動(dòng)記錄下來(lái),無(wú)需額外的人工記錄,避免了人工干預(yù)的不確定性,在原始數(shù)據(jù)上最大程度的保證了用戶產(chǎn)生數(shù)據(jù)的客觀性。另一方面,IPTV采用的是全樣本分析,無(wú)須復(fù)雜的樣本抽取,使得每一份數(shù)據(jù)本身都具有說(shuō)話的能力,從而使相應(yīng)的統(tǒng)計(jì)分析都站在所有數(shù)據(jù)的基礎(chǔ)上,真實(shí)、客觀的反映收視結(jié)果。
傳統(tǒng)收視調(diào)查有一部分采用日記卡的方式記錄收視行為,相應(yīng)的收視數(shù)據(jù)要事后才能錄入統(tǒng)計(jì)系統(tǒng),這就使得分析結(jié)果有一定的滯后性。而IPTV不僅能實(shí)時(shí)采集用戶的收視行為,還能實(shí)時(shí)傳回用戶收視行為數(shù)據(jù),這使得數(shù)據(jù)的分析和反饋更及時(shí)、更快速。另一方面,傳統(tǒng)數(shù)據(jù)分析在處理大量數(shù)據(jù)時(shí),都需要確立明確的對(duì)應(yīng)關(guān)系,非常依賴模型、算法以及服務(wù)器性能。而IPTV收視分析可以采用大數(shù)據(jù)分布式運(yùn)算技術(shù),徹底改變了對(duì)于建模和算法的依賴,能夠根據(jù)數(shù)據(jù)實(shí)時(shí)性的需要,實(shí)時(shí)取得分析結(jié)果,節(jié)省了大量的時(shí)間消耗和資源投入,大大地增強(qiáng)了IPTV收視數(shù)據(jù)處理的時(shí)效性。
得益于IT系統(tǒng)的優(yōu)勢(shì),IPTV收視分析能夠?qū)?shù)據(jù)采集精確到秒。從圖1的收視日志信息中可以看出,用戶觀看的信息精確到秒級(jí),每一次換臺(tái)操作都記錄了下來(lái)。有了秒級(jí)的數(shù)據(jù),就可以做出精細(xì)到秒級(jí)的收視分析。這帶來(lái)的好處顯而易見,顆粒度精細(xì)到秒級(jí)的數(shù)據(jù)分析對(duì)節(jié)目制作、編排、播出、影響力等的研究都將帶來(lái)革命性的成果。
收視分析的樣本量一向是衡量準(zhǔn)確度的首要條件,IPTV收視數(shù)據(jù)得益于龐大的樣本量,通過(guò)這些客觀真實(shí)的數(shù)據(jù)可以準(zhǔn)確的分析出用戶的收視行為趨勢(shì)。當(dāng)數(shù)據(jù)越來(lái)越大時(shí),無(wú)需精準(zhǔn)的算法,只要擁有無(wú)限多的樣本量,就能將偏離值的影響降到最低,得到最為接近事實(shí)的結(jié)論。個(gè)別用戶或者小部分用戶的特殊收視行為,由于數(shù)量級(jí)小,難以對(duì)整體收視趨勢(shì)產(chǎn)生影響,所以IPTV大數(shù)據(jù)更適合于收視率統(tǒng)計(jì)這一類整體收視情況的計(jì)算,所得出的結(jié)果也更準(zhǔn)確更接近于事實(shí)。
雖然IPTV大數(shù)據(jù)應(yīng)用于收視分析具有諸多先天優(yōu)勢(shì),但是在電視收視分析領(lǐng)域,還需要進(jìn)一步發(fā)展,以解決以下問(wèn)題:
目前的IPTV行為數(shù)據(jù),采集的是機(jī)頂盒端的使用操作記錄,只能具體到戶,不能具體到人。也就是說(shuō),目前的技術(shù)可以采集到一家人使用IPTV機(jī)頂盒的所有數(shù)據(jù),但是暫時(shí)無(wú)法區(qū)分某一時(shí)間拿著遙控的是長(zhǎng)輩、年輕人還是兒童。這種用戶身份數(shù)據(jù)的缺失會(huì)影響受眾分析,導(dǎo)致缺乏合適的數(shù)據(jù)源支撐精準(zhǔn)的受眾分析[3]。
這是目前IPTV大數(shù)據(jù)收視分析所面臨的主要問(wèn)題之一。當(dāng)然在技術(shù)上是有辦法解決的,只要解決用戶資料收集和用戶身份識(shí)別這兩個(gè)方面的問(wèn)題,用戶的身份數(shù)據(jù)及其對(duì)應(yīng)的行為數(shù)據(jù)就能夠準(zhǔn)確的獲取,加上龐大的用戶數(shù)據(jù)量及準(zhǔn)確到秒級(jí)的使用記錄,將能夠做出更加準(zhǔn)確、更加精細(xì)的受眾分析。
用戶資料收集有主動(dòng)及被動(dòng)兩種方式:主動(dòng)方式采取用戶主動(dòng)填寫資料的方式,可以在裝機(jī)時(shí)填寫也可以在使用的過(guò)程中通過(guò)在線調(diào)查問(wèn)卷的方式填寫提交;而被動(dòng)方式則可以通過(guò)收集用戶使用數(shù)據(jù),智能分析用戶的使用行為進(jìn)而對(duì)用戶進(jìn)行畫像,將用戶的身份數(shù)據(jù)不斷具象化。當(dāng)然主動(dòng)方式準(zhǔn)確率高但操作繁瑣,被動(dòng)方式用戶無(wú)感知但準(zhǔn)確率有待提高,可以采用主被動(dòng)相結(jié)合的方式取得最好的效果。在另一個(gè)問(wèn)題上:用戶身份識(shí)別,也可以采用主動(dòng)及被動(dòng)兩種技術(shù)手段來(lái)解決:主動(dòng)方式由用戶自主創(chuàng)建賬號(hào)主動(dòng)登錄來(lái)確認(rèn)用戶身份;被動(dòng)方式可以采用智能識(shí)別手段來(lái)識(shí)別用戶身份,比如利用機(jī)頂盒攝像頭進(jìn)行人臉識(shí)別、遙控器加感應(yīng)器進(jìn)行指紋識(shí)別以及通過(guò)用戶使用行為進(jìn)行推導(dǎo)識(shí)別[4]等等。隨著技術(shù)的進(jìn)步,海量用戶的具象化問(wèn)題將很快能夠解決。
中國(guó)IPTV這幾年發(fā)展迅猛,用戶數(shù)已突破3000萬(wàn),但用戶群體集中在三網(wǎng)融合試點(diǎn)地區(qū),也就是在廣電企業(yè)及電信網(wǎng)絡(luò)相對(duì)較發(fā)達(dá)的地區(qū),并未全國(guó)覆蓋。所以,目前中國(guó)IPTV的用戶群體相對(duì)較為集中,尚不具備地域上的廣泛的電視收視的代表性。也就是說(shuō),IPTV的收視分析不能代表全國(guó)所有觀眾的收視習(xí)慣,只能客觀的反應(yīng)IPTV這一終端用戶群體的真實(shí)收視習(xí)慣,這既是IPTV收視分析的局限性,也是IPTV收視分析的精準(zhǔn)性。當(dāng)然,中國(guó)IPTV仍處在高速發(fā)展期。2015年是國(guó)家三網(wǎng)融合政策從試點(diǎn)走向全國(guó)推廣的重要時(shí)期,按照目前的發(fā)展趨勢(shì),未來(lái)中國(guó)IPTV不管在用戶規(guī)模上、覆蓋地區(qū)上都將迅速發(fā)展,從而推動(dòng)IPTV收視分析的影響力不斷擴(kuò)大。
區(qū)別于傳統(tǒng)的收視率調(diào)查方式及收視分析方式,IPTV基于大數(shù)據(jù)的技術(shù)特點(diǎn),意味著IPTV的收視率不完全等同于傳統(tǒng)抽樣調(diào)查收視率。用傳統(tǒng)的收視率等指標(biāo)定義來(lái)套用,會(huì)限制IPTV收視分析的效果及范圍。這個(gè)時(shí)候需要根據(jù)大數(shù)據(jù)的數(shù)據(jù)特點(diǎn),定義新的指標(biāo)體系,來(lái)更全面的評(píng)估節(jié)目收視效果、分析用戶收視行為。比如,結(jié)合時(shí)移、回放、快進(jìn)、快退等互動(dòng)特點(diǎn),定義節(jié)目到達(dá)率、收看完整度、跳出率等新的指標(biāo),以達(dá)到多維度全方位的分析評(píng)估節(jié)目收視效果[5]。這需要電視業(yè)界的共同努力,引入新的指標(biāo),才能更客觀更全面的評(píng)價(jià)節(jié)目收視效果,為電視廣告、電視節(jié)目制作帶來(lái)更全面的參考指標(biāo)。
IPTV因其基于IP網(wǎng)絡(luò)的特點(diǎn),天生具有雙向互動(dòng)的優(yōu)勢(shì),能夠采集到所有用戶的行為數(shù)據(jù)?;谶@些數(shù)據(jù)源基礎(chǔ)上形成的IPTV大數(shù)據(jù)收視分析,相比傳統(tǒng)的收視統(tǒng)計(jì)手段,具有更客觀、更準(zhǔn)確、更及時(shí)、更精細(xì)等特點(diǎn),同時(shí)得益于更豐富的數(shù)據(jù)源,可以分析出更多維度的收視指標(biāo)。目前,IPTV大數(shù)據(jù)技術(shù)雖有優(yōu)勢(shì),但也存在不足,由其特性所決定,其產(chǎn)生的收視分析結(jié)果不能完全替代傳統(tǒng)的收視分析結(jié)果,而是提供了新的參照系、新的指標(biāo),并且隨著技術(shù)的進(jìn)步,IPTV大數(shù)據(jù)分析將能做出更具有針對(duì)性、更加準(zhǔn)確的分析結(jié)果。如能利用好IPTV大數(shù)據(jù)收視分析的特點(diǎn)及優(yōu)勢(shì),將能更好地為節(jié)目制作、播出效果分析服務(wù),這項(xiàng)技術(shù)的應(yīng)用前景一片光明。
[1]王蘭柱.收視率調(diào)查與應(yīng)用手冊(cè)[M].北京:中國(guó)傳媒大學(xué)出版社,2012.
[2]魏凱.IPTV國(guó)際標(biāo)準(zhǔn)化綜述[J].電信網(wǎng)技術(shù),2010,3(3).
[3]王欣.基于生活形態(tài)的IPTV用戶使用行為研究[D].上海:華東師范大學(xué),2010.
[4]艾丹祥.基于數(shù)據(jù)挖掘的客戶智能研究[D].湖北:武漢大學(xué),2007.
[5]趙靚.IPTV的運(yùn)營(yíng)模式分析及研究[D].北京:北京郵電大學(xué),2007.