莊昌武
(作者單位:江蘇省廣電有線信息網(wǎng)絡(luò)股份有限公司淮安分公司)
大數(shù)據(jù)在廣電網(wǎng)絡(luò)運營工作上的應(yīng)用
莊昌武
(作者單位:江蘇省廣電有線信息網(wǎng)絡(luò)股份有限公司淮安分公司)
隨著廣電雙向網(wǎng)絡(luò)的不斷完善,互動用戶數(shù)量不斷上升,廣電大數(shù)據(jù)迎來新的發(fā)展階段。本文針對廣電大數(shù)據(jù)的運營工作,從數(shù)據(jù)采集,到數(shù)據(jù)應(yīng)用進(jìn)行了系統(tǒng)全面的分析,對廣電大數(shù)據(jù)運營具備一定的指導(dǎo)意義。
大數(shù)據(jù);采集;用戶流失;聚類;HADOOP技術(shù)
從廣電行業(yè)來看,大數(shù)據(jù)的特點有三個方面:第一,數(shù)據(jù)體量巨大,從GB級別,躍升到TB級別;第二,數(shù)據(jù)類型繁多,涉及到數(shù)據(jù)采集對象的狀態(tài)信息、日志、各類操作信息乃至地理位置信息等;第三,處理速度快,實時采集和處理數(shù)據(jù),并及時完成數(shù)據(jù)的呈現(xiàn)工作。
本文從廣電網(wǎng)絡(luò)運營商運營管理的角度,對大數(shù)據(jù)技術(shù)的實際應(yīng)用進(jìn)行一些探討。
隨著國家三網(wǎng)融合的發(fā)展,廣電數(shù)字電視網(wǎng)絡(luò)平臺逐步從單向網(wǎng)絡(luò)改造成雙向網(wǎng)絡(luò),業(yè)務(wù)的重心也逐步向雙向業(yè)務(wù)偏移。雙向電視業(yè)務(wù)的推廣,數(shù)字電視用戶和業(yè)務(wù)的快速增長,運營商迫切需要實現(xiàn)對終端設(shè)備可管可控、用戶行為可感知,以便深入、實時地掌握網(wǎng)絡(luò)和設(shè)備運行狀態(tài),了解用戶的行為和習(xí)慣。
廣電數(shù)字電視運營大數(shù)據(jù)分析涉及到的數(shù)據(jù)量較大且廣,一般來說,需綜合以下幾類數(shù)據(jù)(見表1)。
表1 廣電數(shù)字電視運營大數(shù)據(jù)分析
2.1 助力客戶經(jīng)理預(yù)測用戶流失
根據(jù)用戶(包括VIP用戶)在線率,收視時長,業(yè)務(wù)分布等信息,通過數(shù)據(jù)模型測算出用戶流失傾向,并可按需排名輸出報表,使客戶經(jīng)理及時掌握所服務(wù)區(qū)域用戶的第一手信息。
在給客戶經(jīng)理下達(dá)推廣付費頻道節(jié)目包和點播訂購包的任務(wù)后,如果不能提供及時有效的工具,則客戶經(jīng)理很難完成任務(wù),且工作效率低下。每月對退網(wǎng)的用戶進(jìn)行持續(xù)的歷史軌跡分析,結(jié)合BOSS系統(tǒng)里的賬單數(shù)據(jù),設(shè)定退網(wǎng)客戶模型。定期對不活躍用戶進(jìn)行模型匹配分析,并導(dǎo)出報表??蛻艚?jīng)理每周安排一定的時間,對可能退網(wǎng)客戶進(jìn)行電話拜訪或上門拜訪,了解用戶需求,進(jìn)行用戶挽留工作,減少用戶流失。
2.2 助力客戶經(jīng)理分析用戶喜好
大數(shù)據(jù)分析能夠根據(jù)BOSS,客服中心,收視行為等數(shù)據(jù)進(jìn)行用戶個體畫像,掌握用戶日常喜愛收看的節(jié)目類型和頻道類型,以及對最新大片的可能購買度,讓客戶經(jīng)理能挑出最有可能購買產(chǎn)品的前20%的用戶,采取上門拜訪或電話推廣的方式,迅速有效地達(dá)成交易,以達(dá)到精準(zhǔn)營銷的目的。
2.3 助力內(nèi)容精準(zhǔn)推送
內(nèi)容精準(zhǔn)推送是廣電運營商最為常見的大數(shù)據(jù)分析應(yīng)用。傳統(tǒng)的內(nèi)容推送本質(zhì)上還是一種廣播式的。借助于大數(shù)據(jù)平臺能力,根據(jù)用戶的個體畫像,運用商可以制定出精準(zhǔn)的推送策略,將用戶最感興趣的內(nèi)容放置到最容易獲取的地方,實現(xiàn)精準(zhǔn)營銷。
2.4 助力廣告運營
開機(jī)畫面廣告、頻道Banner條廣告、音量調(diào)節(jié)畫面廣告是廣電網(wǎng)絡(luò)運營商最主要的廣告形式。用戶行為分析數(shù)據(jù)報告能給廣電運營商提供充足的數(shù)據(jù)支撐,幫助運營商根據(jù)收看率高低、用戶收看時間等條件,把開機(jī)畫面廣告、頻道Banner條廣告和音量調(diào)節(jié)畫面廣告按照區(qū)域、時段和收視熱度分組打包,精細(xì)化運營廣告資源。例如,把60多個公共頻道按收視率高低,優(yōu)劣互相組合,形成資源較均衡的5個廣告包;再如,把開機(jī)畫面廣告按照不同的時間段運營,根據(jù)小學(xué)生放學(xué)時間、晚間8點檔和晚間11點之后的電視受眾不同而投放不同的廣告。
由于廣電數(shù)字電視運營大數(shù)據(jù)分析涉及到的數(shù)據(jù)量較大且廣,運用當(dāng)前流行的HADOOP技術(shù),通過對以上信息的綜合分析處理,在廣電的運營工作中,具有重要的應(yīng)用價值。有線運營商運用的典型的HADOOP平臺架構(gòu)如圖1所示。
4.1 案例背景
隨著云媒體平臺的深入發(fā)展和業(yè)務(wù)的高速增長,新的應(yīng)用系統(tǒng)和信息資源的加入,業(yè)務(wù)環(huán)境日益復(fù)雜,運營難度日益增長,業(yè)務(wù)增長的壓力越來越大,通過更準(zhǔn)確、及時地了解業(yè)務(wù)的使用情況,了解用戶的使用習(xí)慣和收視喜好,了解用戶在整個收視周期的業(yè)務(wù)的使用情況,可以為業(yè)務(wù)的經(jīng)營提供有效的決策支持。系統(tǒng)的部署可以實現(xiàn)以下幾個方面。第一,用戶收視喜好分析,分析集團(tuán)用戶、VIP用戶、收費用戶、普通用戶和平房用戶所關(guān)注的終端節(jié)目類型,通過挖掘用戶的收視行為,為客戶經(jīng)理推廣業(yè)務(wù)提供數(shù)據(jù)支撐。實現(xiàn)用戶收視節(jié)目排行、不同終端類型(標(biāo)清付費、標(biāo)清免費、高清付費和高清免費)等業(yè)務(wù)的占比,并在用戶收視行為的基礎(chǔ)之上通過對用戶收視行為的聚類挖掘,實現(xiàn)用戶喜好的深入分析并對經(jīng)營業(yè)務(wù)的推廣提供建議和支持。第二,通過引入數(shù)據(jù)挖掘技術(shù)實現(xiàn)對于用戶流失的分析,基于技術(shù)、價格、質(zhì)量和交費渠道等多個維度,進(jìn)行用戶的畫像,用戶價值的分析,實現(xiàn)用戶的流失的分析,和相關(guān)的數(shù)據(jù)輸出,為業(yè)務(wù)的定向營銷提供支撐。第三,系統(tǒng)提供報表輸出功能,通過實現(xiàn)用戶的業(yè)務(wù)數(shù)據(jù)及所屬標(biāo)簽的查詢,并提供報表的定時推送。
圖1 HADOOP平臺架構(gòu)
圖2 云數(shù)據(jù)處理平臺架構(gòu)
4.2 案例主要技術(shù)路線
平臺需要實現(xiàn)對于30萬用戶每天近千萬量級的用戶行為的數(shù)據(jù)分析,提供收視維度的各種信息的統(tǒng)計分析和挖掘工作;同時,根據(jù)用戶業(yè)務(wù)的需求,提供用戶對于上述數(shù)據(jù)的跨時間端的各種統(tǒng)計分析結(jié)果的呈現(xiàn);同時,針對某種用戶的業(yè)務(wù),除提供宏觀的用戶數(shù)據(jù)的匯總外,還要進(jìn)一步提供對于宏觀數(shù)據(jù)的分區(qū)域,分用戶的數(shù)據(jù)的呈現(xiàn)。
從計算和挖掘的角度,系統(tǒng)需要有較快的處理速度,同時由于大數(shù)據(jù)源的要求,對于系統(tǒng)的處理吞吐量也的相應(yīng)的要求。存儲上,系統(tǒng)要滿足1年在線數(shù)據(jù)的業(yè)務(wù)在線查詢,同時查詢的“大海撈針”和全表掃描也對系統(tǒng)的處理能力提出了更高的要求,為保證對于海量用戶行為數(shù)據(jù)的處理的能力的要求,根據(jù)多年數(shù)據(jù)分析挖掘的經(jīng)驗,在基礎(chǔ)平臺引入了云數(shù)據(jù)處理平臺,如圖2所示。
4.3 平臺能力
平臺需要支持基于大數(shù)據(jù)平臺的常規(guī)數(shù)據(jù)挖掘算法,不同算法的時間復(fù)雜度不同,故不再做統(tǒng)一性能指標(biāo)要求,但大數(shù)據(jù)平臺自身的計算性能需要得到保證。大數(shù)據(jù)平臺的性能指標(biāo)應(yīng)在基準(zhǔn)測試中達(dá)到以下要求(見表2)。
4.4 數(shù)據(jù)模型
在確定一個用戶需求后,首先了解需求的應(yīng)用場景,針對用戶應(yīng)用場景,確定所需要的數(shù)據(jù)源。接著設(shè)計數(shù)據(jù)模型。當(dāng)然,還需要對數(shù)據(jù)源進(jìn)行清洗、整理甚至需要脫密脫敏,然后將它們匯總起來,形成這次分析任務(wù)的數(shù)據(jù)庫(數(shù)據(jù)倉庫)。以上只是數(shù)據(jù)建模的第一步,第二步需要數(shù)據(jù)訓(xùn)練。數(shù)據(jù)訓(xùn)練也是調(diào)整模型的方法之一。通常的做法是“前推后驗”和“塊狀切割”?!扒巴坪篁灐钡摹扒巴啤本褪峭ㄟ^過往的數(shù)據(jù)尋找特征值,以便消除干擾數(shù)據(jù),快速建立模型?!昂篁灐本褪歉鶕?jù)得出的模型,借助一定的數(shù)據(jù)往后推測,進(jìn)行驗證,尋找到最佳的結(jié)合點?!皦K狀切割”就是在數(shù)據(jù)量較大的情況下,從小樣本開始驗證,這樣驗證周期會變短,利于快速調(diào)整模型,反復(fù)多次的塊狀驗證后,再進(jìn)行大數(shù)量的驗證。數(shù)據(jù)建模耗時,甚至可以占到整個項目一半以上的時間。
表2 平臺能力指標(biāo)要求
表3 客戶類別結(jié)果
圖3 RFM計算流程
在該平臺中,采用RFM算法來預(yù)測分析客戶流失,具體計算流程如圖3所示。
4.5 客戶分類結(jié)果數(shù)據(jù)
第一步:選取客戶基礎(chǔ)信息數(shù)據(jù)。第二步:系統(tǒng)計算生成含RFM值的客戶數(shù)據(jù)集。第三步:將每個客戶的RFM值和總RFM平均值作比較。第四步:對聚類后的客戶分類結(jié)果進(jìn)行分析和解釋,以所有客戶的R、F、M值作為考核點,將所有的客戶的R、F、M值組合,一共出現(xiàn)8(23)種情況,根據(jù)各指標(biāo)所代表的含義,得到最終八種客戶類型,如表3所示。
對于廣電運營商而言,通過對大數(shù)據(jù)的挖掘分析,可以進(jìn)一步細(xì)分用戶,實現(xiàn)精準(zhǔn)產(chǎn)品營銷和個性化服務(wù)。繼而優(yōu)化廣電現(xiàn)有各業(yè)務(wù)的運營;同時,刺激運營商從數(shù)據(jù)中獲取潛在的用戶需求和市場,創(chuàng)新服務(wù)和商業(yè)模式。
大數(shù)據(jù)技術(shù)給廣電的運營工作帶來了很多有影響力的幫助,也改變了原有的工作流程,只有用好、用活、用足大數(shù)據(jù)技術(shù),才能更好地服務(wù)于客戶,在視頻運營的競爭中得到更多的市場份額。
莊昌武(1958-),男,江蘇淮安,本科,研究方向:廣播電視經(jīng)營管理。