摘 要:大數(shù)據(jù)價值創(chuàng)造的關鍵在于大數(shù)據(jù)的應用,隨著大數(shù)據(jù)技術飛速發(fā)展,大數(shù)據(jù)應用已經(jīng)融入各行各業(yè)。對于通信公司的5G數(shù)字內(nèi)容推薦模型的研究就是大數(shù)據(jù)應用的一個實例。5G數(shù)字內(nèi)容推薦模型主要從客戶數(shù)字偏好行為角度出發(fā),對用戶收視數(shù)據(jù)進行統(tǒng)計分析和圖形化畫像展示,精準顯示其活躍度、付費行為、收視內(nèi)容與欄目的偏好等信息。同時,通過大數(shù)據(jù)信息規(guī)整,對全部用戶群體進行典型畫像描述,便于管理人員和運營人員更加知曉用戶行為習慣和喜好信息。
關鍵詞: 大數(shù)據(jù)技術 "大數(shù)據(jù)應用 "5G數(shù)字內(nèi)容推薦模型 "5G信息技術
中圖分類號:TN929.5;TP311.13
The Application of Big Data Technology in 5G Digital Content Recommendation Model
DAI Yiwen
Shanghai University of Medicine amp; and Health Sciences, Shanghai, 201318 China
Abstract: The key to creating value through big data lies in its application. With the rapid development of big data technology, big data applications have been integrated into various industries. The research on 5G digital content recommendation models for communication companies is an example of big data applications. The 5G digital content recommendation model mainly starts from the perspective of customer digital preference behavior, conducts statistical analysis and graphical portrait display of user viewing data, and accurately displays information such as activity, payment behavior, viewing content, and program preferences. At the same time, by organizing big data information and providing typical portrait descriptions of all user groups, it is easier for managers and operatorsfacilitates management and operation personnel to better understand user behavior habits and preferences.
Key Wwords: Big data technology; Big data application; 5G digital content recommendation model; 5G iInformation tTechnology
隨著大數(shù)據(jù)技術的飛速發(fā)展,大數(shù)據(jù)的應用是大數(shù)據(jù)價值創(chuàng)造的關鍵所在[1],并且大數(shù)據(jù)的應用已經(jīng)融入社會的各個行業(yè),5G信息技術的推廣也離不開大數(shù)據(jù)的支持[2]。為了保證營銷資源的精準投放和充分利用,需要進行數(shù)據(jù)探索分析,確定優(yōu)先的目標客戶群體,進一步篩選出迫切需要或者有潛在需求的目標客戶群體。為提升當前的5G數(shù)字內(nèi)容運營效果,達到用戶訴求與運營需求的平衡[3],基于當前的用戶數(shù)據(jù)包深度分析技術(Deep Packet"Inspection,DPI[wl3]"[L4]")解析數(shù)據(jù)、數(shù)字內(nèi)容類標簽數(shù)據(jù)和大屏影視媒體資源信息[4],建立5G數(shù)字內(nèi)容推薦模型,達到“數(shù)字內(nèi)容+大數(shù)據(jù)”的科學結(jié)合[5],實現(xiàn)千人千面的智能推薦,為5G時代的數(shù)字業(yè)務提供最佳的輔助運營解決方案[6]。因此,大數(shù)據(jù)技術在5G數(shù)字內(nèi)容推薦模型中的應用是十分重要的。
1 "應用大數(shù)據(jù)技術建立5G數(shù)字內(nèi)容推薦模型
算法中5G數(shù)字內(nèi)容推薦模型,基于數(shù)字內(nèi)容的個性化推薦可以分為4類,分別是顯式的標簽特征推薦、向量式的偏好特征推薦、基于協(xié)同過濾的相似用戶推薦和當前熱點內(nèi)容推薦。
1.1 "顯式的標簽特征推薦
如果數(shù)字內(nèi)容是由標簽來描述的,那么這些標簽可以用來表征數(shù)字內(nèi)容。用戶的偏好畫像也可以基于用戶對數(shù)字內(nèi)容的行為打上對應的標簽。以寬帶電視上的電影推薦來舉例,如果用戶過去看了科幻和恐怖兩類電影,那么恐怖、科幻就是用戶的偏好標簽。每個數(shù)字內(nèi)容的標簽可以是包含權(quán)重的,而用戶對數(shù)字內(nèi)容的操作行為也是有權(quán)重的,從而用戶的偏好標簽是有權(quán)重的。在具體推薦時,可以將用戶的偏好標簽關聯(lián)到的數(shù)字內(nèi)容推薦給用戶。
1.2 "向量式的偏好特征推薦
進行向量式的偏好特征推薦需要3個步驟,分別是:構(gòu)建數(shù)字內(nèi)容特征、構(gòu)建用戶特征、基于用戶及數(shù)字內(nèi)容特征為用戶推薦數(shù)字內(nèi)容。[wl5]"[L6]
1.2.1 "構(gòu)建數(shù)字內(nèi)容特征
將標簽按序排列,每個標簽看成一個維度,每個數(shù)字內(nèi)容可用一個N維向量(N是標簽的個數(shù))來表示,若數(shù)字內(nèi)容包含某個標簽,向量在相應標簽的分量上的值為1,否則為0,即轉(zhuǎn)化為機器學習中的獨熱編碼(one-hot code)。數(shù)字內(nèi)容向量可通過余弦相似度方法計算用戶潛在的偏好內(nèi)容。
1.2.2 "構(gòu)建用戶特征
用戶的偏好向量的構(gòu)建,可以通過該用戶點擊、瀏覽的數(shù)字內(nèi)容所對應向量的平均向量來表示。[wl7]"[L8]"多種策略[wl9]"[L10]"可以用來表示用戶偏好向量,比如:基于用戶對操作過的數(shù)字內(nèi)容的評分以及時間加權(quán)來獲取用戶的加權(quán)偏好向量,而不是直接取平均。
根據(jù)用戶操作過的數(shù)字內(nèi)容之間的相似度,為用戶構(gòu)建多個偏好向量(比如對數(shù)字內(nèi)容聚類,用戶在某一類上操作過的向量均值作為用戶在這個類別上的偏好向量),以更好地表達用戶多方位的興趣偏好。
根據(jù)用戶的偏好向量及數(shù)字內(nèi)容特征向量,基于向量相似性,計算用戶對數(shù)字內(nèi)容的偏好度,再基于偏好度大小為用戶推薦數(shù)字內(nèi)容。
1.2.3 "基于數(shù)字內(nèi)容特征為用戶推薦數(shù)字內(nèi)容[wl11]"[L12]"
通過向量的余弦相似度計算用戶與數(shù)字內(nèi)容之間的相似度。根據(jù)用戶對每個數(shù)字內(nèi)容的相似度,基于相似度降序排列,取TopN推薦給用戶。
余弦相似度計算公式:
式(1)中:x表示用戶變量,y表示數(shù)字內(nèi)容變量。
1.3 "基于協(xié)同過濾的相似用戶推薦
協(xié)調(diào)過濾是比較成熟且應用比較廣泛的推薦技術,它不僅有堅實的理論基礎,更有很強的現(xiàn)實意義。推薦系統(tǒng)核心是預測用戶對物品的喜歡程度。
協(xié)同過濾也稱為社會過濾,它計算用戶間偏好的相似性,在相似用戶的基礎上自動的為目標用戶進行過濾和篩選,其基本思想為具有相同或相似的價值觀、思想觀、知識水平和興趣偏好的用戶,其對信息的需求也是相似的。因此,相對于傳統(tǒng)的推薦方法,協(xié)同過濾技術體現(xiàn)出的一個顯著的優(yōu)勢是能夠推薦一些難以進行內(nèi)容分析的項目,如信息質(zhì)量、個人品味等抽象的資源對象。協(xié)同過濾技術能夠有效使用其他興趣相似用戶的評價信息,從而利用較少的用戶反饋,加快個性化學習的速度,同時也利于發(fā)現(xiàn)用戶的隱藏興趣。
1.4 "當前熱點內(nèi)容推薦
1.4.1" 熱點內(nèi)容庫建設[wl15]"[L16]"
基于網(wǎng)關的DPI解析規(guī)則,按照性別、年齡、地域、流量、競品、競品付費用戶、內(nèi)容類別等不同維度在統(tǒng)計期內(nèi)(日、周、月)來統(tǒng)計每個維度用戶使用的(如:視頻類App、音樂類App、閱讀類App、游戲類App)Top 1000的內(nèi)容明細;實現(xiàn)多維度組合并按日、周、月統(tǒng)計、分析出用戶使用的Top 1 000(視頻類App、音樂類App、閱讀類App、游戲類App)熱點內(nèi)容。
1.4.2" 熱點內(nèi)容推薦算法
根據(jù)熱點內(nèi)容庫保存的視頻、閱讀、音樂、游戲四大類業(yè)務,各按維度劃分的熱門(TOP 100)的內(nèi)容。
對視頻、閱讀、游戲、音樂四大類業(yè)務的使用用戶數(shù),按維度及組合分類統(tǒng)計,用戶量從高到低排序,取前100的內(nèi)容形成熱點內(nèi)容集合,整合去重后生成當前各組合用戶的熱點數(shù)字內(nèi)容進行推薦。
2 "模型輸入
5G數(shù)字內(nèi)容推薦模型須輸入的用戶數(shù)字內(nèi)容標簽見表1。
利用用戶行為數(shù)據(jù)對用戶進行畫像處理,需要各種用戶行為數(shù)據(jù),包括搜索、點擊、播放、展現(xiàn)、功能使用、訂購等行為。利用本網(wǎng)媒體資源數(shù)據(jù)對用戶進行畫像處理,同時需要各種影視媒資數(shù)據(jù)提供標簽,構(gòu)造熱點內(nèi)容庫詳見表2。
3 "模型輸出
5G數(shù)字內(nèi)容推薦模型輸出用戶對影視內(nèi)容的個性化消費需求,做到更細致、更精準的數(shù)據(jù)庫營銷,具體模型輸出要素詳見表3。
4 "應用場景
從客戶數(shù)字偏好行為角度出發(fā),在5G數(shù)字內(nèi)容推薦模型中應用大數(shù)據(jù)技術,對用戶收視數(shù)據(jù)進行統(tǒng)計分析和圖形化畫像展示,精準顯示其活躍度、付費行為、收視內(nèi)容與欄目的偏好等信息。同時,通過大數(shù)據(jù)信息規(guī)整,對全部用戶群體進行典型畫像描述,便于管理人員和運營人員更加知曉用戶行為習慣和喜好信息。
5" 標簽輸出
5G數(shù)字內(nèi)容推薦模型可提供如下新增標簽(見表4)。
6 "結(jié)語
把大數(shù)據(jù)技術應用在5G數(shù)字內(nèi)容推薦模型中,從而進行深度商業(yè)挖掘,精準視頻營銷,在對客戶分群知悉的基礎上,把握用戶對影視內(nèi)容的個性化消費需求,做到更細致、更精準的數(shù)據(jù)庫營銷:結(jié)合集中運營平臺,生成個性化的點播單,為電視和手機視頻用戶推薦具有高度相關性的其他[A26]"[L27]"節(jié)目。[A28]"[L29]
參考文獻
[1] 盤和林,鄧思堯,韓至杰.5G大數(shù)據(jù)[wl30]"[L31]"—數(shù)據(jù)資源賦能中國經(jīng)濟[M].北京:中國人民大學出版社,2021.
[2] CICIOGLU M.Performance Analysis of Handover Management in 5G Small Cells [J].Computer Standards amp; Interfaces,2021,75:103502.
[3] 徐海霞.基于大數(shù)據(jù)的5G網(wǎng)絡性能分析與優(yōu)化策略[J] .信息系統(tǒng)工程,2024(11):80-83.
[4] 龔達寧,王雪梅,曹磊.全球5G商用發(fā)展及趨勢展望[J].信息通信技術與政策,2020(12):7-10.
[5] 武軼敏.大數(shù)據(jù)在智慧城市建設中的應用探究[J].新城建科技,2024,33(10):48-50.
[6] WU Y L,MA Y X,DAI H N,et al.Deep Learning for Privacy Preservation in Autonomous Moving Platforms Enhanced 5G Heterogeneous Networks[J].Computer Networks,2020,185(7):107743.