• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于運營商大數(shù)據(jù)的游戲用戶畫像構(gòu)建研究

      2019-09-27 02:34:30歐陽秀平劉卉芳中國聯(lián)通廣東省分公司廣東廣州510627
      郵電設(shè)計技術(shù) 2019年9期
      關(guān)鍵詞:用戶群畫像愛好者

      歐陽秀平,廖 娟,馮 燁,劉卉芳(中國聯(lián)通廣東省分公司,廣東廣州510627)

      0 引言

      隨著5G時代和攜號轉(zhuǎn)網(wǎng)的到來,傳統(tǒng)通信業(yè)務(wù)帶來的收入驅(qū)動力逐漸下降,流量紅利窗口也即將關(guān)閉。如何挖掘自身優(yōu)勢以提升競爭力、減少用戶流失、發(fā)掘用戶的非通信價值成為三大運營商普遍關(guān)注的問題。在此背景下,深度挖掘用戶信息成為大數(shù)據(jù)時代的研究熱點。用戶畫像的定義是使用標(biāo)簽來表征用戶的屬性和特性,以達(dá)到描述用戶的目的,即用戶信息標(biāo)簽化,可以分為用戶屬性研究和用戶行為研究兩大內(nèi)容。用戶屬性包含年齡、性別、歸屬地、職業(yè)、學(xué)歷等基本信息,用戶行為類標(biāo)簽則是通過用戶的行為數(shù)據(jù)挖掘出用戶的行為習(xí)慣、興趣偏好等隱藏信息。各大互聯(lián)網(wǎng)公司都基于自身數(shù)據(jù)對用戶進(jìn)行建模分析,構(gòu)建用戶畫像系統(tǒng)[1-7]。但是,用戶畫像的構(gòu)建很大程度上依賴于業(yè)務(wù)目的和數(shù)據(jù)源,各個互聯(lián)網(wǎng)公司都只擁有用戶在自己平臺的行為數(shù)據(jù),在數(shù)據(jù)不共享的情況下,這些公司的用戶畫像都存在一定局限性。而運營商以號碼為主鍵可整合位置、上網(wǎng)、通信、終端等各類數(shù)據(jù),用戶數(shù)據(jù)的完整性是其他企業(yè)難以企及的,因此,基于運營商數(shù)據(jù)的用戶畫像可以實現(xiàn)更精準(zhǔn)的個性化推薦服務(wù),這是運營商最大的優(yōu)勢和競爭力,同時也能成為運營商流量變現(xiàn)的方式。

      通過對廣東聯(lián)通部分用戶的信息進(jìn)行數(shù)據(jù)挖掘,著重分析其APP使用行為,提出構(gòu)建APP畫像和用戶畫像的方法,為運營商深度了解用戶行為、實現(xiàn)異業(yè)合作、精準(zhǔn)營銷、增加后向收入提供參考。

      1 用戶畫像構(gòu)建框架

      運營商可利用用戶位置、上網(wǎng)、通信、終端等各類數(shù)據(jù)構(gòu)建用戶畫像,對用戶進(jìn)行個性化推薦,這樣不但可以為用戶提供更高質(zhì)量、更精準(zhǔn)的服務(wù),同時也為運營商提供流量變現(xiàn)的可靠方式,在運營商實現(xiàn)跨界的業(yè)務(wù)融合方面具有深遠(yuǎn)的意義和價值。目前,對運營商B域數(shù)據(jù)的研究相對成熟,許多學(xué)者基于用戶賬單數(shù)據(jù)構(gòu)建用戶個體畫像和群體畫像[8-11]。但是,對于運營商E域數(shù)據(jù)如APP上網(wǎng)日志數(shù)據(jù)的研究由于解析困難等原因起步較晚,目前仍屬于研究熱點[12-15]。

      整體來說,目前關(guān)于運營商用戶畫像研究存在以下問題:E域的APP上網(wǎng)日志數(shù)據(jù)沒有被充分挖掘;APP的分類主要靠人工標(biāo)注。針對上述現(xiàn)狀,提出構(gòu)建運營商特色用戶畫像全流程方法,其創(chuàng)新點主要有以下幾方面。

      a)通過爬蟲、NLP分詞等技術(shù)實現(xiàn)APP智能歸類打標(biāo),構(gòu)建APP畫像。通過APP畫像可以快速篩選出滿足任意給定特征屬性詞的所有APP,這不僅解決過去APP歸類需要大量人工標(biāo)注的問題,而且更快速、全面。

      b)通過挖掘APP上網(wǎng)日志數(shù)據(jù),引入用戶興趣時間衰減函數(shù),結(jié)合APP畫像,構(gòu)建用戶的興趣偏好畫像。

      用戶畫像具體構(gòu)建流程框架如圖1所示。首先,對E域通道數(shù)據(jù)進(jìn)行DPI解析得到用戶APP行為數(shù)據(jù),通過網(wǎng)絡(luò)爬蟲、分詞、正則匹配等技術(shù)挖掘互聯(lián)網(wǎng)數(shù)據(jù)得到APP屬性畫像,然后,將用戶的APP使用次數(shù)和流量等信息與APP畫像關(guān)聯(lián),從而挖掘用戶的興趣偏好,再結(jié)合B域數(shù)據(jù)如年齡、性別、地域等基本信息得到個體用戶畫像,最后對用戶的行為屬性標(biāo)簽進(jìn)行聚類整合,構(gòu)建出某一類用戶群體的整體特征,為行業(yè)洞察和差異化精準(zhǔn)營銷提供數(shù)據(jù)支撐。

      2 用戶畫像構(gòu)建實例——游戲行業(yè)

      以游戲行業(yè)為例闡述構(gòu)建運營商特色用戶畫像全流程方法。分析數(shù)據(jù)來自中國聯(lián)通廣東省分公司,隨機抽取1 000萬個用戶的基礎(chǔ)信息和其在2018年7月至2019年1月期間的上網(wǎng)日志進(jìn)行DPI解析,字段主要包括用戶ID、性別、年齡、地(市)、終端、APP名稱、APP使用起止時間、訪問次數(shù)、使用流量等,該數(shù)據(jù)完全符合大數(shù)據(jù)的4V特征:數(shù)據(jù)體量巨大(Volume)、內(nèi)容多樣化(Variety)、價值密度低(Value)、增長速度快(Velocity)。

      圖1 用戶畫像構(gòu)建框架

      2.1 APP畫像構(gòu)建過程

      APP畫像可以反映該APP的類別、功能等信息,其構(gòu)建方法如下:首先,通過搜索APP名稱,對APP官網(wǎng)和百度百科進(jìn)行網(wǎng)頁爬蟲得到關(guān)于該APP的信息,再通過NLP分詞、知識圖譜、正則匹配等方式沉淀一組該APP的屬性特征詞,最后通過統(tǒng)計詞頻、刪除無意義詞等方式得到APP畫像。

      通過上述方法構(gòu)建的屬性特征詞和APP是多對多的映射關(guān)系,共囊括2 306個有DPI用戶數(shù)據(jù)的APP和27 446個屬性詞。以游戲行業(yè)為例,共有330個APP被打上“游戲”標(biāo)簽,即被定義為“游戲APP”,將這部分游戲APP和其他APP的屬性詞做比較,可以得到392個游戲行業(yè)特有詞,通過統(tǒng)計每個高頻詞關(guān)聯(lián)APP的用戶規(guī)模,選取用戶量排名前9的屬性詞作為游戲特征類進(jìn)行重點分析,如表1所示。若需要分析其他特征屬性,方法流程類似。

      表1 游戲行業(yè)主流特征類別

      需要注意的是,一個APP有可能同時歸屬于多個類,例如“絕地求生:刺激戰(zhàn)場”既屬于MOBA類,又屬于FPS類。

      2.2 用戶畫像構(gòu)建過程

      由于各APP的訪問次數(shù)、流量、時長等信息因性質(zhì)不同不具有可比性,需要對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。采用“min-max標(biāo)準(zhǔn)化”方法,將變量的原始值映射成[0,1]之間的值,其公式為:

      式中:

      X*——標(biāo)準(zhǔn)化后的值

      X——原始值

      Xmin——該指標(biāo)的最小值

      Xmax——該指標(biāo)的最大值

      通過構(gòu)建用戶偏好得分模型將用戶游戲偏好劃分為5檔(0~4),分別代表非玩家、試探玩家、一般玩家、核心玩家、塔尖玩家。偏好畫像的得分應(yīng)滿足以下3個條件。

      a)用戶在此特征屬性類中的APP上操作越多,得分越高。

      b)用戶對各個特征類的喜好程度不同可以通過偏好得分區(qū)間體現(xiàn)。

      c)越久遠(yuǎn)的用戶數(shù)據(jù)對得分的影響越小。

      由于用戶的興趣愛好具有很強的時效性,根據(jù)艾賓浩斯遺忘曲線,用戶產(chǎn)生行為時的時間戳t與用戶興趣的相關(guān)性函數(shù)定義如式(2)所示。

      式中:

      a、b——興趣衰減參數(shù)

      T——當(dāng)前時間,顯然,當(dāng)t=T時,p(t)=1達(dá)到最大值

      若假設(shè)a=1/8,b=1/2,則用戶興趣的時間衰減系數(shù)16天衰減一半,64天衰減完畢。具體參數(shù)的設(shè)置可以根據(jù)業(yè)務(wù)需求而定。

      構(gòu)建用戶偏好得分公式如下

      式中:

      PV(t,APPi)——第 t天 APPi的訪問次數(shù),已通過式(1)進(jìn)行標(biāo)準(zhǔn)化處理

      time(t,APPi)——第t天APPi的使用時長,已通過式(1)進(jìn)行標(biāo)準(zhǔn)化處理

      GPRS(t,APPi)——表示第 t天 APPi的使用流量,已通過式(1)進(jìn)行標(biāo)準(zhǔn)化處理

      w1、w2、w3——權(quán)重系數(shù)

      p(t)——時間衰減系數(shù),具體計算如式(2)所示

      通過式(3)對每個用戶在各類游戲中的表現(xiàn)進(jìn)行打分,并劃分為5個等級:top25%的為“塔尖玩家”,top25%~50%的為“核心玩家”,top50%~75%的為“一般玩家”,top75%以下的為“試探玩家”以及不玩這類游戲的“非玩家”。定義“塔尖玩家”和“核心玩家”為“愛好者”。

      2.3 群體畫像分析

      群體用戶畫像是基于單個用戶畫像實例,將某一特征屬性相似的用戶群作為整體進(jìn)行分析,從而得到該用戶群的屬性、行為特征。以表1中的9個特征屬性為例,從基礎(chǔ)信息和行為信息兩大方面構(gòu)建這9個特征愛好者用戶群的群體畫像,若需要分析其他用戶群,方法流程與此類似。

      2.3.1 基礎(chǔ)信息畫像

      對9個特征群體的性別分別進(jìn)行統(tǒng)計,結(jié)果如圖2所示。所有有上網(wǎng)行為的用戶中,男性占比為67%,與這個基準(zhǔn)值相比,消除類游戲愛好者中女性玩家更多,其他類則是男性玩家占比更多。因此消除類APP應(yīng)更注重女性體驗,其他類游戲APP應(yīng)更看重男性視角,從而增加用戶黏性、吸引新用戶。

      圖2 不同類型手游玩家群體性別分布

      年齡分布如圖3所示。通過機器學(xué)習(xí)聚類算法,可以將9個特征群體分為2類,一類為策略、模擬、棋牌、仙俠、消除類游戲愛好者,年齡主要分布在18~33歲,同時在38~53歲的用戶群中也有一定市場,說明這幾類APP更偏向“老少皆宜”;另一類如FPS、MOBA、RPG、桌游類游戲愛好者,年齡主要集中在18~26歲,相比第1類更為“年輕化”,這幾類APP可以著重向在校生和職場新人推薦。

      通過統(tǒng)計終端信息,發(fā)現(xiàn)99.9%的游戲愛好者使用4G終端,終端品牌分布如圖4所示。以全部上網(wǎng)用戶的終端分布為基準(zhǔn),可以看出各個用戶群的終端偏好。其中,策略、棋牌類愛好者更偏好蘋果手機,F(xiàn)PS、MOBA類愛好者更偏愛華為、OPPO、VIVO、小米四大品牌,同時可以發(fā)現(xiàn)OPPO用戶大多喜歡玩游戲。運營商在推廣對應(yīng)權(quán)益產(chǎn)品時,可以參考這些信息進(jìn)行終端合約營銷。

      圖3 不同類型手游玩家群體年齡分布

      圖4 不同類型手游玩家群體終端品牌分布

      2.3.2 行為信息畫像

      選取2018年8月至2019年1月的數(shù)據(jù),統(tǒng)計各類游戲玩家平均每月花在該類游戲上的時長,結(jié)果如圖5所示。MOBA類玩家每月花在MOBA類游戲上的時間最長,達(dá)22 h,其次為消除類和仙俠類。數(shù)據(jù)分析結(jié)果說明這幾類游戲的玩家相對黏性較高,愿意花時間和精力投入在這些游戲中。

      提取樣本用戶的上網(wǎng)日志的DPI解析數(shù)據(jù),計算每個小時的活躍用戶數(shù)占比,結(jié)果如圖6所示。通過機器學(xué)習(xí)聚類算法,將9個特征群體分為2類,一類為FPS、MOBA、策略、模擬類愛好者,晚高峰的活躍用戶數(shù)明顯高于午高峰,說明這類用戶群更偏愛在19點之后玩游戲,其次為11點—18點,在12點呈現(xiàn)小高峰。說明這類用戶群喜歡在一天的工作或?qū)W習(xí)結(jié)束之后再玩游戲。另一類為RPG、棋牌、仙俠、消除、桌游類愛好者,在11點—23點之間的活躍用戶數(shù)相對平穩(wěn),結(jié)合這類游戲性質(zhì),可以解釋為這類用戶群偏愛利用碎片化時間,即有空就玩一兩局,或者直接掛機。

      整體來說,MOBA類游戲愛好者偏向男性化、年輕化,更喜歡用安卓機(華為、OPPO、VIVO),偏愛晚上玩游戲,月均游戲時長22 h。消除類游戲愛好者偏向女性化、中青年居多,更喜歡用OPPO、VIVO,晚高峰與午高峰持平,月均游戲時長21 h。因此MOBA類APP可以重點向使用安卓機的年輕男性推薦,并且在晚上開放限時優(yōu)惠等活動。而消除類APP可以重點向使用OPPO、VIVO的中青年女性推薦。其他游戲類別的分析與此類似。

      圖5 不同類型手游玩家群體月均游戲時長分布

      3 總結(jié)

      與互聯(lián)網(wǎng)公司數(shù)據(jù)相比,E域上網(wǎng)日志數(shù)據(jù)是運營商特有的數(shù)據(jù)源,基于此,本文提出一種構(gòu)建運營商特色用戶畫像的全流程方法,并以游戲行業(yè)為例進(jìn)行應(yīng)用示范。一方面,通過APP智能歸類打標(biāo)解決過去APP歸類需要大量人工標(biāo)注的問題,另一方面,通過挖掘APP上網(wǎng)日志數(shù)據(jù),結(jié)合APP畫像,可以構(gòu)建用戶的興趣偏好畫像,將用戶的興趣偏好分為5個等級,改善E域數(shù)據(jù)未被充分利用的行業(yè)現(xiàn)狀?;趥€體用戶畫像和群體用戶畫像,輸出游戲行業(yè)洞察分析報告,為精準(zhǔn)營銷提供數(shù)據(jù)參考。

      圖6 不同類型手游玩家群體活躍時段分布

      猜你喜歡
      用戶群畫像愛好者
      威猛的畫像
      基于協(xié)同過濾和Embedding的冷啟動推薦算法研究
      消費電子(2021年6期)2021-07-17 10:47:38
      美食愛好者的隨筆
      趣味(語文)(2021年10期)2021-03-09 03:16:08
      “00后”畫像
      畫像
      蝴蝶愛好者
      從資源出發(fā)的面向用戶群的高校圖書館資源推薦模型分析
      直播答題愛好者
      公共圖書館的用戶群和服務(wù)人員的分析
      潛行與畫像
      邻水| 博爱县| 孟村| 遂溪县| 杭锦旗| 文昌市| 涞源县| 禹州市| 合山市| 太原市| 彰武县| 海丰县| 宕昌县| 宜章县| 资兴市| 三河市| 金溪县| 棋牌| 麦盖提县| 西吉县| 衢州市| 六安市| 宜宾县| 宁强县| 安义县| 天水市| 肇州县| 湛江市| 穆棱市| 沾化县| 铜梁县| 青龙| 安吉县| 霸州市| 布尔津县| 镇沅| 台安县| 大名县| 宽甸| 沂源县| 崇信县|