王小菁
摘要:本篇文章通過對(duì)用戶畫像技術(shù)的定義、數(shù)據(jù)來源、數(shù)學(xué)模型和數(shù)據(jù)庫的構(gòu)建、用戶行為分析以及用戶畫像的意義等方面展開介紹,旨在突出強(qiáng)調(diào)用戶畫像在大數(shù)據(jù)時(shí)代的重要性。用戶畫像以標(biāo)簽的形式精準(zhǔn)高效地分析用戶的基本信息、偏好數(shù)據(jù)等,實(shí)現(xiàn)了對(duì)海量用戶的分類以及構(gòu)建虛擬化用戶,對(duì)企業(yè)的發(fā)展有直接且深刻的影響。
關(guān)鍵詞:用戶畫像 模型構(gòu)建 用戶行為
中圖分類號(hào):F274 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-5349(2018)14-0254-02
一、用戶畫像的定義
關(guān)于用戶畫像的定義不同的學(xué)者有不同的表述,比如學(xué)者劉海、張鵬、劉譯璟就提出:全方位、立體性地記錄消費(fèi)者的數(shù)據(jù)就叫作用戶畫像[1]。丁偉、王題等學(xué)者又認(rèn)為:個(gè)體用戶所有信息的集合,就是通過收集與分析用戶的屬性、社交、行為偏好等信息,然后綜合歸納用戶的信息用以勾勒用戶的輪廓。但其關(guān)鍵的含義都是趨向?qū)⒂脩粜畔⒎譃閹讉€(gè)類別然后分別轉(zhuǎn)換成簡短易懂的標(biāo)簽去描繪用戶的特征、偏好等方面的輪廓[2]。抽象地去勾勒用戶特征,在實(shí)際應(yīng)用中具象化,大大提高了企業(yè)的運(yùn)轉(zhuǎn)效率。
二、用戶畫像數(shù)據(jù)的來源
用戶畫像是基于海量數(shù)據(jù)建立起來的標(biāo)簽式虛擬用戶,針對(duì)其數(shù)據(jù)來源不同的學(xué)者有不同的看法,例如學(xué)者姜建武等人認(rèn)為:籠統(tǒng)地看,用戶畫像的數(shù)據(jù)來源大概包括兩種類型:靜態(tài)的用戶基本數(shù)據(jù)(年齡、體重等)和動(dòng)態(tài)的時(shí)間、地點(diǎn)、行為等數(shù)據(jù)(也稱為靜態(tài)信息本體和動(dòng)態(tài)信息本體),同時(shí)動(dòng)態(tài)信息本體隱藏在用戶行為之中,需要利用互聯(lián)網(wǎng)技術(shù)進(jìn)行捕捉。[3]這也是筆者比較贊同的觀點(diǎn),也就是將用戶畫像的數(shù)據(jù)來源概括為靜態(tài)的基本數(shù)據(jù)和動(dòng)態(tài)的行為數(shù)據(jù)。
三、用戶畫像數(shù)學(xué)模型以及數(shù)據(jù)庫的構(gòu)建
對(duì)于企業(yè)而言,傳統(tǒng)的經(jīng)營模式不再能滿足他們的需要,僅僅依靠企業(yè)工作中留下的記錄遠(yuǎn)遠(yuǎn)不夠,同時(shí)在大數(shù)據(jù)背景下,網(wǎng)絡(luò)技術(shù)使得消費(fèi)者的消費(fèi)行為可以轉(zhuǎn)化為數(shù)據(jù),這也成為支持企業(yè)的發(fā)展最重要的數(shù)據(jù)來源之一,所以企業(yè)有必要專門構(gòu)建用戶畫像的數(shù)據(jù)庫。劉海等學(xué)者在4C理論的基礎(chǔ)上設(shè)計(jì)了SQL Server數(shù)據(jù)庫,并且運(yùn)用數(shù)據(jù)庫語言E-R圖進(jìn)行具體的設(shè)計(jì)。這類數(shù)據(jù)庫不僅能夠在企業(yè)內(nèi)部共享使用,還能有效降低企業(yè)的各方面成本,提高企業(yè)的經(jīng)營效益。劉海等學(xué)者最終設(shè)計(jì)的數(shù)據(jù)庫包括客戶的基本信息、關(guān)于記錄客戶登陸日志的三方面信息、客戶瀏覽日志的五個(gè)方面信息、客戶下的訂單的信息、訂單包含的產(chǎn)品信息這五個(gè)部分。這個(gè)數(shù)據(jù)庫全面囊括用戶的所有信息,五個(gè)部分缺一不可。用戶畫像的數(shù)據(jù)庫建立的意義在于方便企業(yè)內(nèi)部查詢數(shù)據(jù),及時(shí)獲取用戶的信息,從而實(shí)現(xiàn)企業(yè)的精準(zhǔn)化營銷。
此外學(xué)者余孟杰還提出權(quán)重計(jì)算法,認(rèn)為內(nèi)容地址、行為類型、時(shí)間衰減,決定了權(quán)重模型是關(guān)鍵,權(quán)重值本身的二次建模是水到渠成的進(jìn)階,他認(rèn)為用戶畫像的核心在于對(duì)于用戶接觸點(diǎn)的理解,他認(rèn)為接觸點(diǎn)直接決定了標(biāo)簽信息。接觸點(diǎn)可以是網(wǎng)址,也可以是某個(gè)產(chǎn)品的特定功能界面[4],并且通過計(jì)算權(quán)重來確定標(biāo)簽?zāi)P汀2⒔柚鶭on kolko提出的標(biāo)簽權(quán)重=衰減因子*行為權(quán)重*網(wǎng)址子權(quán)重這一公式來進(jìn)行計(jì)算模型權(quán)重值[5]。
四、用戶畫像中的用戶行為分析
這部分內(nèi)容學(xué)界中有很多學(xué)者已經(jīng)做過相關(guān)研究,筆者在廣泛閱讀文獻(xiàn)的基礎(chǔ)上,認(rèn)為學(xué)者李映坤在其碩士學(xué)位論文中的研究結(jié)果極具代表性。學(xué)者李映坤主要是通過用戶在打電話、發(fā)短信、上網(wǎng)、玩手機(jī)App這四個(gè)層面的數(shù)據(jù),整理了20個(gè)指標(biāo)對(duì)用戶進(jìn)行分類比較。從而分析不同類別的用戶的行為特征、偏好等潛在的一些特點(diǎn)。同時(shí)他將這部分的研究分為兩個(gè)部分:大樣本聚類下的手機(jī)用戶行為分析和傳統(tǒng)小樣本聚類的游戲用戶分析。
在大樣本聚類分析中李映坤借助Hadoop偽分布集群對(duì)原始數(shù)據(jù)進(jìn)行清理,整理出30380個(gè)用戶的行為數(shù)據(jù),然后使用Mahout上的K-means算法,最終將人群分為五種類型,這五種用戶群的特點(diǎn)主要是:第一類人除了不愛發(fā)短信,打電話、上網(wǎng)、玩應(yīng)用軟件都非常頻繁;第二類人愛打電話愛發(fā)短信愛上網(wǎng),但是使用應(yīng)用軟件的時(shí)間不多;第三類人對(duì)所有的功能都不經(jīng)常使用;第四類人不經(jīng)常打電話發(fā)短信,但在上網(wǎng)和使用應(yīng)用軟件的時(shí)間很多;第五類人經(jīng)常打電話發(fā)短信,尤其是打電話的時(shí)間特別長,同時(shí)他們也經(jīng)常上網(wǎng)和使用應(yīng)用軟件。經(jīng)過對(duì)比這五類用戶群的行為特征,李映坤認(rèn)為第一類人群很有可能是一批年輕的女白領(lǐng),第二類人有可能是一些年長的知識(shí)分子,第三類人更像城市底層的廣大勞動(dòng)者,第四類很可能是學(xué)生,第五類人群很可能是社會(huì)精英階層,平時(shí)業(yè)務(wù)繁忙。筆者對(duì)這一系列的推斷保留意見,有懷疑的部分也有贊成的部分。
在傳統(tǒng)小樣本聚類分析中,學(xué)者李映坤以天天酷跑為例,參考1142名玩家的數(shù)據(jù),根據(jù)市場(chǎng)營銷理論得到這些用戶在R(近度)F(頻度)M(強(qiáng)度)三個(gè)指標(biāo)上的取值,之后使用K-means聚類方法最終將人群劃分為六類。這六類人群的偏好程度以及響應(yīng)的吸引策略是:第一類淺嘗輒止型(放棄治療),第二類累覺不愛型(善意提醒),第三類隔三差五型(簽到獎(jiǎng)勵(lì)),第四類接二連三型(在線獎(jiǎng)勵(lì)),第五類天天酷跑型(加大難度),第六類天昏地暗型(適當(dāng)更新)。[6]根據(jù)不同的用戶群體制定不同的吸引策略是企業(yè)構(gòu)建用戶畫像能夠獲得的成績。
五、用戶畫像的意義
用戶畫像的存在意義大概有以下幾個(gè)方面:
第一,準(zhǔn)確識(shí)別和勾畫目標(biāo)客戶。在眾多的數(shù)據(jù)處理工具中,用戶畫像是幫助企業(yè)定位目標(biāo)客戶最有效的工具之一。用戶畫像源自真實(shí)客戶的特征,在一定程度上反映用戶訴求,從而為企業(yè)的設(shè)計(jì)方向指明道路,雖然用戶畫像是一種虛擬的、標(biāo)簽化的客戶大類,但能夠準(zhǔn)確代表產(chǎn)品的主要受眾和目標(biāo)群體。區(qū)別于原始的僅僅依靠企業(yè)工作記錄,用戶畫像更多的是對(duì)用戶進(jìn)行研究、對(duì)市場(chǎng)進(jìn)行研究。郝勝宇認(rèn)為:如果說傳統(tǒng)的客戶分析是認(rèn)識(shí)了客戶,那么用戶畫像技術(shù)就是與客戶成為朋友。[7]
第二,從長遠(yuǎn)意義來看,用戶畫像可以讓企業(yè)實(shí)時(shí)把握消費(fèi)者的變化。市場(chǎng)在不斷變化,產(chǎn)品的生命周期也在不斷循環(huán),目標(biāo)客戶或者潛在客戶的年齡、需求等方面都在發(fā)生改變,面對(duì)這些無可避免的變動(dòng),用戶畫像就能很好地幫助企業(yè)預(yù)警。比如針對(duì)客戶年齡變動(dòng)這一因素,企業(yè)就需要依靠用戶畫像去確定不同年齡層次的用戶的消費(fèi)特征、行為偏向等,從而調(diào)整產(chǎn)品,擴(kuò)大受眾范圍。
第三,借助用戶畫像實(shí)現(xiàn)精準(zhǔn)化、個(gè)性化推送。用戶畫像將整個(gè)客戶群分成擁有不同特征的子群。在網(wǎng)絡(luò)技術(shù)的支撐下,企業(yè)可以通過郵箱、QQ、微信等第三方賬號(hào)向客戶進(jìn)行有針對(duì)性的推薦,這樣做既節(jié)省成本,還能提高效率,并且不像諸如電話推銷、短信轟炸這種給用戶帶來困擾。當(dāng)用戶畫像與網(wǎng)絡(luò)、大眾傳媒協(xié)同發(fā)展,個(gè)性化推薦將得到進(jìn)一步的發(fā)展與應(yīng)用。比如淘寶的“猜你喜歡”,點(diǎn)進(jìn)去你會(huì)發(fā)現(xiàn)跟你平時(shí)搜索的商品非常接近,這也是一個(gè)double-win的項(xiàng)目,在方便用戶查找自己所需產(chǎn)品的同時(shí),增加了商家的利潤。
參考文獻(xiàn):
[1]劉海,張鵬,劉譯璟.為消費(fèi)者畫像[J].銷售與市場(chǎng):渠道版,2013(9):30-32.
[2]丁偉,王題,劉新海等.基于大數(shù)據(jù)技術(shù)的手機(jī)用戶畫像與征信研究[J].郵電設(shè)計(jì)技術(shù),2016(3):64-69.
[3]姜建武,李景文,陸妍玲等.基于用戶畫像的信息智能推送方法[J].微型機(jī)與應(yīng)用,2016(23):86-89.
[4]余孟杰.產(chǎn)品研發(fā)中用戶畫像的數(shù)據(jù)模建——從具象到抽象[J].設(shè)計(jì)藝術(shù)研究,2014(6):60-64.
[5]Jon Kolko.交互設(shè)計(jì)沉思錄[M].方舟譯.北京:機(jī)械工業(yè)出版社,2012:67-68.
[6]李映坤.大數(shù)據(jù)背景下用戶畫像的統(tǒng)計(jì)方法實(shí)踐研究[D].首都經(jīng)濟(jì)貿(mào)易大學(xué),2016.
[7]郝勝宇,陳靜仁.大數(shù)據(jù)時(shí)代用戶畫像助力企業(yè)實(shí)現(xiàn)精準(zhǔn)化營銷[J].中國集體經(jīng)濟(jì),2016(4):61-62.
責(zé)任編輯:于蕾