彭雯
(鄭州大學(xué)信息管理學(xué)院,河南 鄭州 450001)
交互設(shè)計(jì)之父A.Cooper最早提出用戶畫像(User Profile)的概念,他將用戶畫像定義為真實(shí)用戶的虛擬代表,認(rèn)為用戶畫像是建立在一系列真實(shí)數(shù)據(jù)之上的目標(biāo)用戶模型[1]。在當(dāng)今互聯(lián)網(wǎng)和大數(shù)據(jù)時(shí)代背景下,用戶信息紛繁復(fù)雜,將用戶的具體信息抽象為標(biāo)簽,從而利用標(biāo)簽將用戶形象概念化,是為用戶提供針對(duì)性服務(wù)的關(guān)鍵所在。作為一種勾畫目標(biāo)用戶、聯(lián)系用戶訴求與設(shè)計(jì)方向的有效工具,用戶畫像的應(yīng)用場(chǎng)景和研究領(lǐng)域不斷擴(kuò)展延伸。在此背景下,探究該領(lǐng)域研究的熱點(diǎn),洞察研究熱點(diǎn)的演變趨勢(shì)具有重要意義。
以中國(guó)知網(wǎng)(CNKI)作為文獻(xiàn)數(shù)據(jù)來源,設(shè)定檢索條件為“主題(精確)”,檢索詞為“用戶畫像”,來源類別為學(xué)術(shù)期刊,時(shí)間范圍不做限制,檢索時(shí)間為2022年5月21日。最終獲得有效文獻(xiàn)1809篇作為本文進(jìn)行文獻(xiàn)計(jì)量統(tǒng)計(jì)和可視化分析的數(shù)據(jù)源。
知識(shí)圖譜(Knowledge Graph),在圖書情報(bào)界稱為知識(shí)域可視化或知識(shí)領(lǐng)域映射地圖,是通過將信息可視化技術(shù)、信息科學(xué)等學(xué)科的理論與方法與計(jì)量學(xué)引文分析、共現(xiàn)分析等方法結(jié)合,并利用可視化的圖譜形象地展示學(xué)科的核心結(jié)構(gòu)、發(fā)展歷史、前沿領(lǐng)域以及整體知識(shí)架構(gòu)達(dá)到多學(xué)科融合目的的現(xiàn)代理論。CiteSpace是一款用于分析科學(xué)文獻(xiàn)信息的可視化軟件,由美國(guó)德雷塞爾大學(xué)陳超美教授應(yīng)用Java語言研發(fā)。
本文基于文獻(xiàn)計(jì)量學(xué)方法,利用CiteSpace(6.1 R2)軟件和中國(guó)知網(wǎng)自帶可視化工具生成文獻(xiàn)時(shí)間分布圖、關(guān)鍵詞聚類圖譜、關(guān)鍵詞時(shí)間線圖譜、關(guān)鍵詞突現(xiàn)分析圖譜,分析目前我國(guó)用戶畫像相關(guān)文獻(xiàn)的研究熱點(diǎn)和演進(jìn)趨勢(shì),從而描繪國(guó)內(nèi)用戶畫像研究的知識(shí)全景。
借助CNKI檢索結(jié)果自帶的可視化功能,用戶畫像相關(guān)文獻(xiàn)總體發(fā)文趨勢(shì)如圖1所示。通過圖1可以看出,國(guó)內(nèi)對(duì)于用戶畫像的研究起步較晚。CNKI收錄的我國(guó)最早的一篇關(guān)于用戶畫像的期刊文獻(xiàn)發(fā)表于2011年,2011—2016年是我國(guó)用戶畫像研究的起步階段,該階段文獻(xiàn)數(shù)量較少且增長(zhǎng)速度緩慢;2016—2019年是快速增長(zhǎng)階段,用戶畫像相關(guān)研究呈現(xiàn)爆發(fā)式增長(zhǎng)態(tài)勢(shì);2019—2021年是波動(dòng)式增長(zhǎng)階段,2019—2020年度相關(guān)文獻(xiàn)數(shù)量增幅較小,但2020—2021年度再次出現(xiàn)大幅度增長(zhǎng),圖中2022年發(fā)文量非全年統(tǒng)計(jì)數(shù)據(jù)。目前,我國(guó)用戶畫像相關(guān)研究文獻(xiàn)整體上仍呈現(xiàn)上升趨勢(shì)。
關(guān)鍵詞是對(duì)文章內(nèi)容的高度凝練與總結(jié),關(guān)鍵詞頻數(shù)可以直觀地反映某一知識(shí)領(lǐng)域的研究熱點(diǎn)。根據(jù)研究預(yù)定的標(biāo)準(zhǔn)和步驟,設(shè)置時(shí)間范圍為2011—2022年,以“Keyword”為節(jié)點(diǎn),設(shè)置閾值“TOP 30 per slice”,通過“Pathfinder”剪枝方法修剪全局網(wǎng)絡(luò),運(yùn)行后生成用戶畫像領(lǐng)域研究熱點(diǎn)關(guān)鍵詞圖譜,該圖譜共包含699個(gè)節(jié)點(diǎn)、1253條連線,網(wǎng)絡(luò)密度為0.0051。篩選出頻率在10以上的關(guān)鍵詞,整理得到熱點(diǎn)關(guān)鍵詞頻次表(見表1)。
表1 用戶畫像研究熱點(diǎn)關(guān)鍵詞
除“用戶畫像”這一自身指向性詞語外,出現(xiàn)頻次最高的關(guān)鍵詞依次為:“大數(shù)據(jù)”“精準(zhǔn)營(yíng)銷”“圖書館”“人工智能”“數(shù)據(jù)挖掘”“精準(zhǔn)服務(wù)”等。
在關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)圖譜的基礎(chǔ)上,采用對(duì)數(shù)似然比(loglikelihood ratio,LLR)算法,生成關(guān)鍵詞聚類網(wǎng)絡(luò)圖譜(圖2)。其中,圖譜信息模塊性(Q值)為0.6835>0.3,圖譜輪廓系數(shù)(S值)為0.8946>0.5,表明該關(guān)鍵詞聚類網(wǎng)絡(luò)圖譜聚類結(jié)果合理,基本可以反映該領(lǐng)域的研究情況。
圖2 關(guān)鍵詞聚類網(wǎng)絡(luò)圖譜
綜合關(guān)鍵詞共現(xiàn)與關(guān)鍵詞聚類的分析結(jié)果,結(jié)合查看關(guān)鍵詞節(jié)點(diǎn)“List citing papers to the cluster”所包含的文獻(xiàn)內(nèi)容,將用戶畫像技術(shù)的相關(guān)研究概括為以下幾個(gè)方面:
“大數(shù)據(jù)”“人工智能”“數(shù)據(jù)挖掘”“深度學(xué)習(xí)”等詞語在熱點(diǎn)關(guān)鍵詞中共計(jì)出現(xiàn)421次,占全部30個(gè)熱點(diǎn)關(guān)鍵詞的比例超過20%。用戶畫像的構(gòu)建是一個(gè)搜集用戶特征數(shù)據(jù)、研究用戶信息、細(xì)分標(biāo)簽、豐富用戶畫像描述的過程[2],數(shù)據(jù)采集、數(shù)據(jù)挖掘和分類算法是用戶畫像構(gòu)建過程中關(guān)鍵的核心技術(shù),涉及大數(shù)據(jù)、人工智能、機(jī)器學(xué)習(xí)、社交網(wǎng)絡(luò)等多種技術(shù)和算法。可見,以大數(shù)據(jù)為代表的新興信息技術(shù)是構(gòu)建用戶畫像的基礎(chǔ),同時(shí)用戶畫像作為一種新型的數(shù)據(jù)分析與挖掘工具,也加速了信息技術(shù)手段的發(fā)展與創(chuàng)新。
用戶畫像技術(shù)隨著大數(shù)據(jù)時(shí)代的到來而逐漸興起,同時(shí)也擴(kuò)展了大數(shù)據(jù)的應(yīng)用深度和廣度。“精準(zhǔn)營(yíng)銷”是用戶畫像技術(shù)的關(guān)鍵應(yīng)用場(chǎng)景。在熱點(diǎn)關(guān)鍵詞中,“精準(zhǔn)營(yíng)銷”及其同義關(guān)鍵詞出現(xiàn)了167次,在各種應(yīng)用場(chǎng)景類詞語中出現(xiàn)頻次最高。2011年以來,“用戶畫像”概念一經(jīng)提出,便被率先應(yīng)用到電子商務(wù)領(lǐng)域的精準(zhǔn)營(yíng)銷中。電商企業(yè)實(shí)行精準(zhǔn)營(yíng)銷的重要基石是如何在海量信息中攫取關(guān)鍵信息挖掘出用戶行為特征[3],用戶畫像為其提供解決方案。電商企業(yè)通過構(gòu)建用戶畫像識(shí)別目標(biāo)用戶群體、準(zhǔn)確定位市場(chǎng),打破傳統(tǒng)營(yíng)銷模式,大大提高了營(yíng)銷成功率。
“信息服務(wù)”“知識(shí)服務(wù)”“圖書館”“閱讀推廣”等關(guān)鍵詞共計(jì)出現(xiàn)113次,僅次于“精準(zhǔn)營(yíng)銷”,表征用戶畫像在圖書情報(bào)領(lǐng)域的廣泛應(yīng)用。當(dāng)下,圖書館所依賴的知識(shí)創(chuàng)造與閱讀環(huán)境正在從信息時(shí)代進(jìn)入到“數(shù)據(jù)時(shí)代”,多種形態(tài)資源和多樣化的數(shù)據(jù)構(gòu)成了可充分集成關(guān)聯(lián)的數(shù)字圖書館服務(wù)的大數(shù)據(jù)環(huán)境[4]。個(gè)性化、專業(yè)化的閱讀推薦和知識(shí)服務(wù)是數(shù)字圖書館未來的發(fā)展方向,而構(gòu)建用戶畫像以深刻理解用戶需求、洞察用戶偏好是有效的實(shí)現(xiàn)途徑。目前,圖書情報(bào)與數(shù)字圖書館領(lǐng)域?qū)W者已在包括智慧閱讀推薦、知識(shí)發(fā)現(xiàn)系統(tǒng)、知識(shí)社區(qū)用戶畫像構(gòu)建、資源推薦等主題開展用戶畫像的應(yīng)用進(jìn)行了探討[5]。
此外,以“短視頻”為代表的社交媒體、網(wǎng)絡(luò)社區(qū)也是用戶畫像技術(shù)的應(yīng)用場(chǎng)景之一。如陳燁等研究高血壓主題下的用戶社交行為數(shù)據(jù),分析用戶社交網(wǎng)絡(luò)結(jié)構(gòu)和用戶社交類型的特征,進(jìn)而生成面向高血壓主題的用戶畫像[6]。在電子技術(shù)和大數(shù)據(jù)不斷發(fā)展的背景下,為了能在網(wǎng)絡(luò)中更加快速精準(zhǔn)地找到目標(biāo)用戶,就需要利用相關(guān)分類技術(shù)劃分用戶的身份等各類屬性信息,通過畫像構(gòu)建可以更進(jìn)一步了解網(wǎng)絡(luò)社交用戶的供求信息,對(duì)行為習(xí)慣等數(shù)據(jù)進(jìn)行準(zhǔn)確定位,便于了解用戶信息的全貌[7]。
3.3.1 關(guān)鍵詞時(shí)間線圖譜
關(guān)鍵詞時(shí)間線圖譜通過詳細(xì)展示各聚類模塊內(nèi)部關(guān)鍵詞產(chǎn)生的時(shí)間跨度和關(guān)聯(lián),能夠清晰展現(xiàn)該領(lǐng)域研究的演進(jìn)過程。Citespace控制面板選擇布局(Layout)模塊,選擇“timeline”繪制用戶畫像聚類的時(shí)間線圖譜,如圖3所示。
圖3 關(guān)鍵詞時(shí)間線圖譜
3.3.2 關(guān)鍵詞突現(xiàn)圖譜
關(guān)鍵詞突現(xiàn)是指在短時(shí)間之內(nèi)該詞的出現(xiàn)頻率顯著增加,表明某段時(shí)間內(nèi)該領(lǐng)域的研究備受科研人員的關(guān)注,據(jù)此可以判斷該領(lǐng)域的前沿進(jìn)展和研究趨勢(shì)[8]。Citespace控制面板選擇突現(xiàn)(Burstness)模塊,生成2011—2022年用戶畫像研究突現(xiàn)詞知識(shí)圖譜,如圖4所示,共13個(gè)突現(xiàn)詞。其中,橫線加粗部分表示該詞出現(xiàn)并持續(xù)時(shí)間,橫線較細(xì)部分表示該詞突現(xiàn)成為熱點(diǎn)的持續(xù)時(shí)間。
圖4 關(guān)鍵詞突現(xiàn)圖譜
觀察圖4,從突現(xiàn)度看,排名前5的關(guān)鍵詞依次為機(jī)器學(xué)習(xí)(2.41,2017—2018)、聚類分析(2.37,2020—2022)、用戶體驗(yàn)(2.23,2020—2022)、今日頭條(1.79,2017—2018)和智能化(1.55,2019—2020)。從研究的持續(xù)時(shí)間看,“云計(jì)算”和“云平臺(tái)”是最早突現(xiàn)的關(guān)鍵詞。
綜合圖3、圖4的可視化結(jié)果可知,我國(guó)用戶畫像領(lǐng)域研究的演變過程可以劃分為3個(gè)階段。初期萌芽階段(2011—2016年),該階段隨著“云計(jì)算”技術(shù)的實(shí)現(xiàn),用戶畫像初步進(jìn)入研究視野??焖侔l(fā)展階段(2016—2019年),隨著以大數(shù)據(jù)、云計(jì)算、人工智能為代表的新型數(shù)字技術(shù)廣泛應(yīng)用,用戶畫像技術(shù)在我國(guó)快速發(fā)展。該階段,“用戶標(biāo)簽”“機(jī)器學(xué)習(xí)”“數(shù)據(jù)”“智能化”等多個(gè)關(guān)鍵詞相繼突現(xiàn),表明用戶畫像研究爆發(fā),其研究深度和廣度進(jìn)一步拓展。多元拓展階段(2019年至今),“用戶體驗(yàn)”“服務(wù)模式”“科技期刊”成為用戶畫像研究的焦點(diǎn)??梢钥闯觯髷?shù)據(jù)時(shí)代下的用戶畫像研究延續(xù)了互聯(lián)網(wǎng)時(shí)代下“以用戶為中心”的思維,借助大數(shù)據(jù)的技術(shù)手段和分析工具,更深入地了解用戶,進(jìn)而形成基于用戶大數(shù)據(jù)的精準(zhǔn)認(rèn)知,并在此基礎(chǔ)上為用戶提供精準(zhǔn)化、定制化的高質(zhì)量服務(wù)。此外,“科技期刊”表征用戶畫像在圖書情報(bào)與數(shù)字圖書館界的廣泛應(yīng)用。國(guó)內(nèi)圖書館領(lǐng)域?qū)τ脩舢嬒竦难芯科鸩捷^晚,近3年才逐漸成為研究熱點(diǎn),研究成果也相對(duì)較少,主要集中在圖書館用戶畫像的模型構(gòu)建和實(shí)踐應(yīng)用[8]。
本文借助CiteSpace可視化軟件及中國(guó)知網(wǎng)自帶可視化工具,繪制發(fā)文趨勢(shì)圖、關(guān)鍵詞聚類圖譜、關(guān)鍵詞時(shí)間線和突現(xiàn)圖譜,對(duì)2011—2022年間用戶畫像領(lǐng)域相關(guān)期刊文獻(xiàn)進(jìn)行知識(shí)圖譜展示,分析用戶畫像研究的總體發(fā)文趨勢(shì)、研究熱點(diǎn)及演變趨勢(shì)。分析發(fā)現(xiàn),我國(guó)用戶畫像研究雖然起步較晚,但發(fā)展迅速,研究?jī)?nèi)容集中在關(guān)鍵技術(shù)和實(shí)際應(yīng)用,對(duì)基礎(chǔ)理論的分析較少;目前用戶畫像技術(shù)已廣泛應(yīng)用于精準(zhǔn)營(yíng)銷、個(gè)性化推薦、知識(shí)服務(wù)等;未來仍是多學(xué)科的研究熱點(diǎn)。