摘要:數(shù)字圖書館在發(fā)展過程中,信息的載量越來越大,服務(wù)模式難以創(chuàng)新?,F(xiàn)存的個性化信息服務(wù)存在多種弊端。用戶畫像通過分析用戶的行為偏好,為精準(zhǔn)推薦做參考。本文基于用戶的畫像視角,通過分析構(gòu)建過程,提出了一種數(shù)字圖書館個性化信息服務(wù)研究的新思路。
關(guān)鍵詞:用戶畫像;個性化;數(shù)字圖書館
1背景
當(dāng)今,數(shù)字化、開放化、互聯(lián)化的信息環(huán)境愈演愈烈,人類社會進入了數(shù)據(jù)富足供給的時代,數(shù)據(jù)資源已不再是稀缺資源[1]?!盎ヂ?lián)網(wǎng)+”時代的到來促使高校數(shù)字圖書館所處的社會環(huán)境和技術(shù)環(huán)境出現(xiàn)較大改變,數(shù)字圖書館的服務(wù)內(nèi)涵由信息搜索和信息瀏覽拓展為行為策略指出和信息共享,出現(xiàn)了新的服務(wù)模式包括嵌入式服務(wù),全媒體服務(wù),O2O服務(wù),MOOCs服務(wù),云閱讀服務(wù)[2]。
隨著用戶對于信息的需求量增加,數(shù)字圖書館未來的發(fā)展趨勢逐漸偏向于用戶的個性化信息服務(wù)研究。數(shù)字圖書館的個性化信息服務(wù)大致包括自定義服務(wù)界面設(shè)定、符合個人需求的內(nèi)容定制、個性化信息推送服務(wù)以及智能的信息檢索定制等[3]。當(dāng)前,個性化數(shù)字圖書館信息服務(wù)中存在技術(shù)問題和用戶隱私問題以及圖書館員素質(zhì)方面的問題,同時如何為用戶推送符合他們要求的內(nèi)容也成為研究的難題。用戶畫像的概念最早由交互設(shè)計之父艾倫·庫珀(AlanCooper)提出。
他說,用戶畫像是真實用戶的虛擬表示,基于一組真實數(shù)據(jù)的目標(biāo)用戶模型。自2011年起,互聯(lián)網(wǎng)正式進入了大數(shù)據(jù)時代。網(wǎng)絡(luò)社交文化的迅猛發(fā)展連帶出龐大的線上用戶數(shù)據(jù),有了足夠的數(shù)據(jù)基礎(chǔ),如何精準(zhǔn)的服務(wù)于用戶的問題也隨之產(chǎn)生,對用戶畫像的研究熱潮也開始興起。本文通過分析用戶畫像以及數(shù)字圖書館個性化信息服務(wù)的研究現(xiàn)狀,分析了用戶畫像具體的構(gòu)建過程,并提出了其對于個性化信息服務(wù)的價值。
2領(lǐng)域研究進展
2.1用戶畫像研究現(xiàn)狀
以CNKI數(shù)據(jù)庫作為來源數(shù)據(jù)庫,以“用戶畫像”為關(guān)鍵詞進行檢索,限定中文文獻,不限定時間,檢索到的文獻數(shù)量為629,對檢索到的文獻進行可視化分析,如圖1所示。從圖中可以看出,對于用戶畫像的研究,在2010-2013年的熱度較低;隨著大數(shù)據(jù)時代的來臨,2013年以后,國內(nèi)眾多學(xué)者對用戶畫像研究的熱度逐步上升。通過對文獻的細(xì)致梳理,目前國內(nèi)學(xué)者對于用戶畫像的研究主要分為:(1)理論層面的探討;(2)用戶畫像模型構(gòu)建方法;(3)用戶畫像的應(yīng)用。
2.1.1理論層面研究現(xiàn)狀
用戶畫像的概念最初應(yīng)用于電子商務(wù)領(lǐng)域。在大數(shù)據(jù)時代,用戶信息泛濫。如圖2所示,每個用戶的特定信息都被抽象到標(biāo)簽中,這些標(biāo)簽用于具體化用戶的形象,以便為用戶提供有針對性的服務(wù)。國內(nèi)學(xué)者對于用戶畫像的定義有不同的理解。余孟杰對于用戶畫像的定義更加偏向于用戶角色,指出在產(chǎn)品研發(fā)時需要這樣一個角色來進行討論,通過“用戶信息標(biāo)簽化”把抽象化的數(shù)據(jù)具體為虛擬人物[4]。徐恩,於志文,杜賀和郭斌認(rèn)為用戶畫像是基于一系列數(shù)據(jù)的模型[5]。劉海,盧慧,阮金花,田丙強,胡守忠等認(rèn)為用戶畫像是消費者基本信息和消費記錄所構(gòu)成的數(shù)據(jù)集合[6]。黎小林等基于商品營銷的角度認(rèn)為用戶畫像是指通過收集與分析用戶的相關(guān)數(shù)字化數(shù)據(jù)蹤跡,如頁面點擊歷史、商品交易記錄、用戶反饋數(shù)據(jù)等,將用戶所有的標(biāo)簽綜合起來,勾勒出該用戶的整體特征與輪廓[7]。
2.1.2模型構(gòu)建的研究現(xiàn)狀
陳澤宇和黃勃提出了基于主題詞改進的詞向量模型來構(gòu)建用戶畫像,相比于只利用目標(biāo)單詞的詞向量,用主題詞向量將代表這個主題下單詞的整體語義,更好的表達(dá)了用戶的特征[8]。張壯,馮小年和錢鐵云提出一種基于多模態(tài)融合的用戶畫像模型用于解決用戶畫像建模中各模態(tài)不能深入交互的問題[9]。蔣明會,苗奪謙,羅晟,趙才榮等基于粒計算思想,本文以用戶在搜索引擎的歷史搜索記錄和用戶屬性(年齡、性別、學(xué)歷)為原始數(shù)據(jù),使用Stacking模型融合技術(shù)對多種模型進行融合以改進單一模型、單一粒度學(xué)習(xí)的限制,實現(xiàn)了多粒度的用戶畫像[10]。徐恩,於志文,杜賀,郭斌等基于手機感知數(shù)據(jù)從年齡、性別和人格特征三方面來構(gòu)建用戶畫像.然后,使用隨機森林分類模型識別性別,并利用SVR來識別人格特征.由此提出了一種基于多維感知數(shù)據(jù)的用戶畫像模型[11]。
2.1.3在圖書館領(lǐng)域應(yīng)用的現(xiàn)狀
王雪峰通過基于用戶畫像的相關(guān)理論,對智慧圖書館的群體進行劃分,從而對不同用戶的行為需求進行深層次的挖掘,并分析每一類用戶群體的典型特征,實現(xiàn)了用戶畫像的精準(zhǔn)刻畫。從而對群體用戶的行為進行可視化呈現(xiàn)[12]。徐海玲等基于概念格構(gòu)建了高校圖書館群體用戶興趣畫像,揭示不同群體用戶的行為需求,挖掘潛在的行為規(guī)律,為高校圖書館不同群體用戶的個性化服務(wù)提供參考[13]。李丹等在圖書館廣泛的讀者行為框架中定位用戶與應(yīng)用系統(tǒng)的互動需求,探討可以更好地在讀者與INNOPAC等應(yīng)用系統(tǒng)的互動關(guān)系中發(fā)揮良好作用的推薦方式[14]。過仕明通過用戶畫像和場景五力等相關(guān)理論,構(gòu)建了數(shù)字圖書館用戶畫像,揭示了不同群體用戶的行為需求,并對其場景進行了重構(gòu),為數(shù)字圖書館更好發(fā)展提供了服務(wù)和參考[15]。
王雪峰基于超級IP和用戶畫像的理論,清晰明了的揭示了不同群體用戶的特征,對群體用戶的行為進行可視化呈現(xiàn),并基于用戶的行為提供更加符合特征的場景,從而進一步提升智慧圖書館的服務(wù)能力[12]。
2.2數(shù)字圖書館個性化信息服務(wù)
胡英義總結(jié)了互聯(lián)網(wǎng)環(huán)境下高校圖書館提供信息服務(wù)的必要性和緊迫性,并提出改變提供信息服務(wù)的方式和方法[16]。在過去的十年中,徐遠(yuǎn)峰提出了通過現(xiàn)代信息技術(shù)提高圖書館信息服務(wù)水平并竊聽信息技術(shù)潛力''的想法[17]。劉素清等根據(jù)新媒體的特點,提出了數(shù)字圖書館信息服務(wù)的新方向,分析了新媒體時代用戶對決策信息的個性化需求[18]?;跀?shù)據(jù)挖掘技術(shù),安貝提出了大學(xué)數(shù)字圖書館的信息服務(wù)優(yōu)化策略,并優(yōu)化了大學(xué)數(shù)字圖書館的信息服務(wù)策略[19]。
3基于用戶畫像的個性化服務(wù)策略研究
3.1數(shù)據(jù)來源和構(gòu)建方法
數(shù)據(jù)的收集面向全體師生,包括本科生,碩士生,博士生以及教師。數(shù)據(jù)的來源是圖書館后臺記錄的數(shù)據(jù),主要是借書的記錄數(shù)據(jù)以及用戶的靜態(tài)屬性即性別、年齡、專業(yè)、年級、職稱等如圖3。通過構(gòu)建不同群體的借閱偏好,構(gòu)建用戶畫像,為用戶提供個性化服務(wù)。根據(jù)數(shù)據(jù)來源的不同,目前對用戶畫像的構(gòu)建方法主要分為兩種:基于人文學(xué)科范疇的研究方向和基于計算機、數(shù)據(jù)統(tǒng)計等范疇的研究方向。圖書館個性化信息服務(wù)的用戶畫像屬于人文學(xué)科范疇的研究方向。
3.2構(gòu)建步驟與個性化服務(wù)
將采集到的數(shù)據(jù)進行數(shù)據(jù)清理,構(gòu)建標(biāo)簽體系后進行聚類,然后進行可視化的呈現(xiàn)。半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)主要是在各種系統(tǒng)模塊中生成的行為數(shù)據(jù),例如書目歸還系統(tǒng)中的數(shù)據(jù)恢復(fù),電子閱讀管理系統(tǒng)中的數(shù)據(jù)輸入,Internet接口上的數(shù)據(jù)和數(shù)據(jù)庫操作數(shù)據(jù)等。由于數(shù)據(jù)生成的形式不同,標(biāo)準(zhǔn)和規(guī)范不同,數(shù)據(jù)的存儲方式和格式具有一定程度的排他性,因此較為復(fù)雜?;诩上到y(tǒng)和統(tǒng)一的管理數(shù)據(jù),收集各種類型的數(shù)據(jù)并完成數(shù)據(jù)清除操作更加方便和可操作[20]。
用戶畫像的本質(zhì)是完成對用戶標(biāo)簽的描述,即對用戶進行標(biāo)簽。在人為干預(yù)的前提下,放置一個用于標(biāo)記用戶肖像的系統(tǒng),可以對數(shù)據(jù)挖掘過程中創(chuàng)建的數(shù)據(jù)進行排序并消除其偏差,并歸納和制定標(biāo)簽的特定特征的標(biāo)識。建立用戶標(biāo)簽系統(tǒng)的具體過程主要包括:獲取有關(guān)用戶數(shù)據(jù)的信息,提取信息要點,將其與典型的,具有代表性的參考詞表進行比較,形成用戶需要的標(biāo)簽對應(yīng)的詞表。
聚類分析是一種根據(jù)事物的特征對個體進行分類的方法,將數(shù)據(jù)分為具有較大外部差異但內(nèi)部相似度較高的幾類,目前,聚類分析研究領(lǐng)域主要涉及處理過程,模型識別和市場分析。K-均值算法和C-模糊工具的聚類算法(FCM算法)是目前使用最廣泛的兩種分類方法。聚類后可以根據(jù)不同群體即本科生、碩士生、博士生以及教師的不同的行為偏好構(gòu)建用戶畫像[21]。
建立用戶畫像可為讀者的個性化服務(wù)打下良好基礎(chǔ)。用戶數(shù)據(jù)的來源和格式?jīng)Q定了推薦策略,推薦內(nèi)容及其呈現(xiàn)形式,并直接影響用戶對推薦內(nèi)容的關(guān)注和接受程度。在數(shù)字圖書館的個性化信息服務(wù)的過程中,通過分析用戶的來源來構(gòu)建和預(yù)測用戶畫像的具體模型。然后根據(jù)用戶可能需要的信息進行深入的數(shù)據(jù)挖掘,完成對信息資源的推送服務(wù)。
4結(jié)語
數(shù)字圖書館的服務(wù)模式正在發(fā)生改變,隨著大數(shù)據(jù)技術(shù)的成熟發(fā)展,多種創(chuàng)新模式層出不窮。個性化信息服務(wù)作為數(shù)字圖書館未來的發(fā)展趨勢,對它的深入研究有十分重要的意義。用戶畫像的概念多應(yīng)用于互聯(lián)網(wǎng)營銷領(lǐng)域,將其借鑒于圖書館的個性化服務(wù)能夠促進數(shù)字圖書館的發(fā)展,更好的服務(wù)于讀者。
參考文獻
[1]朝樂門.信息資源管理理論的繼承與創(chuàng)新:大數(shù)據(jù)與數(shù)據(jù)科學(xué)視角[J].中國圖書館學(xué)報,2019(02):26-42.
[2]鄭美玉.“互聯(lián)網(wǎng)+”時代高校數(shù)字圖書館服務(wù)模式創(chuàng)新研究[J].情報理論與實踐,2016,39(7):36-40.
[3]趙天昀.數(shù)字圖書館個性化信息服務(wù)中用戶隱私保護研究[J].圖書館理論與實踐,2018(2):101-103.
[4]余孟杰.產(chǎn)品研發(fā)中用戶畫像的數(shù)據(jù)模建——從具象到抽象[J].設(shè)計藝術(shù)研究,2014(6):60-64.
[5]徐恩,於志文,杜賀,郭斌.基于移動感知數(shù)據(jù)的用戶畫像系統(tǒng)[J].鄭州大學(xué)學(xué)報:理學(xué)版,2019,51(4):30-36.
[6]劉海,盧慧,阮金花,田丙強,胡守忠.基于“用戶畫像”挖掘的精準(zhǔn)營銷細(xì)分模型研究[J].絲綢,2015,52(12):37-42.
[7]黎小林,徐蘇,王海忠.在線平臺用戶畫像對品牌依戀的影響[J].廣東財經(jīng)大學(xué)學(xué)報,2019(5):38-49.
[8]陳澤宇,黃勃.改進詞向量模型的用戶畫像研究[J].計算機工程與應(yīng)用,2020,56(1):180-184.
[9]張壯,馮小年,錢鐵云.基于多模態(tài)融合技術(shù)的用戶畫像方法[J].北京大學(xué)學(xué)報:自然科學(xué)版,2020,56(1):105-111.
[10]蔣明會,苗奪謙,羅晟,趙才榮.基于粒計算的多粒度用戶畫像[J].模式識別與人工智能,2019,32(8):691-698.
[11]徐恩,於志文,杜賀,郭斌.基于移動感知數(shù)據(jù)的用戶畫像系統(tǒng)[J].鄭州大學(xué)學(xué)報:理學(xué)版,2019,51(4):30-36.
[12]王雪峰.智慧圖書館知識服務(wù)場景構(gòu)建研究——以吉林藝術(shù)學(xué)院圖書館為例[J].情報科學(xué),2019,37(12):98-104.
[13]徐海玲,張海濤,張梟慧,魏明珠.基于概念格的高校圖書館群體用戶興趣畫像研究[J].情報科學(xué),2019,37(9):153-158.
[14]李丹,高建忠.基于用戶畫像的圖書館推薦服務(wù)初探[J].圖書館,2019(7): 66-71.
[15]過仕明.數(shù)字圖書館用戶畫像及場景重構(gòu)研究[J].情報科學(xué),2019,37 (12):11-18.
[16]胡迎義.高校圖書館個性化信息服務(wù)研究[J].蘭臺內(nèi)外,2018(12):38- 40.
[17]續(xù)遠(yuǎn)鳳.近十年我國圖書館信息服務(wù)研究綜述[J].圖書館界,2016(6):35 -39.
[18]劉素清,彭妍,惠中艷,等.面向決策支持的高校圖書館信息服務(wù)[J].中國中醫(yī)藥圖書情報雜志,2019,43(2):38-41.
[19]安蓓.基于數(shù)據(jù)挖掘技術(shù)的高校圖書館信息服務(wù)優(yōu)化策略[J].信息記錄材料,2019,20(4):198-199.
[20]潘宇光.高校智慧圖書館讀者信息需求的用戶畫像[J].合肥工業(yè)大學(xué)學(xué)報(社會科學(xué)版),2018,32(2):113-119.
[21]譚浩,郭雅婷.基于大數(shù)據(jù)的用戶畫像構(gòu)建方法與運用[J].包裝工程,2019,40(22):95-101.
作者簡介
曹曉雅(1997—),女,漢,山東泰安,碩士,北京聯(lián)合大學(xué),研究方向:數(shù)字圖書館。