劉海鷗 李 凱 姜 波
(1.燕山大學(xué)經(jīng)濟(jì)管理學(xué)院 河北秦皇島 066004;2. 燕山大學(xué)圖書館 河北秦皇島 066004)
隨著大數(shù)據(jù)技術(shù)的興起,移動圖書館用戶的信息資源需求呈現(xiàn)出大數(shù)據(jù)化、動態(tài)化與場景化等特點(diǎn),這就導(dǎo)致傳統(tǒng)的圖書館信息資源服務(wù)模式難以適應(yīng)用戶的智能化、個性化、創(chuàng)新化推薦服務(wù)需求[1]。如何從海量數(shù)據(jù)中挖掘出與移動用戶需求精準(zhǔn)匹配的圖書館信息資源成為大數(shù)據(jù)時代個性化服務(wù)領(lǐng)域亟待解決的新課題[2]。作為一種新興的用戶行為分析工具,用戶畫像通過提取大量數(shù)據(jù)化標(biāo)簽刻畫出用戶的行為特征,進(jìn)而完成資源的精確推送[3-4]?;诤A繑?shù)據(jù)構(gòu)建移動圖書館用戶畫像和圖書資源畫像,并對二者進(jìn)行情境化融合,可進(jìn)一步有效挖掘讀者在不同情境下的知識服務(wù)需求,因此能為移動圖書館的情境化、即時化、智能化推薦服務(wù)提供新的思路。
關(guān)于用戶畫像的研究較多,國外學(xué)者Costas(2013)[5]、Lei Li(2014)[6]、Ravi(2016)[7]、Pablo[8]等 都 對 用 戶畫像在個性化推薦系統(tǒng)中的構(gòu)建和應(yīng)用進(jìn)行了分析和探討。我國的陳添源(2018)[9]、畢達(dá)天(2018)[10]、佟林杰(2019)[11]、王英(2020)[12]、張莉曼(2020)[13]等學(xué)者也對圖書館推薦系統(tǒng)中用戶畫像的數(shù)據(jù)獲取、畫像建模和用戶特征等進(jìn)行了分析和驗(yàn)證,通過畫像模型對用戶行為數(shù)據(jù)進(jìn)行深入剖析,并結(jié)合用戶的情境信息為其推送適合的圖書資源。資源畫像是在用戶畫像的思想和構(gòu)建原理的基礎(chǔ)上,對圖書資源的各種信息數(shù)據(jù)進(jìn)行挖掘和處理,從而生成關(guān)于圖書資源的畫像模型。相比之下,關(guān)于資源畫像的研究成果較少。楊帆(2018)[14]提出采集ALEPH書目系統(tǒng)、文津書目搜索系統(tǒng)和讀者門戶系統(tǒng)“資源”相關(guān)數(shù)據(jù),構(gòu)建資源畫像模型的標(biāo)簽體系,但未采集文獻(xiàn)數(shù)據(jù)庫并動態(tài)利用數(shù)據(jù)。王慶(2018)[15]、李雅(2018)[16]通過構(gòu)建讀者和圖書資源畫像模型搭建了圖書館大數(shù)據(jù)平臺,將之應(yīng)用于圖書館精細(xì)化讀者服務(wù)領(lǐng)域,致力于向不同用戶群體實(shí)施精準(zhǔn)營銷、進(jìn)行精準(zhǔn)推薦。郭儉等(2019)[17]基于蘇州線上教育中心的學(xué)習(xí)行為數(shù)據(jù),同時融合了用戶行為數(shù)據(jù)的挖掘結(jié)果,由此提出一套資源畫像的構(gòu)建方法,從而為優(yōu)化學(xué)生的學(xué)習(xí)決策提供服務(wù)。畢強(qiáng)(2019)[18]在研究中首先確定了圖書館畫像的數(shù)據(jù)來源,然后遴選了用戶畫像與資源畫像的事實(shí)標(biāo)簽,通過畫像構(gòu)建來進(jìn)行數(shù)字圖書館資源的個性化推薦。徐海玲等(2019)[19]借鑒領(lǐng)域本體的方法,通過對數(shù)據(jù)的深層次挖掘,利用資源聚合的原理,構(gòu)建了基于資源畫像的社交媒體內(nèi)部資源聚合模型和外部資源聚合模型。研究結(jié)果表明,資源畫像能為社交媒體的資源聚合提供新的思路。通過對圖書館數(shù)據(jù)進(jìn)行梳理,劉芳等(2020)[20]探索了資源畫像和讀者畫像的構(gòu)建步驟,并分析了畫像的具體表現(xiàn)方式及其在圖書館中的應(yīng)用,從而為圖書館資源建設(shè)、讀者個性化服務(wù)提供數(shù)據(jù)決策支撐。
通過文獻(xiàn)分析可以看出,用戶畫像在圖書館領(lǐng)域內(nèi)的研究大多關(guān)注如何構(gòu)建和使用用戶畫像,而關(guān)于資源畫像的研究則相對較少,相關(guān)文獻(xiàn)也多單獨(dú)構(gòu)建和使用資源畫像,缺乏對用戶畫像和資源畫像深度融合方面的研究,也沒有深入研究圖書館推薦系統(tǒng)中的用戶畫像與資源畫像情境化的融合問題。鑒于此,文章在借鑒前人研究成果的基礎(chǔ)上,構(gòu)建出移動圖書館的用戶畫像和資源畫像模型,然后從維度、層次和路徑三個方面對移動圖書館用戶畫像和資源畫像進(jìn)行情境化融合。用戶畫像和資源畫像的深度融合可以優(yōu)化移動圖書館推薦系統(tǒng)的服務(wù)方式,并為當(dāng)前移動圖書館的情境化推薦系統(tǒng)研究提供參考。
融合就是將用戶畫像和資源畫像融為一體,有機(jī)結(jié)合,組合成為一個整體。用戶畫像所描述的是讀者的基本信息、閱讀偏好、閱讀風(fēng)格和社交互動等數(shù)據(jù)信息,資源畫像所描述的是圖書資源的基本信息、資源類型、媒體類型和資源熱度等數(shù)據(jù)信息。因此,移動圖書館畫像的情境化融合,就是將用戶畫像和資源畫像所描述的各種讀者數(shù)據(jù)信息和圖書資源數(shù)據(jù)信息融為一體的過程,旨在畫像融合的基礎(chǔ)上將讀者和圖書資源的各種信息標(biāo)簽、主題進(jìn)行有機(jī)結(jié)合,實(shí)現(xiàn)移動圖書館推薦系統(tǒng)在技術(shù)、平臺和服務(wù)上的創(chuàng)新。此外,移動圖書館與傳統(tǒng)圖書館最大的不同在于其移動性,因此需全面考慮用戶所處情境的變換和對用戶需求的影響。這就要求移動圖書館要為用戶提供不同情境下的知識需求服務(wù)[21]。用戶畫像和資源畫像的情境化融合能夠?qū)⒂脩艉唾Y源進(jìn)行更精準(zhǔn)地匹配,構(gòu)建出能與用戶期望相符的情境化推薦系統(tǒng),極大提升情境導(dǎo)向推薦系統(tǒng)的推送功能和服務(wù)效果,將合適的圖書館服務(wù)資源推送給讀者,滿足不同情境下的用戶需求。
2.2.1 數(shù)據(jù)融合
數(shù)字化時代下,隨著云計算和互聯(lián)網(wǎng)技術(shù)的發(fā)展,讀者和圖書資源的各種信息都以數(shù)字化信息的形式存在,并逐漸從數(shù)字化轉(zhuǎn)向?yàn)閿?shù)據(jù)化。數(shù)據(jù)化是指將各種類型的數(shù)字信息,轉(zhuǎn)變?yōu)榻Y(jié)構(gòu)化、標(biāo)準(zhǔn)化的數(shù)據(jù)信息,同時根據(jù)數(shù)據(jù)信息的形式和種類,對數(shù)據(jù)信息進(jìn)行不同的研究和應(yīng)用。數(shù)據(jù)融合就是將各種數(shù)據(jù)信息根據(jù)類型和形態(tài)進(jìn)行融合,形成完整的大數(shù)據(jù),從而能夠?qū)?shù)據(jù)進(jìn)行集中處理,并從中發(fā)現(xiàn)有價值的信息,使數(shù)據(jù)得到最大化利用。畫像模型是挖掘和處理讀者和圖書資源的數(shù)據(jù)之后所呈現(xiàn)的標(biāo)簽集合,因此,用戶畫像和資源畫像可以被視為讀者和圖書資源數(shù)據(jù)信息的代表。讀者和圖書資源的數(shù)據(jù)融合可以通過用戶畫像和資源畫像的情境化融合來完成,生成完整的移動圖書館大數(shù)據(jù)。同時,也能夠發(fā)現(xiàn)和挖掘讀者數(shù)據(jù)和圖書資源數(shù)據(jù)之間存在的關(guān)聯(lián),實(shí)現(xiàn)讀者和圖書資源數(shù)據(jù)的有機(jī)結(jié)合,從而讓數(shù)據(jù)能夠發(fā)揮作用、創(chuàng)造價值。
2.2.2 關(guān)聯(lián)挖掘
關(guān)聯(lián)挖掘就是在用戶畫像和資源畫像所代表的讀者和圖書資源數(shù)據(jù)信息中進(jìn)行挖掘,發(fā)現(xiàn)數(shù)據(jù)當(dāng)中的關(guān)聯(lián)關(guān)系。移動圖書館畫像情境化融合是對用戶畫像和資源畫像的標(biāo)簽、主題和情境等數(shù)據(jù)信息集合進(jìn)行關(guān)聯(lián)的過程,發(fā)現(xiàn)讀者和圖書資源之間的相關(guān)關(guān)系,使畫像能夠更好地進(jìn)行融合,從而提升推薦系統(tǒng)的精準(zhǔn)度。如可以挖掘讀者的文獻(xiàn)查閱、下載和收藏等行為數(shù)據(jù)與圖書資源的分布和服務(wù)數(shù)據(jù)中的相關(guān)關(guān)系,從而發(fā)現(xiàn)用戶和圖書資源的關(guān)聯(lián),實(shí)現(xiàn)圖書資源的精準(zhǔn)推送。除此之外,移動圖書館畫像情境化融合還能挖掘用戶和用戶、資源和資源中的關(guān)聯(lián)。對讀者間進(jìn)行關(guān)聯(lián)挖掘可以發(fā)現(xiàn)不同讀者的相同點(diǎn),如都喜歡同一個作者、喜歡同一種類型的圖書等,為讀者推送具有相同愛好的伙伴,使其能夠充分討論和交流,還能將興趣、偏好相似的用戶進(jìn)行聚類,由此建立準(zhǔn)確、全面的讀者畫像模型。通過關(guān)聯(lián)挖掘能對特征相似、關(guān)聯(lián)度高的資源進(jìn)行聚類,挖掘出信息資源中的隱性關(guān)聯(lián),進(jìn)而發(fā)現(xiàn)復(fù)雜數(shù)據(jù)集的隱性知識,最終為讀者推送更為匹配的資源。
2.2.3 知識發(fā)現(xiàn)
知識發(fā)現(xiàn)是通過各種技術(shù)在各類型信息中發(fā)現(xiàn)和獲取有價值的隱性知識的過程。移動圖書館畫像融合就是在融合讀者和圖書資源的大量數(shù)據(jù)信息后,通過大數(shù)據(jù)技術(shù)和數(shù)據(jù)挖掘技術(shù),發(fā)現(xiàn)讀者和圖書資源中有價值的信息,并轉(zhuǎn)化為有用的知識并應(yīng)用到移動圖書館的推薦系統(tǒng)之中。在云計算和互聯(lián)網(wǎng)技術(shù)的基礎(chǔ)上,大量的讀者和圖書資源信息可以被移動圖書館收集和梳理,以此構(gòu)建出大量的讀者和圖書資源信息庫,然后通過用戶畫像和資源畫像對讀者和圖書資源數(shù)據(jù)信息進(jìn)行處理和研究。最后,在考慮情境要素的基礎(chǔ)上進(jìn)一步融合用戶畫像和資源畫像模型,從讀者和圖書資源的各種信息中提取潛藏知識,以更好地滿足讀者的知識需要。
數(shù)據(jù)獲取與處理是建立用戶畫像和資源畫像模型的第一步。用戶數(shù)據(jù)的收集主要是對讀者的基本情況、閱讀偏好和社交互動等數(shù)據(jù)進(jìn)行收集;圖書資源數(shù)據(jù)的收集主要是對圖書資源的基本信息、內(nèi)容梗概和資源熱度等數(shù)據(jù)進(jìn)行收集。這些數(shù)據(jù)描繪的是讀者和圖書資源的主要屬性,主要通過圖書館相關(guān)數(shù)據(jù)庫,相關(guān)平臺數(shù)據(jù)庫進(jìn)行獲取和處理。如從圖書館平臺可以獲取讀者的姓名、年齡、性別、教育背景、地區(qū)、從事工作、檢索記錄、借閱歷史、借閱記錄等基本信息:通過圖書館后臺數(shù)據(jù)庫中提取出圖書資源的作者、類別、所屬出版社、出版年份、媒介類型、語種、內(nèi)容等數(shù)據(jù);讀者在圖書館中點(diǎn)贊、轉(zhuǎn)發(fā)和下載的資源內(nèi)容及其次數(shù)和頻率,還有讀者對圖書資源的評論和讀者之間的交流互動等數(shù)據(jù),都可以通過圖書館社交網(wǎng)站獲取。由于移動圖書館是一種線上的應(yīng)用方式,因此,在收集數(shù)據(jù)時,數(shù)據(jù)的出處不同,數(shù)據(jù)格式更是多種多樣,這就需要對收集來的數(shù)據(jù)進(jìn)行預(yù)處理。鑒于所獲取數(shù)據(jù)的結(jié)構(gòu)不一致,為了便于用戶畫像和資源畫像的深度融合,需要將所有的數(shù)據(jù)都轉(zhuǎn)換為結(jié)構(gòu)一致的數(shù)據(jù)。文章通過集成、規(guī)約和轉(zhuǎn)化等數(shù)據(jù)預(yù)處理方法將獲取的數(shù)據(jù)轉(zhuǎn)化為同一結(jié)構(gòu)的數(shù)據(jù)格式。需要指出的是,采集數(shù)據(jù)時要盡量保證準(zhǔn)確、及時、完整,這樣構(gòu)建出的畫像模型更為準(zhǔn)確有效,且易于實(shí)現(xiàn)讀者畫像與資源畫像的相互匹配。
在對用戶和圖書資源數(shù)據(jù)進(jìn)行提取和處理后,為了構(gòu)建出精準(zhǔn)的畫像模型,需要對用戶和圖書資源進(jìn)行標(biāo)簽提取,構(gòu)建標(biāo)簽體系。由于用戶和資源畫像是多元化、多維度的,傳統(tǒng)的標(biāo)簽提取方式不能深入挖掘用戶和圖書資源畫像特征,致使用戶畫像和資源畫像的標(biāo)簽標(biāo)注不夠準(zhǔn)確,標(biāo)簽體系也不夠全面,導(dǎo)致用戶畫像和圖書資源的描繪不夠精準(zhǔn)。因此,根據(jù)所提取的信息數(shù)據(jù),從多維度來提取圖書用戶和圖書資源的標(biāo)簽,構(gòu)建較為完善的標(biāo)簽體系。
對于用戶標(biāo)簽的提取,文章根據(jù)所收集到的用戶基本信息數(shù)據(jù)、閱讀偏好數(shù)據(jù)、閱讀風(fēng)格和社交互動數(shù)據(jù)三個維度的具體數(shù)據(jù),從三個方面提取標(biāo)簽,構(gòu)建標(biāo)簽體系。其主要包括基本信息標(biāo)簽、知識偏好標(biāo)簽和社交互動標(biāo)簽?;拘畔?biāo)簽主要描述用戶的姓名、性別、年齡、職業(yè)、教育背景和聯(lián)系方式等信息,由于圖書館數(shù)據(jù)庫中用戶的基本信息較為精練,很多可以直接作為標(biāo)簽。閱讀偏好標(biāo)簽主要描述的是用戶群體系統(tǒng)信息檢索、頁面瀏覽、內(nèi)容下載等行為,在進(jìn)行提取時,可以將用戶檢索內(nèi)容、頁面瀏覽的關(guān)鍵詞作為知識偏好標(biāo)簽。但由于用戶的知識偏好不是一成不變的,在進(jìn)行權(quán)重計算時要綜合考慮場景變化的影響。閱讀風(fēng)格標(biāo)簽主要描述的是用戶閱讀時長、閱讀時段等,此類標(biāo)簽可以通過圖書館門禁系統(tǒng)和借閱記錄提取。社交互動標(biāo)簽主要描述的是用戶閱讀過程中產(chǎn)生的分享、評論和收藏等,此類標(biāo)簽是從移動閱讀網(wǎng)絡(luò)平臺上的評論、討論數(shù)據(jù)中提取。在進(jìn)行標(biāo)簽提取時,可將用戶評論、交流的話題關(guān)鍵詞作為標(biāo)簽進(jìn)行提取,通過用戶間連線的粗細(xì)程度表示用戶互動行為發(fā)生的強(qiáng)弱關(guān)系。
對于圖書資源的標(biāo)簽提取,文章主要從基本屬性數(shù)據(jù)、媒體類型數(shù)據(jù)、內(nèi)容屬性數(shù)據(jù)和資源熱度數(shù)據(jù)四方面信息數(shù)據(jù)中進(jìn)行標(biāo)簽提取,由此構(gòu)建出相對應(yīng)的四維度標(biāo)簽體系,具體包括基本信息標(biāo)簽、媒體類型標(biāo)簽、內(nèi)容屬性標(biāo)簽和資源熱度標(biāo)簽。其中,基本屬性標(biāo)簽主要描述的是圖書資源的作者、出版社、出版時間、資源分布等數(shù)據(jù)信息。媒體類型標(biāo)簽主要描述的是圖書資源的媒體類型,如文本、圖片、音頻和視頻等數(shù)據(jù)信息,在提取標(biāo)簽時,可以將圖書資源所屬的媒體類型作為標(biāo)簽。內(nèi)容屬性標(biāo)簽描寫的是圖書資源的主要內(nèi)容、知識主題和研究領(lǐng)域等數(shù)據(jù),在進(jìn)行標(biāo)簽提取時,可以將圖書資源的知識主題作為標(biāo)簽進(jìn)行提取。資源熱度標(biāo)簽主要描述的是圖書資源被用戶檢索、瀏覽、下載次數(shù)等數(shù)據(jù)。在進(jìn)行標(biāo)簽提取時,用節(jié)點(diǎn)表示圖書資源,節(jié)點(diǎn)大小表示圖書資源被訪問的次數(shù)。由于圖書資源的熱度是會隨著環(huán)境和時間發(fā)生改變的,因此在進(jìn)行權(quán)重計算時,可以通過綜合偏好權(quán)重和衰減權(quán)重進(jìn)行體現(xiàn)。
在構(gòu)建完成多維度的標(biāo)簽體系后,以用戶和圖書資源的標(biāo)簽體系為依據(jù),對讀者和圖書資源的相關(guān)特征進(jìn)行分析。通過特征和標(biāo)簽的匹配,將相應(yīng)的標(biāo)簽粘貼回到讀者和圖書資源上,實(shí)現(xiàn)讀者和圖書資源的標(biāo)簽化,從而構(gòu)建出讀者和圖書資源的畫像模型。在對用戶畫像和資源畫像構(gòu)建完成后,參考各標(biāo)簽不同的權(quán)重,使用tagCloud、Wordle、Tagul等將畫像標(biāo)簽進(jìn)行可視化表示,并采用語義分析技術(shù)進(jìn)一步挖掘讀者和圖書資源間的隱性關(guān)系。最后,聚類用戶畫像與資源畫像的各類標(biāo)簽,實(shí)現(xiàn)類似屬性特征的用戶和圖書資源的聚集,由此得到群體用戶畫像和對應(yīng)的資源畫像。
移動圖書館用戶畫像與資源畫像的情境化融合既要分析讀者在不同情境下的知識需求,也要使圖書資源的知識主題符合用戶所處的情境。因此,移動圖書館用戶畫像與資源畫像的情境化融合要從多個維度進(jìn)行分析。
4.1.1 需求維度
移動圖書館畫像情境化融合的目的是通過畫像融合來實(shí)現(xiàn)用戶和資源的精準(zhǔn)匹配,以此來滿足讀者的需求,而且移動圖書館推薦系統(tǒng)的發(fā)展也離不開用戶需求的驅(qū)動。但當(dāng)前用戶的需求變得越來越復(fù)雜,且會根據(jù)情境的不同發(fā)生改變。因此,移動圖書館畫像的情境化融合要從用戶需求的維度上入手,全面考慮用戶在不同情境下的需求變化趨勢,深度剖析用戶畫像的各維度標(biāo)簽信息,找出不同情境下用戶需求的差別,歸納出用戶在每一情境下的閱讀需求,使移動圖書館的情境化推薦系統(tǒng)成為能夠滿足用戶不同需求、功能多元、方便快捷的推薦系統(tǒng),突出情境化融合的優(yōu)勢。
4.1.2 主題維度
移動圖書館畫像的情境化融合不僅要考慮用戶的需求,還要考慮圖書資源所表達(dá)的知識主題是否與用戶的需求一致,這樣才能達(dá)到最佳的推送效果。因此,情境化融合要將圖書資源所表達(dá)的知識主題與用戶不同情境下的知識需求進(jìn)行精準(zhǔn)匹配,使移動圖書館的情境化推薦系統(tǒng)能夠?qū)D書資源進(jìn)行更為精準(zhǔn)有效的推送,滿足用戶的知識需求。具體而言,通過對圖書資源的基礎(chǔ)信息和主題信息進(jìn)行深度挖掘,構(gòu)建圖書資源的主題詞匯;融合用戶畫像中用戶所檢索的知識主題與資源畫像所表達(dá)的知識主題,實(shí)現(xiàn)圖書資源知識主題與用戶需求的匹配,從而促成用戶畫像和資源畫像充分融合,提高用戶與圖書資源匹配的準(zhǔn)確率。
4.1.3 情境維度
除了考慮用戶的需求和圖書資源的主題之外,還要對用戶所處的情境和移動圖書館推薦系統(tǒng)服務(wù)方式之間的融合進(jìn)行全面考慮。用戶所需求的服務(wù)是與自己所處情境相宜的服務(wù),因此要構(gòu)建出推送服務(wù)和推送時間均能滿足用戶不同場景需求的情境化推薦系統(tǒng)。移動圖書館畫像的情境化融合要從用戶畫像的各種行為數(shù)據(jù)信息中分析出用戶可能所處的情境信息;然后根據(jù)情境信息對資源畫像進(jìn)行分析,在圖書資源中搜尋出與該情境適合的圖書資源;最后根據(jù)用戶所處的情境要素,從情境維度對適合每種情境的服務(wù)方式進(jìn)行選擇,從而實(shí)現(xiàn)用戶情境與移動圖書館推薦系統(tǒng)服務(wù)方式有機(jī)融合的目的,在適當(dāng)時間為讀者提供更合適的推送服務(wù)。
從用戶畫像與資源畫像情境化融合的層次來看,可以分為標(biāo)簽融合、主題融合、情境融合和服務(wù)融合。
4.2.1 標(biāo)簽融合
標(biāo)簽融合是用戶畫像和資源畫像情境化融合的起點(diǎn)。標(biāo)簽是建立畫像模型的核心所在,因此,用戶畫像和資源畫像的融合首先需要從標(biāo)簽上進(jìn)行融合。同時,標(biāo)簽又具有語義化和短文本的特點(diǎn),在融合時會更加便捷。標(biāo)簽所代表的是讀者和圖書資源的各種數(shù)據(jù)信息,因此可以根據(jù)標(biāo)簽所代表的數(shù)據(jù)信息重要性來計算標(biāo)簽的權(quán)重大小,提取權(quán)重較大的標(biāo)簽作為中心標(biāo)簽。其次,根據(jù)聚類算法匯聚中心標(biāo)簽形成聚類中心,計算用戶畫像和資源畫像各類標(biāo)簽和中心標(biāo)簽的相關(guān)度,聚合關(guān)聯(lián)性最大的標(biāo)簽,形成新的聚類中心,如此循環(huán)往復(fù)直至每個標(biāo)簽與聚類中心之間的相關(guān)性不再變化,這樣就完成了標(biāo)簽的聚類,并將聚類的標(biāo)簽進(jìn)行融合。最后,通過標(biāo)簽的融合將相似的用戶和圖書資源進(jìn)行匯總,使其成為用戶畫像和資源畫像融合的基礎(chǔ)部分。
4.2.2 主題融合
主題融合是用戶畫像和資源畫像進(jìn)行情境化融合的中間部分,主題是圖書資源主要內(nèi)容和用戶需求的簡潔表述,用戶復(fù)雜的需求可以通過幾個簡單的主題詞進(jìn)行表達(dá),而圖書資源的主要內(nèi)容和中心思想也可以用幾個簡單的主題詞進(jìn)行表述。因此,要想使畫像融合更加深入細(xì)致,就要將讀者需求主題和圖書資源主題進(jìn)行融合,發(fā)現(xiàn)和挖掘標(biāo)簽中潛在的和有用的用戶需求主題和圖書資源主題,并分析兩者之間的關(guān)聯(lián)性,將關(guān)聯(lián)度大的主題進(jìn)行融合。具體而言,首先需要挖掘用戶畫像中的閱讀偏好和社交互動標(biāo)簽體系中的各類標(biāo)簽,獲取用戶搜索行為和討論行為的主題;其次對圖書資源的主題標(biāo)簽進(jìn)行分析,提取出圖書資源的主題詞,運(yùn)用詞庫匹配擴(kuò)展主題詞;然后運(yùn)用關(guān)聯(lián)規(guī)則的知識發(fā)現(xiàn)方法,對用戶畫像和圖書資源畫像主題之間存在的知識關(guān)聯(lián)進(jìn)行挖掘,并對兩者之間的知識關(guān)聯(lián)度進(jìn)行計算,融合主題關(guān)聯(lián)度較高的用戶畫像和資源畫像;最后,根據(jù)整體規(guī)劃對各個類型的主題詞進(jìn)行有效優(yōu)化與融合,構(gòu)建出多樣化、分布式的融合主題詞庫。
4.2.3 情境融合
情境融合是用戶畫像和資源畫像情境化融合的關(guān)鍵部分,情境是指用戶在一定時間內(nèi)所處的境況。情境融合就是將畫像中所隱藏的情境信息與移動圖書館服務(wù)方式進(jìn)行融合,使推薦系統(tǒng)所提供的服務(wù)方式能更進(jìn)一步進(jìn)行組織和優(yōu)化。依據(jù)用戶畫像中的閱讀偏好標(biāo)簽和社交互動標(biāo)簽,分析出其中隱藏的情境信息,進(jìn)而對讀者可能所處的情境進(jìn)行猜測。根據(jù)用戶所處的不同情境,得出用戶在該情境下的需求主題,結(jié)合用戶需求主題和圖書資源主題在圖書資源中找出合適的服務(wù)資源。此外,情境融合還要選擇適合用戶當(dāng)前情境的服務(wù)方式,將當(dāng)前情境、知識主題和服務(wù)方式進(jìn)行有效融合,構(gòu)建全面、多樣、體驗(yàn)式的情境化推薦系統(tǒng)。
4.2.4 服務(wù)融合
服務(wù)融合是融合的最終目的,畫像融合的最終目標(biāo)是構(gòu)建出精準(zhǔn)的移動圖書館情境化推薦系統(tǒng),通過對各個情境要素的有機(jī)融合和主題凝練,將情境化推薦系統(tǒng)所提供的全部推送服務(wù)和推送時間根據(jù)用戶情境進(jìn)行有效融合,構(gòu)建出適合情境、用戶滿意的移動圖書館推薦系統(tǒng),形成移動圖書館即時、以人為本、情境導(dǎo)向的個性化服務(wù)內(nèi)容和服務(wù)模式。
移動圖書館用戶畫像與資源畫像的情境化融合要按照“需求分析—資源主題—情境融合—服務(wù)優(yōu)化—推薦效果—效果反饋”的路徑循環(huán)發(fā)展,實(shí)現(xiàn)有機(jī)融合。
4.3.1 需求分析
用戶的需求一直是移動圖書館個性化推薦系統(tǒng)的關(guān)注方向,圖書館只有從用戶的角度出發(fā),在全面考慮用戶需求的基礎(chǔ)上進(jìn)行科學(xué)設(shè)計,才能充分體現(xiàn)“用戶第一,以人為本”的理念[22]。用戶需求可通過四個方式進(jìn)行獲取:一是從用戶畫像中的基礎(chǔ)信息數(shù)據(jù)中獲取,根據(jù)用戶的基礎(chǔ)信息,分析出用戶可能所需的圖書資源,以此在圖書資源中進(jìn)行篩選,如對用戶的學(xué)歷、職業(yè)進(jìn)行分析,找出適合用戶的圖書、文獻(xiàn)等資源;二是對用戶畫像中的閱讀偏好進(jìn)行分析,根據(jù)用戶所喜好的作者、內(nèi)容進(jìn)行分析,如某個用戶經(jīng)常借閱“計算機(jī)”類的書籍,就可以將與“計算機(jī)”有關(guān)的圖書資源推送給該用戶;三是用戶行為分析,根據(jù)用戶搜索歷史、下載內(nèi)容分析用戶的知識需求,如某位用戶在移動圖書館平臺上經(jīng)常搜索和下載關(guān)于武俠小說的內(nèi)容,就為其推送有關(guān)武俠小說的圖書資源;四是用戶需求反饋,根據(jù)用戶反饋對畫像進(jìn)行監(jiān)測及修正,改進(jìn)推薦系統(tǒng)的精準(zhǔn)度,并在服務(wù)平臺上進(jìn)行更新與展示,如此循環(huán)最終形成一個良性的情境化推薦生態(tài)系統(tǒng)。
4.3.2 資源主題
移動圖書館內(nèi)圖書資源的數(shù)量較多,怎樣從海量的資源尋找出滿足用戶需求的資源至關(guān)重要。為解決這個問題,可以通過生成一系列資源主題來刻畫圖書資源的內(nèi)容特征,根據(jù)主題詞將合適的圖書資源推送給用戶。具體而言,建立資源主題是從所構(gòu)建的圖書資源畫像各類標(biāo)簽系統(tǒng)中挖掘出圖書資源所包含的各個方面主題詞,將這些主題詞進(jìn)行匯總,然后根據(jù)用戶的查閱、閱覽和下載等行為得出用戶目標(biāo)資源的主題詞,最后將與該主題詞相關(guān)的服務(wù)資源推送給用戶。移動閱讀環(huán)境下,動態(tài)主題畫像能及時反映移動閱讀主題的發(fā)展變化過程,可利用貪婪算法隨著移動閱讀情境的變化對資源主題不斷修正,實(shí)現(xiàn)資源主題的動態(tài)更新。
4.3.3 情境融合
移動圖書館的便捷性使用戶能隨時隨地瀏覽查閱圖書館資源,但用戶情境具有多變性,且用戶需求會根據(jù)情境的不同而發(fā)生改變。因此,需要系統(tǒng)分析用戶的情境要素,以此來對移動圖書館的服務(wù)方式進(jìn)行調(diào)整,從而滿足用戶隨情境變化而轉(zhuǎn)變的需求。具體而言,可根據(jù)讀者在用戶畫像中的行為信息得出讀者所處情境,將情境信息映射為用戶需求內(nèi)容偏好和對資源內(nèi)容的限定性條件,分析當(dāng)前情境下的讀者需求并建立基于情境的用戶偏好模型,圍繞情境變化、融合情境與用戶需求、情境化服務(wù)三個方面逐一計算其與待推薦信息的相似度,以此全面、合理、細(xì)致地挖掘用戶的情境要素,挑選合適的圖書資源,以實(shí)現(xiàn)對移動圖書館畫像的情境化融合。
4.3.4 服務(wù)優(yōu)化
移動圖書館的服務(wù)方式主要是為用戶推送合適的相關(guān)資源的形式。對于服務(wù)的優(yōu)化,需要把握好情境融合的層次,對用戶畫像標(biāo)簽與資源畫像標(biāo)簽、用戶需求和資源主題、情境與推薦服務(wù)的融合等進(jìn)行合理詳細(xì)的考慮,從滿足用戶情境化需求、融通推薦系統(tǒng)虛實(shí)空間、嵌入式實(shí)時服務(wù)、服務(wù)成本合理控制四個維度進(jìn)行綜合考量,科學(xué)布局、合理優(yōu)化移動圖書館服務(wù)方式,及時調(diào)整推送策略、推送方式與推送時間,以全面滿足用戶需求。
4.3.5 推薦效果
推薦效果是衡量移動圖書館用戶畫像與資源畫像情境化融合效果的標(biāo)準(zhǔn)。推薦系統(tǒng)所提供的服務(wù)只有能夠滿足用戶的需求,能使用戶更加便捷迅速地找到自己所需的圖書資源,才能說明畫像融合有了效果,因此推薦效果就是對融合效果的檢驗(yàn)。移動圖書館情境化推薦效果包括推薦系統(tǒng)情境的利用度、所提供服務(wù)的用戶滿意度、用戶體驗(yàn)度、推送的精準(zhǔn)度、成本效益度等指標(biāo)。以上指標(biāo)均能實(shí)現(xiàn),推薦系統(tǒng)才能得到用戶的肯定。
4.3.6 效果反饋
移動圖書館的推薦系統(tǒng)不是一成不變的,須進(jìn)行不定期的優(yōu)化和改善,以滿足用戶多變的需求。用戶是移動圖書館推薦系統(tǒng)的使用者,其反饋對推薦系統(tǒng)和服務(wù)方式的改善和優(yōu)化十分重要。因此,接受用戶反饋并加以利用,處理好移動圖書館情境化推薦與用戶反饋結(jié)果之間的辨證關(guān)系,通過試錯改進(jìn)不足,不斷完善推薦機(jī)制。具體而言,要依據(jù)用戶反饋對畫像模型進(jìn)行修正,做好推薦系統(tǒng)情境要素的斟酌與比選,將與移動圖書館用戶接受期望不符的情境要素刪除,保持情境融合與用戶接受期望方向的一致性和供需的平衡性,優(yōu)化和改善移動圖書館推薦系統(tǒng)所提供的服務(wù)和功能,使移動圖書館推薦系統(tǒng)能夠適應(yīng)和滿足用戶多變的需求,進(jìn)而提高用戶的滿意度。
在互聯(lián)網(wǎng)時代背景下,移動圖書館推薦系統(tǒng)中的用戶畫像與資源畫像融合是對館藏資源進(jìn)行高效利用的重要途徑,并能提高移動圖書館推薦系統(tǒng)的服務(wù)質(zhì)量。文章將用戶畫像方法引用到移動圖書館的推薦系統(tǒng)中,基于用戶畫像的思想對移動圖書館的讀者和圖書資源構(gòu)建用戶畫像和資源畫像,接著從維度、層次和路徑三個方面對用戶畫像和資源畫像的融合進(jìn)行分析,并據(jù)此提出畫像情境化融合在移動圖書館推薦系統(tǒng)中的應(yīng)用,為當(dāng)前移動圖書館推薦系統(tǒng)實(shí)現(xiàn)精準(zhǔn)推送和個性化服務(wù)提供參考。然而,文章只是從理論上對用戶畫像和資源畫像的情境化融合進(jìn)行研究,并沒有從數(shù)據(jù)和算法等方面來對用戶畫像和資源畫像的情境融合進(jìn)行實(shí)證分析。未來,期待學(xué)界針對數(shù)據(jù)挖掘和深度學(xué)習(xí)等技術(shù)開展進(jìn)一步探索,以促進(jìn)本領(lǐng)域研究的不斷深入。
(來稿時間:2020年12月)