劉曉婷,楊 超,趙宇鵬
(河北北方學(xué)院,河北 張家口 075000)
隨著大數(shù)據(jù)、人工智能、云計(jì)算等技術(shù)的廣泛應(yīng)用,社會(huì)逐步向智能化方向發(fā)展。黨的十九大報(bào)告提出建設(shè)智慧社會(huì),這是對(duì)信息社會(huì)發(fā)展趨勢(shì)判斷的科學(xué)部署。圖書(shū)館應(yīng)當(dāng)牢牢把握信息化發(fā)展帶來(lái)的機(jī)遇,為圖書(shū)館智慧化發(fā)展以及為讀者提供更好的智慧化服務(wù)不斷開(kāi)辟新路徑,從而更好地推進(jìn)智慧社會(huì)的建設(shè)。
近年來(lái),用戶(hù)畫(huà)像在電子商務(wù)、醫(yī)療衛(wèi)生、旅游業(yè)、圖書(shū)館等領(lǐng)域都有應(yīng)用。相關(guān)研究表明,用戶(hù)畫(huà)像技術(shù)的運(yùn)用,對(duì)深入了解用戶(hù)需求,實(shí)現(xiàn)信息服務(wù)個(gè)性化和精準(zhǔn)化有顯著作用。用戶(hù)畫(huà)像最初在電商領(lǐng)域中得到應(yīng)用,當(dāng)前也是在電子商務(wù)領(lǐng)域的應(yīng)用最為成熟,主要體現(xiàn)在根據(jù)消費(fèi)習(xí)慣等用戶(hù)行為數(shù)據(jù),推薦個(gè)性化商品和服務(wù)信息,從而實(shí)現(xiàn)精準(zhǔn)營(yíng)銷(xiāo)。在醫(yī)療衛(wèi)生領(lǐng)域,主要體現(xiàn)在根據(jù)用戶(hù)健康信息行為進(jìn)行健康信息推薦。在旅游行業(yè),主要應(yīng)用于旅游信息推薦。在圖書(shū)館行業(yè),當(dāng)前主要是應(yīng)用于精準(zhǔn)讀者服務(wù)方面,用戶(hù)畫(huà)像技術(shù)在圖書(shū)館領(lǐng)域尚屬起步階段。
用戶(hù)畫(huà)像的概念最早由Alan Cooper提出,是指構(gòu)建能夠反映目標(biāo)用戶(hù)真實(shí)數(shù)據(jù)信息情況的虛擬模型[1]。簡(jiǎn)單地說(shuō)就是用戶(hù)信息標(biāo)簽化,是通過(guò)用戶(hù)的基本屬性信息、行為信息興趣偏好等特征性數(shù)據(jù),對(duì)用戶(hù)進(jìn)行聚類(lèi)分析,形成并建立基于用戶(hù)需求的普遍性和差異性模型。
使用CNKI統(tǒng)計(jì)分析工具對(duì)檢索結(jié)果進(jìn)行分析發(fā)現(xiàn),國(guó)內(nèi)最早對(duì)用戶(hù)畫(huà)像技術(shù)在圖書(shū)館領(lǐng)域的研究是在2014年,從2017年開(kāi)始發(fā)文量持續(xù)上升,2018年后的發(fā)文量占全部文獻(xiàn)的93%。文獻(xiàn)研究表明,用戶(hù)畫(huà)像已經(jīng)成為近年來(lái)國(guó)內(nèi)圖書(shū)館學(xué)、情報(bào)學(xué)領(lǐng)域的熱點(diǎn)研究方向。
通過(guò)對(duì)所收集的文獻(xiàn)全文進(jìn)行詳細(xì)的閱讀和分析,對(duì)當(dāng)前國(guó)內(nèi)用戶(hù)畫(huà)像技術(shù)在圖書(shū)館領(lǐng)域的研究進(jìn)行梳理。研究主要集中在4個(gè)方面,其中對(duì)用戶(hù)畫(huà)像模型構(gòu)建方面的研究最多。
1.2.1 用戶(hù)畫(huà)像模型的構(gòu)建
陳添源[2]基于高校移動(dòng)圖書(shū)館的特定情境,通過(guò)對(duì)高校師生進(jìn)行問(wèn)卷調(diào)研的方式,對(duì)人口統(tǒng)計(jì)、使用行為、使用心理進(jìn)行統(tǒng)計(jì),并利用因子分析、聚類(lèi)分析和判別分析法選取適宜的用戶(hù)畫(huà)像個(gè)數(shù),從而構(gòu)建其用戶(hù)畫(huà)像標(biāo)簽體系;李曉敏等[3]為實(shí)現(xiàn)智慧圖書(shū)館精準(zhǔn)實(shí)體圖書(shū)推薦,對(duì)讀者的自然屬性、興趣屬性、社交屬性與圖書(shū)的相似性進(jìn)行匹配,構(gòu)建智慧圖書(shū)館用戶(hù)畫(huà)像;于興尚等[4]以讀者基本信息、閱讀行為、心理特征、社交網(wǎng)絡(luò)、情境感知5個(gè)方面作為數(shù)據(jù)源,構(gòu)建用戶(hù)畫(huà)像。肖海清等[5]為促進(jìn)高校圖書(shū)館閱讀推廣,從數(shù)據(jù)采集層、數(shù)據(jù)處理層、標(biāo)簽抽取層、用戶(hù)交互關(guān)聯(lián)層及應(yīng)用實(shí)現(xiàn)層5個(gè)層面,構(gòu)建了基于閱讀推廣內(nèi)在循環(huán)為機(jī)制的參與式用戶(hù)畫(huà)像模型;楊群等[6]基于大學(xué)圖書(shū)館微知識(shí)服務(wù),規(guī)劃微知識(shí)服務(wù)流程,設(shè)計(jì)了基于用戶(hù)畫(huà)像的微知識(shí)服務(wù)體系模型。張宇等[7]基于圖書(shū)知識(shí)服務(wù)系統(tǒng),通過(guò)讀者基本信息、情境信息、內(nèi)容偏好信息和互動(dòng)會(huì)話信息4個(gè)方面對(duì)用戶(hù)畫(huà)像模型進(jìn)行構(gòu)建,為圖書(shū)館知識(shí)服務(wù)系統(tǒng)提升了效率和精度。
1.2.2 用戶(hù)畫(huà)像算法與技術(shù)
李偉等[8]基于經(jīng)典k-means算法,提出了一種基于馬氏距離的多視角二分k-means算法,優(yōu)化在多視角聚類(lèi)中陷入局部最優(yōu)的缺陷,設(shè)計(jì)了高校圖書(shū)館用戶(hù)畫(huà)像框架;廖運(yùn)平等[9]將圖書(shū)館用戶(hù)畫(huà)像分成面向設(shè)計(jì)與面向營(yíng)銷(xiāo)兩類(lèi),并分別探析二者的內(nèi)涵、特征、創(chuàng)建方法和創(chuàng)建步驟;吳智勤等[10]對(duì)當(dāng)前科研用戶(hù)畫(huà)像存在的算力算法不足、標(biāo)簽不全和不準(zhǔn)的問(wèn)題進(jìn)行分析與改善,提出了基于社交網(wǎng)絡(luò)方法和知識(shí)圖譜技術(shù)的用戶(hù)畫(huà)像標(biāo)簽的構(gòu)建策略。朱會(huì)華等[11]運(yùn)用數(shù)據(jù)挖掘、知識(shí)聚類(lèi),創(chuàng)建基于用戶(hù)畫(huà)像的讀者薦購(gòu)、學(xué)科薦購(gòu)、采訪薦購(gòu)模式。
1.2.3 圖書(shū)館精準(zhǔn)服務(wù)應(yīng)用
毛玉蘭[12]構(gòu)建圖書(shū)館用戶(hù)畫(huà)像,用以提升圖書(shū)館閱讀推廣精準(zhǔn)性,顯著提高閱讀推廣工作效果并提升讀者服務(wù)滿意度;李晶潔等[13]以天津商業(yè)大學(xué)圖書(shū)館為例,依托讀者數(shù)據(jù)并從多維度建立數(shù)據(jù)模型,構(gòu)建用戶(hù)畫(huà)像,并通過(guò)用戶(hù)畫(huà)像對(duì)優(yōu)化館藏結(jié)構(gòu)建設(shè)和服務(wù)提出建議;劉海鷗等[14]從用戶(hù)畫(huà)像大數(shù)據(jù)收集、處理、存儲(chǔ)和安全4個(gè)方面具體闡釋移動(dòng)圖書(shū)館大數(shù)據(jù)應(yīng)用策略,促進(jìn)用戶(hù)畫(huà)像在移動(dòng)圖書(shū)館知識(shí)發(fā)現(xiàn)、知識(shí)產(chǎn)權(quán)保護(hù)、精準(zhǔn)推送等方面的具體應(yīng)用;張若蘭[15]對(duì)于智慧圖書(shū)館情景化知識(shí)推薦服務(wù)方面,設(shè)計(jì)了基于用戶(hù)畫(huà)像服務(wù)的目標(biāo)與服務(wù)流程,并總結(jié)相關(guān)應(yīng)用經(jīng)驗(yàn)。
1.2.4 用戶(hù)畫(huà)像相關(guān)隱私問(wèn)題研究
周林興等[16]剖析了圖書(shū)館用戶(hù)畫(huà)像在構(gòu)建和使用過(guò)程中存在的隱私問(wèn)題,從意識(shí)、管理、技術(shù)和法制4個(gè)層面提出相應(yīng)策略,從而更好實(shí)現(xiàn)圖書(shū)館用戶(hù)畫(huà)像隱私治理。
用戶(hù)畫(huà)像建立在真實(shí)而復(fù)雜的眾多數(shù)據(jù)基礎(chǔ)上,其核心是用戶(hù)信息的標(biāo)簽化,需要將不同的用戶(hù)通過(guò)差異化的標(biāo)簽進(jìn)行描述,將用戶(hù)特征標(biāo)識(shí)出來(lái)。圖書(shū)館用戶(hù)畫(huà)像標(biāo)簽體系,基于高校圖書(shū)館用戶(hù)需求,用戶(hù)畫(huà)像標(biāo)簽首先需要包含讀者人口屬性,其中包括性別、專(zhuān)業(yè)、年級(jí)、身份類(lèi)別(如教師或?qū)W生)。讀者心理屬性分為興趣屬性和社交屬性?xún)深?lèi)。興趣屬性主要是指讀者線上和線下使用圖書(shū)館獲取文獻(xiàn)的偏好,涉及線上電子文獻(xiàn)的查詢(xún)、瀏覽、下載、閱讀和紙質(zhì)文獻(xiàn)查詢(xún)、借閱情況,包含電子書(shū)、論文、視頻和紙質(zhì)圖書(shū)與期刊。社交屬性主要是指讀者與圖書(shū)館相關(guān)事物的互動(dòng),如圖書(shū)館網(wǎng)站平臺(tái)的話題討論、微信公眾號(hào)發(fā)文的評(píng)論、相關(guān)學(xué)科內(nèi)容的關(guān)注與分享、圖書(shū)館推廣活動(dòng)的參與等。讀者行為屬性,主要是指讀者線上或線下使用圖書(shū)館的行為方式與特點(diǎn),如訪問(wèn)的方式、訪問(wèn)終端、經(jīng)常訪問(wèn)的時(shí)間段、每次訪問(wèn)耗用的時(shí)長(zhǎng)、訪問(wèn)的頻率等。構(gòu)建的高校圖書(shū)館用戶(hù)畫(huà)像標(biāo)簽體系,如圖1所示。
高校圖書(shū)館用戶(hù)畫(huà)像的構(gòu)建要遵循兩個(gè)原則:一是能夠代表讀者的全部特征,能夠?qū)⒆x者對(duì)圖書(shū)館資源的利用和圖書(shū)館服務(wù)的使用情況準(zhǔn)確地表述出來(lái);二是能夠滿足高校圖書(shū)館業(yè)務(wù)需求,把圖書(shū)館開(kāi)展的工作和服務(wù)所需的支持?jǐn)?shù)據(jù)盡可能全面涵蓋。構(gòu)建用戶(hù)畫(huà)像可按照以下流程進(jìn)行。
(1)基礎(chǔ)數(shù)據(jù)的采集。數(shù)據(jù)的獲取來(lái)源于圖書(shū)館管理系統(tǒng)、圖書(shū)館門(mén)禁系統(tǒng)、座位管理系統(tǒng)以及圖書(shū)館門(mén)戶(hù)網(wǎng)站的網(wǎng)絡(luò)日志等。圖書(shū)館管理系統(tǒng)保存讀者的基本信息,如專(zhuān)業(yè)、年級(jí)、年齡、性別、身份,還包括讀者借還書(shū)信息。圖書(shū)館門(mén)禁系統(tǒng)記錄了讀者入館頻次、入館時(shí)間及時(shí)長(zhǎng)。座位管理系統(tǒng)記錄了讀者習(xí)慣使用的閱覽室、座位號(hào)、學(xué)習(xí)時(shí)間、頻次等。圖書(shū)館門(mén)戶(hù)網(wǎng)站記錄了讀者檢索、在線閱讀文獻(xiàn)、互動(dòng)留言等信息行為。涉及的讀者數(shù)據(jù)按照用戶(hù)畫(huà)像標(biāo)簽體系分為讀者人口屬性數(shù)據(jù)、讀者心理屬性數(shù)據(jù)、讀者行為屬性數(shù)據(jù),再根據(jù)這些特征對(duì)讀者進(jìn)行畫(huà)像。收集到的用戶(hù)畫(huà)像數(shù)據(jù)可分成兩類(lèi):一類(lèi)是靜態(tài)數(shù)據(jù),另一類(lèi)是動(dòng)態(tài)數(shù)據(jù)。不會(huì)實(shí)時(shí)變動(dòng)的數(shù)據(jù)是靜態(tài)數(shù)據(jù),如讀者人口屬性數(shù)據(jù),而會(huì)實(shí)時(shí)變動(dòng)的數(shù)據(jù)為動(dòng)態(tài)數(shù)據(jù),如讀者心理屬性數(shù)據(jù)、讀者行為屬性數(shù)據(jù)。根據(jù)用戶(hù)的靜態(tài)數(shù)據(jù)能夠了解用戶(hù)的基本需求,根據(jù)用戶(hù)的動(dòng)態(tài)數(shù)據(jù)可以為用戶(hù)提供精準(zhǔn)的個(gè)性化服務(wù)。
(2)數(shù)據(jù)預(yù)處理。其主要是對(duì)收集的數(shù)據(jù)進(jìn)行結(jié)構(gòu)化和清洗,對(duì)存在噪聲和缺失、錯(cuò)誤、不規(guī)則的數(shù)據(jù),進(jìn)行清洗、去除、轉(zhuǎn)換等處理。由于高校圖書(shū)館的數(shù)據(jù)量很大,數(shù)據(jù)中包含很多冗余數(shù)據(jù),必須去除重復(fù)數(shù)據(jù)。
(3)用戶(hù)畫(huà)像構(gòu)建。用戶(hù)靜態(tài)數(shù)據(jù)主要來(lái)源于高校圖書(shū)館信息管理系統(tǒng)數(shù)據(jù)庫(kù),從數(shù)據(jù)庫(kù)直接采集后,采用抽取、轉(zhuǎn)換、加載技術(shù)。而動(dòng)態(tài)數(shù)據(jù)是實(shí)時(shí)變化的,需要用權(quán)重來(lái)衡量數(shù)據(jù)的重要程度。根據(jù)用戶(hù)畫(huà)像標(biāo)簽體系,用一些較為成熟的大數(shù)據(jù)工具軟件構(gòu)建用戶(hù)畫(huà)像和畫(huà)像的權(quán)重。由于用戶(hù)畫(huà)像無(wú)法完全準(zhǔn)確地描述一個(gè)群體,要根據(jù)不斷變化的讀者數(shù)據(jù)進(jìn)行不斷的修改,更符合讀者的特征。
近年來(lái),在高新技術(shù)的飛速發(fā)展下,高校圖書(shū)館逐漸向智慧圖書(shū)館轉(zhuǎn)型發(fā)展,要求圖書(shū)館服務(wù)更加個(gè)性化、精準(zhǔn)化、主動(dòng)化,服務(wù)內(nèi)容和服務(wù)方式也更加豐富多樣。將用戶(hù)畫(huà)像技術(shù)應(yīng)用到智慧圖書(shū)館的建設(shè)中,對(duì)資源精準(zhǔn)推薦、數(shù)據(jù)統(tǒng)計(jì)、館藏資源建設(shè)、學(xué)科服務(wù)等圖書(shū)館服務(wù)將會(huì)有很大幫助,從而更好的滿足讀者需求。
圖書(shū)館資源的精準(zhǔn)推薦,是指能夠按照高校師生的信息需求為讀者主動(dòng)推送館藏信息資源,包括館藏紙本圖書(shū)、期刊,電子圖書(shū)、期刊,數(shù)據(jù)庫(kù)信息等。以往無(wú)差別的資源推薦,對(duì)于圖書(shū)館來(lái)說(shuō)往往是付出很多的勞動(dòng),但效果不理想。高校圖書(shū)館資源精準(zhǔn)推薦,對(duì)促進(jìn)高校閱讀推廣、提高資源利用率有重要的作用。
通過(guò)系統(tǒng)構(gòu)建師生用戶(hù)畫(huà)像,對(duì)圖書(shū)館讀者不同維度和不同層次的標(biāo)簽信息進(jìn)行組織與挖掘,將其與館藏資源包括館藏圖書(shū)和期刊相匹配,讀者人口屬性更能反映一類(lèi)讀者的共性需求,讀者心理屬性和行為屬性更能體現(xiàn)每一讀者的個(gè)性需求,從而精準(zhǔn)地實(shí)現(xiàn)對(duì)讀者的資源推薦。在用戶(hù)畫(huà)像的技術(shù)支持下,圖書(shū)館能夠提高資源推薦的精準(zhǔn)性,促進(jìn)高校師生信息利用,為開(kāi)展各項(xiàng)線下和線上閱讀推廣活動(dòng)提高成效。
高校圖書(shū)館每年都有較多的經(jīng)費(fèi)用于資源的采訪,對(duì)于一些經(jīng)費(fèi)不充足的高校,資金的利用率就顯得尤為重要。在每年圖書(shū)館資源采訪工作中,如何能將經(jīng)費(fèi)用在最能滿足師生需求的資源建設(shè)上,是各個(gè)高校資源建設(shè)方面都在深入研究的問(wèn)題。
基于用戶(hù)畫(huà)像技術(shù),根據(jù)用戶(hù)人口屬性、心理屬性、行為屬性生成個(gè)人畫(huà)像和群體畫(huà)像,并對(duì)圖書(shū)信息資源按中圖法和學(xué)科進(jìn)行分類(lèi),對(duì)文獻(xiàn)信息資源和用戶(hù)數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗、降噪,數(shù)據(jù)發(fā)掘、聚類(lèi)等,最終結(jié)合本校圖書(shū)館采訪的基本方向和原則,將近幾年新出版的圖書(shū)信息資源和高校師生的畫(huà)像相匹配。以此在基于讀者資源需求、館藏資源利用率、學(xué)科建設(shè)需求的基礎(chǔ)上,為圖書(shū)采訪提供科學(xué)的、有依據(jù)的薦購(gòu)。
高校教師承擔(dān)教學(xué)和科研的雙重任務(wù),科研往往是由團(tuán)隊(duì)合作來(lái)完成的,團(tuán)隊(duì)中的成員多數(shù)在人口屬性和興趣屬性上具有一定的相似性。與此同時(shí),每一個(gè)團(tuán)隊(duì)成員在讀者屬性、行為、偏好上也存在個(gè)體差異,從而有利于為不同的讀者制定不同的學(xué)科服務(wù)策略。
學(xué)校各個(gè)學(xué)科的重點(diǎn)研究領(lǐng)域,對(duì)研究團(tuán)隊(duì)及個(gè)人,在深入采集讀者屬性、行為、偏好數(shù)據(jù)的基礎(chǔ)上,通過(guò)數(shù)據(jù)挖掘與分析用戶(hù)數(shù)據(jù),構(gòu)建群體和個(gè)人用戶(hù)畫(huà)像,根據(jù)用戶(hù)畫(huà)像把握和預(yù)測(cè)用戶(hù)的科研興趣偏好,把握科研需求,分析用戶(hù)的研究領(lǐng)域熱點(diǎn)問(wèn)題、研究趨勢(shì)、合作學(xué)者、學(xué)術(shù)影響力、研究成果分析等,并為科研團(tuán)隊(duì)成員推送個(gè)性化的科學(xué)情報(bào)服務(wù)。
用戶(hù)畫(huà)像能夠讓智慧圖書(shū)館掌握師生實(shí)際和潛在的信息需求特征,通過(guò)對(duì)圖書(shū)館業(yè)務(wù)進(jìn)行數(shù)據(jù)統(tǒng)計(jì)分析,為圖書(shū)館未來(lái)發(fā)展決策提供支持和幫助。
例如,可以通過(guò)用戶(hù)畫(huà)像分析不同專(zhuān)業(yè)和年級(jí)的學(xué)生到圖書(shū)館進(jìn)行借閱、自習(xí)、參加讀者活動(dòng)、使用圖書(shū)館智慧空間等設(shè)施的需求;分析圖書(shū)館組織的各種讀者活動(dòng),每種活動(dòng)更吸引哪類(lèi)讀者參與;按照學(xué)科對(duì)館藏資源進(jìn)行分類(lèi),分析用戶(hù)對(duì)各個(gè)學(xué)科的資源需求等。基于用戶(hù)畫(huà)像,智慧圖書(shū)館讀者需求得以全面呈現(xiàn),各項(xiàng)服務(wù)向精準(zhǔn)化發(fā)展,并為未來(lái)圖書(shū)館工作與發(fā)展提供方向指引,促進(jìn)圖書(shū)館服務(wù)水平和讀者滿意度的不斷提升。
當(dāng)前,各地高校圖書(shū)館逐漸向智慧圖書(shū)館轉(zhuǎn)型發(fā)展,從設(shè)備、技術(shù)、服務(wù)等方面進(jìn)行探索和實(shí)踐,為讀者提供更加智慧化的圖書(shū)館服務(wù)。從用戶(hù)畫(huà)像角度,深入結(jié)合圖書(shū)館工作內(nèi)容,探討通過(guò)提高服務(wù)精準(zhǔn)性來(lái)實(shí)現(xiàn)高校圖書(shū)館智慧服務(wù)的方法和策略,對(duì)提升高校圖書(shū)館服務(wù)水平和向智慧圖書(shū)館轉(zhuǎn)型發(fā)展有重要的理論與實(shí)踐意義。