龍春芳
關(guān)鍵詞: 小數(shù)據(jù);圖書館;用戶畫像;融合
摘 要: 文章分析了小數(shù)據(jù)的內(nèi)涵與特征,介紹了圖書館對用戶小數(shù)據(jù)的融合處理流程,指出了基于小數(shù)據(jù)融合的圖書館用戶精準(zhǔn)畫像構(gòu)建方式,以期為相關(guān)研究提供參考。
中圖分類號(hào):G250 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1003-1588(2020)10-0090-03
大數(shù)據(jù)、云計(jì)算等技術(shù)在圖書館的應(yīng)用為信息資源獲取提供了便利,保障了個(gè)性化定制、智能推送等服務(wù)的實(shí)施,推動(dòng)了圖書館服務(wù)環(huán)境、模式與內(nèi)容的變革。然而,大數(shù)據(jù)的總量和復(fù)雜程度日益增長,對其研究和利用要耗費(fèi)大量的人力、財(cái)力,這個(gè)過程不僅容易導(dǎo)致隱私泄露,而且無差別的服務(wù)方式也影響了服務(wù)效果。為解決這些問題,圖書館界開始關(guān)注小數(shù)據(jù)。小數(shù)據(jù)是指具有顯著個(gè)體特性的信息證據(jù),是從個(gè)體角度采集的全部數(shù)據(jù),包括行為、喜好、社會(huì)關(guān)系等。對小數(shù)據(jù)進(jìn)行統(tǒng)一融合和客觀分析,發(fā)現(xiàn)其中隱含的價(jià)值,可以預(yù)測個(gè)體的行為、特征和社會(huì)聯(lián)系,彌補(bǔ)大數(shù)據(jù)的不足[1]。通過數(shù)據(jù)融合建立精準(zhǔn)的用戶畫像,對用戶閱讀場景、閱讀需求、身份特點(diǎn)等進(jìn)行分析,有利于準(zhǔn)確制訂服務(wù)方案,提升用戶的服務(wù)體驗(yàn)。
1 小數(shù)據(jù)的內(nèi)涵、特征與作用分析
1.1 小數(shù)據(jù)的內(nèi)涵
小數(shù)據(jù)又被稱作個(gè)體資料,是指包含個(gè)體所有特征信息的數(shù)據(jù)集合。關(guān)于小數(shù)據(jù)的研究始于2011年,最初研究人員僅將其看作與大數(shù)據(jù)相對的概念,即規(guī)模小、變化慢、維度低的數(shù)據(jù)。舍恩伯格教授在《大數(shù)據(jù)時(shí)代》一書中指出,大數(shù)據(jù)是側(cè)重決策的全數(shù)據(jù),是通過全方位的數(shù)據(jù)采集、整理、分析探索事物發(fā)展的結(jié)果,小數(shù)據(jù)是以用戶為中心,側(cè)重對個(gè)體特征的深入挖掘,旨在探索個(gè)體與相關(guān)事物之間的聯(lián)系。
1.2 小數(shù)據(jù)的特點(diǎn)
隨著大數(shù)據(jù)的興起,人們?nèi)找嬲J(rèn)識(shí)到數(shù)據(jù)的價(jià)值,借助大數(shù)據(jù)分析預(yù)測用戶需求成為各行各業(yè)的趨勢。與大數(shù)據(jù)相比,小數(shù)據(jù)具有成本低、風(fēng)險(xiǎn)低、個(gè)性化、動(dòng)態(tài)化的特點(diǎn),各種移動(dòng)終端、可穿戴設(shè)備的應(yīng)用也為小數(shù)據(jù)采集提供了便利[2]。小數(shù)據(jù)是圍繞個(gè)體產(chǎn)生的,因此不同個(gè)體之間的差異以及對同一事物的不同見解決定了數(shù)據(jù)的個(gè)性化特點(diǎn)。小數(shù)據(jù)的形式多樣,包括圖像、視頻、聲音等。由于小數(shù)據(jù)規(guī)模較小、結(jié)構(gòu)簡單,并不需要復(fù)雜的技術(shù)和系統(tǒng)配置,所以可以在一定程度上避免信息利用過程中存在的風(fēng)險(xiǎn)。小數(shù)據(jù)的數(shù)據(jù)體量小,分析整理更加方便,對于系統(tǒng)的配置要求不高,能夠減少系統(tǒng)損耗,降低數(shù)據(jù)處理成本[3]。
1.3 小數(shù)據(jù)的作用
小數(shù)據(jù)包括用戶的情境狀態(tài)數(shù)據(jù)、身體數(shù)據(jù)、行為數(shù)據(jù)等,對這些數(shù)據(jù)進(jìn)行采集和分析,建立與用戶相關(guān)的數(shù)據(jù)模型,可以更好地預(yù)測用戶需求。小數(shù)據(jù)從微觀層面反映了用戶的閱讀需求、個(gè)性特征、喜好等,揭示了用戶活動(dòng)與圖書館服務(wù)之間的因果關(guān)系。對個(gè)體數(shù)據(jù)進(jìn)行追蹤、采集和分析,可以精準(zhǔn)預(yù)測個(gè)體需求和事態(tài)發(fā)展方向,為圖書館制訂服務(wù)方案提供依據(jù)。
2 圖書館對用戶小數(shù)據(jù)的融合處理流程
數(shù)據(jù)融合是指將異構(gòu)數(shù)據(jù)轉(zhuǎn)換為統(tǒng)一的形式以便為決策提供依據(jù)。圖書館用戶在獲取服務(wù)過程中會(huì)產(chǎn)生形式多樣的小數(shù)據(jù),圖書館應(yīng)對這些小數(shù)據(jù)進(jìn)行融合分析,挖掘其中隱含的價(jià)值。
2.1 分析數(shù)據(jù)源
圖書館通過多種途徑采集與用戶相關(guān)的小數(shù)據(jù)后,首先要對數(shù)據(jù)進(jìn)行綜合分析,經(jīng)過數(shù)據(jù)映射、去重、更新等操作后將其納入小數(shù)據(jù)融合庫中。對于來源多樣的異構(gòu)小數(shù)據(jù),圖書館需要建立統(tǒng)一的數(shù)據(jù)模型,在確定不同數(shù)據(jù)映射關(guān)系的基礎(chǔ)上賦予不同數(shù)據(jù)相應(yīng)的權(quán)重,再將這些數(shù)據(jù)納入相同的模型中。對于相同模型下的映射數(shù)據(jù),圖書館還需要做好去重工作以減少數(shù)據(jù)存儲(chǔ)占用的空間,提高數(shù)據(jù)存儲(chǔ)效率[4]。
2.2 深入挖掘小數(shù)據(jù)的基本屬性
深入挖掘小數(shù)據(jù)的基本屬性有利于掌握讀者的個(gè)性化特征。圖書館應(yīng)從數(shù)據(jù)中提取與用戶屬性相關(guān)的內(nèi)容,如檢索次數(shù)、 訪問時(shí)長、閱讀類型等,用于更準(zhǔn)確地分析用戶行為。在這個(gè)過程中,圖書館既要對有價(jià)值的數(shù)據(jù)進(jìn)行挖掘利用,也要重視去重處理,只有這樣才能準(zhǔn)確描述用戶偏好并劃分用戶群體。
2.3 構(gòu)建用戶畫像
用戶小數(shù)據(jù)收集與整理完成后,圖書館就要對這些數(shù)據(jù)進(jìn)行關(guān)聯(lián)、挖掘和態(tài)勢分析,從中獲取可用的信息并納入用戶數(shù)據(jù)庫,從而全面掌握用戶的興趣愛好、行為特征和個(gè)性化需求。圖書館只有結(jié)合用戶所處的情境建立符合用戶特征的知識(shí)空間,探究不同數(shù)據(jù)之間的關(guān)聯(lián),才能獲得更有價(jià)值的數(shù)據(jù),為構(gòu)建用戶畫像奠定基礎(chǔ)。
3 基于小數(shù)據(jù)融合的圖書館用戶精準(zhǔn)畫像構(gòu)建
3.1 小數(shù)據(jù)融合分析
圖書館建立用戶精準(zhǔn)畫像的目的就是結(jié)合用戶小數(shù)據(jù)還原用戶信息,從而全方位把握用戶需求,為開展個(gè)性化服務(wù)提供支持[5]。圖書館不僅可以從各類服務(wù)系統(tǒng)中獲取小數(shù)據(jù),也可以借助智能終端、可穿戴設(shè)備等采集用戶數(shù)據(jù)。由于采集的初始數(shù)據(jù)是分散異構(gòu)的,彼此之間關(guān)聯(lián)度不高,所以需要對這些數(shù)據(jù)進(jìn)行融合。在這個(gè)過程中,圖書館可以提取用戶基本信息,初步描繪出用戶畫像,然后對用戶靜態(tài)、動(dòng)態(tài)數(shù)據(jù)進(jìn)行分類處理并對源數(shù)據(jù)庫進(jìn)行完善,進(jìn)而得到更加清晰的畫像。
3.2 用戶畫像構(gòu)建
圖書館對用戶精準(zhǔn)畫像的描摹是長期動(dòng)態(tài)的過程,需要分階段、分步驟進(jìn)行。首先,圖書館要根據(jù)源數(shù)據(jù)分析結(jié)果為不同用戶設(shè)置對應(yīng)的標(biāo)簽,然后對用戶標(biāo)簽進(jìn)行分類,建立個(gè)體用戶和群體用戶標(biāo)簽體系;其次,圖書館從多個(gè)渠道獲取用戶小數(shù)據(jù)后,需要借助數(shù)據(jù)集成、清洗、轉(zhuǎn)換等技術(shù)對其進(jìn)行預(yù)處理,再利用語義分析、聚類分析、有序化分析等算法得出符合用戶特點(diǎn)的標(biāo)簽;再次,圖書館應(yīng)根據(jù)不同用戶之間、不同數(shù)據(jù)之間的關(guān)聯(lián)勾勒出個(gè)體和群體用戶畫像,為個(gè)性化服務(wù)提供依據(jù),詳見圖1。
3.3 用戶隱私保護(hù)
圖書館在處理用戶數(shù)據(jù)過程中不可避免地會(huì)涉及一些隱私內(nèi)容,尤其是個(gè)性化服務(wù)策略的制訂是以小數(shù)據(jù)為依據(jù)的,這些與用戶切身相關(guān)的數(shù)據(jù)若利用不當(dāng),很容易引發(fā)各種糾紛。圖書館要想規(guī)避用戶小數(shù)據(jù)利用風(fēng)險(xiǎn),保障用戶的信息安全,不僅需要引進(jìn)先進(jìn)的信息處理技術(shù),還需要完善相應(yīng)的規(guī)章制度[6]。一方面,圖書館要借助信息加密、身份識(shí)別等技術(shù)對用戶隱私信息進(jìn)行安全認(rèn)證,根據(jù)用戶等級設(shè)置系統(tǒng)訪問權(quán)限,對重要信息進(jìn)行加密傳輸,避免被竊取或惡意傳播;另一方面,圖書館要規(guī)范用戶數(shù)據(jù)使用流程,確保管理人員規(guī)范操作,對于部分重要數(shù)據(jù)的處理必須征得原持有者的同意。
4 基于小數(shù)據(jù)融合的圖書館用戶需求分析與服務(wù)策略
4.1 了解用戶需求
結(jié)合用戶精準(zhǔn)畫像模型挖掘有價(jià)值的內(nèi)容是掌握用戶需求的必要步驟。圖書館要做好小數(shù)據(jù)的價(jià)值挖掘工作,促進(jìn)數(shù)據(jù)庫的不斷完善和更新,確保用戶需求與個(gè)性化推送內(nèi)容的精準(zhǔn)匹配[7]。由于用戶需求是動(dòng)態(tài)變化的,所以數(shù)據(jù)庫中的內(nèi)容需要實(shí)時(shí)更新。圖書館也要利用相關(guān)評估模塊對與用戶興趣相關(guān)的內(nèi)容進(jìn)行測評,從而及時(shí)發(fā)現(xiàn)用戶需求,提高信息服務(wù)的針對性。
4.2 調(diào)整服務(wù)方案
圖書館用戶的需求是隨著服務(wù)方式、服務(wù)階段、閱讀情境等而變化的,存在隱性需求和顯性需求之分,也存在長期需求和短期需求之分[8]。鑒于用戶需求的復(fù)雜、動(dòng)態(tài)性,圖書館應(yīng)做好用戶數(shù)據(jù)庫管理工作并及時(shí)對用戶小數(shù)據(jù)進(jìn)行補(bǔ)充、刪改和更新,保障用戶畫像構(gòu)建的科學(xué)、合理。一方面,圖書館要根據(jù)小數(shù)據(jù)了解用戶心理、行為、社會(huì)關(guān)系的特點(diǎn),發(fā)現(xiàn)用戶感興趣的內(nèi)容,明確不同數(shù)據(jù)之間的因果關(guān)系;另一方面,圖書館應(yīng)重點(diǎn)采集與用戶興趣相關(guān)的資源,為個(gè)性化服務(wù)提供支持。圖書館只有根據(jù)用戶需求變化動(dòng)態(tài)調(diào)整服務(wù)方案,才能為其提供更精準(zhǔn)和有效的服務(wù)。
4.3 推送個(gè)性化資源
圖書館建立精準(zhǔn)用戶畫像的最終目的就是為個(gè)性化服務(wù)提供有效指導(dǎo)?;ヂ?lián)網(wǎng)環(huán)境下,越來越多的用戶習(xí)慣于通過網(wǎng)絡(luò)檢索館藏資源,因此,圖書館可以對用戶的在線瀏覽數(shù)據(jù)進(jìn)行綜合分析,借助“數(shù)字足跡”跟蹤的方式獲取用戶小數(shù)據(jù),全面掌握用戶的行為偏好并制訂信息資源采集、處理、推送的具體方案,提高資源推送的針對性和精準(zhǔn)性。
5 結(jié)語
滿足用戶的個(gè)性化資源獲取需求是圖書館讀者服務(wù)的目標(biāo)。大數(shù)據(jù)環(huán)境下,圖書館可以借助數(shù)據(jù)分析技術(shù)、數(shù)據(jù)挖掘技術(shù)等構(gòu)建基于用戶個(gè)性化特 征的數(shù)據(jù)庫,建立精準(zhǔn)、動(dòng)態(tài)、真實(shí)的用戶畫像,在保護(hù)用戶隱私的基礎(chǔ)上全面掌握用戶需求,制訂科學(xué)合理的個(gè)性化服務(wù)方案,切實(shí)提高圖書館的服務(wù)效能。
參考文獻(xiàn):
[1]? 陳臣.圖書館小數(shù)據(jù)讀者個(gè)性化興趣預(yù)測與發(fā)現(xiàn)模型的構(gòu)建[J].圖書館論壇,2017(5):98-105.
[2] 陳添源.高校移動(dòng)圖書館用戶畫像構(gòu)建實(shí)證[J].圖書情報(bào)工作,2018(7):38-46.
[3]? 胡媛,毛寧.基于用戶畫像的數(shù)字圖書館知識(shí)社區(qū)用戶模型構(gòu)建[J].圖書館理論與實(shí)踐,2017(4):82-85,97.
[4] 范曉玉,竇永香,趙捧未,等.融合多源數(shù)據(jù)的科研人員畫像構(gòu)建方法研究[J].圖書情報(bào)工作,2018(15):31-40.
[5] 汪強(qiáng)兵,章成志.融合內(nèi)容與用戶手勢行為的用戶畫像構(gòu)建系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J].數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn),2017(2):80-86.
[6] 劉艷.基于數(shù)字足跡的公共圖書館社會(huì)化閱讀服務(wù)研究[J].數(shù)字圖書館論壇,2018(11):52-57.
[7] 丁雷.大數(shù)據(jù)環(huán)境下高校圖書館用戶畫像與特征研究[J].中國科技信息,2018(24):59-62,64.
[8] 陳廉芳.大數(shù)據(jù)環(huán)境下圖書館用戶小數(shù)據(jù)的采集、分析與應(yīng)用[J].國家圖書館學(xué)刊,2016(3):69-74.
(編校:周雪芹)