陳 臣(蘭州財(cái)經(jīng)大學(xué)信息工程學(xué)院)
當(dāng)前,隨著傳感器網(wǎng)絡(luò)技術(shù)、云計(jì)算技術(shù)、大數(shù)據(jù)技術(shù)、集成電路技術(shù)和高速無線傳輸網(wǎng)絡(luò)的快速發(fā)展與應(yīng)用普及,圖書館在提升大數(shù)據(jù)采集、傳輸、存儲、即時分析和智慧決策流程效率的同時,大幅降低了數(shù)據(jù)采集、存儲、傳輸、處理和分析設(shè)備上的成本支出。因此,數(shù)據(jù)采集、存儲、分析與決策活動中的成本支出,已不是影響圖書館數(shù)據(jù)決策應(yīng)用的主要因素。在數(shù)據(jù)智慧決策中,圖書館如何確保所采集的數(shù)據(jù)具有高價值密度、低數(shù)據(jù)總量和強(qiáng)讀者相關(guān)性,并與閱讀場景和讀者閱讀習(xí)慣強(qiáng)關(guān)聯(lián),能夠全面解釋讀者閱讀需求、閱讀行為、閱讀收益和滿意度之間的因果關(guān)系,有效降低圖書館數(shù)據(jù)決策系統(tǒng)的資源需求和提升數(shù)據(jù)決策的相關(guān)性、時效性,是確保圖書館基于數(shù)據(jù)決策支持的讀者個性化智慧閱讀服務(wù)安全、高效、實(shí)時、動態(tài)、經(jīng)濟(jì)和滿意的關(guān)鍵。康奈爾大學(xué)計(jì)算機(jī)科學(xué)教授艾斯汀指出,從用戶上網(wǎng)和使用各種移動設(shè)備過程中產(chǎn)生的大量用戶行為軌跡數(shù)據(jù)中提取出的個體數(shù)據(jù),可以為揭示人類行為模式規(guī)律提供依據(jù),這些個體數(shù)據(jù)即為大數(shù)據(jù)時代的小數(shù)據(jù)[1]。大數(shù)據(jù)雖然能夠全面、快速、精準(zhǔn)地發(fā)現(xiàn)事物之間隱匿的相關(guān)性與內(nèi)在規(guī)律,并為圖書館在未來發(fā)展方向、服務(wù)模式構(gòu)建、服務(wù)系統(tǒng)安全高效運(yùn)行和用戶服務(wù)質(zhì)量保障上提供科學(xué)的決策支持,但其海量、低價值密度、低讀者相關(guān)性和不重視事物因果關(guān)系的特點(diǎn),會導(dǎo)致在讀者個性化服務(wù)決策中具有較高的系統(tǒng)資源損耗和決策時延、較低的決策結(jié)果準(zhǔn)確性和讀者個性化匹配度,最終導(dǎo)致大數(shù)據(jù)個性化服務(wù)決策千人一面,不能滿足讀者閱讀活動實(shí)時、動態(tài)和定制的個性化需求。因此,圖書館必須依靠輕量、高質(zhì)、多維和強(qiáng)相關(guān)的用戶小數(shù)據(jù)集構(gòu)建讀者個性化智慧服務(wù)體系,滿足讀者的個性化閱讀需求。
圖書館用戶小數(shù)據(jù)可以定義為讀者在閱讀活動中和圖書館個性化服務(wù)過程中產(chǎn)生的,以讀者為核心的用戶相關(guān)數(shù)據(jù),該數(shù)據(jù)具有多層次、多維度和強(qiáng)用戶相關(guān)性,具有較小的數(shù)據(jù)總量和較高的價值密度,能夠發(fā)現(xiàn)以讀者為中心的讀者、圖書館、用戶服務(wù)三要素之間的因果關(guān)系和規(guī)律,能夠精確描述服務(wù)情景和精準(zhǔn)讀者畫像,可為圖書館讀者提供個性化服務(wù)定制和推送,為讀者滿意度評估與反饋優(yōu)化提供精確、實(shí)時的小數(shù)據(jù)科學(xué)決策支持。圖書館小數(shù)據(jù)主要從圖書館服務(wù)器監(jiān)控設(shè)備、視頻監(jiān)控器、管理信息系統(tǒng)、網(wǎng)絡(luò)監(jiān)控器、傳感器網(wǎng)絡(luò)、讀者閱讀終端、用戶可穿戴智能設(shè)備等采集而來,此外,第三方數(shù)據(jù)增值服務(wù)商所采集的用戶數(shù)據(jù)也是圖書館小數(shù)據(jù)的重要來源。依據(jù)小數(shù)據(jù)采集方式和獲取情景的不同,讀者小數(shù)據(jù)可分為讀者個體特征數(shù)據(jù)、閱讀行為數(shù)據(jù)、閱讀情景數(shù)據(jù)、閱讀關(guān)系數(shù)據(jù)、用戶服務(wù)監(jiān)控?cái)?shù)據(jù)、閱讀心理數(shù)據(jù)等(見表1)。
表1 讀者小數(shù)據(jù)的內(nèi)容與來源方式
圖書館只有全方位、不間斷地采集、處理、整合、分析以讀者為中心的小數(shù)據(jù),才能發(fā)現(xiàn)蘊(yùn)藏在數(shù)據(jù)中的知識與事物之間的因果關(guān)系,從而精準(zhǔn)地識別讀者在閱讀喜好、需求、模式、習(xí)慣、終端和社會關(guān)系等方面的區(qū)別,實(shí)現(xiàn)個性化閱讀服務(wù)內(nèi)容、模式、推送時間等的動態(tài)定制,保證讀者獲得較高的閱讀收益,提升讀者對圖書館個性化服務(wù)的滿意度[2]。
2.2.1 小數(shù)據(jù)具有更高的價值密度
讀者小數(shù)據(jù)是圖書館以讀者為中心,在讀者個性化服務(wù)內(nèi)容推送、服務(wù)質(zhì)量保證、服務(wù)滿意度反饋與內(nèi)容優(yōu)化、讀者閱讀活動相關(guān)情景中所采集的全方位、多維度、完全特征的用戶全部數(shù)據(jù)。以讀者為中心的多維度小數(shù)據(jù)由讀者個體特征、閱讀行為、位置信息、社交媒體、監(jiān)控視頻、文字評述、語音、圖片、閱讀終端設(shè)備信息、傳感器感知數(shù)據(jù)等組成,小數(shù)據(jù)在數(shù)據(jù)體量和數(shù)據(jù)總量增長速度上遠(yuǎn)遠(yuǎn)小于大數(shù)據(jù),且與大數(shù)據(jù)同樣具有多樣性、高速性、真實(shí)性和高價值的數(shù)據(jù)特征。
①小數(shù)據(jù)是圍繞讀者個體而采集的用戶服務(wù)和閱讀行為數(shù)據(jù),具有強(qiáng)用戶相關(guān)性、低冗余度和低噪聲比例的特點(diǎn),價值信息不容易被干擾,數(shù)據(jù)的價值密度較高。②圖書館對讀者小數(shù)據(jù)的采集具有全情景、多維度、深層次、不間斷的特點(diǎn)。就單一用戶而言,小數(shù)據(jù)采集的總量有限、種類單一,是針對單一讀者在閱讀活動全時段、全方位、全流程、全場景的采集,能夠真實(shí)解釋讀者的閱讀行為、需求、心理和個性特征,在讀者個性化服務(wù)決策中相比大數(shù)據(jù)具有更高的相關(guān)性和決策優(yōu)勢[3]。③大數(shù)據(jù)是相關(guān)圖書館所有業(yè)務(wù)、對象和服務(wù)的數(shù)據(jù)集合,數(shù)據(jù)采集具有極強(qiáng)的廣泛性和低用戶相關(guān)性。而小數(shù)據(jù)則僅限于以讀者為中心的相關(guān)數(shù)據(jù),是對讀者閱讀活動和相關(guān)服務(wù)數(shù)據(jù)的深度采集、處理與挖掘,具有用戶相關(guān)性強(qiáng)和知識挖掘更徹底、深入的優(yōu)點(diǎn)。④與大數(shù)據(jù)相比,小數(shù)據(jù)較低的數(shù)據(jù)噪聲大幅提升了圖書館數(shù)據(jù)知識發(fā)現(xiàn)和智慧決策的效率與科學(xué)性。
2.2.2 小數(shù)據(jù)具有較低的決策系統(tǒng)性能要求和資源消耗
(1)從數(shù)據(jù)獲取來源看,大數(shù)據(jù)的樣本采集范圍為圖書館全對象、全系統(tǒng)、全情景和全時段的數(shù)據(jù),大數(shù)據(jù)對處理、存儲、分析和決策系統(tǒng)的性能要求較高,且大數(shù)據(jù)以指數(shù)級快速增長,要求圖書館數(shù)據(jù)應(yīng)用系統(tǒng)具有較高的性能冗余和可擴(kuò)展性。而小數(shù)據(jù)是以讀者為中心的用戶個體相關(guān)數(shù)據(jù),具有較小的數(shù)據(jù)體量和低增長速度,對圖書館數(shù)據(jù)應(yīng)用系統(tǒng)構(gòu)建的性能和可擴(kuò)展性要求較低。
(2)圖書館采集的小數(shù)據(jù)具有較強(qiáng)的針對性和目的性,雖然所采集的小數(shù)據(jù)也具有類型多樣化特點(diǎn)(包含結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)),但半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)較少,因此,在數(shù)據(jù)處理、分析和決策過程中對決策系統(tǒng)的要求較低。
(3)大數(shù)據(jù)采集具有海量、全方位和全樣本的特點(diǎn),所以只有數(shù)據(jù)標(biāo)準(zhǔn)化才能保證大數(shù)據(jù)采集的效率、規(guī)模和實(shí)時性,也就是說,大數(shù)據(jù)只有對海量、弱相關(guān)性的數(shù)據(jù)進(jìn)行快速、實(shí)時分析,才能發(fā)現(xiàn)數(shù)據(jù)中隱藏的事物關(guān)系特征,具有較高的系統(tǒng)資源需求與損耗。而小數(shù)據(jù)是以單個讀者為中心而開展的全方位、不間斷的數(shù)據(jù)采集與挖掘,因此,小數(shù)據(jù)不需要對全體數(shù)據(jù)進(jìn)行處理和響應(yīng),只需對單一讀者特定時間與背景的數(shù)據(jù)進(jìn)行針對性深度挖掘,具有較小的數(shù)據(jù)體量、高精確度和強(qiáng)相關(guān)性,對圖書館系統(tǒng)資源的需求與應(yīng)用損耗較低[4]。
2.2.3 小數(shù)據(jù)可完美詮釋以讀者為中心事物的因果關(guān)系
因果關(guān)系是一個事件和第二個事件之間的作用關(guān)系,后一事件是前一事件的結(jié)果,而相關(guān)性是兩種或兩種以上事物之間的相互關(guān)系。也就是說,兩個事物存在因果關(guān)系,那么它們一定存在相關(guān)關(guān)系;但存在相關(guān)關(guān)系的兩個事物卻不一定是因果關(guān)系。大數(shù)據(jù)著眼于數(shù)據(jù)之間表層相關(guān)性描述,不探究影響數(shù)據(jù)相關(guān)性的深層原因,而小數(shù)據(jù)不僅關(guān)注數(shù)據(jù)相關(guān)性表現(xiàn),也注重揭示數(shù)據(jù)相關(guān)關(guān)系的驅(qū)動因素[5]。大數(shù)據(jù)這種著眼于數(shù)據(jù)之間表層相關(guān)性描述而不探究事物之間的因果關(guān)系的原因,是由大數(shù)據(jù)海量、處理高速、類型多樣和高價值的特性決定的,適用于圖書館服務(wù)模式預(yù)測與變革、服務(wù)系統(tǒng)構(gòu)建與運(yùn)營、服務(wù)滿意度綜合評估與優(yōu)化、客戶等級評估與關(guān)系管理等宏觀戰(zhàn)略決策方面。而小數(shù)據(jù)圍繞讀者個體數(shù)據(jù)的采集、處理與深度挖掘,能夠明確讀者行為、需求、心理、情景背后存在的內(nèi)在因果關(guān)系和驅(qū)動因素,通過小數(shù)據(jù)價值提取、挖掘強(qiáng)相關(guān)核心數(shù)據(jù)、響應(yīng)讀者個性化服務(wù)定制需求、服務(wù)的優(yōu)化與滿意度管理等四個步驟,實(shí)現(xiàn)了科學(xué)、高效的讀者價值管理,保證了讀者對于圖書館服務(wù)的滿意度。
2.2.4 小數(shù)據(jù)可實(shí)現(xiàn)讀者個性化服務(wù)的精準(zhǔn)定制與推送
(1)大數(shù)據(jù)采集的是圖書館對全對象、全范圍、多類型和全時段的數(shù)據(jù),在用戶數(shù)據(jù)分析與服務(wù)決策過程中,大數(shù)據(jù)通常更關(guān)注對讀者大群體的描述、定義、劃分與服務(wù)定制。小數(shù)據(jù)的采集是以讀者為中心展開的,從讀者特征、思想、行為、心理、生理、情景等方面對單一個體進(jìn)行全方位精準(zhǔn)畫像,進(jìn)而完成對個體用戶服務(wù)的定制、推送、反饋、評估與完善。對于以讀者為中心的用戶精準(zhǔn)畫像、個性化服務(wù)定制、用戶關(guān)系管理與價值提升、讀者滿意度保證等而言,小數(shù)據(jù)更能準(zhǔn)確還原以讀者為中心的事物因果關(guān)系,高效、精準(zhǔn)、實(shí)時和經(jīng)濟(jì)地為讀者提供優(yōu)質(zhì)個性化服務(wù)。
(2)圖書館采集小數(shù)據(jù)的價值密度、精確性和實(shí)時性要遠(yuǎn)高于大數(shù)據(jù),小數(shù)據(jù)在提示讀者個體閱讀需求與服務(wù)模式變化等用戶微觀層面的有效性也遠(yuǎn)強(qiáng)于大數(shù)據(jù)。小數(shù)據(jù)從讀者行為、生理、思想、情景等細(xì)節(jié)數(shù)據(jù)上真實(shí)地描繪與表現(xiàn)讀者,以個體讀者為唯一決策對象具有決策內(nèi)容更精準(zhǔn)、深刻、實(shí)時和動態(tài)及個性化服務(wù)針對性強(qiáng)等特點(diǎn)。
(3)大數(shù)據(jù)分析是在海量、低相關(guān)的數(shù)據(jù)中尋找事物的規(guī)律與相關(guān)性,而小數(shù)據(jù)則是從總量有限和高用戶相關(guān)性的個體數(shù)據(jù)中尋找事物的因果關(guān)系,更關(guān)注讀者閱讀活動背后存在的事物內(nèi)在的機(jī)制與因果關(guān)系,對讀者閱讀需求、服務(wù)有效性、用戶滿意度和服務(wù)系統(tǒng)運(yùn)行科學(xué)性有較強(qiáng)的可解釋性,是圖書館個性化閱讀服務(wù)定制與服務(wù)質(zhì)量保證的重要決策依據(jù)[6]。
與大數(shù)據(jù)海量、數(shù)據(jù)結(jié)構(gòu)復(fù)雜、低價值密度和低讀者相關(guān)性相比,小數(shù)據(jù)具有數(shù)據(jù)總量有限、數(shù)據(jù)標(biāo)準(zhǔn)化、高價值密度和強(qiáng)用戶相關(guān)性特點(diǎn),是基于讀者閱讀場景、閱讀心理、閱讀需求、閱讀模式等微觀層面對讀者的系統(tǒng)畫像與描述,可以準(zhǔn)確闡述讀者閱讀行為、心理、場景、情緒、習(xí)慣、文化和社會背景之間的因果關(guān)系。本文設(shè)計(jì)的基于小數(shù)據(jù)的圖書館個性化服務(wù)動態(tài)決策系統(tǒng)具有決策精準(zhǔn)、個性化定制、實(shí)時推送和動態(tài)優(yōu)化的優(yōu)點(diǎn),其系統(tǒng)組織結(jié)構(gòu)見圖1。
圖1 基于小數(shù)據(jù)決策支持的圖書館個性化服務(wù)動態(tài)決策系統(tǒng)
系統(tǒng)的底層為數(shù)據(jù)存儲層,主要存儲圖書館原有讀者小數(shù)據(jù)、網(wǎng)絡(luò)監(jiān)控讀者行為數(shù)據(jù)、視頻監(jiān)控讀者行為數(shù)據(jù)、讀者閱讀終端數(shù)據(jù)、管理信息系統(tǒng)數(shù)據(jù)、可穿戴設(shè)備用戶采集數(shù)據(jù)和第三方共享用戶小數(shù)據(jù)等。數(shù)據(jù)存儲層具有數(shù)據(jù)存儲量大、讀寫速度快和安全性高的優(yōu)點(diǎn)。
系統(tǒng)的第二層為小數(shù)據(jù)管理層,主要負(fù)責(zé)數(shù)據(jù)處理前的高速二級存儲、數(shù)據(jù)標(biāo)準(zhǔn)化處理、數(shù)據(jù)過濾與去噪、數(shù)據(jù)價值提取,以及實(shí)現(xiàn)數(shù)據(jù)采集、存儲、過濾、去噪、價值提取、訪問、決策、價值評估和刪除等全數(shù)據(jù)生命周期流程的管理[7]。
系統(tǒng)的第三層為數(shù)據(jù)決策層,主要依據(jù)讀者個性化閱讀需求動態(tài)構(gòu)建數(shù)據(jù)決策模型,以及對決策模式進(jìn)行動態(tài)評估、決策模型管理、決策場景的設(shè)計(jì)和決策應(yīng)用。數(shù)據(jù)決策層基于讀者高價值、全方位和強(qiáng)相關(guān)性的讀者小數(shù)據(jù)支持,準(zhǔn)確發(fā)現(xiàn)讀者閱讀活動與圖書館個性化服務(wù)要素之間的因果關(guān)系,通過實(shí)時、動態(tài)的個性化服務(wù)推送,來滿足讀者不斷變化的閱讀需求。
決策應(yīng)用層是動態(tài)決策系統(tǒng)的最高層,基于底層功能模塊的支持,主要負(fù)責(zé)讀者閱讀情景預(yù)測與定制、讀者閱讀模式預(yù)測與匹配、用戶服務(wù)質(zhì)量評估與優(yōu)化、個性化閱讀服務(wù)定制與推送、讀者關(guān)系管理與價值提升等功能。圖書館基于小數(shù)據(jù)決策應(yīng)用的精準(zhǔn)性、實(shí)時性、個性化程度與經(jīng)濟(jì)性,不但與系統(tǒng)底層小數(shù)據(jù)的價值總量、個性化程度、可用性和數(shù)據(jù)決策科學(xué)性緊密相關(guān),而且讀者的閱讀方法、圖書館用戶服務(wù)模式、科技支撐能力和圖書館業(yè)服務(wù)變革發(fā)展也是影響小數(shù)據(jù)決策有效性的重要因素。因此,圖書館基于小數(shù)據(jù)的個性化服務(wù)動態(tài)決策必須隨著上述要素的變化而動態(tài)調(diào)整。
(1)避免小數(shù)據(jù)應(yīng)用誤差。圖書館采集讀者小數(shù)據(jù)的精確度、相關(guān)性、實(shí)時性和可用性,是保證小數(shù)據(jù)決策科學(xué)性和圖書館個性化服務(wù)有效性的關(guān)鍵。①讀者閱讀行為小數(shù)據(jù)與閱讀活動所處的地理位置、閱讀場景及讀者的生理特征、心理特征、閱讀社會關(guān)系、閱讀需求變化等有極強(qiáng)相關(guān)性,因此,圖書館所采集的小數(shù)據(jù)必須涉及眾多強(qiáng)相關(guān)性變量,小數(shù)據(jù)采集系統(tǒng)也應(yīng)具備一定的機(jī)器智慧學(xué)習(xí)能力,并通過數(shù)據(jù)決策有效性評估結(jié)果優(yōu)化小數(shù)據(jù)采集模式。②噪聲數(shù)據(jù)是圖書館小數(shù)據(jù)決策面臨的一個無法避免且影響巨大的問題。圖書館可采用分箱、聚類、計(jì)算機(jī)和人工檢查相結(jié)合等方法將噪聲對圖書館小數(shù)據(jù)的決策影響降至最低點(diǎn)[8]。③圖書館通過讀者的閱讀內(nèi)容、閱讀文獻(xiàn)目錄查詢、論壇瀏覽及發(fā)言來采集用戶小數(shù)據(jù)時,易受到閱讀論壇上相似讀者群語言、情緒、愛好和社交網(wǎng)絡(luò)結(jié)構(gòu)的影響。因此,圖書館必須通過小數(shù)據(jù)相關(guān)性分析與數(shù)據(jù)關(guān)系因果判斷選取出正確的小數(shù)據(jù)。
(2)小數(shù)據(jù)決策應(yīng)堅(jiān)持全數(shù)據(jù)的原則。精確、全面、多維度、多層次和全時段地對讀者進(jìn)行畫像,真實(shí)揭示讀者與閱讀情景之間的因果關(guān)系,是圖書館確保小數(shù)據(jù)決策科學(xué)、高效的必要條件。①小數(shù)據(jù)采集應(yīng)包括讀者的基本特征數(shù)據(jù)、閱讀情境數(shù)據(jù)、閱讀行為數(shù)據(jù)、傳感網(wǎng)絡(luò)采集數(shù)據(jù)、閱讀心理與生理數(shù)據(jù)、讀者位置與移動路徑信息數(shù)據(jù)、閱讀時的天氣與環(huán)境信息等數(shù)據(jù),在數(shù)據(jù)的分析與決策過程中要融合多源數(shù)據(jù),實(shí)現(xiàn)小數(shù)據(jù)中蘊(yùn)藏知識的完全挖掘與發(fā)現(xiàn)。②圖書館應(yīng)構(gòu)建多樣性的小數(shù)據(jù)生態(tài)系統(tǒng),在確保讀者隱私數(shù)據(jù)安全性的前提下,實(shí)現(xiàn)多終端設(shè)備數(shù)據(jù)、第三方小數(shù)據(jù)平臺數(shù)據(jù)、讀者相關(guān)大數(shù)據(jù)的共享與融合。③在小數(shù)據(jù)決策中,應(yīng)關(guān)注讀者獨(dú)特的行為數(shù)據(jù)痕跡,如讀者閱讀滿意度反饋與評論內(nèi)容語言風(fēng)格的變化、照片與視頻肢體語言的特征、閱讀生理數(shù)據(jù)的變化、閱讀時場景與位置變化等,從情境、習(xí)慣、效仿、激勵、一致性、易理解性等方面分析讀者小數(shù)據(jù),實(shí)現(xiàn)讀者閱讀個性化需求的精準(zhǔn)發(fā)現(xiàn)和服務(wù)有效性的合理評估[9]。
(3)小數(shù)據(jù)決策應(yīng)重點(diǎn)關(guān)注高價值讀者。依據(jù)二八定律可知,占據(jù)讀者總?cè)藬?shù)20%的高端讀者群可為圖書館帶來80%的服務(wù)收益,占據(jù)著80%的圖書館系統(tǒng)服務(wù)資源,也擁有著影響讀者個性化閱讀體驗(yàn)和滿意度的圖書館80%投訴[10]。因此,必須根據(jù)用戶價值對讀者群進(jìn)行細(xì)分和差異化管理,依據(jù)讀者價值和閱讀需求進(jìn)行服務(wù)資源的分配與調(diào)度,才能確保讀者閱讀收益與圖書館服務(wù)收益最優(yōu)。①圖書館應(yīng)根據(jù)讀者歷史小數(shù)據(jù)精準(zhǔn)預(yù)測讀者的閱讀需求、模式、行為和結(jié)果,并依據(jù)讀者價值最優(yōu)化原則分配系統(tǒng)資源和服務(wù)時間。②在劃分高價值讀者群時,要緊密結(jié)合高價值讀者的個性化閱讀需求與閱讀模式,確保高價值讀者個性化服務(wù)推送在閱讀時間、地點(diǎn)、內(nèi)容、模式和綜合收益方面評估最優(yōu)。③高價值讀者的價值需求和閱讀需求是動態(tài)變化的,低價值讀者也具有發(fā)展為高價值讀者的潛能。因此,圖書館需依據(jù)讀者的閱讀內(nèi)容、時間、模式、終端設(shè)備、移動路徑、閱讀心理與生理變化、反饋評價等小數(shù)據(jù)構(gòu)建全方位的讀者畫像,并據(jù)此動態(tài)分配服務(wù)系統(tǒng)資源,在獲取較高服務(wù)收益的同時不斷提升讀者的價值和忠誠度。
(4)小數(shù)據(jù)決策應(yīng)保護(hù)讀者隱私安全。小數(shù)據(jù)的安全管理既是關(guān)系圖書館小數(shù)據(jù)決策可用性的關(guān)鍵,又是關(guān)系讀者個性化閱讀活動可靠性的重要因素。①圖書館在以讀者為核心開展小數(shù)據(jù)的采集、處理、分析和應(yīng)用時,應(yīng)確保讀者對小數(shù)據(jù)的采集、共享、使用、決策的范圍與深度具有知情權(quán)、所有權(quán)、編輯管理權(quán)和刪除決定權(quán)。在讀者認(rèn)為小數(shù)據(jù)侵犯了個人隱私時,讀者有對敏感小數(shù)據(jù)停止采集與共享、限制數(shù)據(jù)應(yīng)用范圍和刪除樣本的決定權(quán)。②圖書館對小數(shù)據(jù)的融合和分析等操作在發(fā)現(xiàn)小數(shù)據(jù)所蘊(yùn)藏知識的同時,可能會導(dǎo)致讀者隱私被侵犯[11]。因此,圖書館在小數(shù)據(jù)應(yīng)用中應(yīng)堅(jiān)持決策適度和風(fēng)險可控的原則,不要過量、過度地采集和使用小數(shù)據(jù)。同時,可利用數(shù)據(jù)脫敏、數(shù)據(jù)清洗和數(shù)據(jù)重構(gòu)技術(shù)過濾讀者隱私數(shù)據(jù),在確保小數(shù)據(jù)決策科學(xué)的前提下防范讀者隱私被侵犯。③圖書館應(yīng)構(gòu)建讀者小數(shù)據(jù)敏感度評估和分級別安全保護(hù)制度,通過使用前安全評估、使用時安全管理、使用后保密存儲與銷毀,實(shí)現(xiàn)小數(shù)據(jù)全生命周期的安全管理。
在圖書館數(shù)據(jù)決策中,小數(shù)據(jù)是以讀者為中心全方位采集的數(shù)據(jù),包括讀者的閱讀習(xí)慣、閱讀社會關(guān)系、閱讀模式、閱讀行為、讀者位置與移動路徑、閱讀生理與心理、閱讀評價反饋、閱讀終端等,它具有數(shù)據(jù)量有限、標(biāo)準(zhǔn)化結(jié)構(gòu)、高價值密度、對讀者個體全方位全天候地深度挖掘的特點(diǎn)。因此,在圖書館讀者個性化服務(wù)中,與大數(shù)據(jù)相比,小數(shù)據(jù)較具有數(shù)據(jù)總量有限、系統(tǒng)資源損耗低、數(shù)據(jù)決策對象單一、決策結(jié)果實(shí)時精準(zhǔn)的優(yōu)點(diǎn),能夠解釋以讀者個性化服務(wù)為核心的眾多事物之間的因果關(guān)系,實(shí)現(xiàn)了讀者個性化閱讀服務(wù)在內(nèi)容定制、服務(wù)時效、系統(tǒng)資源損耗、讀者價值量提升、服務(wù)質(zhì)量與讀者滿意度保證等方面的綜合評估最優(yōu)。①圖書館在讀者個性化服務(wù)數(shù)據(jù)決策中,應(yīng)依據(jù)讀者個性化閱讀實(shí)際,堅(jiān)持小數(shù)據(jù)為主、大數(shù)據(jù)為輔的原則,利用大數(shù)據(jù)尋求影響讀者個性化閱讀體驗(yàn)因素間的規(guī)律,再用小數(shù)據(jù)匹配讀者的閱讀活動場景,從而精確制定出科學(xué)、高效、個性化、經(jīng)濟(jì)和動態(tài)的讀者個性化服務(wù)策略。②圖書館在小數(shù)據(jù)決策中,應(yīng)根據(jù)不同讀者對個性化閱讀服務(wù)在精確度、時效性、經(jīng)濟(jì)性和閱讀成本上的特殊需求,不斷增強(qiáng)決策系統(tǒng)數(shù)據(jù)應(yīng)用算法的科學(xué)性,確保決策結(jié)果最優(yōu)。③在小數(shù)據(jù)決策中,圖書館應(yīng)對小數(shù)據(jù)實(shí)施標(biāo)準(zhǔn)化處理、噪聲信號過濾和敏感數(shù)據(jù)保護(hù)等,在提升數(shù)據(jù)可靠性、可用性和安全性的同時,注意不能對小數(shù)據(jù)過度清洗、重組、挖掘和刪除,實(shí)現(xiàn)小數(shù)據(jù)決策效率和讀者個性化閱讀收益的最優(yōu)結(jié)合[12]。