陳臣
(蘭州商學(xué)院信息中心 甘肅蘭州 730020)
基于小數(shù)據(jù)決策支持的圖書(shū)館個(gè)性化服務(wù)
陳臣
(蘭州商學(xué)院信息中心 甘肅蘭州 730020)
文章在對(duì)大數(shù)據(jù)和小數(shù)據(jù)關(guān)系進(jìn)行研究的基礎(chǔ)上,分析了小數(shù)據(jù)對(duì)圖書(shū)館個(gè)性化服務(wù)的影響,并對(duì)圖書(shū)館個(gè)性化服務(wù)QOS保證、服務(wù)成本問(wèn)題、用戶(hù)隱私等關(guān)鍵問(wèn)題展開(kāi)討論,設(shè)計(jì)了一種基于小數(shù)據(jù)決策支持的圖書(shū)館個(gè)性化服務(wù)模式。該個(gè)性化服務(wù)模式可實(shí)現(xiàn)資源和服務(wù)的高度融合,并以用戶(hù)需求為主導(dǎo),為讀者提供個(gè)性化閱讀服務(wù)。
小數(shù)據(jù);大數(shù)據(jù);決策支持;圖書(shū)館;個(gè)性化服務(wù)
當(dāng)前,圖書(shū)館已進(jìn)入大數(shù)據(jù)時(shí)代。圖書(shū)館大數(shù)據(jù)環(huán)境具有數(shù)據(jù)Volume(海量)、Velocity(處理高速)、Variety(類(lèi)型多樣)和Value(高價(jià)值)的4V特性。隨著圖書(shū)館大數(shù)據(jù)總量和數(shù)據(jù)類(lèi)型的快速增長(zhǎng),其數(shù)據(jù)環(huán)境將更加復(fù)雜、多變,大數(shù)據(jù)的采集、處理、分析和決策過(guò)程將消耗更多的系統(tǒng)資源和成本。此外,圖書(shū)館在立足大數(shù)據(jù)構(gòu)建用戶(hù)服務(wù)體系、優(yōu)化服務(wù)資源管理與分配策略、變革讀者服務(wù)模式和為讀者提供個(gè)性化服務(wù)時(shí),常因大數(shù)據(jù)結(jié)構(gòu)多樣、數(shù)據(jù)處理龐大和復(fù)雜、個(gè)性化服務(wù)針對(duì)性不強(qiáng)和大數(shù)據(jù)應(yīng)用成本過(guò)高等原因,影響了圖書(shū)館讀者個(gè)性化服務(wù)系統(tǒng)構(gòu)建與服務(wù)保障的效率、可用性、經(jīng)濟(jì)性和可控性。
隨著通信技術(shù)、云計(jì)算和互聯(lián)網(wǎng)的發(fā)展,互聯(lián)網(wǎng)與傳感器網(wǎng)絡(luò)已大幅度縮小了企業(yè)和用戶(hù)的距離。以“小數(shù)據(jù)”決策為基礎(chǔ)的用戶(hù)個(gè)性化服務(wù)保障,已成為這個(gè)時(shí)代亟需研究與發(fā)展的課題,并廣泛應(yīng)用于以用戶(hù)為中心,以及個(gè)性化服務(wù)水平要求高的醫(yī)療、營(yíng)銷(xiāo)和圖書(shū)館服務(wù)等行業(yè)。大數(shù)據(jù)反映規(guī)律,小數(shù)據(jù)體現(xiàn)個(gè)性。小數(shù)據(jù)是企業(yè)要獲取、處理與合成大數(shù)據(jù),進(jìn)行產(chǎn)品細(xì)分和準(zhǔn)確市場(chǎng)定位,保證服務(wù)更加高效、個(gè)性化和經(jīng)濟(jì)的前提。此外,小數(shù)據(jù)立足于微觀世界,在有限數(shù)據(jù)樣本空間下解決讀者的個(gè)性化服務(wù)需求和服務(wù)等問(wèn)題,可在較小數(shù)據(jù)采集、存儲(chǔ)、分析和決策成本投入的前提下,大幅提升讀者的個(gè)性化閱讀愉悅感和服務(wù)滿(mǎn)意度。因此,如何在“小數(shù)據(jù)”中獲得更多無(wú)法預(yù)知或與直覺(jué)相左的信息、知識(shí),是大數(shù)據(jù)時(shí)代圖書(shū)館提高自身服務(wù)能力和讀者個(gè)性化服務(wù)QOS保證應(yīng)重點(diǎn)關(guān)注的問(wèn)題。
2.1 小數(shù)據(jù)概念的產(chǎn)生
“小數(shù)據(jù)”是指以個(gè)人為中心的全方位數(shù)據(jù),包括數(shù)據(jù)被采集對(duì)象實(shí)時(shí)的生活習(xí)慣、身體狀況、社交、財(cái)務(wù)、喜好、情緒、行為等數(shù)據(jù)。通過(guò)對(duì)分析對(duì)象全部小數(shù)據(jù)資源的收集、利用和分析,可對(duì)外形成一個(gè)富有個(gè)人色彩的數(shù)據(jù)系統(tǒng),能夠?qū)崿F(xiàn)對(duì)個(gè)人特性、社會(huì)關(guān)系、需求和行為的精確分析與預(yù)測(cè)。第一個(gè)意識(shí)到“小數(shù)據(jù)”重要性的是美國(guó)康奈爾大學(xué)教授德波哈爾·艾斯汀。早在他父親去世之前幾個(gè)月,他就注意到他父親在數(shù)字社會(huì)脈動(dòng)中的細(xì)微變化。父親不再發(fā)送電子郵件和不去超市買(mǎi)菜,散步的距離也越來(lái)越短。而這種逐漸衰弱的狀態(tài),無(wú)論在醫(yī)院通過(guò)測(cè)脈搏、查病歷、心電圖或者全面體檢,都不能獲得這個(gè)90歲老人的身體異常表現(xiàn)。但通過(guò)跟蹤老人的實(shí)時(shí)個(gè)體化數(shù)據(jù),就可以發(fā)現(xiàn)他的生活狀況已與平時(shí)明顯不同。這啟發(fā)艾斯汀開(kāi)始研究小數(shù)據(jù),從日常生活的小數(shù)據(jù)之中尋找異常之處,并把它當(dāng)作一種新的醫(yī)學(xué)證據(jù)。
大數(shù)據(jù)時(shí)代,隨著監(jiān)控設(shè)備、傳感器設(shè)備、可穿戴設(shè)備和個(gè)人閱讀終端設(shè)備的發(fā)展與成熟,圖書(shū)館可以安全、高效、持續(xù)和保密地采集讀者個(gè)人數(shù)據(jù),所采集的小數(shù)據(jù)與讀者個(gè)體相匹配,直接表現(xiàn)了讀者閱讀需求、行為、關(guān)系和方式隨時(shí)間變化的規(guī)律,是圖書(shū)館發(fā)現(xiàn)讀者閱讀需求和為讀者提供個(gè)性化服務(wù)的直接依據(jù)。其次,與大數(shù)據(jù)資源結(jié)構(gòu)和應(yīng)用模式相比,讀者是圖書(shū)館小數(shù)據(jù)資源唯一的采集對(duì)象,是圖書(shū)館對(duì)讀者閱讀需求、活動(dòng)和模式全方位、不間斷的深度挖掘,傳統(tǒng)的大數(shù)據(jù)應(yīng)用模式和決策方法已不適用于小數(shù)據(jù)環(huán)境。第三,小數(shù)據(jù)是圖書(shū)館大數(shù)據(jù)應(yīng)用的必要完善與補(bǔ)充,是在圖書(shū)館大數(shù)據(jù)宏觀決策的基礎(chǔ)上,對(duì)讀者閱讀需求的個(gè)性化定制和QOS(Quality of Service,服務(wù)質(zhì)量)的可靠保障。
2.2 小數(shù)據(jù)與大數(shù)據(jù)的關(guān)系
2.2.1 小數(shù)據(jù)與大數(shù)據(jù)的組織結(jié)構(gòu)和數(shù)據(jù)類(lèi)型不同
首先,從數(shù)據(jù)組織結(jié)構(gòu)上分析,大數(shù)據(jù)具有海量、多類(lèi)型、快速處理和高價(jià)值等4V特性,且非結(jié)構(gòu)化數(shù)據(jù)占據(jù)大數(shù)據(jù)總量的75%以上。為了提高數(shù)據(jù)在采集、處理、存儲(chǔ)和分析過(guò)程的效率可控性,大數(shù)據(jù)對(duì)數(shù)據(jù)組織結(jié)構(gòu)和數(shù)據(jù)類(lèi)型的標(biāo)準(zhǔn)化要求較高。小數(shù)據(jù)并不是指數(shù)據(jù)總量而言小,而是指圖書(shū)館依據(jù)讀者閱讀和個(gè)性化服務(wù)QOS要求,以讀者為中心進(jìn)行的全方位、不間斷的用戶(hù)個(gè)性化數(shù)據(jù)采集、存儲(chǔ)、分析與決策活動(dòng)。小數(shù)據(jù)以讀者作為數(shù)據(jù)采集、處理、決策和應(yīng)用中心,具有易收集、易處理和易操作的特點(diǎn),能夠滿(mǎn)足讀者個(gè)性化閱讀服務(wù)高效、實(shí)時(shí)、可視和快捷的需求。其次,小數(shù)據(jù)具有更小的數(shù)據(jù)總量和更強(qiáng)的數(shù)據(jù)應(yīng)用針對(duì)性,因此,在數(shù)據(jù)的采集、處理、分析和決策中,對(duì)大數(shù)據(jù)系統(tǒng)的系統(tǒng)性能和資源配置需求較低,可在較低成本投入情況下獲取較高的讀者個(gè)性化服務(wù)決策收益。第三,大數(shù)據(jù)往往是反映圖書(shū)館在用戶(hù)服務(wù)模式與方法、服務(wù)系統(tǒng)構(gòu)建、服務(wù)市場(chǎng)競(jìng)爭(zhēng)環(huán)境和讀者整體需求等方面的大規(guī)律,具有覆蓋面廣、內(nèi)容繁多、分析深度有限和針對(duì)性不強(qiáng)的特點(diǎn)。而小數(shù)據(jù)則以讀者個(gè)性化閱讀需求和服務(wù)為中心,能夠?qū)τ脩?hù)服務(wù)的內(nèi)容、模式、方法和產(chǎn)品進(jìn)行深度細(xì)分,對(duì)用戶(hù)服務(wù)市場(chǎng)、對(duì)象和內(nèi)容的定位更加精確。因此,小數(shù)據(jù)是大數(shù)據(jù)決策的必要優(yōu)化與完善。
2.2.2 小數(shù)據(jù)決策與應(yīng)用具有較高的難度
與大數(shù)據(jù)相比,圖書(shū)館小數(shù)據(jù)具有數(shù)據(jù)量偏小、數(shù)據(jù)模式不規(guī)范、數(shù)據(jù)信號(hào)微弱、數(shù)據(jù)出現(xiàn)頻率低和數(shù)據(jù)噪音過(guò)大的缺點(diǎn),導(dǎo)致小數(shù)據(jù)價(jià)值易被過(guò)濾和忽視。同時(shí),圖書(shū)館小數(shù)據(jù)系統(tǒng)具有美國(guó)圣塔菲研究所羅列的復(fù)雜系統(tǒng)多變量、相互作用、同時(shí)發(fā)生三個(gè)典型特征。因此,圖書(shū)館小數(shù)據(jù)系統(tǒng)具有較高的系統(tǒng)結(jié)構(gòu)與數(shù)據(jù)應(yīng)用復(fù)雜度。其次,與讀者相關(guān)小數(shù)據(jù)具有數(shù)據(jù)總量小和快速?zèng)Q策需求低的特點(diǎn),圖書(shū)館往往更加注重非結(jié)構(gòu)化數(shù)據(jù)的之間的關(guān)聯(lián),以及對(duì)與讀者個(gè)體相關(guān)數(shù)據(jù)的深度采集與挖掘。因此,通過(guò)對(duì)小數(shù)據(jù)集應(yīng)用方向的分析可得出,小數(shù)據(jù)不是大數(shù)據(jù)集合的精簡(jiǎn)與提煉,而是對(duì)大數(shù)據(jù)應(yīng)用與決策的必要補(bǔ)充和延伸。第三,滿(mǎn)足讀者需求和加強(qiáng)CRM管理是圖書(shū)館小數(shù)據(jù)應(yīng)用的重點(diǎn)與核心。作為數(shù)據(jù)資源庫(kù)的重要組成部分,小數(shù)據(jù)可以在大數(shù)據(jù)宏觀分析、決策的基礎(chǔ)上,更加深入、細(xì)致地挖掘讀者行為特征、個(gè)體需求、CRM管理有效性和用戶(hù)群結(jié)構(gòu)科學(xué)性,通過(guò)對(duì)讀者個(gè)體的精準(zhǔn)分析更加精確地了解讀者,并與讀者群建立穩(wěn)定、良好的關(guān)系,為讀者提供基于小數(shù)據(jù)的精準(zhǔn)個(gè)性化閱讀推送服務(wù)。
2.2.3 小數(shù)據(jù)偏重于對(duì)讀者個(gè)體數(shù)據(jù)的深度分析
對(duì)于數(shù)據(jù)的處理與分析過(guò)程,大數(shù)據(jù)往往側(cè)重于數(shù)據(jù)的全面性和廣闊度,對(duì)與圖書(shū)館讀者服務(wù)過(guò)程相關(guān)的數(shù)據(jù),進(jìn)行大規(guī)模、全方位的采集、存儲(chǔ)、計(jì)算與分析,希望通過(guò)全面、系統(tǒng)的分析,來(lái)準(zhǔn)確發(fā)現(xiàn)讀者的閱讀需求和圖書(shū)館服務(wù)的規(guī)律、未來(lái)發(fā)展趨勢(shì)。大數(shù)據(jù)應(yīng)用存在著數(shù)據(jù)海量、類(lèi)型復(fù)雜、應(yīng)用范圍廣和數(shù)據(jù)噪音多的問(wèn)題,因此,要求大數(shù)據(jù)類(lèi)型、應(yīng)用模式具有較高的一致性和標(biāo)準(zhǔn)化水平。小數(shù)據(jù)是以讀者個(gè)體作為唯一數(shù)據(jù)采集、處理、分析和決策的對(duì)象,小數(shù)據(jù)決策對(duì)數(shù)據(jù)的精準(zhǔn)性、針對(duì)性、個(gè)性化和隱私性要求較高,所涉及的內(nèi)容包括讀者的社會(huì)關(guān)系、工作與生活環(huán)境、閱讀需求和愛(ài)好,以及讀者個(gè)體所處的地理位置、移動(dòng)路徑和閱讀內(nèi)容等隱私數(shù)據(jù),是圖書(shū)館用戶(hù)服務(wù)決策和實(shí)施過(guò)程從擺脫傳統(tǒng)的主觀經(jīng)驗(yàn)性主義,向“以客戶(hù)為中心”理念的指導(dǎo)下的小數(shù)據(jù)客觀性決策轉(zhuǎn)變的重要依據(jù)。
2.2.4 小數(shù)據(jù)比大數(shù)據(jù)有更苛刻的安全環(huán)境要求
小數(shù)據(jù)模式下,讀者個(gè)體數(shù)據(jù)是圖書(shū)館發(fā)現(xiàn)讀者閱讀需求、明確讀者閱讀模式變化趨勢(shì)、有效評(píng)估讀者個(gè)性化閱讀QOS保障有效性、優(yōu)化用戶(hù)服務(wù)策略的重要依據(jù)。
為了保證圖書(shū)館能夠全面、精確和不間斷地采集讀者相關(guān)數(shù)據(jù),圖書(shū)館必須全面構(gòu)建以視頻監(jiān)控系統(tǒng)、傳感器網(wǎng)絡(luò)系統(tǒng)、IT服務(wù)系統(tǒng)監(jiān)控設(shè)備、用戶(hù)閱讀終端數(shù)據(jù)采集系統(tǒng)等為核心的讀者數(shù)據(jù)采集系統(tǒng),有效結(jié)合通信運(yùn)營(yíng)商、增值服務(wù)商等第三方協(xié)作服務(wù)商的共享數(shù)據(jù),才能實(shí)現(xiàn)對(duì)讀者閱讀行為、個(gè)人行動(dòng)軌跡、閱讀思想需求和變化、閱讀社會(huì)關(guān)系等數(shù)據(jù)的全面、無(wú)縫采集。因此,小數(shù)據(jù)模式下讀者處于個(gè)人行為和隱私完全暴露的環(huán)境中,如何通過(guò)法律、科技和行業(yè)規(guī)范來(lái)保護(hù)讀者隱私,使讀者能夠完全控制自身相關(guān)數(shù)據(jù)采集的內(nèi)容與數(shù)量、存儲(chǔ)與使用權(quán)、作用對(duì)象和應(yīng)用方向,是圖書(shū)館小數(shù)據(jù)分析應(yīng)重點(diǎn)關(guān)注的內(nèi)容。其次,大數(shù)據(jù)應(yīng)用模式是以圖書(shū)館用戶(hù)服務(wù)為中心的海量數(shù)據(jù)全面采集、存儲(chǔ)、分析與應(yīng)用過(guò)程,讀者相關(guān)數(shù)據(jù)在大數(shù)據(jù)總量中占據(jù)較小的比例,且數(shù)據(jù)的處理、分析也不是以讀者個(gè)體為核心。而小數(shù)據(jù)的采集、存儲(chǔ)、分析和決策都是以讀者為中心,所以應(yīng)注重讀者在小數(shù)據(jù)決策隱私保護(hù)中的核心地位和作用。第三,讀者是小數(shù)據(jù)資源的生產(chǎn)者和決策作用對(duì)象,小數(shù)據(jù)資源具有較強(qiáng)的讀者個(gè)體屬性特征。因此,如何將數(shù)據(jù)安全保護(hù)技術(shù)與小數(shù)據(jù)個(gè)體屬性特征相結(jié)合,是確保圖書(shū)館小數(shù)據(jù)安全和數(shù)據(jù)隱私保護(hù)技術(shù)應(yīng)用高效、經(jīng)濟(jì)的前提。
3.1 圖書(shū)館小數(shù)據(jù)的組織結(jié)構(gòu)與數(shù)據(jù)特征
圖書(shū)館小數(shù)據(jù)是以讀者為中心采集的用戶(hù)相關(guān)數(shù)據(jù),數(shù)據(jù)內(nèi)容涉及讀者的個(gè)體特征、閱讀行為與需求、社會(huì)關(guān)系、用戶(hù)地理位置及移動(dòng)路徑等相關(guān)信息,是圖書(shū)館發(fā)現(xiàn)讀者個(gè)性化閱讀需求和閱讀模式變化趨勢(shì),制定、完善和優(yōu)化讀者個(gè)性化閱讀服務(wù)策略的重要依據(jù)。從數(shù)據(jù)的價(jià)值總量、密度、可靠性和可用性劃分,圖書(shū)館小數(shù)據(jù)可劃分為讀者個(gè)體特征數(shù)據(jù)、讀者行為監(jiān)控?cái)?shù)據(jù)、第三方共享數(shù)據(jù)和外圍社會(huì)化數(shù)據(jù)4個(gè)層次的內(nèi)容(見(jiàn)圖1)。
圖1 圖書(shū)館小數(shù)據(jù)組織結(jié)構(gòu)與數(shù)據(jù)特征圖
讀者個(gè)體特征數(shù)據(jù)是小數(shù)據(jù)的核心數(shù)據(jù),主要由讀者特征數(shù)據(jù)庫(kù)記錄數(shù)據(jù)、讀者社會(huì)關(guān)系數(shù)據(jù)、讀者滿(mǎn)意度評(píng)估與服務(wù)需求反饋數(shù)據(jù)等組成。讀者個(gè)體特征數(shù)據(jù)具有較高的科學(xué)性、真實(shí)性、高價(jià)值密度和決策可用性,是圖書(shū)館描述讀者個(gè)體特征和明確用戶(hù)需求的主要數(shù)據(jù)依據(jù)。但是,讀者個(gè)體特征數(shù)據(jù)也具有數(shù)據(jù)總量偏小、數(shù)據(jù)價(jià)值可挖掘潛力小和數(shù)據(jù)更新緩慢的缺點(diǎn)。讀者行為監(jiān)控?cái)?shù)據(jù)位于小數(shù)據(jù)庫(kù)的第二層,主要由視頻監(jiān)控設(shè)備、傳感器網(wǎng)絡(luò)、閱讀終端監(jiān)控器和服務(wù)器監(jiān)控設(shè)備采集數(shù)據(jù)組成,主要實(shí)現(xiàn)對(duì)讀者的閱讀行為、個(gè)體位置與移動(dòng)路徑、社會(huì)關(guān)系交往等數(shù)據(jù)的采集與存儲(chǔ)。該類(lèi)型數(shù)據(jù)對(duì)實(shí)時(shí)性和數(shù)據(jù)全面、完整性有較高的要求,是圖書(shū)館判定讀者閱讀需求、服務(wù)模式和方法的重要依據(jù)。小數(shù)據(jù)第三層為第三方共享數(shù)據(jù),主要由通信運(yùn)營(yíng)商和其它第三方增值服務(wù)商共享數(shù)據(jù)組成。該類(lèi)型數(shù)據(jù)能夠全面、完整的覆蓋讀者閱讀活動(dòng)相關(guān)信息,但具有較低的隱私安全性、可靠性和可控性,因此,圖書(shū)館在小數(shù)據(jù)分析中應(yīng)加強(qiáng)對(duì)該層數(shù)據(jù)的過(guò)濾、挖掘和價(jià)值發(fā)現(xiàn)。外圍社會(huì)化數(shù)據(jù)是圖書(shū)館小數(shù)據(jù)的第四層數(shù)據(jù),圖書(shū)館可通過(guò)開(kāi)放API(應(yīng)用程序界面)和百度、臉譜等合約數(shù)據(jù)提供商獲得共享數(shù)據(jù),在對(duì)數(shù)據(jù)進(jìn)行整理、去噪后運(yùn)用于小數(shù)據(jù)分析。外圍社會(huì)化數(shù)據(jù)具有較強(qiáng)的數(shù)據(jù)價(jià)值發(fā)現(xiàn)與挖掘潛能,為圖書(shū)館小數(shù)據(jù)決策提供必要的支持和補(bǔ)充。從第一層讀者個(gè)體特征數(shù)據(jù)至第四層外圍社會(huì)化數(shù)據(jù),小數(shù)據(jù)的價(jià)值密度、數(shù)據(jù)安全需求、數(shù)據(jù)可控性和數(shù)據(jù)可用性逐層遞減,而小數(shù)據(jù)的數(shù)據(jù)總量、數(shù)據(jù)噪聲和數(shù)據(jù)可獲取性則呈現(xiàn)逐層遞增現(xiàn)象。
3.2 基于小數(shù)據(jù)分析的圖書(shū)館用戶(hù)個(gè)性化服務(wù)體系構(gòu)建
3.2.1 制定科學(xué)的小數(shù)據(jù)采集、過(guò)濾標(biāo)準(zhǔn)
小數(shù)據(jù)應(yīng)用是以讀者為核心的數(shù)據(jù)采集、處理、分析和決策過(guò)程,因此,圖書(shū)館要注重小數(shù)據(jù)的讀者個(gè)性化特征,數(shù)據(jù)的采集、存儲(chǔ)、分析和應(yīng)用一定要擺脫大數(shù)據(jù)的全面、海量、多類(lèi)型和快速處理特征,通過(guò)制定、實(shí)施科學(xué)的小數(shù)據(jù)采集、過(guò)濾、處理和應(yīng)用標(biāo)準(zhǔn),才能為讀者個(gè)性化閱讀服務(wù)提供可靠的小數(shù)據(jù)決策支持。
監(jiān)控技術(shù)和傳感器網(wǎng)絡(luò)技術(shù)的發(fā)展,使圖書(shū)館可對(duì)讀者個(gè)體的位置信息、移動(dòng)路徑、社會(huì)交往、閱讀行為、閱讀瀏覽量、網(wǎng)站停留時(shí)間和閱讀滿(mǎn)意度反饋等相關(guān)數(shù)據(jù),實(shí)現(xiàn)全方位、不間斷的采集、存儲(chǔ)、分析和決策。但是,隨著圖書(shū)館小數(shù)據(jù)資源采集范圍、種類(lèi)和深度的持續(xù)快速增長(zhǎng),過(guò)于龐大的小數(shù)據(jù)會(huì)導(dǎo)致圖書(shū)館數(shù)據(jù)決策過(guò)程對(duì)系統(tǒng)資源的需求量,以及決策活動(dòng)的復(fù)雜度快速增長(zhǎng),并大幅降低小數(shù)據(jù)決策的可靠性和可用性。因此,圖書(shū)館在小數(shù)據(jù)資源采集、過(guò)濾、處理和應(yīng)用標(biāo)準(zhǔn)的制定中,應(yīng)堅(jiān)持?jǐn)?shù)據(jù)標(biāo)準(zhǔn)化、高價(jià)值密度和多樣性的原則,避免因過(guò)度追求數(shù)據(jù)的同源性和一致性而使數(shù)據(jù)過(guò)度過(guò)濾,導(dǎo)致數(shù)據(jù)的價(jià)值和可用性下降。此外,小數(shù)據(jù)的采集、過(guò)濾應(yīng)堅(jiān)持讀者需求和個(gè)性化服務(wù)相關(guān)性的原則,通過(guò)對(duì)采集的小數(shù)據(jù)資源進(jìn)行噪聲過(guò)濾、類(lèi)型分類(lèi)和樣本選擇,提高小數(shù)據(jù)決策的精確度、針對(duì)性、可靠性和可用性,為讀者提供基于小數(shù)據(jù)的讀者個(gè)性化定制服務(wù)。
3.2.2 為讀者提供基于小數(shù)據(jù)的個(gè)性化閱讀服務(wù)
小數(shù)據(jù)是圖書(shū)館發(fā)現(xiàn)讀者閱讀需求、愛(ài)好和習(xí)慣,判斷閱讀服務(wù)QOS標(biāo)準(zhǔn)、讀者閱讀收益和用戶(hù)滿(mǎn)意度,將讀者科學(xué)劃分為不同讀者群的直接依據(jù)。
個(gè)性化服務(wù)定制和推送有效性是決定讀者閱讀活動(dòng)滿(mǎn)意度和忠誠(chéng)度的重要因素。因此,圖書(shū)館應(yīng)通過(guò)小數(shù)據(jù)應(yīng)用系統(tǒng)的分析、決策,智能、高效地將讀者劃分為若干個(gè)服務(wù)需求和QOS保障標(biāo)準(zhǔn)不同的用戶(hù)群,在為群客戶(hù)整體提供無(wú)差異服務(wù)保障的前提下,依據(jù)每一個(gè)讀者的小數(shù)據(jù)指標(biāo)分析結(jié)果,為讀者提供量身訂制的個(gè)性化服務(wù),一方面可以增加讀者的閱讀滿(mǎn)意度和忠誠(chéng)度,另一方面又不會(huì)因個(gè)性化服務(wù)水平的大幅提升而導(dǎo)致圖書(shū)館服務(wù)成本上漲。其次,圖書(shū)館在保證讀者小數(shù)據(jù)隱私安全的前提下,可將小數(shù)據(jù)整體作為大數(shù)據(jù)庫(kù)的重要補(bǔ)充和完善,避免了大數(shù)據(jù)庫(kù)對(duì)讀者個(gè)人數(shù)據(jù)的重復(fù)采集、過(guò)濾和決策,可有效提高大數(shù)據(jù)決策的效率和精確度。第三,智慧閱讀和個(gè)性化服務(wù)是未來(lái)圖書(shū)館發(fā)展的一個(gè)重要方向,而小數(shù)據(jù)則為圖書(shū)館智慧服務(wù)體系和個(gè)性化服務(wù)模式的構(gòu)建提供科學(xué)的數(shù)據(jù)決策支持。圖書(shū)館可通過(guò)對(duì)讀者個(gè)人小數(shù)據(jù)接口的查詢(xún),提前預(yù)測(cè)未來(lái)讀者的閱讀需求、閱讀內(nèi)容、閱讀方式和閱讀時(shí)間,可在最精確時(shí)間以最經(jīng)濟(jì)的服務(wù)模式,為讀者提供精準(zhǔn)的個(gè)性化定制服務(wù),避免因無(wú)目標(biāo)的廣告投放而影響讀者的閱讀愉悅感。第四,隨著圖書(shū)館用戶(hù)服務(wù)模式的變革和服務(wù)方法的發(fā)展,大數(shù)據(jù)呈現(xiàn)出多數(shù)據(jù)來(lái)源、海量、多類(lèi)型和離散化的現(xiàn)狀。此外,大數(shù)據(jù)的整合、重組過(guò)程也會(huì)導(dǎo)致數(shù)據(jù)復(fù)雜度和價(jià)值挖掘難度增大。在圖書(shū)館服務(wù)系統(tǒng)構(gòu)建和用戶(hù)服務(wù)推送中,大數(shù)據(jù)作為實(shí)時(shí)動(dòng)態(tài)指數(shù),可實(shí)現(xiàn)對(duì)圖書(shū)館宏觀科學(xué)決策和未來(lái)發(fā)展趨勢(shì)的科學(xué)預(yù)測(cè)。而小數(shù)據(jù)則是通過(guò)對(duì)讀者歷史數(shù)據(jù)的分析與判斷,為讀者提供動(dòng)態(tài)、可定制的個(gè)性化服務(wù)。因此,圖書(shū)館在小數(shù)據(jù)決策過(guò)程中應(yīng)加強(qiáng)與大數(shù)據(jù)應(yīng)用的結(jié)合和共享。
3.2.3 實(shí)現(xiàn)基于小數(shù)據(jù)的圖書(shū)館CRM精確管理
圖書(shū)館小數(shù)據(jù)資源是以讀者為中心的數(shù)據(jù)集合,小數(shù)據(jù)應(yīng)用應(yīng)注重不同數(shù)據(jù)之間的緊密相關(guān)性、數(shù)據(jù)價(jià)值可釋性和實(shí)用性。對(duì)基于小數(shù)據(jù)的讀者個(gè)性化服務(wù)而言,如何科學(xué)采集一個(gè)具有較小數(shù)據(jù)總量、較高價(jià)值密度和精確表述讀者個(gè)性化特征的小數(shù)據(jù)集,是圖書(shū)館完成讀者服務(wù)個(gè)性化定制和改善用戶(hù)服務(wù)細(xì)節(jié),實(shí)現(xiàn)基于商業(yè)智能(Business Intelligence,BI)自動(dòng)化精準(zhǔn)營(yíng)銷(xiāo)服務(wù)的必要保證。
首先,小數(shù)據(jù)是讀者、圖書(shū)館和用戶(hù)服務(wù)之間的聯(lián)系橋梁。小數(shù)據(jù)的本質(zhì)特征就是以讀者為中心,圖書(shū)館借助小數(shù)據(jù)分析可以明確讀者的服務(wù)需求、服務(wù)滿(mǎn)意度反饋、所希望的服務(wù)產(chǎn)品和服務(wù)模式等。圖書(shū)館可基于對(duì)讀者小數(shù)據(jù)庫(kù)資源的發(fā)現(xiàn)和挖掘,建立圖書(shū)館與讀者之間的即時(shí)溝通關(guān)系,完成讀者個(gè)性化定制服務(wù)的實(shí)時(shí)推送、反饋、修改和完善,最終建立一個(gè)讀者與服務(wù)品牌共存的關(guān)系。其次,二八定律指出,圖書(shū)館服務(wù)收益的80%來(lái)自占據(jù)讀者總數(shù)20%的高端用戶(hù),而占據(jù)讀者總數(shù)80%的普通讀者只為圖書(shū)館貢獻(xiàn)了20%的服務(wù)收益。因此,圖書(shū)館通過(guò)對(duì)小數(shù)據(jù)資源的整合與分析,可從讀者的行為、思想和社會(huì)關(guān)系中發(fā)現(xiàn)讀者的價(jià)值,在滿(mǎn)足全體讀者QOS的前提下,為高價(jià)值讀者定制具有個(gè)性化特征的特色服務(wù)和產(chǎn)品,通過(guò)進(jìn)一步提高高價(jià)值客戶(hù)的服務(wù)依賴(lài)性和閱讀忠誠(chéng)度,大幅度提升圖書(shū)館閱讀服務(wù)的綜合收益率。第三,基于小數(shù)據(jù)資源的支撐,圖書(shū)館可構(gòu)建科學(xué)的讀者識(shí)別模型、讀者價(jià)值評(píng)價(jià)模型、讀者服務(wù)滿(mǎn)意度評(píng)估模型、讀者閱讀需求預(yù)測(cè)模型、服務(wù)產(chǎn)品關(guān)聯(lián)分析模型、客戶(hù)CRM(客戶(hù)關(guān)系管理)管理模型等,在有效降低服務(wù)風(fēng)險(xiǎn)和提升客戶(hù)需求洞察的前提下,提升圖書(shū)館讀者服務(wù)市場(chǎng)的綜合競(jìng)爭(zhēng)力。
3.2.4 利用小數(shù)據(jù)分析保護(hù)讀者隱私安全
與大數(shù)據(jù)海量、多類(lèi)型、快速和高價(jià)值的4V特性相比,小數(shù)據(jù)具有以讀者為中心、數(shù)據(jù)總量可控、數(shù)據(jù)處理即時(shí)性要求低、數(shù)據(jù)價(jià)值密度高的特點(diǎn)。因此,圖書(shū)館對(duì)以讀者為中心的小數(shù)據(jù)安全、隱私保護(hù),應(yīng)堅(jiān)持從小數(shù)據(jù)結(jié)構(gòu)特點(diǎn)與讀者個(gè)性化服務(wù)模式出發(fā),制定可靠的數(shù)據(jù)安全管理與應(yīng)用策略,不斷提高小數(shù)據(jù)資源的安全性。
圖書(shū)館小數(shù)據(jù)是以讀者為中心的個(gè)人數(shù)據(jù)集合。因此,圖書(shū)館在對(duì)其擁有的小數(shù)據(jù)資源管理中,應(yīng)結(jié)合小數(shù)據(jù)的安全性需求,對(duì)圖書(shū)館內(nèi)不同部門(mén)和館外第三方共享方設(shè)定相應(yīng)的數(shù)據(jù)共享、使用權(quán)限,通過(guò)預(yù)先設(shè)定的小數(shù)據(jù)使用授權(quán)程序,嚴(yán)格控制小數(shù)據(jù)的閱讀、傳輸、下載和存儲(chǔ),保證數(shù)據(jù)不被第三方非法獲得和使用。其次,小數(shù)據(jù)資源是圖書(shū)館大數(shù)據(jù)庫(kù)重要的組成部分,圖書(shū)館對(duì)大數(shù)據(jù)資源進(jìn)行分析、決策的過(guò)程中,往往會(huì)因?yàn)閷?duì)數(shù)據(jù)的過(guò)度分析而導(dǎo)致讀者隱私泄露。為了在不影響大數(shù)據(jù)決策有效性的前提下保護(hù)小數(shù)據(jù)安全,圖書(shū)館應(yīng)嚴(yán)格控制大數(shù)據(jù)分析系統(tǒng)對(duì)小數(shù)據(jù)資源的隨意訪(fǎng)問(wèn)、下載和共享,而應(yīng)將所需分析的內(nèi)容傳輸給小數(shù)據(jù)分析系統(tǒng),當(dāng)小數(shù)據(jù)分析系統(tǒng)完成數(shù)據(jù)分析后,直接將分析結(jié)果傳輸給大數(shù)據(jù)決策系統(tǒng)即可,而不是將包含讀者隱私數(shù)據(jù)的小數(shù)據(jù)原始資源傳輸給大數(shù)據(jù)庫(kù)。第三,圖書(shū)館應(yīng)將讀者放在小數(shù)據(jù)資源安全管理的核心地位,由讀者決定與自身相關(guān)小數(shù)據(jù)內(nèi)容的采集、共享和使用。當(dāng)圖書(shū)館需要對(duì)讀者相關(guān)小數(shù)據(jù)資源采集時(shí),應(yīng)對(duì)讀者小數(shù)據(jù)資源采集的內(nèi)容、方式和使用對(duì)象進(jìn)行告知,由讀者決定小數(shù)據(jù)資源采集、應(yīng)用、共享、傳播的范圍、內(nèi)容、程度、時(shí)限和對(duì)象,并對(duì)與自身相關(guān)小數(shù)據(jù)進(jìn)行生命周期的全程監(jiān)控。此外,讀者還應(yīng)擁有圖書(shū)館監(jiān)控系統(tǒng)和傳感器網(wǎng)絡(luò)系統(tǒng)對(duì)自身小數(shù)據(jù)采集的控制權(quán),可通過(guò)監(jiān)控系統(tǒng)對(duì)讀者帳號(hào)、密碼的認(rèn)證,暫停圖書(shū)館對(duì)自身小數(shù)據(jù)的采集。
目前,“以客戶(hù)為中心”和“讀者個(gè)性化服務(wù)定制”的理念,已成為圖書(shū)館服務(wù)系統(tǒng)構(gòu)建和服務(wù)模式變革的核心內(nèi)容,也是圖書(shū)館提高讀者閱讀滿(mǎn)意度和增強(qiáng)服務(wù)市場(chǎng)競(jìng)爭(zhēng)力的重要依據(jù)。因此,如何通過(guò)海量數(shù)據(jù)的分析、預(yù)測(cè)和判斷,準(zhǔn)確把握讀者閱讀需求和閱讀模式變化,成為關(guān)系圖書(shū)館個(gè)性服務(wù)QOS保證的重要因素。
與大數(shù)據(jù)決策模式相比,小數(shù)據(jù)決策以讀者為中心,具有更高的決策針對(duì)性、準(zhǔn)確性、可靠性、可用性和實(shí)時(shí)性。同時(shí),具有比大數(shù)據(jù)分析系統(tǒng)更低的系統(tǒng)配置和資源消耗需求,是圖書(shū)館個(gè)性化服務(wù)質(zhì)量的可靠保證和大數(shù)據(jù)決策必要的組成部分。為了增強(qiáng)小數(shù)據(jù)決策有效性,圖書(shū)館應(yīng)以讀者個(gè)性化服務(wù)需求和閱讀滿(mǎn)意度保證為中心,加強(qiáng)小數(shù)據(jù)決策的精細(xì)化管理和差異化保障,不斷提升小數(shù)據(jù)分析、決策的深度和個(gè)性化水平,才能確保圖書(shū)館服務(wù)的有效性、可預(yù)測(cè)性和針對(duì)性,才能為讀者提供安全、高效、經(jīng)濟(jì)和便捷的小數(shù)據(jù)個(gè)性化閱讀服務(wù)。
[1]馬曉亭.大數(shù)據(jù)時(shí)代圖書(shū)館數(shù)據(jù)可用性:價(jià)值、挑戰(zhàn)和保障[J].圖書(shū)館理論與實(shí)踐,2014(10):5-8.
[2]高永梅,琚春華,鮑福光.基于大數(shù)據(jù)的電信領(lǐng)域用戶(hù)服務(wù)模型與數(shù)據(jù)融合策略研究[J].電信科學(xué),2014(7):62-69.
[3]馬曉亭.基于用戶(hù)服務(wù)價(jià)值的圖書(shū)館大數(shù)據(jù)價(jià)值分析與服務(wù)質(zhì)量保證研究[J].圖書(shū)館,2014(5):95-98.
[4]任磊,杜一,馬帥,等.大數(shù)據(jù)可視分析綜述[J].軟件學(xué)報(bào),2014,25(9):1909-1936.
[5]方艾,金鐸,徐雄,等.電信運(yùn)營(yíng)商能耗優(yōu)化的大數(shù)據(jù)分析模型研究[J].電信科學(xué),2014(10):38-42.
[6]漆晨曦.立足小數(shù)據(jù)基礎(chǔ)的電信企業(yè)大數(shù)據(jù)分析應(yīng)用發(fā)展策略[J].電信科學(xué),2014(10):15-20.
[7]Jiang D,Chen G,Ooi B C,et al.epiC:an Extensible and Scalable System for Processing Big Data[J].Proceedings of the VLDB Endowment,2014,7(7):1-12.
[8]馬曉亭.大數(shù)據(jù)時(shí)代圖書(shū)館客戶(hù)關(guān)系管理研究[J].圖書(shū)館工作與研究,2014(6):49-52.
[9]McAfee A,Brynjolfsson E.Big Data:The Management Revolution[J].Harvard Business Review,2012(October):61-68.
[10]Data centers efficiency how others can do it[EB/OL].[2014-12-18].http://www.google.com/about/datacenters/efficiency/external.htm.
[11]代雙鳳,董繼陽(yáng),薛健.科學(xué)計(jì)算中大數(shù)據(jù)可視化分析與應(yīng)用[J].工程研究-跨學(xué)科視野中的工程,2014,6(3):275-281.
[12]王忠,趙惠.大數(shù)據(jù)時(shí)代個(gè)人數(shù)據(jù)的隱私顧慮研究[J].情報(bào)理論與實(shí)踐,2014,37(11):26-29.
[13]馬曉亭.基于個(gè)性化服務(wù)需求的圖書(shū)館大數(shù)據(jù)分析平臺(tái)構(gòu)建研究[J].新世紀(jì)圖書(shū)館,2014(6):20-23.
Study of Personal Services Mode for Library Based on Small Data Decision Support
Based on the study of the relationship between big data and small data,this article analyzed the influence of small data on personalized services of library,discussed the key issues in personalized services for library like QOS guarantee of personal services,service costs and users privacy,and then designed a personal services mode for library based on small data decision support.The personal services mode can make its resources and services highly fused and integrated,and the core concept of the personal services mode is user demand-led,because it can provides personalized reading services for readers.
small data;big data;decision support;library;personalized services
G252.62
A
10.11968/tsygb.1003-6938.2015014
陳臣(1974-),男,蘭州商學(xué)院信息中心工程師。
2015-01-20;責(zé)任編輯:劉全根