余波 王桀
摘 要:近幾年大數據行業(yè)的興起給信息技術帶來了深刻的變革。在這樣的背景下,數字圖書館的建設也要有大數據思維,在資源建設、技術應用、服務方面都要有一個大的提升,服務模式由被動“等待”共性化轉向積極主動“自動推送和個性化”。未來的圖書館一定要充分利用大數據這個平臺,每一個圖書管理員也應該努力成為數據分析員。
關鍵詞:大數據 數據 應用研究
中圖分類號:G251.5 文獻標識碼:A 文章編號:1003-9082 ( 2017 ) 08-00-01
引言
信息技術的飛速發(fā)展,人們的生產、生活、學習已經越來越離不開互聯(lián)網。隨之而來的人們生產、存儲的巨量且復雜的數據開始激增。隨著數據量從GB時代邁入TB時代,麥肯錫公司在2011年提出了大數據這個概念。互聯(lián)網時代已經對現有的圖書館造成了很大的沖擊,紙質圖書借閱量的下降,人們對網絡資源需求的不斷提高,圖書館數據庫建設的滯后等都要求圖書館應該跟緊時代腳步,加快轉型步伐。大數據時代的到來更使我們圖書館人感到了緊迫感。
一、圖書館應用大數據面臨的幾個問題
1.來源及獲取問題
圖書館傳統(tǒng)業(yè)務軟件內的數據。主要是數據庫里的結構化數據,包括書目數據:讀者的身份信息:借還書的記錄:延時記錄:資金管理等。這類數據雖然不太符合大數據的特征,但可以融入與其他大數據的分析中,是圖書館大數據分析環(huán)節(jié)中的重要部分,這類數據也包括廣泛使用的條形碼和逐漸增多的二維條形碼數據?;ヂ?lián)網數據包括門戶網站、社交網絡、微博、微信。使讀者主動參與到圖書館的知識服務中,在與讀者的交互過程中,會產生大量數據,這些數據記錄了讀者的信息需求、習慣愛好等個性化信息。文獻數據是各類數字化資源的總稱,隨著數字圖書館進程的不斷加快,這類數據正呈現爆發(fā)式增長,是圖書館大數據的組成部分。但是這類數據,由于來源廣泛,存在數據格式不兼容或不能離開供應商的軟件讀取等問題,需要數據供應商在一定的條件下,提供通用格式的數據,以解決數據互操作的問題。
2.存儲問題
海量的數據資源對存儲系統(tǒng)提出了新的挑戰(zhàn),要求存儲系統(tǒng)具備足夠的存儲空間:靈活的可擴展性和較低的使用成本,圖書館目前主要有三種存儲架構,第一種 DAS 方式,是服務器直接連接存儲設備,第二種 NAS 方式,是通過網絡方式連接存儲,第三種 SAN,是通過專用的存儲網絡連接存儲,以實現集中存儲集中管理,但三種方式都存在可擴展性差的問題,難以適應海量數據的存儲要求,對大數據而言,云存儲是較為理想的方式,云存儲系統(tǒng)具有很強的可擴展性,它采用并行擴容方式,當容量不夠時,只需增加具有一定容量的服務器,而且容量擴展后,性能不會隨之下降。
二、圖書館大數據的應用研究
圖書館的應用研究,應建立在業(yè)務需求的基礎上,致力于提高服務體系的組織水平,促進圖書館事業(yè)與制度建設的創(chuàng)新發(fā)展,大數據在圖書館中的應用將主要圍繞構建新型知識服務體系和智能化管理上。
1.構建新型知識服務體系的應用利用大數據分析技術,能夠揭示數據背后隱藏的讀者行為和信息需求,有利于改進圖書館的服務,優(yōu)化整合圖書館的資源,建立新型知識服務體系,大數據的應用主要包括:
1.1對讀者的信息和借閱行為的分析,主要包含:①分析文獻類型與讀者的性別:年齡:學歷:專業(yè)的關系。②分析各類文獻的利用情況,進行文獻類別的借閱率排行,及時補充借閱率高的圖書,下架過時文獻,為調整借閱文獻的品種和采訪提供科學依據和預測信息,以優(yōu)化館藏結構。③個性化服務,分析讀者的活躍度:閱讀喜好:借閱方式:信息需求:行為習慣等數據,圖書館可以有的放矢地向用戶提供符合其個性化需求的服務,如新書推薦:同類書推薦:信息需求推送:個性化的圖書借閱:網上個性化門戶等。
1.2社交網絡交互數據的分析使讀者主動參與到圖書館的知識服務中,通過數據分析可以發(fā)現讀者的信息需求:讀者的研究課題等,可以有針對性地向其推薦所需要的圖書:課題的論文資料:研究報告:專利文獻等。
1.3圖書館信息資源的整合。面對大量的信息,圖書館通過大數據處理,從各類資源中整合有用的知識和關聯(lián)關系。通過數據的加工整理,探索以數據為基礎的知識發(fā)現分析和數據的增值服務。
1.4建立一個全新的知識服務導航機制,建立用戶知識需求預測導航:多維數據資源的組織和分析導航:讀者信息行為分析導航:數據資源和學術資源的服務導航等。
1.5知識服務的智能輔助決策,根據讀者的借閱數據,建立圖書館館藏資源的調整和預測機制,為圖書館管理增加必要的手段。
三、智能化管理方面的應用
1.圖書館對大數據的應用研究還包括建立大數據分析的可視化模型,如借閱分析模型:統(tǒng)計分析模型:預測模型:風險評估模型等,可視化將成為未大數據分析的重要方式。
2.圖書館物業(yè)管理的智能分析和輔助決策,各類傳感器將普遍應用于未來的智慧型圖書館中,通過對傳感器數據的多維度分析,實現物業(yè)管理的智能化。
3.閱覽室閱讀數據的統(tǒng)計預測。目前圖書館閱覽室一般無法提供讀者閱讀書籍的數據。通過在一組書架中增加RFID 識別設備,當讀者取書閱讀時即可將數據傳至服務器中,經過數據分析和挖掘可以對讀者的閱讀進行統(tǒng)計和預測。根據書籍的閱讀率及時增加熱門圖書,剔除冷門圖書,有利于更好地調整閱覽室的文獻資源布局。
結語
圖書館目前正在面臨著新技術、新思想、新服務、新用戶需求的全面沖擊。未來圖書館如果定位,數字圖書館向何處發(fā)展,都亟待解決。隨著網絡大數據服務的崛起,圖書館面臨著越來越大的責任。如果不轉變思路,未來就會被互聯(lián)網服務取而代之。如何從圖書館掌握的大數據中提取到可用的資源、分析用戶的閱讀習慣,是圖書館未來轉型為“以用戶需求為主導”的模型的主要一環(huán)。
參考文獻:
[1]容春琳.公共圖書館應用大數據的策略研究[J].圖書館建設,2013(7):91-95.
[2]陳明奇.姜禾,張娟,廖方宇.大數據時代的美國信息網絡安全新戰(zhàn)略分析[C].第27次全國計算機安全學術交流論文集,2012,(8):42-45.
[3]陳茫.周力青,呂艷娥.大數據時代下的圖書館移動服務創(chuàng)新研究[L].圖書與情報,2014(1):171-121
[4]李白楊.張心源.數字圖書館建設中大數據問題初探[J].情報科學.2013(11) 26-29.