耿 衛(wèi) 楊偉超 尤江東
(信息工程大學,河南 鄭州 450001)
隨著科技環(huán)境的巨變,信息網(wǎng)絡迅猛發(fā)展。首先是電腦的全球普及,移動智能終端的盛行,隨之而來的是社交網(wǎng)絡的爆炸式發(fā)展,還有存儲技術(shù)的發(fā)展等,這些都讓數(shù)據(jù)的生產(chǎn)和收集能力得到提升。其次是非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)的有效分析模型的構(gòu)建,相關(guān)軟硬件的支撐,讓數(shù)據(jù)的分析能力得到提升。面對數(shù)據(jù)形式日益復雜,數(shù)據(jù)的獲取越來越細致,數(shù)據(jù)的傳送、分享和訪問能力也得到徹底變革。
國際數(shù)據(jù)公司(IDC)的研究結(jié)果表明,2008年全球產(chǎn)生的數(shù)據(jù)量為0.49ZB,2009年的數(shù)據(jù)量為0.8ZB,2010年增長為1.2ZB,2011年的數(shù)量更是高達1.82ZB,相當于全球每人產(chǎn)生200GB以上的數(shù)據(jù)。而到2012年為止,人類生產(chǎn)的所有印刷材料的數(shù)據(jù)量是200PB。無所不在的移動設備、RFID、無線傳感器每分每秒都在產(chǎn)生數(shù)據(jù),數(shù)以億計用戶的互聯(lián)網(wǎng)服務時時刻刻在產(chǎn)生巨量的交互,信息量每年正以最少59%的速度在遞增,到2020年世界上的數(shù)據(jù)存儲總額將達到35ZB。而更關(guān)鍵的是,這些信息不再是單純的數(shù)字和文字,還有更復雜的圖片、音頻和視頻。
通俗地講大數(shù)據(jù)指的是海量數(shù)據(jù)加處理方法。有4 個典型的特征:一是variety(多樣性),多樣性是指海量數(shù)據(jù)中包含結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù),相對于以文本為主的結(jié)構(gòu)化數(shù)據(jù),非結(jié)構(gòu)化數(shù)據(jù)越來越多,包含視頻、圖片、位置等多種信息;二是volume(體量),體量是指包含的數(shù)據(jù)量規(guī)模龐大,具有一定的分析規(guī)模;三是velocity(速度),速度則是指數(shù)據(jù)處理的速度非???,這是大數(shù)據(jù)區(qū)分于傳統(tǒng)數(shù)據(jù)挖掘的最顯著特征;四是value(價值),價值密度的高低與數(shù)據(jù)總量的大小成反比,通過強大的機器算法更迅速地完成數(shù)據(jù)的價值挖掘。大數(shù)據(jù)時代,院校的教學、讀者的學習方式都會隨之發(fā)生改變,數(shù)據(jù)將成為圖書館的核心資產(chǎn),并將影響圖書館的業(yè)務模式,甚至重構(gòu)其服務方式。如何挖掘分析數(shù)據(jù)資產(chǎn),使其為大學決策乃至全軍服務,是我們研究大數(shù)據(jù)的核心議題。全軍圖書館在大數(shù)據(jù)時代,面臨文化、信息化、人才培養(yǎng)等各方面的挑戰(zhàn),同時也迎來轉(zhuǎn)型機遇和契機。
圖書館作為服務和信息資源保障部門,是大數(shù)據(jù)存儲和服務的提供地。圖書館專業(yè)技術(shù)人才要及時掌握大數(shù)據(jù)技術(shù)給圖書館帶來的影響,制定大數(shù)據(jù)時代圖書館發(fā)展策略。未來圖書館的競爭將是對大數(shù)據(jù)的綜合掌握。隨著人們對大數(shù)據(jù)的認識程度的提高,對大數(shù)據(jù)分析技術(shù)的日臻完善,大數(shù)據(jù)變得愈加有價值。例如,讀者的借閱習慣、服務消費記載、服務質(zhì)量提升等,能為圖書館未來發(fā)展、服務模式進行趨勢分析、發(fā)展預測提供支持的大數(shù)據(jù),都有可能成為圖書館的核心資產(chǎn),也是未來圖書館發(fā)展的選擇。
軍隊院校圖書館資源共建共享保障機制建設,圍繞“全軍院校一個館”的建設目標,堅持“統(tǒng)籌規(guī)劃、信息推動、聯(lián)建共享、集約高效”的原則,以信息系統(tǒng)研發(fā)和信息化條件建設為抓手,以信息資源建設為重點,以提高圖書館人員信息服務素質(zhì)為突破口,在軍隊院校圖書館統(tǒng)一的信息管理系統(tǒng)支撐下,努力構(gòu)建基于網(wǎng)絡共享,服務基于網(wǎng)絡互聯(lián)的“大平臺、大數(shù)據(jù)、大服務”的運行保障模式。
文獻資源聯(lián)建共享,通用資源聯(lián)合保障,有效提升全軍院校圖書館文獻資源整體保障能力,也有效地節(jié)省了信息資源建設經(jīng)費。隨著大數(shù)據(jù)時代技術(shù)的發(fā)展,為聯(lián)建共享提供了有力的技術(shù)支撐。
近十年來,軍校圖書館在信息資源聯(lián)建共享方面已經(jīng)邁開了步子。在數(shù)字圖書館建設中,總部機關(guān)批準了多個信息資源共享重點建設項目,取得了豐碩的成果,發(fā)揮了很好的作用。例如,我校的作戰(zhàn)信息與戰(zhàn)場環(huán)境專業(yè)圖書館建設,從全軍信息資源共建共享的建設需求出發(fā),完成了數(shù)字資源創(chuàng)建、元數(shù)據(jù)加工、組織管理、信息挖掘、加工整合和提交管理等多個環(huán)節(jié),最終建成17個專題數(shù)據(jù)庫,有效提高作戰(zhàn)信息與戰(zhàn)場環(huán)境專業(yè)圖書館信息服務聯(lián)合保障能力,完善了軍事特色信息資源建設保障體系。另外,為更好的提高資源使用效益,共建共享,提供聯(lián)合保障,我校與地方高校簽訂戰(zhàn)略合作協(xié)議,優(yōu)質(zhì)資源共享、軍民融合發(fā)展。
軍隊院校圖書館在聯(lián)席會組織領(lǐng)導下,完成通用文獻數(shù)字資源統(tǒng)一訂購和聯(lián)合采購,配發(fā)全軍院校共享。組織有關(guān)院校集中與資源數(shù)據(jù)商進行談判,聯(lián)合采購各院校所需的信息資源,降低了采購成本,提高了經(jīng)費使用效益。到2012年底,納入聯(lián)合保障計劃的通用數(shù)字資源庫已達62個,其中統(tǒng)一采購配發(fā)全軍院校使用的各類資源數(shù)據(jù)庫26個,聯(lián)合采購的資源數(shù)據(jù)庫33個,較好地保障了軍隊院校信息資源所需。
軍隊院校圖書館開展信息化建設已有多年,圖書館已形成了加強信息化服務的共識,鍛煉出了一支信息化建設與管理的人才隊伍,積累了建設的經(jīng)驗;先后開發(fā)了圖書館業(yè)務管理系統(tǒng)(Milins、NM2000、Milnets)和數(shù)字圖書館管理系統(tǒng)(MADL),部分實現(xiàn)了信息資源的共建共享,在數(shù)字圖書館建設和圖書館信息化建設中發(fā)揮了重要的作用。
隨著大數(shù)據(jù)時代信息技術(shù)發(fā)展并結(jié)合當前軍隊院校圖書館現(xiàn)狀,參考借鑒中國高等教育文獻保障系統(tǒng)(CALIS)、國家科學數(shù)字圖書館系統(tǒng)等建設項目情況,軍隊院校圖書館啟動新的信息管理系統(tǒng)建設-MALIS 項目建設。MALIS 項目建設整合現(xiàn)有資源和應用系統(tǒng),推進資源和技術(shù)平臺的聯(lián)合開發(fā)建設,構(gòu)建軍事特色鮮明、信息資源豐富、標準規(guī)范統(tǒng)一、服務功能強大、使用方便快捷、管理安全可靠、國內(nèi)一流的軍隊院校圖書館信息管理系統(tǒng),實現(xiàn)統(tǒng)一平臺、統(tǒng)一標準,統(tǒng)一檢索、統(tǒng)一認證,通過協(xié)同建設、聯(lián)合保障,使系統(tǒng)成為圖書館整體服務能力提升的倍增器,為院校教學科研、部隊教育訓練、機關(guān)決策咨詢提供高效率、全方位的文獻保障和信息服務,成為軍隊信息化建設的重要基礎設施,使軍隊院校圖書館建設從分散走向聯(lián)合,從以資源建設為重點轉(zhuǎn)變?yōu)橐孕畔⒎諡橹行?,借助大?shù)據(jù)時代信息技術(shù),通過資源共享、聯(lián)合保障,真正實現(xiàn)“全軍院校一個館”的資源建設與信息服務目標。
數(shù)字資源的積累就是數(shù)字圖書館財富的沉淀。一方面我們通過引進購買數(shù)據(jù)庫和自主數(shù)字化加工的方式,不斷積累期刊、圖書、會議、論文、報紙等渠道發(fā)表的,經(jīng)過權(quán)威審核把關(guān)的學術(shù)資源,這類資源相對嚴緊可靠,具有較高的學術(shù)價值;另一方面通過互聯(lián)網(wǎng)智能抓取技術(shù),不斷積累相關(guān)的網(wǎng)絡資訊內(nèi)容,這類資源時效性好,是鮮活的研究參考資料。嚴謹學術(shù)資料和鮮活的網(wǎng)絡資訊互相取長補短,相得益彰,形成數(shù)字圖書館的基礎財富。
大數(shù)據(jù)時代,圖書館應加大對知識資源庫的價值挖掘,更好地為讀者服務。下面分析我校圖書館大量的用戶信息行為產(chǎn)生的數(shù)據(jù)。
我校用戶查詢書目產(chǎn)生的milnets日志—存在于milnets系統(tǒng)。用戶借還書產(chǎn)生的流通日志—存在于milnets系統(tǒng)。用戶檢索瀏覽下載電子資源產(chǎn)生的日志—存在于不同數(shù)據(jù)庫系統(tǒng)。
用戶訪問產(chǎn)生的流量數(shù)據(jù)。主要有兩類:
其一是交換機的出入口流量、上下行組包數(shù)、CPU、內(nèi)存占用率等。緩存在不同交換機。
其二是服務器的占用內(nèi)存、進程數(shù)、CPU負載、當前用戶數(shù)、硬盤卷占用情況—緩存在不同服務器。
利用這些信息,進行價值挖掘,我們可以為學科服務,利用各種日志數(shù)據(jù),研究探索從網(wǎng)絡底層獲取數(shù)據(jù)。以我校九大學科為例,將不同學院讀者檢索瀏覽下載的信息行為數(shù)據(jù)進行分類,分析用戶檢索瀏覽下載的文獻(全文、摘要、關(guān)鍵詞)特征,加入時間緯度,歸納出讀者感興趣的主題,利用關(guān)聯(lián)分析、聚類分析、社會網(wǎng)絡分析等進行學科熱點預測和交叉學科分析研究。建立基于讀者信息行為分析的學科服務支持研究報告。最后得出讀者的需求,建立九大學科服務群。
在大數(shù)據(jù)面前,搜索是基礎,首先要給讀者提供簡捷、精準的搜索服務。其次是及時融入專題服務,為各專業(yè)學科、社會熱點快速地創(chuàng)建虛擬專題庫,聚類相關(guān)的背景資料,為讀者提供針對性的服務。另外提供按需推送的服務,根據(jù)用戶的學科專業(yè)、研究領(lǐng)域、自定義過濾條件,及時將最新更新的資源通知、推送給用戶。讓讀者廣泛參與,為專業(yè)學科、干教提供建站云端,使更多的人或組織可以參與到資源建設和使用中來。最后,提供安全、可控的服務,對用戶的知識服務嚴格審核,鼓勵使用但杜絕惡意下載。根據(jù)這些需求,我們開發(fā)建設倉儲智能管理平臺系統(tǒng)。
我校的倉儲智能管理平臺系統(tǒng),可以有效地將網(wǎng)頁式服務(資源導航、統(tǒng)一檢索、信息發(fā)布等)、桌面端服務、信息采集、專題數(shù)字信息等功能有效集成于一個平臺之上,實現(xiàn)所有信息全平臺無障礙流通。在用戶服務以及大數(shù)據(jù)建設兩個方面獲得提升。探索從網(wǎng)絡底層獲取用戶訪問數(shù)據(jù)庫資源的信息行為數(shù)據(jù)的方法。解決圖書館界數(shù)據(jù)異構(gòu)和應用異構(gòu)難題。整合的數(shù)字資源包括館藏書目、館藏數(shù)字化資源、鏡像資源、非鏡像數(shù)據(jù)資源、開放獲取資源以及網(wǎng)絡公開資源等。
服務創(chuàng)新,就是要克服循守舊的思想,銳意進取,勇于實踐,創(chuàng)造性地解決各種難題,不斷探索適應讀者的需要、符合本單位實際情況的服務模式。大數(shù)據(jù)時代,必須依靠改革創(chuàng)新探索新對策,尋求新辦法。樹立創(chuàng)新意識,及時把服務中好的經(jīng)驗和做法上升到理論高度,促進圖書館知識服務邁上新臺階。圖書館服務創(chuàng)新是其價值體現(xiàn)的核心,也是其存在的價值與意義所在。
大數(shù)據(jù)時代,多類數(shù)據(jù)的擁有、挖掘、融合、利用水平是圖書館創(chuàng)新的關(guān)鍵因素。一方面圖書館知識服務只有對大量的用戶數(shù)據(jù)挖掘、分析,才能得出圖書館所需要的決策參考。另一方面讀者需要大數(shù)據(jù)分析及內(nèi)容,例如圖書館為讀者做的信息參考、情報分析等。積極探索和分析大數(shù)據(jù),要求我們在三個方面徹底改變對大數(shù)據(jù)的態(tài)度。第一是收集和使用大量數(shù)據(jù),而不是像統(tǒng)計學家們在過去100多年里所做的那樣,只滿足于少量的數(shù)據(jù)或樣本;第二是拋棄我們對有條理和純凈的數(shù)據(jù)的偏愛,轉(zhuǎn)而接受雜亂無章的數(shù)據(jù);第三是收集和分析大量信息及一切相關(guān)素材,找出可能有助于預測未來事件發(fā)生的規(guī)律。
現(xiàn)代圖書館的服務,需要更高的技術(shù)要求,需要高標準的智能化服務水平。圖書館智能化服務水平的高低,不僅影響知識從單個主體擁有向多個主體擁有的流通與傳播,而且對隱性的知識向顯性的知識轉(zhuǎn)變、知識的發(fā)現(xiàn)、挖掘和組織等都有影響。
未來圖書館對技術(shù)、工具的應用需求將會更加迫切,這也為圖書館的技術(shù)應用水平提高提出了更高的要求。目前聚類分析、網(wǎng)絡分析、可視化分析、數(shù)據(jù)融合、數(shù)據(jù)集成等技術(shù)已經(jīng)初步發(fā)展,也可能是未來研究和發(fā)展的方向。我們要積極發(fā)展應用,努力通過這些數(shù)據(jù)分析預測未來的發(fā)展趨勢。
大數(shù)據(jù)時代已經(jīng)到來,展望未來,圖書館發(fā)展前景廣闊。工作人員應積極嘗試和思考解決圖書館信息服務創(chuàng)新和資源開發(fā)中的大數(shù)據(jù)問題,為開創(chuàng)圖書館工作的新局面,為培養(yǎng)高素質(zhì)新型人才,做出更大的貢獻!
[1]張文彥,等.大數(shù)據(jù)時代的圖書館初探[J].圖書與情報,2012(06).
[2]孫琳.大數(shù)據(jù)時代圖書館服務體系創(chuàng)新研究[J].理論觀察,2013(04).
[3]韓翠峰.大數(shù)據(jù)帶給圖書館的影響與挑戰(zhàn)[J].圖書與情報,2012(05).
[4]韓翠峰.大數(shù)據(jù)時代圖書館的服務創(chuàng)新與發(fā)展[J].圖書館,2013(01).
[5]徐子沛.大數(shù)據(jù):正在到來的數(shù)據(jù)革命,以及它如何改變政府、商業(yè)與我們的生活[M].桂林:廣西師范大學出版社,2012:40-57.