摘 要 論文先分析了大數(shù)據(jù)在圖書館的應(yīng)用背景,繼而辨析國內(nèi)相關(guān)文獻(xiàn)研究的現(xiàn)狀與不足,再援引國外信息行業(yè)大數(shù)據(jù)的應(yīng)用實例,結(jié)合國內(nèi)外圖書館運用大數(shù)據(jù)的具體實踐,對圖書館增值服務(wù)做借鑒式分析,最后提出大數(shù)據(jù)在圖書館增值服務(wù)中應(yīng)用的新思考。
關(guān)鍵詞 大數(shù)據(jù) 圖書館 增值服務(wù)
分類號 G252
DOI 10.16810/j.cnki.1672-514X.2017.05.×××
Abstract This paper begins with the analysis of the background of big data applied in library, then states the current situation and deficiencies in domestic related researches. Also, it quotes big data application examples in the information industry abroad, and combines with the practice of using big data in the value-added services in library to make reference analysis. Finally, it puts forward the new thinkings of the application of big data in the value-added services in library.
Keywords Big data. Library. Value-added services.
隨著移動終端、云計算、物聯(lián)網(wǎng)等新技術(shù)應(yīng)用發(fā)展,大數(shù)據(jù)被越來越多的行業(yè)認(rèn)識和利用,而關(guān)于“大數(shù)據(jù)”的研究也隨之成為熱點。圖書館界也掀起研究熱潮,多以圖書館大數(shù)據(jù)的特征、涵義、應(yīng)用范圍為基礎(chǔ),進(jìn)行概念性的評述及策略研究。筆者試圖援引國外信息行業(yè)大數(shù)據(jù)的應(yīng)用實例,結(jié)合國內(nèi)外圖書館運用大數(shù)據(jù)的實踐,“以實例說數(shù)據(jù)”,對圖書館增值服務(wù)進(jìn)行借鑒式的分析與探索,便于對大數(shù)據(jù)更具客觀性與全面性地認(rèn)識和應(yīng)用,以期與業(yè)界同仁進(jìn)行學(xué)習(xí)和交流。
1 圖書館大數(shù)據(jù)的應(yīng)用背景
1.1 圖書館信息變革回溯
從紙本數(shù)據(jù)采集到結(jié)構(gòu)化數(shù)據(jù)庫的建立,圖書館的“技術(shù)革命”經(jīng)歷著數(shù)次更迭。幾個世紀(jì)以來,圖書館人和用戶一直用分類法和索引法來存儲和檢索紙本信息資源。索引是事先設(shè)定好的,在信息化初期,它有不可替代的功能,但不可否認(rèn)在很大程度上也限制了用戶的搜索范圍和效率。
20世紀(jì)90年代,隨著計算機(jī)數(shù)據(jù)集成系統(tǒng)的應(yīng)用,圖書館對文本進(jìn)行數(shù)字化加工,終于解決了卡片目錄弊端。經(jīng)過幾十年的發(fā)展,信息存儲和信息處理能力隨著技術(shù)和帶寬的提高,圖書館在文本等結(jié)構(gòu)化數(shù)據(jù)的傳播和服務(wù)方面,與以往相較已不可同日而語。但隨著互聯(lián)網(wǎng)、智能便攜終端和云計算技術(shù)的發(fā)展,數(shù)據(jù)量以前所未有的速度增長,“大數(shù)據(jù)”應(yīng)用而生,圖書館將不可避免地迎來“大數(shù)據(jù)”時代。
1.2 大數(shù)據(jù)應(yīng)用的現(xiàn)實背景
“大數(shù)據(jù)”并非一個確切的概念,它是指需要處理的信息量過大,超出一般電腦處理數(shù)據(jù)所使用的內(nèi)存量,必須改進(jìn)處理數(shù)據(jù)的技術(shù)。最先經(jīng)歷信息爆炸的學(xué)科,如天文學(xué)和基因?qū)W,創(chuàng)造出了“大數(shù)據(jù)”這個概念[1]8。圖書館界對其特點有過詳盡論述,此處不再贅言。筆者認(rèn)為就圖書館而言,大數(shù)據(jù)應(yīng)用的現(xiàn)實背景是“量變”與“質(zhì)變”,即數(shù)據(jù)量的劇增和數(shù)據(jù)結(jié)構(gòu)的變化。
1.2.1 數(shù)據(jù)的質(zhì)變與量變
以谷歌為例,每天處理超過24PB字節(jié)的數(shù)據(jù),處理的數(shù)據(jù)量是美國國家圖書館所有紙質(zhì)出版物數(shù)據(jù)量的上千倍。南加利福尼亞州的馬丁.希爾伯特通過對書籍、圖片、電郵、照片、視頻、游戲、導(dǎo)航等數(shù)據(jù)增長量和速度的長期研究發(fā)現(xiàn),2007年全世界所有數(shù)據(jù)中只有7%的模擬數(shù)據(jù)存儲在報紙、書籍、圖片等媒介上,其余全部是數(shù)字?jǐn)?shù)據(jù);數(shù)字?jǐn)?shù)據(jù)的數(shù)量每三年多就會翻一倍,而模擬數(shù)據(jù)的數(shù)量基本上沒有增加[1]11-12。人類存儲信息量的增長速度比世界經(jīng)濟(jì)增長速度要快4倍,計算機(jī)處理速度則是世界經(jīng)濟(jì)增長速度的9倍[1]13。這些數(shù)據(jù)量和結(jié)構(gòu)的變化必將與現(xiàn)實沖突,在擁有海量、參差不齊的數(shù)據(jù)后,如果無法揭示數(shù)據(jù)間的相關(guān)關(guān)系和潛在價值,很多行業(yè)的普遍規(guī)則和方法將不再適用。
1.2.2 圖書館知識增值服務(wù)面臨的問題
《大數(shù)據(jù)時代》作者維克爾指出:“大數(shù)據(jù)時代的來臨使人類第一次有機(jī)會和條件,在非常多的領(lǐng)域和非常深入的層次獲得和使用全面數(shù)據(jù)、完整數(shù)據(jù)和系統(tǒng)數(shù)據(jù),深入探索現(xiàn)實世界的規(guī)律,獲取過去不可能獲取的知識。[1]”
圖書館目前使用最普遍的數(shù)據(jù)庫查詢語言是結(jié)構(gòu)化語言,而適用于傳統(tǒng)數(shù)據(jù)庫的結(jié)構(gòu)化數(shù)字?jǐn)?shù)據(jù)只有5%,剩下的95%的非結(jié)構(gòu)化數(shù)據(jù)都無法被利用,如網(wǎng)頁與視頻資源[1]64。這就意味著圖書館面對洶涌而來的圖像、視頻和音樂等非結(jié)構(gòu)化數(shù)據(jù)的轉(zhuǎn)化、分析、應(yīng)用將會停滯不前,導(dǎo)致服務(wù)的貶值和落伍。如何轉(zhuǎn)變思維,把控新技術(shù)的脈搏,有效利用大數(shù)據(jù)為服務(wù)增值,重塑知識“領(lǐng)跑者”的形象,圖書館界也給予了關(guān)注,并在積極思考。
2 圖書館大數(shù)據(jù)研究的現(xiàn)狀與評述
2.1 研究現(xiàn)狀與作用
筆者以“圖書館”+“大數(shù)據(jù)”為檢索詞,采用系統(tǒng)分析法、文獻(xiàn)閱讀法,通過檢索超星發(fā)現(xiàn)學(xué)術(shù)論文數(shù)據(jù)庫、中國知網(wǎng)期刊全文數(shù)據(jù)庫,對2006年至2016年2月近十年圖書館有關(guān)大數(shù)據(jù)研究的文獻(xiàn)進(jìn)行檢索發(fā)現(xiàn),作為新興的信息技術(shù),大數(shù)據(jù)在圖書館界的研究2006年初現(xiàn)端倪,從2013年起呈逐年上升趨勢,到2015年達(dá)到“井噴”狀態(tài)。圖書館對大數(shù)據(jù)的研究主要以大數(shù)據(jù)的基礎(chǔ)理論、給圖書館帶來的機(jī)遇與挑戰(zhàn)、對圖書館服務(wù)創(chuàng)新的影響、圖書館的應(yīng)用策略及其他相關(guān)問題等作為主題,其發(fā)展趨勢如圖1所示。同時,在對知網(wǎng)期刊全文數(shù)據(jù)庫論文主題統(tǒng)計中顯示,應(yīng)用策略、服務(wù)創(chuàng)新、基礎(chǔ)討論、機(jī)遇挑戰(zhàn)研究及其他分別占比為28%、25%、23%、12%和11%。
我國圖書館對大數(shù)據(jù)的研究,正如陸靜在文中所說,大數(shù)據(jù)給圖書館所帶來的新機(jī)遇與挑戰(zhàn),開啟了大數(shù)據(jù)與圖書館服務(wù)方式的創(chuàng)新研究,所提出的圖書館應(yīng)用大數(shù)據(jù)的策略,可以說對圖書館實施和推動大數(shù)據(jù)應(yīng)用,有效開展服務(wù)創(chuàng)新提供了嶄新思路,對圖書館提升服務(wù)有較大的理論價值和現(xiàn)實指導(dǎo)意義[2]。
2.2 研究中存在的問題與不足
總結(jié)近年來圖書館界對大數(shù)據(jù)的研究,雖然研究的論文數(shù)量激增,不僅有大數(shù)據(jù)的單一理論研究,還呈現(xiàn)出視角多樣化、多元化態(tài)勢,開展了多學(xué)科的交叉研究,但“重理論、輕實踐”的問題突出應(yīng)用研究比較缺乏。筆者就研究內(nèi)容發(fā)現(xiàn),目前圖書館界對大數(shù)據(jù)的研究還存在如下問題:第一,理論架構(gòu)多有雷同,如諸多文章大幅對大數(shù)據(jù)的涵義、特征加以描述,其內(nèi)容照搬前人基礎(chǔ),重復(fù)太多;對大數(shù)據(jù)帶給圖書館機(jī)遇與挑戰(zhàn)的論述,缺少獨立的見解;第二,研究多停留于對國內(nèi)外理論的宏觀描述和表面探討層次,又困于技術(shù)力量薄弱,缺乏合理的團(tuán)隊合作研究,沒有持續(xù)增長性;第三,雖然圖書館界對大數(shù)據(jù)的研究增長迅猛,但普遍存在理論闡述多,實證實踐少的狀況。常此以往,會對圖書館學(xué)科發(fā)展和研究創(chuàng)新產(chǎn)生不利影響。
3 國外信息行業(yè)大數(shù)據(jù)應(yīng)用實例
在大數(shù)據(jù)急速增長的進(jìn)程中,一些企業(yè)早已領(lǐng)略它的價值與潛力,如谷歌、百度、網(wǎng)飛、阿里巴巴、亞馬遜、騰訊和臉譜等。正是這些成功的行業(yè)典范,吸引了眾多關(guān)注大數(shù)據(jù)的目光。考慮圖書館運用大數(shù)據(jù)主要為增值用戶服務(wù)和促進(jìn)行業(yè)發(fā)展,故援引國外相關(guān)信息產(chǎn)業(yè)的實例,以便明晰圖書館增值服務(wù)的效果和目標(biāo)。
3.1 谷歌:從數(shù)字到數(shù)據(jù)化的發(fā)展
2004年,谷歌與全球最大、最著名的圖書館進(jìn)行合作,試圖將所有版權(quán)條例允許的書本內(nèi)容全部數(shù)字化,此舉方便了全球用戶在不受時間和地點限制下查閱,不能不說是個盛舉。但問題隨之而來,用戶需要知道要找的內(nèi)容在哪本書上,并在浩瀚文字中尋找自己所需要的片斷,因為這些數(shù)字文本沒有數(shù)據(jù)化,不能通過檢索詞查找,也不能被分析。只能說谷歌擁有了海量的圖像,這些圖像還要依靠用戶的仔細(xì)閱讀、多次查找才能轉(zhuǎn)化為有用的信息。
谷歌意識到只有將這些信息數(shù)據(jù)化,它的巨大作用才會發(fā)揮,因此它使用了能識別數(shù)字圖像的光學(xué)字符識別軟件來識別文本中的字、詞、句和段落,從而將數(shù)字化圖像轉(zhuǎn)化為數(shù)據(jù)化文本。谷歌數(shù)字圖書館利用它所擁有的圖書為數(shù)據(jù)資源,不僅可以對作者存在爭議的書籍進(jìn)行作品風(fēng)格鑒定,還可以讓學(xué)術(shù)作假行為無處藏身。
3.2 Face book(臉譜):社交化網(wǎng)絡(luò)的再挖掘
截止到2015年6月,F(xiàn)ace book擁有用戶量約15億[3]。通過上千億的朋友關(guān)系網(wǎng)進(jìn)行連接,使得Face book的社交網(wǎng)絡(luò)更加強(qiáng)大。Face book社交平臺的成功不僅僅是尋找朋友、建立關(guān)系的場所,它直接觸摸到用戶的關(guān)系、經(jīng)歷和情感,更將用戶日常生活的無形元素提取出來,轉(zhuǎn)化為數(shù)據(jù)。在它之前,社會化關(guān)系一直被當(dāng)作信息存在,沒有清楚地界定為數(shù)據(jù),直到Face book“社交臉譜”的出現(xiàn)。
Face book對數(shù)據(jù)的進(jìn)一步挖掘是“喜好”。它每天更新的照片量超過1000萬張,用戶在此點擊“Like”按鈕或?qū)懺u論約有三十億次,其意義遠(yuǎn)不是表面上看到的照片分享、上傳、個人喜好那么簡單,這為Face book挖掘用戶信息提供了大量的數(shù)據(jù)線索;Face book還通過用戶社交網(wǎng)絡(luò),跟蹤用戶的“狀態(tài)更新”,以確定最佳的廣告位賺取收入。
3.3 亞馬遜:個性化推薦記錄系統(tǒng)
亞馬遜的銷售額三分之一來自它的推薦系統(tǒng),它記錄用戶購買過的書籍和瀏覽過的網(wǎng)頁,分析個人愛好,為其提供個性化的服務(wù),推薦具體的書籍。亞馬遜總裁和創(chuàng)始人杰夫·貝索斯從一開始就注意從每一個用戶身上捕捉大量數(shù)據(jù),如他們購買什么類型的書,哪些書他們?yōu)g覽卻沒買,瀏覽了多長時間,哪些書是團(tuán)購的等等。
但在用戶信息量巨大時,依據(jù)購買信息樣本分析的作用越來越小。于是亞馬遜通過Kindle電子書閱讀器記錄用戶反復(fù)標(biāo)注和強(qiáng)調(diào)的內(nèi)容,書商樂意知道讀者喜歡哪些段落,從而提高他的銷量;作者知道哪些橋段為讀者喜歡,以便提高作品質(zhì)量;出版社則通過這些數(shù)據(jù),選擇出版更暢銷的書籍。值得一提的是亞馬遜并沒有將數(shù)據(jù)轉(zhuǎn)賣給書商或出版社。
除此以外,國內(nèi)眾所周知的行業(yè)如:百度采集用戶的搜索數(shù)據(jù),阿里巴巴采集交易與信用卡數(shù)據(jù),騰訊采集社交數(shù)據(jù)等,對其服務(wù)的增值乃至企業(yè)的成功產(chǎn)生了巨大作用。
4 國內(nèi)外圖書館運用大數(shù)據(jù)的實踐
2012年美國著名的信息咨詢公司(GARTNER)曾描述“大數(shù)據(jù)的技術(shù)目前正處于誘發(fā)階段,進(jìn)入真正實施及應(yīng)用推廣還需要2-5年”[4]41??梢姶髷?shù)據(jù)的處理和應(yīng)用仍在不斷磨合中,但國內(nèi)外一些研究型、大學(xué)圖書館作為“先行者”,就其應(yīng)用及推進(jìn)已展開實踐工作,具體內(nèi)容如下:
4.1 資源數(shù)據(jù)化的長期保存和建設(shè)
圖書館的數(shù)據(jù)資源比較單一,對隱藏著巨大價值的非結(jié)構(gòu)化數(shù)據(jù)的收集還是空白,但有些圖書館已優(yōu)先對在某一方面形成了一定規(guī)模的、結(jié)構(gòu)比較完整的文獻(xiàn)資源特別是原生資源,有系統(tǒng)、有組織地進(jìn)行開發(fā)和整理,如美國國會圖書館的“美國記憶”項目,收集整理了照片、手稿、海報、樂譜、地圖、錄音、動態(tài)圖像等記載美國歷史文化的特藏。澳大利亞國家圖書館、荷蘭國家圖書館等就原生數(shù)字資源和特色館藏進(jìn)行了長期保存[5]。我國圖書館界也開始注重結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化數(shù)據(jù)的收集與豐富工作,如國家圖書館正在將云服務(wù)與關(guān)聯(lián)數(shù)據(jù)結(jié)合起來,實現(xiàn)數(shù)字館藏的組織和聚合,以用戶需求為導(dǎo)向,建立超大型元數(shù)據(jù)倉儲。改造建成后的數(shù)字圖書館的非結(jié)構(gòu)化數(shù)據(jù)存儲量將達(dá)到800TB左右[6]。
4.2 基于“個人門戶”概念的個性化信息推送服務(wù)
通過“個人門戶”能將圖書館最快、最有價值的信息聚集起來,真正實現(xiàn)用戶的“一站式”個性化體驗,國內(nèi)外多家圖書館正在積極開展此項目。經(jīng)美國研究圖書學(xué)會的調(diào)查,哥倫比亞大學(xué)、加州大學(xué)圣地亞哥分校、麻省理工學(xué)院、華盛頓大學(xué)等都紛紛建立了自己的數(shù)字圖書館門戶。國內(nèi)有條件的圖書館也在近幾年開展了基于“門戶”的個性化服務(wù),如北京師范大學(xué)圖書館Metalib+SFX統(tǒng)一檢索型數(shù)字圖書館門戶、北航圖書館搭建的TRS數(shù)字圖書館門戶等[4]39。新加坡國家圖書館則采用大數(shù)據(jù)技術(shù)對持續(xù)增長的大量非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行分析,在其門戶網(wǎng)站上將讀者最感興趣的信息實行自動推送,目前已完成對“新加坡記憶”特色資源網(wǎng)站上的上萬篇文章的文本分析[7]78。
4.3 架構(gòu)大數(shù)據(jù)驅(qū)動下的特色資源服務(wù)平臺
大數(shù)據(jù)作為一種新技術(shù)與知識服務(wù)的新工具,對其特色資源平臺的內(nèi)容設(shè)計、數(shù)據(jù)收集與存儲,知識組織與加工等構(gòu)建不容忽視。在此方面,國內(nèi)圖書館以清華大學(xué)圖書館為代表,應(yīng)用大數(shù)據(jù)技術(shù)為讀者提供知識服務(wù),在檢索平臺上綜合運用多來源數(shù)據(jù),將書、刊、文章等元數(shù)據(jù)匯聚在一起用于檢索,用戶通過開放鏈接技術(shù)定位及獲取資源。國外圖書館以美國哈佛大學(xué)圖書館為代表,率先在國家公共數(shù)字圖書館中公開圖書大數(shù)據(jù)并提供下載,內(nèi)容包括書目數(shù)據(jù)、音頻、圖像、手稿等多種類型的非結(jié)構(gòu)化數(shù)據(jù),共計一千多萬種[7]77-78。
5 大數(shù)據(jù)環(huán)境下圖書館增值服務(wù)相關(guān)問題探析
上述實例折射出大數(shù)據(jù)的加工、挖掘、個性化服務(wù)等方面的經(jīng)驗和效果,為圖書館增值服務(wù)提供了良好的借鑒。筆者在此基礎(chǔ)上,結(jié)合對實例的借鑒分析,提出一些新的思考:
5.1 技術(shù)分析法日益增強(qiáng)且多樣化
隨著數(shù)據(jù)量的不斷增長,對數(shù)據(jù)的處理能力也隨之增強(qiáng),大數(shù)據(jù)的重點是否在技術(shù)方面,是計劃使用大數(shù)據(jù)的圖書館一直擔(dān)憂和探討的。不少業(yè)界人士認(rèn)為,大數(shù)據(jù)重點是技術(shù)層面的問題,應(yīng)側(cè)重于硬件和軟件,但圖書館在此方面多有欠缺。
對目前規(guī)模不等、類型不同的行業(yè)使用的大數(shù)據(jù)分析技術(shù)進(jìn)行回顧和總結(jié),可以發(fā)現(xiàn),起先不同行業(yè)在不同領(lǐng)域采用不同分析算法,包括機(jī)器學(xué)習(xí)技術(shù)、統(tǒng)計學(xué)、圖形識別、人工智能、數(shù)據(jù)庫系統(tǒng)等?,F(xiàn)在,這些技術(shù)均進(jìn)化成了強(qiáng)大而復(fù)雜的大數(shù)據(jù)專用工具,如解決數(shù)據(jù)結(jié)構(gòu)多樣性的谷歌公司開發(fā)的開源式分布系統(tǒng)——Hadoop,它善于處理超大量的數(shù)據(jù)。
為適應(yīng)新數(shù)據(jù)源不斷出現(xiàn)的局面,一些行業(yè)在大數(shù)據(jù)應(yīng)用方面采用多樣化的技術(shù)分析法:線索與目標(biāo)優(yōu)先排序、推介服務(wù)、發(fā)展成功概率打分、風(fēng)險建模、用戶價值與收益率打分、用戶維系與流失預(yù)測、產(chǎn)品與服務(wù)內(nèi)容優(yōu)化、消費意向分析等[8]。分析方式的多樣化提示圖書館應(yīng)考慮和有經(jīng)驗的互聯(lián)網(wǎng)運營商、大數(shù)據(jù)服務(wù)商以大數(shù)據(jù)服務(wù)平臺聯(lián)盟與共享的方式,借助第三方在咨詢、研發(fā)、管理和服務(wù)方面的經(jīng)驗,為用戶提供需求預(yù)測、個性化推送、服務(wù)定制、閱讀風(fēng)險評估等增值服務(wù)。只有這樣才能實現(xiàn)人、資源、技術(shù)三個要素的智慧交互與融合,才能體現(xiàn)圖書館大數(shù)據(jù)應(yīng)用的價值。
5.2 預(yù)測能力和個性化服務(wù)是核心
隨著大數(shù)據(jù)價值的顯現(xiàn),很多人關(guān)心的大數(shù)據(jù)運用往往與自身相關(guān),比如購物更便捷,觀影可以有更多選擇性,大數(shù)據(jù)應(yīng)用給自身帶來更多幫助。其實無論數(shù)據(jù)量和規(guī)模怎么變化,最核心的問題還是要揭示隱藏的規(guī)律,即預(yù)測用戶需要,提供更精準(zhǔn)的服務(wù)。
圖書館在大數(shù)據(jù)背景下,若想推出富有創(chuàng)新精神的顛覆性的戰(zhàn)略,就必須確立清晰的服務(wù)方向:要考慮大數(shù)據(jù)出現(xiàn)時會發(fā)生什么?在做大數(shù)據(jù)分析前,應(yīng)了解用戶最急迫的使用需要是什么?大數(shù)據(jù)經(jīng)分析后,能幫助用戶解決什么問題?采取什么措施和方法才最為有效?只有預(yù)先洞察到用戶對哪些服務(wù)感興趣,會做出什么選擇,把握用戶做決定的原因和差異,提供個性化服務(wù),才能提升圖書館增值服務(wù)。
目前圖書館的服務(wù)策略仍采用一種“逆向思維”,在數(shù)據(jù)化要求下,當(dāng)務(wù)之急是要改變傳統(tǒng)的“接收問題—對問題進(jìn)行查詢與分析—提交答案—發(fā)送與跟蹤”服務(wù)流程,遵循大數(shù)據(jù)的“正向思維模式”: “收集數(shù)據(jù)—量化分析—找出相關(guān)關(guān)系—預(yù)測需求—提出個性化方案”,主動改變固有的服務(wù)方式,滿足用戶差異性需求[9]。
通過以上方式,圖書館還可挖掘哪些用戶屬于行動派、哪些用戶喜歡分享經(jīng)驗、對服務(wù)如何評價等,這將是圖書館增值服務(wù)的具體手段和途徑。
5.3 大數(shù)據(jù)的潛在價值和再利用是目標(biāo)
提取海量數(shù)據(jù)的價值,使其從龐大的信息庫中釋放出能量,這是大數(shù)據(jù)的縮影。通過大數(shù)據(jù)的應(yīng)用與分析,許多行業(yè)都看到了大數(shù)據(jù)的潛在價值,極大地刺激他們進(jìn)一步采集、存儲、循環(huán)利用數(shù)據(jù)來尋求更多的利益。
因為社會化利用和私營化對數(shù)據(jù)的利用更有創(chuàng)新性,其潛在價值也往往通過這些行業(yè)的利用來釋放,使得大數(shù)據(jù)的再利用大多帶有商業(yè)性質(zhì)。但非營利性數(shù)據(jù)的二次利用,如美國幾大保險公司創(chuàng)立的衛(wèi)生保健成本協(xié)會(Health Care Cost Institute),匯集了50億張保單,匿名分享這些數(shù)據(jù)后,發(fā)現(xiàn)美國的醫(yī)療花費比通貨膨脹時增長了3倍多,其中急診治療費上漲了11%[1]175。此種再利用目標(biāo)更明確,運行透明化,且富有社會責(zé)任心,值得非盈利的公共服務(wù)行業(yè)學(xué)習(xí)。2015年8月國務(wù)院(國發(fā)[2015]50號)“關(guān)于促進(jìn)大數(shù)據(jù)發(fā)展行動綱要的通知”將“加強(qiáng)數(shù)字圖書館、檔案館、美術(shù)館等公益設(shè)施建設(shè)”與“發(fā)展科學(xué)大數(shù)據(jù)、知識服務(wù)大數(shù)據(jù)應(yīng)用”緊密相聯(lián),表明政府對公共文化行業(yè)數(shù)據(jù)應(yīng)用和治理的決心[10]。
圖書館界從實例與政策兩方面印證了圖書館大數(shù)據(jù)在真空里是沒有價值可言的,只有利用大數(shù)據(jù)來推動實戰(zhàn),并從以往局限于少數(shù)象牙塔之中的學(xué)術(shù)精英圈子,擴(kuò)大到其他社會機(jī)構(gòu)和政府的決策部門,它的潛力和作用才能釋放出來。其次,大數(shù)據(jù)的應(yīng)用將會輻射到更多領(lǐng)域,通過對行業(yè)重要職能進(jìn)行優(yōu)化的方式,實現(xiàn)跨行業(yè)的發(fā)展。圖書館收集數(shù)據(jù)固然重要,但要產(chǎn)生有意義的成果,仍需要一個過程,數(shù)據(jù)化只是過程的一部分,作為公共服務(wù)行業(yè)在推動數(shù)據(jù)互動的社會能力和責(zé)任感方面,仍有許多上升空間。
6 結(jié)語
世界邁進(jìn)大數(shù)據(jù)時代,大數(shù)據(jù)已深刻影響人們的生活、思考和學(xué)習(xí)方式,對圖情界的沖擊也將是驚人的,將研究成果運用到圖書館增值服務(wù)的實踐中是研究的最終目的。鑒于大數(shù)據(jù)的實用案例分分秒秒都在刷新,因此筆者認(rèn)為并不存在所謂的“最佳分析模型”或“最佳實踐案例”。因水平有限,以上觀點難免有偏頗之處,唯希望業(yè)界多關(guān)注大數(shù)據(jù)行業(yè)動態(tài)和應(yīng)用實踐,結(jié)合圖書館實際,形成全方位、多層面的理論與實踐相結(jié)合的研究態(tài)勢,為圖書館迎接大數(shù)據(jù)提供良好導(dǎo)向。
參考文獻(xiàn):
[ 1 ] 維克爾.邁爾-舍恩伯格,肯尼思.庫克耶.大數(shù)據(jù)時代[M].盛楊燕,周濤,譯.2版.杭州:浙江人民出版社,2013.
[ 2 ] 陸靜.我國圖書館界大數(shù)據(jù)研究評述與展望[J].圖書館雜志,2014(1):20-25.
[ 3 ] Facebook/全球活躍用戶數(shù)為14.9億[EB/OL].[2015-08-02].http://mt.sohu.com/20150802/n418019391.shtml.
[ 4 ] 江云,李鳳蘭.大數(shù)據(jù)在我國圖書館的應(yīng)用及推進(jìn)研究[J].圖書館工作與研究,2014(6):35-41.
[ 5 ] 陳傳夫,錢鷗,代鈺珠.大數(shù)據(jù)時代的數(shù)字圖書館建設(shè)研究[J].圖書情報工作,2014(7):40-44.
[ 6 ] 王天泥.知識咨詢:大數(shù)據(jù)時代圖書館的知識服務(wù)增長點[J].圖書與情報,2013(2):74-77.
[ 7 ] 朱維喬.大數(shù)據(jù)驅(qū)動的特色資源服務(wù)平臺架構(gòu)研究[J].圖書館研究,2014(4):77-81
[ 8 ] 大數(shù)據(jù)時代的中國機(jī)遇:專訪美國西塞羅集團(tuán)(CICERO)首席執(zhí)行官Randy Shumway[EB/OL].[2015-12-22].http://www.cnii.com.cn/informatization/2015-12/22/content_1669513.htm.
[ 9 ] 馬娜梅.大數(shù)據(jù)背景下圖書館知識咨詢服務(wù)策略[J].圖書館研究,2014(4):90-93.
[10] 國務(wù)院關(guān)于印發(fā)促進(jìn)大數(shù)據(jù)發(fā)展行動綱要的通知[EB/OL].[2015-09-05] http://www.gov.cn/Zhengce/content/2015-09/05/content_10137.htm.
陶繼華 安徽行政學(xué)院圖書館信息檢索部館員。安徽合肥,230059。
(收稿日期:2016-05-11 編校:陳安琪)