王麗丹
摘要:雖然大數(shù)據(jù)時(shí)代已經(jīng)到來(lái),但圖書(shū)館如何應(yīng)用大數(shù)據(jù)技術(shù),使其適應(yīng)大數(shù)據(jù)環(huán)境的探索、研究只是剛剛起步。面對(duì)這一形勢(shì),作為圖書(shū)館界的頂頭上司——國(guó)家文化部圖書(shū)館司應(yīng)召集專(zhuān)家研究制定一部具有法規(guī)性質(zhì)的文獻(xiàn),供各級(jí)各類(lèi)圖書(shū)館在服務(wù)中使用。而就圖書(shū)館個(gè)體而言,也應(yīng)有擔(dān)當(dāng),積極探索、研究如何適應(yīng)大數(shù)據(jù)潮流的種種問(wèn)題。
Abstract: Although the era of big data has come, the exploration and research on how to apply big data technology to adapt to the big data environment for the library is only just starting. In face of this situation, as the head of the library industry, the Department of Library of the Ministry of Culture should convene experts to study and formulate a document that is of a statutory nature for use by libraries at all levels and in services. In terms of individual libraries, they should also be responsible for actively exploring and studying how to adapt to the big data trend.
關(guān)鍵詞:大數(shù)據(jù);數(shù)據(jù)技術(shù);圖書(shū)館;資源轉(zhuǎn)化;數(shù)字資源
Key words: big data;data technology;libraries;resource conversion;digital resources
中圖分類(lèi)號(hào):G251 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1006-4311(2018)19-0201-02
2016年5月25日,國(guó)務(wù)院總理李克強(qiáng)在貴陽(yáng)出席“中國(guó)大數(shù)據(jù)產(chǎn)業(yè)峰會(huì)暨中國(guó)電子商務(wù)創(chuàng)新發(fā)展峰會(huì)”開(kāi)幕式并發(fā)表致辭。李克強(qiáng)說(shuō):“當(dāng)今世界,信息化浪潮席卷全球,大數(shù)據(jù)、云計(jì)算、物聯(lián)網(wǎng)等蓬勃發(fā)展,使互聯(lián)網(wǎng)時(shí)代邁上一個(gè)新臺(tái)階?!崩羁偫肀硎荆阂胺e極培育發(fā)展大數(shù)據(jù)等信息網(wǎng)絡(luò)產(chǎn)業(yè)”,“利用大數(shù)據(jù)等技術(shù)為民謀利、解民所憂,促進(jìn)形成公平普惠、便捷高效的民生服務(wù)體系?!盵1]李總理這一辭,說(shuō)明發(fā)展大數(shù)據(jù)已提上了國(guó)家戰(zhàn)略地位。研究開(kāi)發(fā)大數(shù)據(jù)進(jìn)一步協(xié)同創(chuàng)新、科研模式創(chuàng)新、服務(wù)模式創(chuàng)新、產(chǎn)業(yè)摸式創(chuàng)新、人才培養(yǎng)等方面的問(wèn)題。
此前,筆者略知大數(shù)據(jù)的重要性,專(zhuān)門(mén)查閱了很多的圖書(shū)館學(xué)、情報(bào)學(xué)近期的文獻(xiàn)資料。從眾多的文獻(xiàn)資料中了解到:如今數(shù)字化無(wú)處不在、無(wú)所不在,每個(gè)人都在享受著數(shù)據(jù)帶來(lái)的好處。在查閱中,大數(shù)據(jù)對(duì)圖書(shū)館的業(yè)務(wù)帶來(lái)的巨大影響和作用,大數(shù)據(jù)可以提高圖書(shū)館的智能化水平,為用戶(hù)提供個(gè)性化服務(wù),為科研和資源建設(shè)提供幫助,給人們的生活帶來(lái)巨大的便利。筆者也有初步的了解和膚淺的認(rèn)識(shí)。以下就這個(gè)專(zhuān)題,略作探討,請(qǐng)識(shí)者指教。
那么,什么是大數(shù)據(jù)?大數(shù)據(jù)就是大量的數(shù)據(jù)。在物聯(lián)網(wǎng)、云計(jì)算、移動(dòng)互聯(lián)網(wǎng)的催生下,各種終端設(shè)備產(chǎn)生了驚人的數(shù)據(jù)量,從而快速推動(dòng)大數(shù)據(jù)時(shí)代的到來(lái)。但是,各業(yè)界關(guān)于大數(shù)據(jù)并未形成統(tǒng)一的定義,彼此之間達(dá)成的基本共識(shí)是:它是一種海量、形式多樣化的非結(jié)構(gòu)化數(shù)據(jù),通常各種熱點(diǎn)話題聯(lián)系在一起,比如云計(jì)算、商業(yè)智能、數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)分析與挖掘、NoSQL、Hadoop等。維基百科的定義是:大數(shù)據(jù)又稱(chēng)海量資料,其所涉及的資料量規(guī)模巨大到無(wú)法通過(guò)目前主流軟件工具,在合理時(shí)間內(nèi)達(dá)到擷取、管理、處理、并整理成為幫助企業(yè)經(jīng)營(yíng)決策更積極目的的資訊。IBM和IDC的界定較有代表性,兩者共同認(rèn)為大數(shù)據(jù)滿足“4V”,具有大量化(Volume)、多樣化(Variety)和快速化(Velocity)的特征,IBM認(rèn)定的第四個(gè)“V”是真實(shí)性(Veracity),而IDC認(rèn)為第四個(gè)“V”是價(jià)值高(Value)。無(wú)論如何定義大數(shù)據(jù),傳統(tǒng)的數(shù)據(jù)管理方式都將會(huì)被其顛覆,在數(shù)據(jù)的來(lái)源、思維方式和處理方式等方面都將會(huì)發(fā)生巨大改變。[2]
在知識(shí)日月更新、經(jīng)濟(jì)突飛猛進(jìn)的發(fā)展中,大數(shù)據(jù)廣泛應(yīng)用到社會(huì)生產(chǎn)和日常生活中,對(duì)人類(lèi)社會(huì)的發(fā)展進(jìn)步起著重要的推動(dòng)作用。在醫(yī)學(xué)、圖書(shū)、物流、城市管理、金融、汽車(chē)、零售、餐飲、電信、能源、體育娛樂(lè)、安全、政府、日常生活等方面,都離不開(kāi)數(shù)據(jù)。從中我們可以深刻地感受到大數(shù)據(jù)帶給我們的社會(huì)影響和巨大的重要價(jià)值。各行各業(yè)的工作效率得到大大提升,也極大地滿足了人們的各種需求。所有東西一旦用上“大數(shù)據(jù)”,就變得既快又好,功效顯著提高。舉個(gè)簡(jiǎn)單的例子,如:在南寧,家里電視機(jī)出了故障,業(yè)主只要致電96335,通報(bào)電視機(jī)機(jī)頂盒數(shù)字電視智能卡的編號(hào),廣西廣電網(wǎng)絡(luò)就會(huì)迅速查到業(yè)主地址,并派維修人員幫助業(yè)主排除故障。又如,病人患病到醫(yī)院,只要使用就診卡(號(hào)),就可以解決醫(yī)生看病、開(kāi)處方、交費(fèi)、取藥等問(wèn)題,甚至可以實(shí)現(xiàn)異地遠(yuǎn)程治療,做到足不出戶(hù),就可以解決就醫(yī)難的問(wèn)題。再如,有了銀行卡,就可以通過(guò)ATM機(jī)自動(dòng)存取款、交費(fèi)、轉(zhuǎn)賬;或通過(guò)電腦上網(wǎng),在家里就可以自己處理自助轉(zhuǎn)存款、交費(fèi)、轉(zhuǎn)賬等問(wèn)題??梢?jiàn),數(shù)據(jù)技術(shù)正在改變著人們的生活,提高著人們的生活質(zhì)量和辦事效率,推動(dòng)著社會(huì)向前發(fā)展。
大數(shù)據(jù)時(shí)代雖如澎湃的浪潮洶湧而至,大數(shù)據(jù)技術(shù)在圖書(shū)館界的研究近年來(lái)也在啟動(dòng),但都是試探性的。例如,在國(guó)外,有專(zhuān)家在“SCI,Elsevier,ProQuest,ISTP等數(shù)據(jù)庫(kù)中以‘大數(shù)據(jù)+圖書(shū)館為關(guān)鍵詞檢索到關(guān)于大數(shù)據(jù)與圖書(shū)館服務(wù)相關(guān)的成果有2321篇,已經(jīng)取得了較好的研究成果。但這些成果主要集中表現(xiàn)在‘大數(shù)據(jù)技術(shù)給圖書(shū)館服務(wù)的桃戰(zhàn)與思考方面、大數(shù)據(jù)技術(shù)在圖書(shū)館服務(wù)建設(shè)中應(yīng)用的可行性領(lǐng)域?!憋@然,這些成果只是探討大數(shù)據(jù)時(shí)代圖書(shū)館數(shù)字資源存儲(chǔ)、歸檔、保存和用于檢索的可行性相關(guān)問(wèn)題。而在大數(shù)據(jù)對(duì)圖書(shū)館服務(wù)建設(shè)的解決方案、工作模式等方面的研究還不多見(jiàn)。[3]而對(duì)于大數(shù)據(jù)技術(shù)應(yīng)用在圖書(shū)館服務(wù)領(lǐng)域的實(shí)質(zhì)研究還沒(méi)有??梢?jiàn),大數(shù)據(jù)對(duì)圖書(shū)館資源管理與服務(wù)的系統(tǒng)研究只是剛剛起步。那么如何把大數(shù)據(jù)應(yīng)用到圖書(shū)館工作中去,對(duì)圖書(shū)館人是一種新的挑戰(zhàn)。
撲面而來(lái)的大數(shù)據(jù)時(shí)代浪潮,對(duì)于它的研究,光有圖書(shū)館系統(tǒng)內(nèi)一些熱心人士的零星分散的研究探索是遠(yuǎn)遠(yuǎn)不夠的。他們的研究即便取得有用的成果,也只是作個(gè)參考,解決不了全國(guó)圖書(shū)館系統(tǒng)如何使大數(shù)據(jù)技術(shù)在圖書(shū)館內(nèi)科學(xué)化、標(biāo)準(zhǔn)化、規(guī)范化的應(yīng)用問(wèn)題。為了從根本上解決這個(gè)問(wèn)題,國(guó)家文化部圖書(shū)館司要勇于擔(dān)當(dāng)重任,組織領(lǐng)導(dǎo)圖書(shū)館系統(tǒng)的專(zhuān)家,并邀請(qǐng)其他行業(yè)的數(shù)據(jù)技術(shù)專(zhuān)家共同研究探討,并達(dá)成共識(shí)。筆者認(rèn)為,這是國(guó)內(nèi)頂級(jí)研究,應(yīng)重點(diǎn)抓住如下課題:
①圖書(shū)館(包括大學(xué)圖書(shū)館等)如何由紙質(zhì)資源、電子資源、音像資源、膠片資源等轉(zhuǎn)化為數(shù)字可檢索的資源問(wèn)題。特別是對(duì)存量巨大的圖書(shū)、期刊、報(bào)紙、圖片、畫(huà)冊(cè)等,應(yīng)該采取什么方法、步驟和技術(shù),使其轉(zhuǎn)化為可供檢索的數(shù)字資源問(wèn)題。
②非圖書(shū)館但屬于哲學(xué)、社會(huì)科學(xué)的單位,如社會(huì)科學(xué)院、博物館、通志館、檔案館、民族研究所等,它們儲(chǔ)存的各種文獻(xiàn)資料,同樣是人們智慧的結(jié)晶,是推動(dòng)社會(huì)進(jìn)步不可缺少的無(wú)價(jià)之寶,同圖書(shū)資料一樣,應(yīng)當(dāng)采取什么方法、步驟和技術(shù),使之轉(zhuǎn)化為可供撿索的數(shù)字資源問(wèn)題。
③非圖書(shū)館非哲學(xué)、社會(huì)科學(xué)類(lèi)學(xué)位,如醫(yī)院、銀行、鐵路等儲(chǔ)藏的專(zhuān)業(yè)資源如何轉(zhuǎn)化為數(shù)字可檢索的資源問(wèn)題。
④以上各種資源轉(zhuǎn)化為數(shù)字資源后,還要以圖書(shū)館為中樞,建立一個(gè)節(jié)點(diǎn),以使相互之間能夠互聯(lián)互通,各自不受阻礙,自由檢索。
⑤在自由檢索的前沿要建立一道屏障,確保國(guó)家、國(guó)防、科技、商業(yè)和個(gè)人隱私等機(jī)密的安全,不會(huì)出現(xiàn)泄密問(wèn)題。
以上各點(diǎn),就是對(duì)大數(shù)據(jù)技術(shù)在圖書(shū)館服務(wù)中,必須首先突破和解決的問(wèn)題。當(dāng)然,在大數(shù)據(jù)滾滾而來(lái)的浪潮中,作為圖書(shū)館個(gè)體,也應(yīng)當(dāng)有所作為。比如,明清時(shí)代、民國(guó)時(shí)期的古籍、書(shū)刊,甚至解放初期的書(shū)、報(bào)、刊,多數(shù)紙質(zhì)已經(jīng)發(fā)黃、變脆,稍一翻動(dòng),就會(huì)破碎。對(duì)這些文獻(xiàn)要及時(shí)搶救,該修復(fù)、該掃描的,要及時(shí)按排人力、物力,加以解決。再如,對(duì)現(xiàn)有館藏,哪些該轉(zhuǎn)化為數(shù)字資源,哪些不該轉(zhuǎn)化為數(shù)字資源的,也要心中有數(shù),作好調(diào)查研究,該剔除的文獻(xiàn)就剔除,該保留的文獻(xiàn)就保留。為適應(yīng)大數(shù)據(jù)技術(shù)在圖書(shū)館應(yīng)用而必須做好前期準(zhǔn)備工作,也是每個(gè)圖書(shū)館都要做的工作。在這方面,一些實(shí)力雄厚的圖書(shū)館已經(jīng)走在前面了。例如,美國(guó)哈佛大學(xué)圖書(shū)館已經(jīng)將大數(shù)據(jù)引入服務(wù),并準(zhǔn)備將圖書(shū)館大數(shù)據(jù)公之于眾。[2]而中國(guó)國(guó)家圖書(shū)館正在進(jìn)行面向面數(shù)字化的一期改造,致力于打造大數(shù)據(jù)時(shí)代的數(shù)字圖書(shū)館。[2]就圖書(shū)館界整體而言,目前最重要的還是要做好大數(shù)據(jù)時(shí)代圖書(shū)館館員的培訓(xùn)工作,因?yàn)榇髷?shù)據(jù)技術(shù)應(yīng)用在圖書(shū)館管理服務(wù)工作中,其操作難度比較大,要求圖書(shū)館必須具備懂新技術(shù)又具有交叉學(xué)科背景的圖書(shū)館專(zhuān)業(yè)技能人才。因此,當(dāng)前圖書(shū)館服務(wù)領(lǐng)域的一項(xiàng)工作重點(diǎn)即為對(duì)大數(shù)據(jù)技術(shù)人才的培訓(xùn)和培養(yǎng),具體應(yīng)從各個(gè)方面來(lái)大力提高大數(shù)據(jù)時(shí)代圖書(shū)館館員的各種服務(wù)技能和素質(zhì),不僅要從多學(xué)科交叉方面做好圖書(shū)館館員的培養(yǎng),包括情報(bào)學(xué)、信息科學(xué)、圖書(shū)館學(xué)、計(jì)算機(jī)與網(wǎng)絡(luò)學(xué)等,還要聯(lián)系實(shí)際,有針對(duì)性地對(duì)圖書(shū)館館員進(jìn)行專(zhuān)業(yè)知識(shí)理論的學(xué)習(xí),包括大數(shù)據(jù)、云計(jì)算、物聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)等,同時(shí)還要加強(qiáng)對(duì)其信息科學(xué)、心理學(xué)、管理學(xué)等其他相關(guān)學(xué)科知識(shí)的培養(yǎng)。[3]
當(dāng)然,大數(shù)據(jù)在圖書(shū)館的應(yīng)用,各地政府應(yīng)當(dāng)高度重視,加大公益性投入,保障經(jīng)費(fèi)到位;使圖書(shū)館的發(fā)展跟上時(shí)代步伐。從以上情況來(lái)看,大數(shù)據(jù)技術(shù)在圖書(shū)館的應(yīng)用還須深入研究、探索。但是,只要認(rèn)準(zhǔn)這個(gè)研究、探索的目標(biāo),不管它有多么遙遠(yuǎn),也不管這條道路有多么崎嶇,人們只要勇于攀登,目標(biāo)終將達(dá)到。
參考文獻(xiàn):
[1]余建斌.李克強(qiáng)出席中國(guó)大數(shù)據(jù)產(chǎn)業(yè)峰會(huì)暨中國(guó)電子商務(wù)創(chuàng)新發(fā)展峰會(huì)并致辭[N].人民日?qǐng)?bào),2015-05-26(1).
[2]楊海亞.提供公共智慧服務(wù):大數(shù)據(jù)時(shí)代圖書(shū)館服務(wù)模式創(chuàng)新[J].創(chuàng)世紀(jì)圖書(shū)館,2014(3):11-12.
[3]程結(jié)晶.大數(shù)據(jù)時(shí)代圖書(shū)館服務(wù)創(chuàng)新的內(nèi)容及策略研究[J].情報(bào)理論與實(shí)踐,2016(3):57-61.