文/常熟理工學(xué)院圖書館 胡悅
大數(shù)據(jù)技術(shù)的運(yùn)用對高校圖書館的管理產(chǎn)生了極大影響,大數(shù)據(jù)技術(shù)為圖書館管理的效率和空間提供了更多的可能,為圖書館在功能上的轉(zhuǎn)型和信息化的發(fā)展找到了新的方向。
傳統(tǒng)的圖書館運(yùn)營,一般是依據(jù)“以書為本”的模式,進(jìn)行單純的書本閱覽和借還,或者是簡單的文獻(xiàn)資料的整理和管理。這樣的管理方式在現(xiàn)代社會是十分落后的。對于快速發(fā)展的社會而言,圖書館的慢效率仿佛是另一個時空,這里的時間依舊停留在20世紀(jì)。對于習(xí)慣快節(jié)奏的現(xiàn)代人而言,無法適應(yīng)圖書館的慢效率,這也是越來越多的人不愛進(jìn)圖書館的原因之一。人們不愛進(jìn)圖書館,意味著圖書館的資源無法被充足利用,圖書館的書成為了“死書”,不僅造成了資源上的浪費(fèi),也限制了圖書館的發(fā)展。
首先,實(shí)體的紙質(zhì)圖書需要大量的館藏空間。進(jìn)入圖書館的紙質(zhì)圖書,需要按中圖法進(jìn)行編目,確定每一種圖書的索引號,以便讀者借書時,可以將書籍在浩如煙海的書架中迅速定位,準(zhǔn)確找到自己要借的書。隨著圖書館的擴(kuò)大,館藏書籍越來越多、越來越豐富,找書、借書和還書的步驟越來越復(fù)雜。其次,傳統(tǒng)的圖書館在信息的查找和閱覽方面,必須由讀者前往圖書館才能實(shí)現(xiàn),雖然不少圖書館在館內(nèi)設(shè)置了電腦設(shè)備供讀者自助查閱,但是設(shè)備過少,在人流高峰時期易造成擁堵和等待。在借書和還書環(huán)節(jié)仍舊依靠人工服務(wù),無法24小時全天候進(jìn)行管理和服務(wù),某些讀者存在圖書借閱時間過期和續(xù)借的情況,無法及時滿足讀者的要求。最后,傳統(tǒng)的圖書館的管理體系存在組織結(jié)構(gòu)落后的情況,崗位職能固化,各部門分工細(xì)致但缺少聯(lián)系,對于讀者的需求處于被動服務(wù)狀態(tài),在知識服務(wù)和信息推送上,未形成主動服務(wù)的態(tài)勢,無法發(fā)揮圖書館平臺優(yōu)勢。
大數(shù)據(jù)與云計(jì)算經(jīng)常被一同提起,這兩項(xiàng)主流技術(shù)是互聯(lián)網(wǎng)領(lǐng)域所關(guān)注的焦點(diǎn)。但這兩者在運(yùn)用方面有很大的不同,大數(shù)據(jù)是處理海量的數(shù)據(jù),而云計(jì)算是進(jìn)行基礎(chǔ)架構(gòu)。本文主要論述的是大數(shù)據(jù)技術(shù),通過大數(shù)據(jù)分析圖書館海量的書籍信息和讀者信息。大數(shù)據(jù)通過處理結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行儲存和數(shù)據(jù)分析,通過數(shù)據(jù)分析和價(jià)值鏈接,可以作為決策的依據(jù)。大數(shù)據(jù)一直處于不斷發(fā)展中,從3V特征到4V特征,隨后IBM公司提出了大數(shù)據(jù)的5V特征。最新的論述中,大數(shù)據(jù)具有Volume(海量性),即大數(shù)據(jù)在數(shù)據(jù)收集、存儲和計(jì)算的量都非常大,起始計(jì)量單位至少是P、E或Z。Variety(多樣性)即大數(shù)據(jù)的種類和來源多樣化;Value(高價(jià)值)即大數(shù)據(jù)雖然數(shù)據(jù)價(jià)值密度相對較低,但是浪里淘沙卻又彌足珍貴;Velocity(高速度)即大數(shù)據(jù)中數(shù)據(jù)增長和處理十分快速,時效性要求高;Veracity(準(zhǔn)確性)即大數(shù)據(jù)的準(zhǔn)確性和可信賴度,質(zhì)量要求高。大數(shù)據(jù)的基本特征與圖書館的信息處理和要求在很大程度上是十分契合的,在圖書館的智慧化、信息化的過程中,大數(shù)據(jù)的運(yùn)用得當(dāng)將會對圖書館的智能發(fā)展十分有利。
(一)結(jié)構(gòu)化數(shù)據(jù)的處理。人們在圖書館進(jìn)行書籍信息的搜索時,帶有目的性的圖書搜索一般通過作者和書名。但是對于無目的的圖書檢索或是關(guān)于某一信息的大量圖書資料的收集,就需要進(jìn)行關(guān)鍵字或是圖書分類進(jìn)行檢索。這些就涉及大數(shù)據(jù)對于圖書的結(jié)構(gòu)化數(shù)據(jù)的處理。傳統(tǒng)的圖書館信息處理系統(tǒng)過于緩慢和單一,容易造成信息搜索的遺漏,而大數(shù)據(jù)對于圖書信息進(jìn)行學(xué)科、內(nèi)容、時間和來源的分類,多樣化的信息處理在讀者進(jìn)行某一關(guān)鍵詞的檢索時,能通過大數(shù)據(jù)層層篩選,為讀者提供高效、準(zhǔn)確的信息檢索服務(wù)。這樣不僅使圖書館的效率提高,也加大了圖書館館藏圖書的使用率。
(二)個性化推送服務(wù)。大數(shù)據(jù)的最明顯特征是可以根據(jù)人們的搜索喜好,進(jìn)行針對性推送服務(wù)。這在淘寶、微博、百度等相關(guān)平臺上已經(jīng)進(jìn)行了運(yùn)用,人們在社交平臺上搜索某一東西時,點(diǎn)開購物軟件就能得到相關(guān)推送。這在圖書館的運(yùn)營上也是十分有用的。在快節(jié)奏的現(xiàn)代生活中,智能手機(jī)的廣泛普及,短閱讀的流行,使人們對于書籍的閱讀減少。雖然社會上有“放下手機(jī),重新拿起書籍”的提倡,但需要圖書館主動出擊,向人們推廣書籍閱讀。圖書館可以利用大數(shù)據(jù)的推送模式,依托于云計(jì)算所建立的圖書館APP或小程序,對圖書館的客戶進(jìn)行閱讀愛好、習(xí)慣和偏愛書籍類型相關(guān)方面的數(shù)據(jù)收集,為客戶提供定制化的書籍推送,引導(dǎo)讀者進(jìn)行閱讀。同時在社會健康知識的宣傳方面,圖書館也可以借助自身對于資料收集的高效性和準(zhǔn)確性,對讀者進(jìn)行相關(guān)知識的宣傳,擴(kuò)大圖書館的社會影響力,讓讀者體驗(yàn)到完善的服務(wù),增加讀者與圖書館的聯(lián)系。
(一)數(shù)據(jù)安全風(fēng)險(xiǎn)。大數(shù)據(jù)在數(shù)據(jù)收集方面雖然來源多樣化,但是某些數(shù)據(jù)收集依舊涉及隱私方面的問題,大數(shù)據(jù)在日常的分析和處理上需要進(jìn)行維護(hù)和確保數(shù)據(jù)安全。數(shù)據(jù)安全問題是不少大公司考慮的問題,由于收集的信息涉及客戶的相關(guān)隱私,一旦泄露就會造成社會動蕩,承擔(dān)法律風(fēng)險(xiǎn)和客戶信任問題。在圖書館方面,由于收集讀者的身份證號、學(xué)號、手機(jī)號、讀者借閱信息和借閱行為等敏感數(shù)據(jù),所以對于數(shù)據(jù)維護(hù)和安全管理方面,圖書館需要投入大量的資金和人力。對于不盈利的圖書館機(jī)構(gòu)而言,這無疑是一筆不小的開支。在圖書館沒有構(gòu)建大數(shù)據(jù)管理的能力之前,對于具有這方面技術(shù)的IT合作企業(yè)的選擇也是一個重點(diǎn)。既需要構(gòu)建一個高效的大數(shù)據(jù)管理系統(tǒng),也需要進(jìn)行數(shù)據(jù)安全的日常維護(hù)和安全風(fēng)險(xiǎn)的管控。
(二)知識產(chǎn)權(quán)數(shù)據(jù)化問題。圖書館在進(jìn)行館藏書籍?dāng)?shù)據(jù)化時,在知識共享和知識產(chǎn)權(quán)方面也有法律的限制因素。例如,高校圖書館使用自動化的網(wǎng)絡(luò)數(shù)據(jù)搜尋工具為本校的優(yōu)勢學(xué)科和關(guān)鍵領(lǐng)域抓取相關(guān)的數(shù)據(jù)資源,為學(xué)科領(lǐng)域建立自己的文獻(xiàn)數(shù)據(jù)庫時,可能會侵犯已下載作品的復(fù)制權(quán)和編輯權(quán)。并且難以驗(yàn)證來自互聯(lián)網(wǎng)的數(shù)據(jù)運(yùn)用權(quán)力,可能會導(dǎo)致知識產(chǎn)權(quán)糾紛和著作權(quán)保護(hù)困難。此外,圖書館在自制的軟件數(shù)據(jù)庫中數(shù)字化他人作品也可能出現(xiàn)知識產(chǎn)權(quán)問題。為了保護(hù)知識產(chǎn)權(quán),某些圖書館的自制數(shù)據(jù)庫未完全向社會或個人開放,僅在有限的范圍內(nèi)提供使用。
(一)建立風(fēng)險(xiǎn)評估。圖書館的智能化建設(shè)需要投入大量的資金和人力。這就需要圖書館在初期建構(gòu)大數(shù)據(jù)處理模式時投入大量資金購買好的硬件設(shè)備,獲取設(shè)備供應(yīng)商的準(zhǔn)確信息,尋求好的品牌進(jìn)行合作,確保設(shè)備的完善和優(yōu)質(zhì)。在網(wǎng)絡(luò)和信息服務(wù)方面,可以與優(yōu)秀企業(yè)合作,強(qiáng)強(qiáng)聯(lián)手。圖書館工作人員需要不斷提高自身工作水平,學(xué)習(xí)數(shù)據(jù)的維護(hù)和處理方式,為圖書館數(shù)據(jù)的完整性、準(zhǔn)確性和安全性提供保障。
(二)強(qiáng)化數(shù)字資源建設(shè)。高校圖書館可以深層次挖掘本校圖書館的資料,將有效的資料內(nèi)容轉(zhuǎn)化為數(shù)字資源,集中儲存到所建立的功能較為完善的網(wǎng)絡(luò)數(shù)據(jù)庫中,盡可能開發(fā)本校的知識產(chǎn)權(quán)資源。從圖書館中篩選出可以完成數(shù)字資源轉(zhuǎn)化的文獻(xiàn)資料,以便高校的師生查閱和學(xué)習(xí)。對于古籍類的文獻(xiàn)資源,可以通過掃描、光學(xué)字符識別等技術(shù)進(jìn)行數(shù)字化轉(zhuǎn)化,不光可以建立文本資料庫,對于視頻、音頻、圖片等多媒體數(shù)據(jù)也可以進(jìn)行數(shù)據(jù)分類、儲藏,全方位構(gòu)建信息化圖書館,促進(jìn)高校圖書館文獻(xiàn)資源共享,提高圖書館的信息服務(wù)水平。
從以上研究可以得知,大數(shù)據(jù)技術(shù)對于圖書館信息化建設(shè)是機(jī)遇,也是挑戰(zhàn)。高校圖書館想要更好地服務(wù)廣大在校師生,必須把握時代的脈搏,準(zhǔn)確抓住時代的機(jī)遇,促進(jìn)高校圖書館在管理方面不斷提高和改善,引導(dǎo)高校圖書館智能化、信息化發(fā)展,使圖書館的資源得到最大化利用,為讀者構(gòu)建綜合性服務(wù)平臺,促進(jìn)知識的傳播。