陳則芝,張友梅
(合肥職業(yè)技術(shù)學院,安徽 合肥 230031)
在生活中,小到個人,大到企業(yè)、行業(yè)乃至整個社會,時時刻刻都在產(chǎn)生著數(shù)據(jù)。這些數(shù)據(jù)有可用二維表結(jié)構(gòu)表示的結(jié)構(gòu)化數(shù)據(jù), 也有類似XML、HTML 的半結(jié)構(gòu)化數(shù)據(jù),而成為主流的是諸如文檔、圖片、音頻、視頻等非結(jié)構(gòu)化數(shù)據(jù)。 這些數(shù)據(jù)不僅數(shù)據(jù)量大,還具有種類繁多、增長迅速、價值密度低等特點。 許多企業(yè)借助大數(shù)據(jù)技術(shù)對這些數(shù)據(jù)進行收集、存儲、管理和分析,從中挖掘出有用的信息,為生產(chǎn)生活服務。 如:提供產(chǎn)品或服務的企業(yè)可以利用大數(shù)據(jù)進行精準營銷;中小企業(yè)利用大數(shù)據(jù)進行服務轉(zhuǎn)型等。 我們的生活正因為大數(shù)據(jù)的運用發(fā)生了翻天覆地的變化,大數(shù)據(jù)逐漸改變我們的生產(chǎn)生活方式。
隨著計算機技術(shù)和網(wǎng)絡技術(shù)的發(fā)展, 讀者對圖書的需求也發(fā)生了變化, 特別是數(shù)字化閱讀需求呈上漲趨勢。為了迎合了這個需求,作為承擔著教育職能的各大高校不斷探索數(shù)字圖書館的建設路徑,紛紛將圖書“搬上”了網(wǎng)絡平臺,利用現(xiàn)代化的數(shù)字技術(shù),生成數(shù)字化的館藏文獻,讓讀者借助互聯(lián)網(wǎng)不受時間地點限制地查詢信息, 從而更好地為教學科研服務。
為了更好發(fā)揮數(shù)字圖書館的功能, 各高校加大建設資金的投入, 不斷完善數(shù)字資源, 收錄中國知網(wǎng)、萬方、CSCD、維普、Springer、EBSCO 等數(shù)據(jù)庫。一些高校建立了內(nèi)部數(shù)據(jù)庫以收錄學生論文、 教學參考書等,搭建起為師生服務的數(shù)字服務平臺。
大數(shù)據(jù)時代的到來, 將促進數(shù)字圖書館數(shù)據(jù)的管理、分析、使用及服務的深層次變革,為高校數(shù)字圖書館的建設提供了條件, 也對高校數(shù)字圖書館的發(fā)展提出新的挑戰(zhàn)。 目前高校數(shù)字圖書館建設中仍存在以下幾個問題。
高校數(shù)字圖書館中有大量的結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù), 數(shù)字圖書館需要通過某種數(shù)據(jù)處理技術(shù)對數(shù)字資源進行收集、 轉(zhuǎn)換和存儲, 建立起相應的數(shù)據(jù)庫。收集數(shù)據(jù)時所采用的技術(shù)不同,造成數(shù)據(jù)格式不同,如:有的數(shù)字資源是借助物聯(lián)網(wǎng)和RFID 標簽技術(shù)對紙質(zhì)文獻進行掃描獲得的; 有的數(shù)字資源是通過現(xiàn)成的數(shù)據(jù)庫獲得的。 由于缺乏統(tǒng)一的數(shù)字資源標準,勢必增加資源整合的難度[1]。
高校數(shù)字圖書館雖然實現(xiàn)館藏文獻的數(shù)字化,但對數(shù)字資源的數(shù)據(jù)挖掘能力不足, 數(shù)據(jù)配置未盡合理,如:重視論文期刊的收錄,忽視音頻、視頻等資源的收錄;近期的圖書收錄率高,時間較遠的著作收錄率較低;中文文獻的收錄比較多,外文文獻收錄比較少等。 由此可見, 高校數(shù)字圖書館的數(shù)字資源與讀者的需求之間還存在相當大的差距, 讀者很難從高校數(shù)字圖書館中獲取足夠的資源[2]。
不同高校考慮到各自的社會效益和經(jīng)濟利益,不愿意開放數(shù)字圖書館數(shù)據(jù)庫的端口, 致使每個高校的數(shù)字圖書館的建設相對獨立, 從而形成了一個個數(shù)據(jù)孤島。 這樣一方面導致很多數(shù)字資源重復建設,文獻資源庫中存在著重復交叉的問題;另一方面造成數(shù)字圖書館之間很難實現(xiàn)資源共享,如:有的高校投入大量精力建設重點專業(yè)和學科, 建立起自己的特色數(shù)據(jù)庫, 但由于缺乏共享, 導致讀者能夠檢索到的數(shù)據(jù)量較少, 降低了數(shù)字圖書館服務水平和質(zhì)量。
很多高校的數(shù)字圖書館基于校園網(wǎng)開展數(shù)字資源的存儲、 管理和檢索等服務。 一旦學校網(wǎng)絡出現(xiàn)故障,則數(shù)字圖書館的各項工作就會受到影響,導致信息資源的收集和存儲無法進行。 同時學校網(wǎng)絡的帶寬也會導致數(shù)字化圖書館訪問速度過慢, 無法滿足讀者需求,讀者體驗變得越來越差[3]。
部分圖書館在建設數(shù)字化圖書館時沒有意識到讀者數(shù)據(jù)對其發(fā)展的重要性, 沒有獲得有效的讀者需求信息資源。 雖然可以向讀者推薦一定的信息資源,但是缺少對讀者瀏覽及檢索行為的了解和掌握,無法根據(jù)讀者閱讀愛好及習慣提供精準的個性化服務,這些問題制約了圖書館數(shù)字化建設的發(fā)展。
雖然各個高?;蚨嗷蛏俳⒘藬?shù)字圖書館,擁有一定的數(shù)字資源,但是存在只管建不管用,只管用不管如何用,只管如何用不管用的好不好等問題,這樣就造成資源的利用率并不高[4]。
隨著我國對知識版權(quán)愈加重視, 版權(quán)問題成為數(shù)字圖書館發(fā)展過程中的一大難題。 在信息資源個性化服務中,需要對信息資源進行分類、整理之后提供給讀者利用。 雖然這種對信息資源的分類整理是對原始文獻的創(chuàng)造, 但對這些信息資源進行歸類整理之后, 以專題的形式借助數(shù)字化信息資源進行再編輯和出版,將直接關(guān)系到原著的演繹權(quán),這可能涉及版權(quán)問題。
大數(shù)據(jù)環(huán)境下, 高校數(shù)字圖書館的資源繁雜多樣,數(shù)量呈幾何級增長,面對不同平臺且數(shù)量眾多的異構(gòu)信息資源, 要充分利用大數(shù)據(jù)相關(guān)技術(shù)對圖書館信息資源進行挖掘整理, 構(gòu)建基于大數(shù)據(jù)的數(shù)字圖書館服務體系,如:信息服務、文獻檢索服務、個性化服務、微平臺服務等。
在大數(shù)據(jù)背景下,各高校圖書館應同心協(xié)力,利用大數(shù)據(jù)技術(shù)合理解決好各數(shù)據(jù)庫之間的兼容性問題,不斷拓寬資源整合范圍,從資源層、數(shù)據(jù)處理層、應用層、 用戶交互層四個層次來構(gòu)建數(shù)字圖書館信息服務系統(tǒng), 有效實現(xiàn)各個圖書館之間的數(shù)據(jù)資源共享共建,防止圖書館數(shù)字資源的重復建設。也可分利用大數(shù)據(jù)技術(shù)研發(fā)有聲數(shù)字、 立體閱讀等新型數(shù)字資源,將服務范圍進行延伸和擴展。
每所高校都有自己的特色專業(yè)和重點學科,當然會有與之相關(guān)的特色資源。各高校應高度重視特色資源的開發(fā)與運用,在進行資源整合時,互相取長補短,聯(lián)合開發(fā)特色數(shù)字資源庫,為讀者提供特色服務。
另外,高校數(shù)字圖書館應通過數(shù)字平臺,圍繞教育方針政策及社會熱點,開展各種學術(shù)活動如講座、專家論壇等,從而提升讀者的數(shù)字閱讀體驗。
傳統(tǒng)圖書館的資源共享是通過借閱來實現(xiàn),而現(xiàn)在的高校數(shù)字圖書館則是通過訪問資源數(shù)據(jù)庫來實現(xiàn)。
高校數(shù)字圖書館一般都會購買中國知網(wǎng)、 維普期刊網(wǎng)、萬方等多個數(shù)據(jù)庫的使用權(quán),若建立跨數(shù)據(jù)庫的統(tǒng)一的檢索平臺, 讓讀者在一個檢索界面進行檢索,不僅避免一一登錄這些平臺的麻煩,還大大提高檢索效率。
為幫助讀者從海量的資源庫中快速、 準確地獲取所需要的資源, 高校圖書館不斷完善圖書館檢索系統(tǒng), 提供精確檢索與模糊檢索兩種關(guān)鍵詞檢索方式。在精準檢索中設置多個檢索選項,可以幫助讀者精準地檢索到所需要的信息資源。 在需求不太明確的情況下,通過模糊檢索,可以獲得與檢索關(guān)鍵詞相關(guān)的多個文獻資源。
在大數(shù)據(jù)環(huán)境下, 可利用大數(shù)據(jù)技術(shù)對數(shù)據(jù)資源進行采集、篩選、分類、聚類等處理,智能理解、識別檢索關(guān)鍵詞, 借助于網(wǎng)絡資源抓取功能對資源內(nèi)容進行抓取,自動跟蹤分析讀者行為,在掌握讀者偏好的基礎上,為讀者提供更加精準的服務。
傳統(tǒng)的高校數(shù)字圖書館將讀者當作被動接受的主體,為讀者提供資源的檢索、借閱、論文下載等服務。
在大數(shù)據(jù)背景下, 高校數(shù)字圖書館應注重讀者信息行為數(shù)據(jù)的利用,加強對讀者閱讀需求的研究,主動為師生推送信息資源,進行個性化服務推薦,構(gòu)建個性化信息服務的系統(tǒng)模型。
大數(shù)據(jù)環(huán)境下, 數(shù)字圖書館不僅要記錄基礎服務數(shù)據(jù), 充實館藏數(shù)據(jù), 更要建立完善的讀者信息庫。 讀者信息庫除了記錄讀者姓名、專業(yè)方向、聯(lián)系方式等個人特征信息外,還應利用大數(shù)據(jù)技術(shù),從海量的借閱、搜索、瀏覽痕跡等行為信息中提取有價值的信息。
高校數(shù)字圖書館可利用協(xié)同過濾、 基于內(nèi)容過濾等推薦技術(shù)等對讀者的瀏覽與搜索行為進行挖掘與研究,建立與讀者需求匹配的資源庫,從海量信息中篩選個性化內(nèi)容。在讀者登錄數(shù)字圖書館時,根據(jù)讀者的行為數(shù)據(jù),在頁面主動向讀者進行圖書推薦,或通過郵件、 微信等方式向讀者進行個性化閱讀資料推薦,極大提高讀者的閱讀興趣[5]。
隨著移動互聯(lián)技術(shù)的發(fā)展,使得手機、手持閱讀器等設備走進我們的生活。利用移動終端,人們只需通過無線網(wǎng)絡就可以在任何時間、 任何地點獲取所需要的信息。
高校圖書館也要與時俱進, 拓展數(shù)字化閱讀平臺,將數(shù)字圖書館引入移動平臺,借助新媒體技術(shù),建立移動數(shù)字圖書館APP 或開通圖書館微信公眾號。
在移動數(shù)字圖書館APP 或在微信公眾號中提供個人中心、動態(tài)信息、圖書借閱、資源檢索、閱讀推廣、讀者交流等服務,及時把信息動態(tài)、個性化推薦等信息傳遞給讀者, 使移動設備成為高校數(shù)字圖書館為讀者提供服務的重要場所。
讀者在手機、平板等移動客戶端上登錄成功后,可以了解圖書館的相關(guān)信息,隨時進行圖書預約、在線瀏覽資源, 也可借助語音識別等技術(shù)與讀者進行資源共享。
借助移動數(shù)字圖書館APP 或在微信公眾號,可以挖掘讀者隱性的信息需求,結(jié)合在線分享功能,主動將圖書館資源、服務和活動等信息推送給讀者,促進圖書館的服務升級[6]。
高校圖書館要充分意識到建設數(shù)字圖書館的重要性,加大資金的投入,引進先進設備和技術(shù),對基于不同網(wǎng)絡下的異構(gòu)數(shù)據(jù)資源進行數(shù)字化管理及分布式管理,實現(xiàn)數(shù)字化資源的革新,確保讀者能及時檢索到自己需要的信息資源。
目前, 數(shù)字化圖書館的建設中主要的硬件投入是服務器,可以借助HDFS 分布式存儲相關(guān)技術(shù),對圖書館的服務器、數(shù)據(jù)庫等多個方面進行整合,構(gòu)建數(shù)字圖書館的運行環(huán)境, 用于電子圖書的存儲、搜索、下載等服務。 為防止數(shù)據(jù)丟失和突發(fā)故障,需建立一個基于NAS 的異地備份系統(tǒng),提高數(shù)字圖書館的健壯性,從而保證數(shù)字圖書館的穩(wěn)定及高效運行。
為更好地提高數(shù)字圖書館的服務質(zhì)量, 各高校之間應聯(lián)合起來建立一個統(tǒng)一的管理制度, 對接相互之間的數(shù)據(jù)平臺,開放端口和數(shù)據(jù)庫,統(tǒng)一調(diào)度圖書館信息資源,使讀者不管從哪個數(shù)字圖書館登陸,都可以方便地查詢、檢索自己感興趣的信息,真正實現(xiàn)各個圖書館之間的資源共享和合作。
在高校數(shù)字圖書館建設中, 從信息平臺的搭建到軟件的開發(fā)與應用,從信息資源的收集到存儲與傳播等環(huán)節(jié)都存在安全隱患,這些勢必將影響系統(tǒng)的順利運行。
高校圖書館應必須建立、健全相應的法律法規(guī),采取多種防護措施,以保障數(shù)字圖書館系統(tǒng)的安全運轉(zhuǎn)。如:依據(jù)文獻資源的重要性對其設置不同的訪問權(quán)限;加強防火墻的建設,提高預警系統(tǒng)的防范能力;對訪問IP 進行檢測,屏蔽非法的訪問;及時修復存在的漏洞等[7]。
在新的數(shù)字圖書館服務模式中, 圖書館人員的業(yè)務水平有待提高。 圖書館人員要轉(zhuǎn)變服務理念,樹立起為讀者服務的思想,不僅要熟悉傳統(tǒng)的工作流程和模式,還要熟練掌握與數(shù)字圖書館相關(guān)的操作技術(shù)。 因此,高校圖書館應定期組織館員進行相關(guān)培訓,以提升圖書館人員的綜合素質(zhì),滿足當前高校數(shù)字圖書館不斷發(fā)展的需要。
大數(shù)據(jù)應用的普及為高校數(shù)字圖書館的建設帶來了新的契機。 高校圖書館應緊隨時代的步伐,以滿足讀者需求為目標,注重研究與創(chuàng)新,探索新的服務模式,擴大服務范圍。加大建設資金的投入,有效整合高校數(shù)字圖書館的館藏資源,借助統(tǒng)一的資源檢索平臺, 實現(xiàn)高校圖書館之間的資源共享。挖掘讀者行為數(shù)據(jù), 為讀者提供個性化推薦服務。同時制定合理的圖書館管理制度,提升個性化服務意識,以提高數(shù)字圖書館個性化信息服務的水平和質(zhì)量。