浦潔
摘 要 數(shù)字圖書館雖然逐步解決了傳統(tǒng)圖書館基礎網(wǎng)絡設施等硬件建設的高成本、傳統(tǒng)架構模式上的資源分享效率低和存儲量小等一系列缺陷,但無法克服各自獨立的信息源分布儲存和服務。云計算可以利用低成本與超大容量等優(yōu)勢,將圖書館數(shù)據(jù)進行遷移,從而有效地解決了傳統(tǒng)圖書館運行存在的一系列問題。論文在描述云計算及其優(yōu)勢的基礎上,對云計算技術給圖書館信息構建帶來的變化與問題進行了分析,研究了創(chuàng)建數(shù)字圖書館過程中的云計算應用問題。
關鍵詞 云計算 數(shù)字圖書館 云存儲 基礎框架 云服務模式
分類號 G250.76
DOI 10.16810/j.cnki.1672-514X.2018.01.xxx
Abstract Although the digital library gradually solves a series of defects such as the high cost of traditional library infrastructure such as network and other hardware facilities, the low efficiency of resource sharingand low storage in traditional architecture model, it can not overcome the independent sources of information storage and distribution services. Cloud computing can make use of the advantages of low cost and super large capacity to transfer library data, thus effectively solve a series of problems existing in the operation of traditional libraries. Based on the description of cloud computing and its advantages, the changes and problems brought in library information construction by cloud computing technology have been analyzed, and the process of creating a digital library of cloud computing applications is studied.
Keywords Cloud computing. Digital library. Cloud storage infrastructure. Cloud service model.
數(shù)字圖書館雖然處理各種各樣的數(shù)據(jù)和信息,向用戶提供快捷、便利的服務,但是,信息源各自分離、相對獨立,信息源,阻礙了其進一步發(fā)展。隨著分布式計算技術的應用,并行計算、網(wǎng)格計算、效用計算以及云計算的普及,出現(xiàn)了類似于基礎設施即服務(IaaS)、平臺即服務(PaaS)和軟件即服務(SaaS) 等多種數(shù)字服務技術[1]。其中,云計算的特點在于按需獲取、多樣性、擴展性和虛擬能力服務[2],在資源利用與管理方面有低成本、高效益的優(yōu)勢,這必然會為圖書館的管理與服務領域帶來深層次的改革與大范圍的影響。
1 數(shù)字圖書館建設中存在的問題
1.1 基礎設施架構成本高
基礎設施架構的成本和維護費高、利用率低是目前數(shù)字圖書館建設普遍存在的問題。傳統(tǒng)圖書館IT改造基礎設施的構架包括購買不間斷電源、防火墻、交換機、服務器和存儲器等各種設備,并且需要將軟硬件進行搭建、運營、維護,而后期的這一筆費用是相當高的。同時,隨著IT行業(yè)的發(fā)展,這些設施活躍周期很短,即便是使用不太先進的設備,購買和擴展新的模塊配件也需要許多花費。
1.2 信息資源存儲技術問題
在數(shù)字圖書館中,獲取多規(guī)則開發(fā)語言的計算機科學技術是十分重要的。然而,如今不同數(shù)據(jù)標準、不同軟件或不同模塊工具之間的數(shù)據(jù)交換技術更新地十分迅速,數(shù)據(jù)體量的爆炸式增長、標準規(guī)則的多應用拓展要求數(shù)字圖書館應該具備更強、更靈活的資源存儲設施,從而擁有可伸縮的存儲資源空間、靈活可配的性能管理以及高可靠性的資料備份能力[3]。
1.3 資源共享效率低
盡管數(shù)字圖書館打破了空間與時間的限制,但受其安全性的限制,為保證服務設備的正常功能與數(shù)據(jù)資源的安全性,傳統(tǒng)圖書館會對訪問終端服務器的流量與最大支撐數(shù)量進行控制,這樣不僅導致了服務器的訪問限制,而且影響了圖書館之間的數(shù)據(jù)傳輸能力、壓力承載能力與資源共享程度。
2 基于云計算的數(shù)字圖書館優(yōu)勢
2.1 有效降低基礎設施構架成本
云計算改變了信息服務的供應方式。在“云”中的存儲資源、基礎設備是可以無限制擴展的,通過云計算技術的利用,客戶設備可以得到低成本化與資源綠色化改善。云計算通過虛擬技術,利用虛擬軟件融合成百上千的服務器,對外以統(tǒng)一、標準的平臺服務用戶。另外,云計算是按需收費,在性能需求不變的情況下,軟硬件更新迭代無需額外花費。同時,云計算采用的“云端托管”模式,從開發(fā)、運營到后期維護,都提供成熟、低成本的服務方案,相較于自行項目建設,要節(jié)省很多成本。在這樣的技術下,數(shù)據(jù)資源能夠在滿足高利用率的前提下運行得更長久,能源效用與數(shù)據(jù)資源的利用率會達到最高,成本也會控制得最低。
2.2 有效解決資源存儲技術上的困難
云計算通過可視化界面,可以實時集中監(jiān)控整個虛擬環(huán)境、存儲負載服務的性能數(shù)據(jù)情況,從而實現(xiàn)利用數(shù)據(jù)融合管理大規(guī)模服務器技術,根據(jù)用戶需求,系統(tǒng)自動或人為配置,靈活地分配存儲資源空間和對外服務性能,甚至可以通過資源調(diào)度來解決存儲空間的問題。同時,云計算高性能、可擴展的存儲計算技術,可以從容應對目前高速發(fā)展的數(shù)據(jù)交換技術。在數(shù)據(jù)資料備份方面,云計算的高存儲效率造就了快速備份、一備三的備份技術,達到99.9999999%的數(shù)據(jù)可靠性[4]。在當今信息資源爆炸式增長的背景下,云計算可以確保數(shù)字圖書館在數(shù)據(jù)管理、數(shù)據(jù)存儲、數(shù)據(jù)安全方面能力得到提升。endprint
2.3 有效加強數(shù)字資源共享
云計算具有“云端資源庫”的特點,人們可以在任何時間、地點使用庫中的資源。在云計算的環(huán)境下,數(shù)字圖書館的信息資源被存儲在由成千上萬個服務器構成的“云端”中,這些資源可以在全球范圍內(nèi)被使用。同時,云計算的高數(shù)據(jù)吞吐能力可以提升大型資料的傳輸效率。當資料面對用戶高并發(fā)訪問讀取時,高性能的壓力承載能力可以避免服務器癱瘓。云計算技術的應用,使得圖書館信息資源的共享度更高,信息使用者的需求更容易被滿足。
3 數(shù)字圖書館云存儲技術及其基礎框架
與傳統(tǒng)的數(shù)據(jù)存儲相比,云存儲具有很多優(yōu)勢。用戶不僅不需要購買具體的存儲設備,而且可以在任何地點利用網(wǎng)絡接口獲取已經(jīng)存儲的數(shù)據(jù)。云存儲的核心是應用與存儲裝置的排列組合[5]。對于數(shù)字圖書館終端用戶來說,云存儲并不是一種具體的設備,而是一種統(tǒng)一的、標準的服務,一種能夠提供圖書資料數(shù)據(jù)隨時隨地存取的服務。
3.1 GFS、HDFS分布式數(shù)據(jù)存儲技術
GFS和HDFS是兩種主流的大規(guī)模分布式數(shù)據(jù)存儲技術,云計算利用大規(guī)模分布式存儲的途徑來存儲數(shù)據(jù)。為了滿足Google在數(shù)據(jù)處理方面急速增長的需求,Google設計并開發(fā)了文件處理系統(tǒng)GFS(Google File System),Hadoop團隊開發(fā)了開源系統(tǒng)HDFS(Hadoop Distributed File System)。為了更加有效地利用云計算資源,Google開發(fā)了基于GFS的Map Reduce運行模式;同時,Hadoop團隊基于Google的GFS和Map Reduce,開發(fā)了屬于自己的分布式并行程序設計模式,即HDFS & Map Reduce。Map Reduce是一個基于集群的高性能并行計算平臺,運用并行計算與運行軟件架構,提供了一個龐大但設計精良的并行計算存儲軟件框架,能自動完成計算存儲任務的并行化處理,自動劃分計算數(shù)據(jù)和計算任務,在集群節(jié)點上自動分配和執(zhí)行任務以及收集計算結果,將數(shù)據(jù)分布存儲、數(shù)據(jù)通信、容錯處理等并行計算涉及到的很多系統(tǒng)底層的復雜細節(jié)交由系統(tǒng)負責處理,大大減少了軟件開發(fā)人員的負擔。
3.2 數(shù)字圖書館中的云存儲基礎框架
如圖1所示,圖中展示的是基于云計算的數(shù)字圖書館中大規(guī)模數(shù)據(jù)的云存儲框架。
在云計算架構數(shù)字圖書館中,存儲層是最基礎的部分,書籍資料也是存儲在這一層。存儲設備可以是光纖通道,也可以是直接連接存儲(DAS)、網(wǎng)絡連接存儲(NAS)和存儲區(qū)域網(wǎng)絡(SAN)等。云存儲的存儲裝置通常涵蓋許多不同地理區(qū)域的資料與數(shù)據(jù)。它們通過廣域網(wǎng)、因特網(wǎng)或光纖網(wǎng)絡等連接在一起,形成統(tǒng)一的存儲服務。云端資源的存儲平臺是管理層,即虛擬化存儲計算平臺,也是數(shù)字圖書館中云存儲的核心部分[6]。通過GFS & Map Reduce以及HDFS & Map Reduce的并行程序運行模式,存儲平臺可以演變出分布式計算、并行計算以及云計算存儲等方法。云端資源的存儲平臺擁有處理大規(guī)模數(shù)據(jù)的能力,并且能夠使多重存儲設備中的云存儲資源聯(lián)合運作,實現(xiàn)空間資源地可伸縮、服務性能地可調(diào)度等特點[7]。云存儲應用平臺是云計算系統(tǒng)的應用界面層,是整個云存儲系統(tǒng)中最靈活的部分。應用平臺提供不同服務對應于不同的操作界面和用戶請求,包括統(tǒng)一的圖書館服務界面、服務登記和證明、數(shù)據(jù)申請服務、廣域網(wǎng)、因特網(wǎng)的網(wǎng)絡權限等。在獲取層,任何數(shù)字圖書館的被授權用戶都可以登入云存儲系統(tǒng),并通過應用界面獲得使用云存儲設備的權限。通過獲取層,用戶可以獲得書籍資料數(shù)據(jù)存儲、遠程讀取共享、數(shù)據(jù)應用支撐和個人空間服務等服務。
4 數(shù)字圖書館云服務模型
隨著云計算使用的普及,信息服務的定義方式也發(fā)生了相應的改變。事實上,“云”并不是將服務分開,而是將資源和服務更緊密地聚集在一起。云計算供應者根據(jù)以下三種基本模式提供它們的服務:基礎設施即服務(IaaS)、平臺即服務(PaaS)、軟件即服務(SaaS)。在這三種模式中,基礎設施即服務(IaaS)是最基礎的一種,每一個更高程度的模型都提取了低程度模型的細節(jié)[8]。數(shù)字圖書館中的云服務模型包含硬件和應用程序托管層,它在提供基礎服務的同時,還對計算服務和存儲服務進行整合與鏈接。無論是哪里的資源,也無論是什么樣的數(shù)據(jù)庫,云服務模型都可以提供給用戶最快、最直接的服務。平臺即服務(PaaS)模式作為一個開發(fā)平臺服務于軟件開發(fā)者,開發(fā)者可以在一個包括SDK,文檔和測試環(huán)境等在內(nèi)的開發(fā)平臺上非常方便地編寫應用,而且不論是在部署,或者運行的時候,用戶都無需為服務器,操作系統(tǒng),網(wǎng)絡和存儲等資源的管理操心。此模塊提供友好的開發(fā)環(huán)境、豐富的端口服務、可伸縮的資源調(diào)度、精細的管理和監(jiān)控。軟件即服務(SaaS)是將應用作為服務提供給軟件使用者。通過SaaS模式,用戶只要接上網(wǎng)絡,并通過瀏覽器或者軟件,就能隨時隨地直接享受數(shù)字圖書館的各類云服務。
4.1 數(shù)字圖書館云服務模式
數(shù)字圖書館的云服務平臺包括基礎框架服務平臺、軟件服務平臺、地區(qū)服務平臺(包括地區(qū)應用基礎框架平臺和地區(qū)應用系統(tǒng)) 和服務平臺(即應用、程序、信息資源的整合),如圖2所示。
數(shù)字圖書館的這種開放式、面向服務的框架,可以通過定義良好的接口和契約,將應用程序的不同功能服務之間聯(lián)系起來。對于整合類似于區(qū)域性公共服務、不同交易之間的公共服務、第三方公共服務等地區(qū)性服務具有很大的便利性。
4.2 數(shù)字圖書館云服務平臺架構
數(shù)字圖書館云服務平臺包括基礎框架服務、基礎平臺服務和軟件服務三個方面,如圖3所示。
我們可以通過按需購買IaaS的云存儲服務,建立屬于自己的云服務中心。公共服務平臺(平臺即服務PaaS)面向數(shù)字圖書館軟件開發(fā)者,由一系列軟件構成,它提供類似數(shù)據(jù)服務、驗證和指示等服務。終端應用服務(即軟件即服務SaaS)面向數(shù)字圖書館用戶,包括數(shù)字圖書館的服務平臺和地區(qū)服務平臺,提供數(shù)字圖書館的一系列軟件應用服務,如參考咨詢、館際互借和專題服務等[9]。數(shù)字圖書館云服務平臺針對不同的場景應用和數(shù)據(jù)安全要求,對外輸出形式分為公共云端、個人云端以及混合云端,實現(xiàn)云計算服務定制化。
5 結語
數(shù)字圖書館的云計算目前仍處在研究的初級階段。隨著云計算在圖書館領域的不斷發(fā)展與應用,數(shù)字圖書館的發(fā)展將會邁上新的臺階。同時,隨著云計算技術和相關政策法規(guī)的逐步成熟與完善,云計算必將推動數(shù)字圖書館的發(fā)展。
參考文獻:
FOX A, GRIFFITH R, JOSEPH A, et al. Above the clouds: a berkeley view of cloud computing[J].Dept. Electrical Eng. and Comput. Sciences, University of California, Berkeley, Rep. UCB/EECS,2009(28):13.
OU Y, ZHOU Z. Cloud storage and cloud service in the digital library[C]//Proceedings of the 9th International Symposium on Linear Drives for Industry Applications, Volume 1. Springer Berlin Heidelberg, 2014:295-302.
張東.云存儲技術研究與應用[J].科研信息化技術與應用,2012(3):85-90.
孔陶茹.云存儲應用探討[J].互聯(lián)網(wǎng)天地,2013(12):87-90.
王麗敏,黨衛(wèi)紅,王淑閣.云計算環(huán)境下個人數(shù)字圖書館發(fā)展探析[J].浙江高校圖書情報工作,2011,1(105):1-5.
云存儲時代來臨:吹響后存儲時代的號角[J].計算機光盤軟件與應用,2013(21):5-8.
諶偉.云存儲系統(tǒng)的分析與應用探討[J].數(shù)字技術與應用,2013(10):216.
江偉玉,劉麗敏,查達仁.面向云存儲的訪問控制服務研究[J].信息網(wǎng)絡安全,2013(10):34-37.
李屹炬,魏寶林.分布式云存儲技術的分析[J].信息系統(tǒng)工程,2013(9):98-98.endprint