彭駿
(第二軍醫(yī)大學,上海 200433)
當前云計算已經(jīng)成為IT研究的熱點問題,作為最擅長利用最新信息技術(shù)和理論的學科,圖書館學界也開始關(guān)注這一問題。可以預見,作為信息數(shù)據(jù)中心的圖書館在不久的將來會廣泛應用云計算技術(shù),而圖書館也必然在未來的云時代中獲益。
按照OCLC的說法,圖書館引進云計算服務,可以讓圖書館的數(shù)據(jù)以大規(guī)模的分布式方式存在,圖書館的協(xié)作和服務也可以在更大的Web范圍內(nèi)進行。這不僅會影響到上游出版商對于數(shù)據(jù)和信息的組織整合提供方式,信息擁有者、使用者、提供者的關(guān)系和職能更為復雜,而且也會影響到圖書館與用戶的交互方式,以更為個性化、更為貼近用戶日常信息接收和知識交流方式的形式提供服務。[1]因此,云時代圖書館信息資源的建設將相應發(fā)生重大的變化。
云計算(cloud computing)是在分布式系統(tǒng)、網(wǎng)格計算等基礎上發(fā)展出的一種新型計算模型,是一種新興的共享基礎架構(gòu)方法。它擁有超大規(guī)模的分布式環(huán)境,其核心是提供數(shù)據(jù)存儲和網(wǎng)絡計算服務。所謂“云”是指計算機群,每一群包括了幾十萬臺,甚至上百萬臺計算機,是數(shù)據(jù)存儲和應用服務的中心,用來完成存儲和計算的工作[2]。
目前公認的云計算有以下幾大形式:虛擬化(Virtualization)、效用計算(Utility Computing)、基礎設施即服務 (Infrastructure as a service,IaaS)、平臺即服務(Platform as a Service,PaaS)、軟件即服務(Software as a Service,SaaS)。在這些服務形式下,用戶終端不再需要配置大容量硬盤等存儲設備,數(shù)據(jù)可以放在云中來管理,無論何時何地都可以方便地存取,同時輕松地實現(xiàn)存儲數(shù)據(jù)的共享;用戶也不需要再安裝和更新各種軟件,因為SaaS可以通過瀏覽器將應用程序傳給用戶在線使用;如果用戶想要完成類似超級計算機才能完成的計算任務,也不需要斥巨資購買昂貴的計算機設備,效用計算服務形式可以創(chuàng)造虛擬的計算中心,提供超級計算能力。作為程序開發(fā)者不需要自建開發(fā)環(huán)境,轉(zhuǎn)而利用PaaS來使用中間商的設備開發(fā)自己的程序,并通過網(wǎng)絡發(fā)送到用戶手中。從它的構(gòu)建方式到提供的服務形式不難看出,云計算的確整合了網(wǎng)絡資源,為終端用戶提供了巨大的方便。按照云計算的理念,隨著云計算服務的普及,“用戶可以通過網(wǎng)絡和簡易的終端設備隨時隨地使用幾乎所有的信息資源及計算能力,像用電用水一樣,按使用量來計費?!?/p>
分析云計算的特點和服務模式,我們不難看出云計算也適用于圖書館的資源建設。目前圖書館信息資源體系中主要分為兩大類,即實體資源和數(shù)字資源。實體資源包括印刷型文獻、縮微平片膠卷、音像資料等。由于實體資源的物理特性,不能通過網(wǎng)絡進行共享(除非先進行實體資源的數(shù)字化),所以本文主要研究利用云計算開展數(shù)字資源的保障鏈服務。現(xiàn)階段圖書館的數(shù)字資源大體包括三個方面的內(nèi)容:
(1)館藏書目數(shù)據(jù)庫。館藏書目數(shù)據(jù)庫是開發(fā)信息資源的基礎數(shù)據(jù)庫,是圖書館全面實現(xiàn)網(wǎng)絡化、自動化的基礎,其作用是對館藏進行揭示,便于用戶檢索和利用圖書館的信息資源。
(2)特色文獻數(shù)據(jù)庫。特色文獻數(shù)據(jù)庫是圖書館根據(jù)其文獻資源狀況與用戶的信息需求,選擇館藏中富有特色的文獻資源所建立的專門化數(shù)據(jù)庫。比如高校圖書館的本校學位論文數(shù)據(jù)庫、學術(shù)成果數(shù)據(jù)庫,地方圖書館的地方方志數(shù)據(jù)庫。
(3)商用數(shù)據(jù)庫產(chǎn)品。這些資源由數(shù)據(jù)庫生產(chǎn)商開發(fā),產(chǎn)品類型多種多樣,如文摘數(shù)據(jù)庫、書目數(shù)據(jù)庫、全文數(shù)據(jù)庫、事實數(shù)據(jù)庫等。大部分都可以通過Web進行服務。
所有這些數(shù)字資源在云中皆表現(xiàn)為數(shù)據(jù),圖書館的服務則表現(xiàn)為對數(shù)據(jù)的操控。在此條件下,圖書館信息資源建設的目標將不再是占有資源,而是確保信息資源在用戶有需求時能夠及時獲取,因此圖書館要建設一個信息資源保障鏈。這種信息資源保障鏈與過去的資源共享、文獻傳遞服務不同,信息資源保障鏈更追求時效性。傳統(tǒng)的文獻傳遞服務最快也要一天時間(根據(jù)本館服務時間),而用戶對于資源的需求是要求實時獲取,這一問題在傳統(tǒng)條件下無法獲得根本解決,而在云計算時代,由于技術(shù)和服務模式的進步,使得圖書館利用云計算服務建立實時的信息資源保障鏈成為可能。
對圖書館數(shù)字資源保障鏈而言,存儲是首要問題。傳統(tǒng)上,數(shù)字資源的存儲主要是靠各圖書館自己建設的服務器、磁盤陣列存儲,隨著信息量的不斷擴大,各館的存儲設備也在不斷擴容,普通本科院校每年的數(shù)字資源以5-10TB數(shù)量增長,每年至少要增加1-2個磁盤陣列以及服務器,[3]才能勉強滿足數(shù)字資源的增長需求。從未來發(fā)展來看,各館再建立自己的存儲中心已經(jīng)力不從心,而云計算服務將能解決數(shù)字資源存儲的難題。
利用云計算進行的存儲可稱為“云存儲”,它是指通過集群應用、網(wǎng)格技術(shù)或分布式文件系統(tǒng)等功能,將網(wǎng)絡中大量各種不同類型的存儲設備通過應用軟件集合起來協(xié)同工作,共同對外提供數(shù)據(jù)存儲和業(yè)務訪問功能的一個系統(tǒng)。當云計算系統(tǒng)運算和處理的核心是大量數(shù)據(jù)的存儲和管理時,云計算系統(tǒng)中就需要配置大量的存儲設備,那么云計算系統(tǒng)就轉(zhuǎn)變成為一個云存儲系統(tǒng),所以云存儲是一個以數(shù)據(jù)存儲和管理為核心的云計算系統(tǒng)。
在云時代,圖書館藏書目數(shù)據(jù)庫和特色文獻數(shù)據(jù)庫資源都可以選擇存儲在云中。圖書館根據(jù)本館需要向云服務提供商租用相應的存儲空間,并可以隨時按照需要增加或減少空間的大小。數(shù)字資源存儲在“云”中,就如同存儲在本地一樣,可以隨時調(diào)用數(shù)據(jù),并省去了存儲空間管理的麻煩。
檢索是數(shù)字資源利用的重要環(huán)節(jié),基于云計算的數(shù)字圖書館資源保障鏈能否順利應用,就需要考查其檢索功能。網(wǎng)絡中信息檢索的成敗取決于服務器計算能力,而云計算在這方面提供了很好的保障。與傳統(tǒng)的數(shù)字圖書館相比,利用云計算進行圖書館數(shù)字資源的檢索,將更加有效。
云計算為網(wǎng)絡應用提供了強大的計算能力,可以為普通用戶提供每秒10萬億次的運算支持,完成用戶的各種業(yè)務要求。這種超級運算能力在普通計算環(huán)境下是難以達到的。因此,為圖書館開展大規(guī)模用戶同時在線檢索服務提供了可能。同時,云計算的檢索功能還可以為圖書館提供新的服務模式,即按照用戶的使用量來付費,同時根據(jù)用戶的不同,開發(fā)不同的界面使用檢索服務。
另外,傳統(tǒng)數(shù)字圖書館的數(shù)據(jù)基本上處于“分布式存儲,分布式訪問”的狀況。用戶要檢索不同的數(shù)據(jù)庫的內(nèi)容需要通過不同的數(shù)據(jù)庫檢索系統(tǒng),分別進入各個數(shù)據(jù)庫的檢索界面。基于云計算的圖書館至少在技術(shù)上能夠?qū)⒎植际酱鎯Φ臄?shù)據(jù)庫和一站式的檢索界面結(jié)合起來。用戶通過Google式的檢索界面將檢索請求提交給云計算服務器,服務器根據(jù)用戶提交的請求調(diào)配強大的計算能力,進行本體演算、機器智能推理等復雜計算,充分分析用戶需求。根據(jù)分析結(jié)果調(diào)配存儲在分布式云存儲服務器的資源,將結(jié)果提供給用戶,可以極大提高資源查全率和查準率。這為用戶提供快捷的、直達需要的數(shù)字資源的良好體驗。
傳統(tǒng)數(shù)字圖書館資源的獲取中,有兩種主要方式:一是由圖書館購買數(shù)據(jù)庫安裝在本地使用;二是購買數(shù)據(jù)庫使用權(quán)遠程訪問。本地鏡像站獲取速度雖快,但是占用大量貯存空間,遠程訪問的速度又不甚理想。而在云時代,圖書館將不再購買數(shù)據(jù)庫本地安裝,而遠程訪問獲取的方式也將改變,資源獲取變得更快捷,更經(jīng)濟。
在云計算模式中,相關(guān)的數(shù)據(jù)資源存儲在“云?!敝校S著IPv6等技術(shù)的應用以及云計算本身的分布式架構(gòu)和強大計算能力,使得從云中獲取數(shù)字資源的速度將如同在本地一樣快捷。圖書館用戶在任何時間、任何地點都可以以方便、安全的方式向云服務器提交獲取資源請求,云計算服務器將通過統(tǒng)一平臺,自動調(diào)取分布在云中各處的數(shù)據(jù)提供給用戶。雖然在“云”里有成千上萬臺計算機為其提供服務,但對于“云”外的用戶來說,他看到的只是一個統(tǒng)一的“服務”(或接口)界面,用戶使用云服務就像通過互聯(lián)網(wǎng)使用本地計算機一樣的方便。[7]可以說,基于云計算的圖書館數(shù)字資源獲取的核心關(guān)鍵詞是“隨時獲取,按需付費”。
從上面的分析我們不難看出,利用云計算技術(shù)建立圖書館數(shù)字資源保障鏈的可能性,下面我們再從簡單的幾個方面來闡述一下云計算的特點和優(yōu)勢:
“云計算”將信息集中處理,保證了圖書館及用戶的信息安全。云計算提供了最為可靠安全的數(shù)據(jù)存儲中心,數(shù)據(jù)(如文檔和媒體)將會自動同步,通過Web可在所有的設備上使用。
傳統(tǒng)數(shù)字圖書館的服務器及公用電腦常被木馬病毒攻擊。由于計算機和存儲設備的交叉使用,導致計算機病毒在圖書館網(wǎng)內(nèi)廣泛傳播。安裝殺毒軟件,除了使用費用,還要定期更新和防止殺毒軟件誤刪除的危險。因此,圖書館數(shù)據(jù)安全工作不太可能做到足夠的專業(yè),云計算中所提供云存儲服務,可以為重要數(shù)據(jù)提供安全的防護,因為這些工作都是由專業(yè)的云存儲服務商來提供,他們有先進的技術(shù)和專業(yè)的團隊,可以為圖書館提供各種安全服務承諾。
同時,數(shù)據(jù)的統(tǒng)一管理更容易實現(xiàn)安全監(jiān)測:通過將信息存儲在一個或者若干個數(shù)據(jù)中心,通過分布式、多節(jié)點備份,保證數(shù)據(jù)的安全及可靠。對應的管理者可以對數(shù)據(jù)進行統(tǒng)一管理,負責資源的分配、負載的均衡、軟件的部署、安全的控制,并有效降低使用者的成本,而且可以根據(jù)圖書館要求提供各種專業(yè)而嚴格的權(quán)限管理策略,讓圖書館不同層級的用戶共享數(shù)據(jù)。
另外,確保服務器的全天候可靠運行,最大限度地降低服務器出錯概率。在現(xiàn)行的圖書館中,由于數(shù)據(jù)都集中在館內(nèi)的服務器上,一旦服務器出現(xiàn)故障,將使圖書館無法進行正常的服務,甚至會導致重要數(shù)據(jù)的丟失,給圖書館造成不可挽回的損失。運用云計算模式可以挽回這種局面,因為云中有成百萬臺服務器,即使云中的某臺服務器出現(xiàn)故障,云中的其它服務器也可以在極短時間內(nèi),快速利用克隆技術(shù)將這臺服務器中的數(shù)據(jù)完全拷貝到別的服務器中,并啟動新的服務器來提供服務,從而使圖書館真正實現(xiàn)無間斷的安全服務。
隨著云計算的發(fā)展,極大地減少了軟硬件資源的管理和維護成本,節(jié)省了人力物力。據(jù)預計,相對于自已運營的數(shù)據(jù)中心而言,云計算服務提供商的存儲成本一般只有其1/10,而帶寬成本只有1/2,計算處理能力成本只有3/10。
對于圖書館說,硬件設施投入是一筆巨大的開支,而且為了適應技術(shù)設備的發(fā)展,這些設備往往還需要不斷更新或升級,這又意味著一筆硬件資源的浪費。云計算中,用戶不需要任何的部署成本,只需花少量的錢來租用相關(guān)的云服務商所提供的相關(guān)服務即可。它可以讓用戶使用很少的投資獲得較大的回報,同時用戶不必擔心自己花費巨大投資所部署的IT產(chǎn)品被時常淘汰的后果,因為具體的硬件配置和更新都是由云服務提供商來提供的。
云計算時代,用戶將不需要安裝和升級電腦上的各種應用軟件,只需安裝網(wǎng)絡瀏覽器,就可以方便快捷地使用云計算提供的各種服務。同時,圖書館還可以向云計算服務商定制軟件服務,比如圖書館所需的信息檢索、文獻閱讀等應用軟件,一些常用的應用軟件,如辦公軟件、電子郵件系統(tǒng)等也可以從云服務中以低廉的價格獲得。
圖書館還可以以極低的成本投入獲得極高的運算能力,克服服務器訪問限制的瓶頸。普通服務器的相關(guān)硬件資源都有一定的限制,若服務器同時響應,用戶的數(shù)量超過了自身的限制,將導致服務器的崩潰。如果圖書館想滿足這部分被限制的用戶的請求,就不得不花費大量的資金部署更高級別的服務器。而應用云計算技術(shù),通過支付少量的費用,圖書館就可獲得云模式中成百上萬臺服務器提供的服務,用戶的請求便可在毫秒的時間內(nèi)獲得響應,從而使圖書館以較低的成本獲得較高的效益,與花數(shù)萬元購買專用的服務器相比,使用云服務顯然更經(jīng)濟劃算。
另外,云計算服務還能有效降低圖書館維護成本。圖書館資源建設的維護工作涉及到硬件、軟件等各方面,如對服務器、計算機、網(wǎng)絡設備所進行維護、升級和硬件更新;數(shù)據(jù)庫數(shù)據(jù)的拷貝、安裝;大量的軟件安裝、授權(quán)使用、后期更新、病毒防范等等。而使用云計算模式,由于云計算模式對于用戶終端的配置沒有限制,因此有關(guān)的技術(shù)人員不必在升級圖書館的相關(guān)硬件上煞費苦心,數(shù)據(jù)庫服務器的日常維護也由云服務提供商來提供,大部分軟件的使用都來自于SaaS的“云海”中,軟件的安裝、更新、授權(quán)和病毒防范等問題也統(tǒng)統(tǒng)丟到“云”里。這樣,相關(guān)人員的工作強度就會大大降低,從而能騰出更多的時間來開展其他的工作。
圖書館資源建設的目的是為了更多的人能夠使用圖書館,最大限度地發(fā)揮圖書館的作用。但是在傳統(tǒng)的數(shù)字圖書館服務模式下,用戶一般必須使用計算機,才能使用指定圖書館的數(shù)字資源。而云計算條件下的圖書館將能讓更多的用戶利用各種終端在不同的圖書館中共享數(shù)字資源。
云計算輕松實現(xiàn)不同設備間的數(shù)據(jù)應用。隨著嵌入式技術(shù)的發(fā)展,各種智能終端設備的性能越來越完善,不少掌上電腦、智能手機的CPU和存儲能力已經(jīng)與低端PC不相上下,而這些設備的便攜性使得它們成為未來重要的圖書館使用接入終端,但傳統(tǒng)數(shù)字圖書館很難實現(xiàn)各種設備共享圖書館的數(shù)字資源。而云計算能解決這一難題,在云計算的網(wǎng)絡應用模式中,數(shù)據(jù)保存在“云”端,同時,云計算模式提供了強大的無線接入功能,因此未來用戶可以通過各種相關(guān)的終端使用圖書館的數(shù)字資源,從而使圖書館資源中心的作用得到最大限度的發(fā)揮。所有電子設備只需要連接互聯(lián)網(wǎng),就可以同時訪問和使用這些數(shù)據(jù),這些設備之間的數(shù)據(jù)也可以無障礙共享。實現(xiàn)用戶對數(shù)字圖書館的無縫接入,這樣可以使圖書館的數(shù)據(jù)能實現(xiàn)更深一層次的共享[9],可以真正帶給用戶“圖書館無處不在”的體驗[10]。
無論是不是新概念,無論是不是炒作,云計算的研究熱潮已經(jīng)形成。雖然理想中“云計算”還沒有在圖書館現(xiàn)實中實現(xiàn),而且也有研究發(fā)現(xiàn)存在諸如網(wǎng)絡基礎設施問題、先期投入等問題。2009年7月,美國國會圖書館宣布進行為期一年的試驗,在他們的國家數(shù)字信息基礎設施和保存計劃中測試云技術(shù)對永久保存數(shù)字內(nèi)容的應用[11],可以預料,這將對云計算在圖書館的應用產(chǎn)生巨大的影響。作為圖書館更應該投身到云計算研究的熱潮中去,借“云”之力,讓圖書館的發(fā)展在云時代扶搖直上,直達云端。
[1]OCLC云服務深度解讀[EB/OL].http://www.kevenlw.name/archives/1290.2009-10-16.
[2]中國云計算網(wǎng)[EB/OL].http://www.cloudcomputing-china.cn/Article/jh/200805/1.html accessed.2009-10-16.
[3]Michael Armbrust,ArmandoFox,Rean Griffith,etc.Above the Coulds:A Berkeley Viewof Cloud Computing[EB/OL].http://www.eecs.berkeley.edu/Pubs/TechRpts/2009/EECS-2009-28.pdf.2009-10-16.
[4]邱鋒祥,汪曉蘭.圖書館應用網(wǎng)格技術(shù)的幾點思考[J].圖書情報工作,2009,53(1):105-108.
[5]云計算和云存儲的關(guān)系[EB/OL].http://tech.ddvip.com/2009-06/1243849316121868.html.2009-10-28.
[6]云計算細分之七大類商業(yè)模式[EB/OL].http://blog.chinaunix.net/u2/75125/showart_1657241.html.2009-10-28.
[7]李永先,欒旭倫,李森森.圖書館迎來“云”時代[J].高校圖書情報論壇,2009,8(1):59-61,4.
[8]IT主管應該盡早為云計算做準備 [EB/OL].http://blog.e-works.net.cn/280051/archive/2009/02/06/22827.html.2009-10-28.
[9] 盧曉娟.云計算與未來圖書館 [J].數(shù)字信息資源建設,2009,(2):23-24.
[10]周 舒,張嵐嵐.云計算改善數(shù)字圖書館用戶體驗初探[J].圖書館學研究,2009,(4):28-30,36.
[11]Rosenberg D.Library of Congress test drives cloud storage[EB/OL].http://news.cnet.com/8301-13846_31028628062.html.2009-11-12.
[12]李開復.云計算[J].中國教育網(wǎng)絡,2008,(6):34.
[13]張 瑩.“云計算”技術(shù)在高校資源建設中的應用初探[J].科技資訊,2009,(9):219-220.
[14]孫 衛(wèi).圖書館在云時代的思考[J].數(shù)字圖書館論壇,2009,(6):35-41.
[15]Using IPv6 for hybrid cloud computing.[EB/OL].http://www.zuia.org/xwdt/gjdt/45cbe003f2045c6a47646102ff76445f.html.2009-11-12.