摘要:隨著數(shù)字圖書館存儲(chǔ)數(shù)據(jù)量的快速增長,要不斷滿足對存儲(chǔ)資源的管理、異構(gòu)平臺(tái)的數(shù)據(jù)共享、存儲(chǔ)系統(tǒng)可用性和可擴(kuò)展性等方面的要求??梢娞摂M存儲(chǔ)技術(shù)在圖書館的應(yīng)用無疑極大地推動(dòng)數(shù)字圖書館建設(shè)與發(fā)展。
關(guān)鍵詞:虛擬存儲(chǔ)化;數(shù)字圖書館;存儲(chǔ)區(qū)域網(wǎng)
1 虛擬存儲(chǔ)化概念
所謂虛擬存儲(chǔ)(Virtul Storage)技術(shù),是指把多個(gè)物理上獨(dú)立存在的存儲(chǔ)體通過軟件或硬件的手段集中管理起來,形成一個(gè)邏輯上的虛擬存儲(chǔ)單元供主機(jī)訪問。這個(gè)虛擬邏輯單元的存儲(chǔ)容量是它所集中管理的各物理存儲(chǔ)體的存儲(chǔ)容量之和,而它的訪問帶寬則在一定程度上接近各個(gè)物理存儲(chǔ)體的訪問帶寬之和。
虛擬存儲(chǔ)技術(shù)是用一種設(shè)備來完全模擬另一種物理設(shè)備的存儲(chǔ)方式。比如,在虛擬存儲(chǔ)中,可能用一個(gè)磁帶驅(qū)動(dòng)器來模擬一個(gè)物理的磁盤或磁盤子系統(tǒng)。在這種虛擬存儲(chǔ)架構(gòu)中,互相獨(dú)立的虛擬設(shè)備和物理設(shè)備都可以被當(dāng)作同樣的存儲(chǔ)設(shè)備來訪問。虛擬存儲(chǔ)是靈活的、具有可伸縮性的,它不僅具有更好的可管理性,更重要的是它能夠?yàn)榇鎯?chǔ)用戶節(jié)省極大的投資。
虛擬存儲(chǔ)是將存儲(chǔ)系統(tǒng)虛擬化,在存儲(chǔ)系統(tǒng)的基本物理存儲(chǔ)單元層到應(yīng)用層之間增加一個(gè)或多個(gè)硬件的或軟件的虛擬層,在各種不同類型的應(yīng)用環(huán)境中更方便、更經(jīng)濟(jì)地使用存儲(chǔ)系統(tǒng)。
虛擬存儲(chǔ)實(shí)際上是邏輯存儲(chǔ),是一種智能、有效地管理存儲(chǔ)數(shù)據(jù)的方式。虛擬存儲(chǔ)克服了物理存儲(chǔ)的局限,它可以把物理設(shè)備變成完全不同的邏輯鏡像,呈現(xiàn)給用戶,既充分利用了物理設(shè)備的優(yōu)勢,如高性能、高可用,又打破了物理設(shè)備本身不可克服的局限性。從用戶角度看,使用存儲(chǔ)空間而不是使用物理存儲(chǔ)硬件,管理存儲(chǔ)空間而不是管理物理存儲(chǔ)部件,這就是虛擬存儲(chǔ)化的概念。
2 虛擬存儲(chǔ)化特點(diǎn)
2.1 使存儲(chǔ)設(shè)備管理簡單化
虛擬存儲(chǔ)化技術(shù),讓用戶以自主、自動(dòng)的方式在磁盤或者磁帶上存儲(chǔ)數(shù)據(jù),使系統(tǒng)管理員不必再操心后端,只要關(guān)注于存儲(chǔ)空間管理即可。在虛擬化環(huán)境中,所有的存儲(chǔ)管理操作,例如系統(tǒng)升級、建立和分配虛擬磁盤、改變RAID級別、擴(kuò)充存儲(chǔ)空間等都可自動(dòng)實(shí)現(xiàn),存儲(chǔ)管理變得輕松簡單。虛擬存儲(chǔ)提供了一個(gè)大容量存儲(chǔ)系統(tǒng)集中管理的手段,由網(wǎng)絡(luò)中的一個(gè)環(huán)節(jié)進(jìn)行統(tǒng)一管理,避免了由于存儲(chǔ)設(shè)備擴(kuò)充所帶來的管理方面的麻煩。
2.2 有較好的設(shè)備兼容性
虛擬存儲(chǔ)技術(shù)為存儲(chǔ)資源管理提供了更好的靈活性,可以將不同類型的存儲(chǔ)設(shè)備集中管理使用,保障了用戶以往購買的存儲(chǔ)設(shè)備的投資,在存儲(chǔ)設(shè)備的開支上可以節(jié)省一筆不小費(fèi)用。
2.3 在視頻點(diǎn)播系統(tǒng)中應(yīng)用優(yōu)勢明顯
虛擬存儲(chǔ)對于視頻點(diǎn)播系統(tǒng)最有價(jià)值的特點(diǎn)是:可以大大提高存儲(chǔ)系統(tǒng)整體訪問帶寬。存儲(chǔ)系統(tǒng)是由多個(gè)存儲(chǔ)模塊組成,而虛擬存儲(chǔ)系統(tǒng)可以很好地進(jìn)行負(fù)載平衡,把每一次數(shù)據(jù)訪問所需的帶寬合理地分配到各個(gè)存儲(chǔ)模塊上,這樣系統(tǒng)的整體訪問帶寬就增大了。例如,一個(gè)存儲(chǔ)系統(tǒng)中有兩個(gè)存儲(chǔ)模塊,每一個(gè)存儲(chǔ)模塊的訪問帶寬為50MBps,則這個(gè)存儲(chǔ)系統(tǒng)的總訪問帶寬就可以接近各存儲(chǔ)模塊帶寬之和,即100MBps。這種帶寬特點(diǎn)用于傳送非圖像文件時(shí)更顯速度優(yōu)勢。
3 虛擬存儲(chǔ)技術(shù)種類
根據(jù)主機(jī)、存儲(chǔ)設(shè)備和存儲(chǔ)網(wǎng)絡(luò)所處的位置,虛擬存儲(chǔ)可以分為三個(gè)層次:基于服務(wù)器主機(jī)的虛擬存儲(chǔ)、基于存儲(chǔ)設(shè)備的虛擬存儲(chǔ)、基于網(wǎng)絡(luò)的虛擬存儲(chǔ)。三種方式有各自的優(yōu)缺點(diǎn),不同條件的圖書館可根據(jù)實(shí)際選用。目前,使用較多的是基于網(wǎng)絡(luò)的虛擬存儲(chǔ)方式。
4 虛擬化存儲(chǔ)技術(shù)在圖書館數(shù)字資源建設(shè)中應(yīng)用
近年來,各館都在建設(shè)數(shù)字圖書館方面投入一定的人力、物力,目前圖書館數(shù)字資源占圖書館館藏的比重越來越大,數(shù)字圖書館已從概念發(fā)展到實(shí)際應(yīng)用。圖書館的數(shù)字化資源一般包括數(shù)字圖書、數(shù)字期刊、數(shù)字古籍、多媒體視頻數(shù)據(jù)等。國內(nèi)提供數(shù)字圖書資源的公司有:北京世紀(jì)超星公司,圖書量已達(dá)80萬冊,容量為8TB左右;北京書生之家公司,容量為5TB;北京國圖,圖書量為20萬冊,總?cè)萘繛?TB;北大方正,數(shù)據(jù)容量1TB左右。數(shù)字期刊目前國內(nèi)較普遍采用的有三家,分別是清華同方、重慶維普公司和萬方數(shù)字期刊,他們各自的電子期刊總?cè)萘慷荚?TB以上。就高校圖書館而言,一般都采購有幾家的數(shù)字資源產(chǎn)品,數(shù)字資源總存儲(chǔ)量在十幾個(gè)TB左右,而且每年都會(huì)購買新的數(shù)字圖書和數(shù)字期刊,新增存儲(chǔ)容量也有數(shù)個(gè)TB。這種數(shù)據(jù)量的增加光靠購買新的設(shè)備是不可能的,在現(xiàn)有設(shè)備條件下提高它們的利用率,可以一定程度解決數(shù)據(jù)存儲(chǔ)問題。由此可見,圖書館是網(wǎng)絡(luò)技術(shù)和存儲(chǔ)技術(shù)最大的受益者,虛擬存儲(chǔ)技術(shù)在圖書館的應(yīng)用無疑極大地推動(dòng)數(shù)字圖書館的建設(shè)與發(fā)展。
由于虛擬存儲(chǔ)具有的特點(diǎn),虛擬存儲(chǔ)技術(shù)正逐步成為共享存儲(chǔ)管理的主流技術(shù),其具體應(yīng)用如下:
數(shù)據(jù)復(fù)制。在數(shù)據(jù)復(fù)制方面已經(jīng)發(fā)展出多種鏡像方法。許多存儲(chǔ)供應(yīng)商提供三層鏡像結(jié)構(gòu),有的公司甚至能夠提供4層鏡像結(jié)構(gòu)。全面鏡像能在另一個(gè)驅(qū)動(dòng)器上產(chǎn)生完全相同的副本。有時(shí),在不同地理位置上存在的副本驅(qū)動(dòng)器,通過IP地址相連能產(chǎn)生遠(yuǎn)程或異步副本,實(shí)現(xiàn)遠(yuǎn)距離數(shù)據(jù)遷移,這對于不同規(guī)模的圖書館來說,都是一種極為重要的數(shù)據(jù)災(zāi)難恢復(fù)工具。
實(shí)時(shí)數(shù)據(jù)恢復(fù)。利用磁帶來還原數(shù)據(jù)是數(shù)據(jù)恢復(fù)工作的主要手段,但常常難以成功。數(shù)據(jù)管理工作中一個(gè)重要的發(fā)展新方向是將近期內(nèi)的備份數(shù)據(jù)轉(zhuǎn)移到磁盤介質(zhì),而非磁帶介質(zhì)。這遠(yuǎn)比用磁帶恢復(fù)數(shù)據(jù)安全可靠。同時(shí),整卷數(shù)據(jù)都能被快速恢復(fù)。這對于隨書光盤鏡像文件的管理特別有意義。
應(yīng)用整合。存儲(chǔ)管理發(fā)展的又一新方向是將服務(wù)貼近應(yīng)用。沒有一個(gè)信息技術(shù)領(lǐng)域的管理人員會(huì)單純出于對存儲(chǔ)設(shè)備的興趣而去購買它。存儲(chǔ)設(shè)備是用來服務(wù)于應(yīng)用的,比如數(shù)據(jù)庫、通訊系統(tǒng)等等。通過將存儲(chǔ)設(shè)備和關(guān)鍵的企業(yè)應(yīng)用行為相整合,能夠獲取更大的價(jià)值,同時(shí),大大減少操作過程中遇到的難題。
虛擬化技術(shù)可以減少存儲(chǔ)系統(tǒng)的管理開銷,實(shí)現(xiàn)存儲(chǔ)系統(tǒng)的數(shù)據(jù)共享,提供透明的高可用性和可擴(kuò)展性,優(yōu)化使用存儲(chǔ)系統(tǒng)。圖書館對存儲(chǔ)的要求也不再是單純的購買行為,而是把眼光更多地投在它在異構(gòu)環(huán)境下的應(yīng)用與管理上??梢钥闯?,存儲(chǔ)虛擬化、存儲(chǔ)網(wǎng)絡(luò)化是存儲(chǔ)技術(shù)與存儲(chǔ)管理發(fā)展的必然趨勢。
5 虛擬存儲(chǔ)技術(shù)催生下數(shù)字圖書館建設(shè)主流模式
經(jīng)過對數(shù)字圖書館各種主要技術(shù)的研究和相關(guān)技術(shù)的發(fā)展,為建立現(xiàn)實(shí)的數(shù)字圖書館打下重要技術(shù)基礎(chǔ),在不遠(yuǎn)的將來我國將會(huì)在虛擬存儲(chǔ)技術(shù)催生下建立一批現(xiàn)代科技型數(shù)字圖書館,主要有三種類型:
特種館藏型模式:將自己圖書館的珍藏(包括善本古籍珍藏)或特種館藏(包括圖片、聲音、音樂、影視等各種載體)的資料進(jìn)行數(shù)字化,提供網(wǎng)上共享。例如:以美國SPE協(xié)會(huì)出版的SPE會(huì)議論文和美國石油文摘等。
服務(wù)主導(dǎo)型模式:這種服務(wù)模式的資源一般由三部分組成:a. 圖書館本身的數(shù)字化特種館藏;b. 商用的網(wǎng)上聯(lián)機(jī)電子出版物或數(shù)據(jù)庫(包括在本館的資源鏡像站);c. 在因特網(wǎng)上有用的文獻(xiàn)信息資源。它們用統(tǒng)一的界面向讀者提供服務(wù)。例如:目前國外有些大學(xué)的數(shù)字圖書館模式。
文獻(xiàn)型模式:一些文獻(xiàn)服務(wù)公司、出版社、代理商等建立的一種供商用文獻(xiàn)型的數(shù)字圖書館,提供全文的期刊、雜志、電子圖書(也包括音樂和影視資料)等,一般既有索引數(shù)據(jù)庫,又有全文的對象數(shù)據(jù)庫。
參考文獻(xiàn)
[1]謝長生.SAN網(wǎng)絡(luò)級存儲(chǔ)虛擬化實(shí)現(xiàn)方式的研究與設(shè)計(jì).計(jì)算機(jī)應(yīng)用研究,2004(4)
[2]周粵.淺析虛擬存儲(chǔ)技術(shù)及其IPSAN實(shí)現(xiàn)方式.現(xiàn)代計(jì)算機(jī),2003(8)
[3]周曉英.關(guān)于我國數(shù)字圖書館建設(shè)若干問題的思考.情報(bào)資料工作,2002,(3)
[4]索傳軍.論網(wǎng)絡(luò)化圖書館的信息資源建設(shè).圖書館,1999,(1)
[5]杜寶娟.試論圖書館的數(shù)字化建設(shè). 天津職業(yè)技術(shù)師范學(xué)院學(xué)報(bào),2001(4):52-53.