劉亞莉
關(guān)鍵詞:大數(shù)據(jù)環(huán)境;數(shù)字圖書館;信息服務(wù)資源;整合存儲(chǔ)
摘要:為了應(yīng)對數(shù)據(jù)量不斷增大的多類型信息資源,圖書館采用了資源整合與存儲(chǔ)技術(shù)。文章闡述了大數(shù)據(jù)環(huán)境下圖書館信息服務(wù)資源整合存儲(chǔ)的意義,提出了圖書館大數(shù)據(jù)資源整合的存儲(chǔ)策略,并在此基礎(chǔ)上設(shè)計(jì)了數(shù)字圖書館信息資源云存儲(chǔ)系統(tǒng)。
中圖分類號:G250文獻(xiàn)標(biāo)識(shí)碼:A文章編號:1003-1588(2017)11-0090-02
隨著新興的物聯(lián)網(wǎng)技術(shù)、云計(jì)算技術(shù)以及社交軟件的快速發(fā)展,衍生數(shù)據(jù)的增長速度驚人,網(wǎng)絡(luò)中充斥著海量數(shù)據(jù),這些都預(yù)示著大數(shù)據(jù)時(shí)代的來臨。人們的生產(chǎn)生活已經(jīng)離不開數(shù)字化信息,而在海量數(shù)據(jù)中篩選出有效數(shù)據(jù)的相關(guān)技術(shù)已經(jīng)成為專家學(xué)者重點(diǎn)關(guān)注的問題[1]。值得注意的是,作為傳統(tǒng)圖書信息資源提供者的圖書館也應(yīng)該與時(shí)俱進(jìn),嘗試獲取更為準(zhǔn)確和有效的數(shù)據(jù)信息。顯然,圖書館應(yīng)該依靠海量圖書資源平臺(tái),將大數(shù)據(jù)處理技術(shù)與數(shù)字圖書館服務(wù)理念進(jìn)行緊密結(jié)合,積極探究數(shù)據(jù)的獲取、整理以及存儲(chǔ)等技術(shù),為用戶提供更加有效和人性化的服務(wù)。
1大數(shù)據(jù)環(huán)境下圖書館信息服務(wù)資源整合存儲(chǔ)的意義
1.1為資源共享提供技術(shù)保障
在整合和管理館藏資源后,圖書館方面還需要借助先進(jìn)的信息處理技術(shù)維護(hù)和存儲(chǔ)圖書文獻(xiàn)資源,尤其是非常稀缺的光盤制品和微縮文獻(xiàn)制品等。由于采用的存儲(chǔ)技術(shù)具有運(yùn)行穩(wěn)定性高、存儲(chǔ)技術(shù)成熟、存儲(chǔ)壽命長、存儲(chǔ)應(yīng)用面廣以及存儲(chǔ)密度大等優(yōu)勢[2],所以筆者嘗試將RSS技術(shù)、標(biāo)簽技術(shù)以及Web2.0技術(shù)等應(yīng)用在圖書館存儲(chǔ)工作中,從而幫助圖書館實(shí)現(xiàn)用戶信息推送服務(wù)、用戶個(gè)性化定制服務(wù)、擴(kuò)大檢索服務(wù)、新書發(fā)送服務(wù)以及相關(guān)信息鏈接服務(wù)等[3]。正是由于上述服務(wù)提供的技術(shù)支持,才能為圖書館與用戶之間的互動(dòng)交流提供有利環(huán)境,才能讓用戶有更多機(jī)會(huì)參與到信息交流過程中來,并根據(jù)個(gè)人的信息需求獲取相應(yīng)的信息資源服務(wù)。
1.2便于文獻(xiàn)資源的提供和利用
需要說明的是,很多歷史文獻(xiàn)資源極其珍貴,尤其是原稿只有一份時(shí),不可能滿足用戶的閱讀需求,而且相互傳遞閱讀也不可能實(shí)現(xiàn)。然而,一本一千多頁的16K的書籍,經(jīng)過數(shù)字化處理之后就可以利用六張微縮平片進(jìn)行存儲(chǔ),而且這些平片可以直接進(jìn)行傳送閱讀。當(dāng)然,關(guān)于音像制品、微縮制品以及光盤的管理和存儲(chǔ)技術(shù)就顯得十分重要,如果沒有有效的管理和存儲(chǔ)技術(shù),就會(huì)對資源管理和共享產(chǎn)生不利的影響。
2圖書館大數(shù)據(jù)信息服務(wù)資源整合存儲(chǔ)系統(tǒng)設(shè)計(jì)
2.1系統(tǒng)總體架構(gòu)
總體來講,基于數(shù)字圖書館的云存儲(chǔ)資源模型主要包括應(yīng)用服務(wù)部分、平臺(tái)服務(wù)部分以及基礎(chǔ)設(shè)施部分等,這些都參照層次進(jìn)行分類[4]。其中,應(yīng)用服務(wù)部分主要提供具體的系統(tǒng)功能,平臺(tái)服務(wù)部分主要提供系統(tǒng)監(jiān)控功能、用戶管理功能以及為應(yīng)用服務(wù)部分提供專門接口等。形象地說,基于數(shù)字圖書館的云存儲(chǔ)資源模型就是一種云端類型的網(wǎng)絡(luò),該網(wǎng)絡(luò)可以提供高并發(fā)的網(wǎng)絡(luò)計(jì)算服務(wù)以及網(wǎng)絡(luò)功能服務(wù)等,該模型可以利用分布式技術(shù)和虛擬化技術(shù)擴(kuò)展Web網(wǎng)絡(luò)服務(wù)器、應(yīng)用服務(wù)器、存儲(chǔ)服務(wù)器以及數(shù)據(jù)庫服務(wù)器等,還可以在不同區(qū)域的數(shù)字圖書館之間提供多種檢索、計(jì)算以及存儲(chǔ)服務(wù)等。具體的區(qū)域數(shù)字圖書館資源云存儲(chǔ)模型圖見圖1。
基礎(chǔ)設(shè)施服務(wù)層(即IaaS層)是區(qū)域數(shù)字圖書館云存儲(chǔ)模型的基礎(chǔ)部分,支撐著整個(gè)模型框架的運(yùn)作,其利用虛擬化技術(shù)將硬件資源和相應(yīng)管理功能進(jìn)行有機(jī)結(jié)合。該服務(wù)層包括兩個(gè)方面的功能:一是利用網(wǎng)絡(luò)硬件設(shè)備、存儲(chǔ)設(shè)備以及主機(jī)進(jìn)行虛擬化、抽象化以及分布式處理,將數(shù)字圖書館的各種硬件設(shè)備整合在一起,共同封裝為基于云存儲(chǔ)的基礎(chǔ)服務(wù)設(shè)施,用戶只需將其當(dāng)成一個(gè)整體即可,當(dāng)然也無須知道是哪部分設(shè)備提供服務(wù),只要發(fā)布調(diào)用設(shè)備命令就可以獲取到所需的硬件和軟件資源。二是借助虛擬化技術(shù)以及抽象化技術(shù),基礎(chǔ)設(shè)施服務(wù)層為用戶提供備份管理、計(jì)算服務(wù)管理、數(shù)據(jù)存儲(chǔ)管理以及負(fù)載管理等服務(wù)。
平臺(tái)服務(wù)層(即PaaS層)是區(qū)域數(shù)字圖書館云存儲(chǔ)模型的中間部分,又稱為云中間件,其將系統(tǒng)的復(fù)用性軟件和通用性軟件進(jìn)行整合,從而實(shí)現(xiàn)為區(qū)域數(shù)字圖書館提供PaaS層服務(wù)。該服務(wù)層主要提供以下幾個(gè)方面的功能:一是提供系統(tǒng)信息管理接口功能,如提供課題管理、專題管理、資源管理以及簡報(bào)管理等功能。二是提供平臺(tái)核心服務(wù)接口功能,如提供行為分析和統(tǒng)計(jì)功能、任務(wù)調(diào)度功能、資源整合功能以及檢索功能等[5]。三是提供信息發(fā)布接口服務(wù),如提供用戶定制、發(fā)布信息檢索、系統(tǒng)資源導(dǎo)航以及資源專題發(fā)布功能等。四是提供信息規(guī)劃接口功能,如提供信息資源規(guī)劃以及資源體系規(guī)劃等功能。五是系統(tǒng)信息資源加工接口功能,如提供信息生產(chǎn)的分析和統(tǒng)計(jì)功能以及信息內(nèi)容編發(fā)功能等。六是提供資源庫的發(fā)布接口功能。
應(yīng)用服務(wù)層(即SaaS層)是區(qū)域數(shù)字圖書館云存儲(chǔ)模型高層部分,可以為區(qū)域數(shù)字圖書館提供所需的服務(wù)和應(yīng)用軟件支持。借助應(yīng)用服務(wù)層提供的軟件功能,區(qū)域數(shù)字圖書館可以根據(jù)用戶具體需求,將系統(tǒng)功能以租用的方式提供給用戶或其他組織。具體來講,系統(tǒng)提供的服務(wù)功能主要包括RSS信息服務(wù)、信息訂閱推送服務(wù)、系統(tǒng)信息檢索服務(wù)、個(gè)性化用戶信息服務(wù)、系統(tǒng)公共信息服務(wù)、企業(yè)競爭監(jiān)管服務(wù)、用戶參考和咨詢服務(wù)、技術(shù)評估服務(wù)以及高新技術(shù)查新服務(wù)等。
用戶權(quán)限使用計(jì)費(fèi)模塊主要提供用戶管理、系統(tǒng)計(jì)費(fèi)、用戶權(quán)限確認(rèn)以及系統(tǒng)支付等功能。系統(tǒng)管理以及業(yè)務(wù)支持模塊主要提供系統(tǒng)管理以及業(yè)務(wù)支持的相關(guān)功能,從而保證整個(gè)系統(tǒng)能夠正常運(yùn)行??蛻舳四K是整個(gè)數(shù)字圖書館的最高層,不僅為用戶提供登錄功能,而且還可以直接與服務(wù)器進(jìn)行交互,該模塊不再局限于個(gè)人計(jì)算機(jī),只要是能夠訪問云端的終端設(shè)備都可以登錄客戶端。
2.2云存儲(chǔ)模型結(jié)構(gòu)分析
云存儲(chǔ)模塊是一種集合了客戶端、服務(wù)器、存儲(chǔ)設(shè)備、應(yīng)用軟件、接入網(wǎng)以及訪問接口等模塊功能的綜合型系統(tǒng),已經(jīng)不是一個(gè)功能單一的存儲(chǔ)設(shè)備。顯然,存儲(chǔ)功能是整個(gè)云存儲(chǔ)模型的核心功能,并且借助應(yīng)用軟件對外提供數(shù)據(jù)存儲(chǔ)服務(wù)以及用戶使用功能等。云存儲(chǔ)模型的具體結(jié)構(gòu)示意圖見圖2。endprint
云存儲(chǔ)系統(tǒng)模型主要有四層結(jié)構(gòu):第一層為存儲(chǔ)層,即云存儲(chǔ)的底層。需要注意的是,云存儲(chǔ)設(shè)備的結(jié)點(diǎn)分布廣泛且數(shù)量巨大,而結(jié)點(diǎn)之間可以借助互聯(lián)網(wǎng)、光纖網(wǎng)絡(luò)以及廣域網(wǎng)進(jìn)行連接。在存儲(chǔ)設(shè)備中還會(huì)配備存儲(chǔ)的統(tǒng)一管理設(shè)備,可以實(shí)現(xiàn)針對存儲(chǔ)設(shè)備的虛擬化管理。傳輸層還能實(shí)現(xiàn)冗余管理、硬件設(shè)備維護(hù)以及運(yùn)行狀態(tài)監(jiān)管等功能。第二層為基礎(chǔ)管理層,該層為云存儲(chǔ)模型的核心部分,也是系統(tǒng)功能實(shí)現(xiàn)最為復(fù)雜的部分?;A(chǔ)管理層可以利用分布式技術(shù)、集群技術(shù)以及網(wǎng)絡(luò)計(jì)算技術(shù)等實(shí)現(xiàn)各個(gè)存儲(chǔ)設(shè)備之間的數(shù)據(jù)交互,從而實(shí)現(xiàn)將多個(gè)存儲(chǔ)設(shè)備進(jìn)行集合并統(tǒng)一提供數(shù)據(jù)服務(wù),還能夠保證數(shù)據(jù)交互的速度更快、性能更好以及穩(wěn)定性更強(qiáng)。此外,CDN類型的內(nèi)容分發(fā)系統(tǒng)以及數(shù)據(jù)加密技術(shù)還能夠保證系統(tǒng)數(shù)據(jù)的完整性和安全型,以及私密數(shù)據(jù)不能被無權(quán)限的用戶訪問,與此同時(shí),還可以利用數(shù)據(jù)備份功能、數(shù)據(jù)容災(zāi)功能保障存儲(chǔ)數(shù)據(jù)的安全,以防存儲(chǔ)數(shù)據(jù)的損壞和丟失。第三層為應(yīng)用程序接口層,該層為云存儲(chǔ)模型中最為靈活和多變的部分。云存儲(chǔ)提供商可以根據(jù)不同用戶的應(yīng)用需求,開發(fā)出不同的用戶服務(wù)接口,從而提供不同的服務(wù),如可以提供遠(yuǎn)程數(shù)據(jù)備份、視頻監(jiān)控、網(wǎng)絡(luò)硬盤存儲(chǔ)、視頻點(diǎn)播以及IPTV平臺(tái)等功能。第四層為訪問層,該層是用戶與云存儲(chǔ)模型之間的鏈接部分。該層能夠利用公用應(yīng)用接口,保證有權(quán)限的用戶可以登錄云存儲(chǔ)系統(tǒng),從而實(shí)現(xiàn)云存儲(chǔ)系統(tǒng)的相應(yīng)功能。由于云存儲(chǔ)提供商的應(yīng)用目的和單位性質(zhì)不盡相同,所以其提供的訪問類型以及訪問方式差別也較大。
3結(jié)語
資源共享模式是大數(shù)據(jù)時(shí)代圖書館發(fā)展的必然趨勢,同時(shí)也是現(xiàn)階段發(fā)展的唯一途徑。借助資源整合技術(shù),圖書館不僅可以實(shí)現(xiàn)信息資源的規(guī)?;幚?,還可以實(shí)現(xiàn)本館與其他圖書館在同一平臺(tái)上用戶和資源的統(tǒng)一管理,從而最大限度地實(shí)現(xiàn)資源共享的目的。而存儲(chǔ)功能就是借助先進(jìn)技術(shù),將文獻(xiàn)資源按照一定的次序進(jìn)行管理和存儲(chǔ)處理,讓相同或相似的文獻(xiàn)資源緊密關(guān)聯(lián),這也是基于文獻(xiàn)資源的存儲(chǔ)處理的核心所在。
參考文獻(xiàn):
[1]溫浩宇,李京京.大數(shù)據(jù)時(shí)代的數(shù)字圖書館異構(gòu)數(shù)據(jù)集成研究[J].圖書館雜志,2012(9):138-141.
[2]吳珺,謝樹泉,工春枝.基于語義的隧聯(lián)網(wǎng)數(shù)據(jù)整合方法[J].智能系統(tǒng)學(xué)報(bào),2014(6):209-213.
[3]樊偉紅,李晨暉,張興旺,等.圖書館需要怎樣的“大數(shù)據(jù)”[J].圖書館雜志,2012(11):63-71.
[4]張文彥,武瑞原,于潔.大數(shù)據(jù)時(shí)代的圖書館初探[J].圖書與情報(bào),2012(6):15-21.
[5]韓翠峰.大數(shù)據(jù)帶給圖書館的影響與挑戰(zhàn)[J].圖書與情報(bào),2012(5):37-40.
(編校:崔萌)endprint