□陳放 王曉平
大連工業(yè)大學(xué),大連,116026
“圖書館統(tǒng)計云服務(wù)”是一種利用大規(guī)模的低成本計算單元,通過 IP網(wǎng)絡(luò)相連,為多個用戶提供的統(tǒng)計服務(wù)[1]。目前圖書館的“云”概念已經(jīng)騰空而起,“雨”是靠無數(shù)云相互碰撞產(chǎn)生的。“云”和“雨”形成的氣象現(xiàn)象也可以用來解釋圖書館的“云服務(wù)”形成過程。OCLC已經(jīng)將圖書館的“云”形成了“雨”,著陸到我們圖書館世界的地面上,圖書館的上空究竟還有多少“云”能夠形成“雨”?這不能以人們的主觀意愿為轉(zhuǎn)移,這與自然界中“云”的形成過程十分相似,至于“云”是否能夠形成“雨”取決于許多客觀條件。圖書館“云”和“雨”的形成與著陸是有過程的,需要圖書館人在無數(shù)“云”朵中穿行與相互碰撞才能形成。
“全國高校圖書館事實數(shù)據(jù)庫”系統(tǒng)(以下簡稱事實數(shù)據(jù)庫系統(tǒng)),就是一個典型的“統(tǒng)計云服務(wù)”的成功應(yīng)用,只不過我們過去沒有用“云服務(wù)”的理念去定義這種服務(wù)。事實數(shù)據(jù)庫系統(tǒng)是在教育部高等學(xué)校圖書情報工作指導(dǎo)委員會的領(lǐng)導(dǎo)下,2005年以來采用“統(tǒng)計云服務(wù)方式”在全國高校范圍內(nèi)實施。全國各高校圖書館都能夠通過互聯(lián)網(wǎng),登錄并使用安裝在北京大學(xué)圖書館計算機服務(wù)器上的事實數(shù)據(jù)庫系統(tǒng),只要認(rèn)真及時填報相關(guān)數(shù)據(jù),就能檢索并統(tǒng)計高校圖書館的建設(shè)、管理與服務(wù)情況,為各高校圖書館提供本統(tǒng)計與評估服務(wù),從 1999年至今,全國高校圖書館的統(tǒng)計數(shù)據(jù)主要來源于該系統(tǒng)。
在“統(tǒng)計云服務(wù)”的過程中,我們經(jīng)過多年與各種“云”的相互碰撞,受到商業(yè)智能(BI,Business Intelligence)的啟發(fā),使我們想到商業(yè)企業(yè)統(tǒng)計可以有專門的統(tǒng)計分析工具,圖書館統(tǒng)計工作為什么不能有專業(yè)的統(tǒng)計工具呢?我們從事實數(shù)據(jù)庫系統(tǒng)的建設(shè)與應(yīng)用中看到了“統(tǒng)計云服務(wù)”所具有的實際應(yīng)用價值和發(fā)展空間。
云計算給圖書館管理帶來了諸多挑戰(zhàn),如統(tǒng)計數(shù)據(jù)的保密和隱私;數(shù)據(jù)的有效遷移;統(tǒng)計結(jié)果的獲取方式及存儲方式;數(shù)據(jù)的知識產(chǎn)權(quán)等等?!皥D書館應(yīng)用云計算并沒有現(xiàn)成的道路可走”[2],對于不同的云服務(wù)會有不同方法、不同的解決方案。本文通過事實數(shù)據(jù)庫系統(tǒng)的開發(fā)與應(yīng)用實例,結(jié)合用戶實際需求,對云服務(wù)所面臨的挑戰(zhàn),從技術(shù)、應(yīng)用層面進(jìn)行研究和探討。
“統(tǒng)計云服務(wù)”的系統(tǒng)構(gòu)架必須建立在開放、穩(wěn)定、整合的平臺之上。該平臺應(yīng)該具有提供多層次的用戶管理、安全性控制、連接數(shù)據(jù)源以及訪問、分析和共享信息的功能。系統(tǒng)構(gòu)架猶如建房子的地基,從構(gòu)建系統(tǒng)那一刻起,就要考慮為滿足系統(tǒng)功能與性能指標(biāo),需要構(gòu)建什么樣的地基。在C/S系統(tǒng)構(gòu)架的圖書館管理集成系統(tǒng)中,系統(tǒng)構(gòu)架注重的是模塊的科學(xué)劃分及模塊之間的耦合度,以及對圖書館工作流描述的細(xì)膩程度。在“云”服務(wù)時代,我們不是一步就登上“云”端,而是一步一步走上“云”端,“全國高校圖書館事實數(shù)據(jù)庫”毋庸質(zhì)疑是一種“統(tǒng)計云服務(wù)”模式,從 1999年的單機版系統(tǒng),到 2005年的網(wǎng)絡(luò)版系統(tǒng),從其發(fā)展歷程可以清楚地描繪出其步入“云“端的軌跡。因而那些在C/S系統(tǒng)構(gòu)架設(shè)計方面積累的經(jīng)驗仍然是我們直上“云”端的寶貴財富。
“統(tǒng)計云服務(wù)”的開放性是其生存、發(fā)展與應(yīng)用的基本保證。開放性的云服務(wù)系統(tǒng)應(yīng)該采用B/S(Broser/Server)結(jié)構(gòu)進(jìn)行開發(fā)與設(shè)計,同時應(yīng)解決好系統(tǒng)構(gòu)架設(shè)計中可能存在的問題。
“一朵云”是由 N個云片組成的,我們假設(shè)“一朵云”是由N個圖書館組成的一個區(qū)域性圖書館;“一層云”是由N朵云組成的,我們假設(shè)“一層云”是由N個區(qū)域性圖書館組成的;顯然云層越厚,云朵聚集與碰撞的機會就越多,形成雨的概率就越大,即圖書館管理層次越多可供聚合的數(shù)據(jù)就越多,信息生產(chǎn)量就越大。因而,可以說“云”是“云服務(wù)”的基本元素。一個“統(tǒng)計云服務(wù)”系統(tǒng)至少應(yīng)設(shè)計為三層用戶管理,即基礎(chǔ)層、區(qū)域?qū)雍椭骺貙印;A(chǔ)層提供每個圖書館的統(tǒng)計服務(wù)管理,區(qū)域?qū)硬坏軌蛱峁┗A(chǔ)層服務(wù),還能夠?qū)Ρ緟^(qū)域內(nèi)所有圖書館的統(tǒng)計數(shù)據(jù)進(jìn)行統(tǒng)計服務(wù)管理,主控云層不但能夠提供轄區(qū)內(nèi)所有區(qū)域圖書館的統(tǒng)計服務(wù),還能夠?qū)爡^(qū)內(nèi)所有區(qū)域圖書館的統(tǒng)計數(shù)據(jù)進(jìn)行統(tǒng)計服務(wù)管理。即基礎(chǔ)層是區(qū)域?qū)拥淖蛹?區(qū)域?qū)邮侵骺貙拥淖蛹?。從目前的需求來?暫時各層之間沒有交集,但并不意味今后各層之間沒有交集,OCLC的客戶云組織,由于圖書館屬性的多元化,使各層級之間具有典型的交集層結(jié)構(gòu)。例如:事實數(shù)據(jù)庫系統(tǒng)的云層管理分為三層:基礎(chǔ)云層是由經(jīng)教育部注冊、登記、批準(zhǔn)的普通高校和高職院校圖書館,利用該系統(tǒng)填報本館統(tǒng)計數(shù)據(jù)組成的云層;區(qū)域云層是由各省、市高校圖書情報工作指導(dǎo)委員會,利用基礎(chǔ)云層提供的數(shù)據(jù)組成的云層;主控云層是:教育部高校圖書情報工作指導(dǎo)委員會,利用區(qū)域云層提供的數(shù)據(jù)組成的云層;我們通過多云層多用戶權(quán)限管理的方法,根據(jù)工作需要授予各云層用戶不同的權(quán)限。主控云層具有編輯系統(tǒng)重要的配置參數(shù)的權(quán)限,如:統(tǒng)計項目名稱和統(tǒng)計代碼名稱、編輯數(shù)據(jù)字典、定義統(tǒng)計公式等權(quán)限,并具有按院校分類或省、市檢索和統(tǒng)計全國各高校圖書館不同年度的館舍建設(shè)情況、設(shè)備與設(shè)施情況、館員年齡與學(xué)歷結(jié)構(gòu)情況、讀者年齡與學(xué)歷結(jié)構(gòu)情況、文獻(xiàn)資源分類與數(shù)量、讀者服務(wù)情況等,并可按照院校分類與統(tǒng)計項目分別列出統(tǒng)計數(shù)據(jù)排行榜,也可按照省、市與統(tǒng)計項目分別列出統(tǒng)計數(shù)據(jù)排行榜等。區(qū)域云層沒有編輯系統(tǒng)重要的配置參數(shù)權(quán)限,但具有主控云層除此之外的其他權(quán)限。基礎(chǔ)云層除具有區(qū)域云層的權(quán)限之外,還具有填報和編輯本館統(tǒng)計數(shù)據(jù)的權(quán)限。通過分析我們認(rèn)為多層、多用戶管理的系統(tǒng)構(gòu)架是“統(tǒng)計云服務(wù)”的基本構(gòu)架。
層級管理為系統(tǒng)權(quán)限管理的科學(xué)性與安全性奠定了基礎(chǔ)。處于基礎(chǔ)層的圖書館通過系統(tǒng)授權(quán)可以完成對本館數(shù)據(jù)的遷移或錄入,但是不能對其他圖書館的數(shù)據(jù)進(jìn)行上述操作,從而解決了圖書館統(tǒng)計數(shù)據(jù)的保密問題,由于統(tǒng)計數(shù)據(jù)不涉及到讀者個人的閱讀隱私,因而無需擔(dān)憂個人隱私的外泄。
各圖書館把本館的數(shù)據(jù)遷移到“云”中管理,總不像放到“家”中管理那么放心。其實,能夠提供“云”服務(wù)的公共事業(yè)單位或企業(yè),都比每個圖書館更注重系統(tǒng)的安全性和保密性。他們所構(gòu)造的“云服務(wù)”平臺,無論在系統(tǒng)的硬件設(shè)施方面還是在軟件方面都會采取一系列安全措施。在中國提供“云”服務(wù)的企業(yè)與用戶之間要建立一種完全信任機制還有一段漫長的路要走,主機托管的信任機制在中國已經(jīng)逐步形成,但是軟件系統(tǒng)的托管機制即云服務(wù)的信任機制還需要通過政府或者群團組織進(jìn)行推動。
對于本地圖書館管理集成系統(tǒng)安全性和可靠性管理所采取的措施是基于局域網(wǎng)范圍內(nèi)的,對于廣域網(wǎng)來說,“開放”的服務(wù)模式將使更多的圖書館受益,同時對系統(tǒng)的防護(hù)也帶來了更多的挑戰(zhàn)。在系統(tǒng)構(gòu)架設(shè)計中,值得注意的是要充分利用互聯(lián)網(wǎng)的優(yōu)勢,實現(xiàn)系統(tǒng)安全可靠運行的動態(tài)管理。例如:加強系統(tǒng)操作日志的動態(tài)管理,提高查詢系統(tǒng)操作記錄的時效性,跟蹤和防范可能進(jìn)行惡意攻擊的隱患;數(shù)據(jù)的備份機制要實現(xiàn)動態(tài)管理,對系統(tǒng)數(shù)據(jù)備份的數(shù)量和主要內(nèi)容進(jìn)行動態(tài)通報,尤其是對系統(tǒng)重要數(shù)據(jù)庫數(shù)據(jù)容量的變更、系統(tǒng)運行狀態(tài)異常信息等進(jìn)行實時、透明的提醒處理甚至可以提供短信提示等等。
從操作層面上來講,對“云服務(wù)”系統(tǒng)的易操作性要求很高,不需要人們刻意地進(jìn)行應(yīng)用指導(dǎo)服務(wù),就可以操作自如。從應(yīng)用層面上來講,對系統(tǒng)的可替代性要求很高,用戶要能夠利用原有系統(tǒng)的數(shù)據(jù)而又?jǐn)[脫原有系統(tǒng)的束縛輕松應(yīng)用云服務(wù)。這就需要系統(tǒng)構(gòu)架設(shè)計在智能化方面多動腦筋,注重系統(tǒng)在應(yīng)用層面參數(shù)配置的靈活性,在提供核心功能服務(wù)的同時,使系統(tǒng)又具有個性化,為圖書館提供基于本館統(tǒng)計工作定制的統(tǒng)計工具,使系統(tǒng)具有更大的靈活性和使用范圍?!霸品?wù)”必然要走向自然應(yīng)用的道路,才有生命力和市場價值。
B/S系統(tǒng)結(jié)構(gòu)的潛在問題是系統(tǒng)的運行效率會受到網(wǎng)絡(luò)環(huán)境的制約,為此在應(yīng)用技術(shù)領(lǐng)域,網(wǎng)上已經(jīng)公開了許多成熟的技術(shù),不過我們除了在編碼方法上采取措施之外,還要在系統(tǒng)構(gòu)架上對關(guān)鍵性的功能在數(shù)據(jù)結(jié)構(gòu)、編程方法、輸出方式、數(shù)據(jù)遷移方式等方面的技術(shù)問題進(jìn)行優(yōu)化,以提高系統(tǒng)運行效率。
“云服務(wù)”應(yīng)用的特點是圖書館可以跨行業(yè)、跨企業(yè)自主選擇和應(yīng)用用戶所需要的內(nèi)容、工具和作業(yè)平臺,其應(yīng)用價值在于提供“云服務(wù)”的系統(tǒng)是否能夠?qū)崿F(xiàn)零成本的數(shù)據(jù)遷移。數(shù)據(jù)遷移最大的問題在于數(shù)據(jù)的標(biāo)準(zhǔn)化,商業(yè)利益與零成本數(shù)據(jù)遷移是一對永恒的矛盾,這是構(gòu)成“云服務(wù)”應(yīng)用價值的最大障礙。我國圖書館所使用的自動化管理集成系統(tǒng)軟件比較雜,沒有一個像微軟那樣在市場占有率中有絕對優(yōu)勢的軟件供應(yīng)商能夠自然形成數(shù)據(jù)遷移的標(biāo)準(zhǔn),值得慶幸的是,在我國市場上流通的主流圖書館自動化系統(tǒng)所采用的著錄標(biāo)準(zhǔn)是國標(biāo),書目數(shù)據(jù)通訊格式是 CNMARC、USMARC格式,這些軟件基本上都具有書目數(shù)據(jù)和館藏數(shù)據(jù)輸出接口,比較麻煩的是文獻(xiàn)采訪和文獻(xiàn)流通等數(shù)據(jù)沒有標(biāo)準(zhǔn)的數(shù)據(jù)通訊格式,這對“統(tǒng)計云服務(wù)”帶來了困難。在短時間內(nèi),我們不可能通過圖書館行業(yè)組織或多家企業(yè)聯(lián)合制定圖書館數(shù)據(jù)遷移標(biāo)準(zhǔn),按照《云計算權(quán)利宣言》對云計算標(biāo)準(zhǔn)提出的四點要求,我們應(yīng)盡可能使用現(xiàn)有標(biāo)準(zhǔn),避免使用具有壟斷性質(zhì)的專有標(biāo)準(zhǔn)[3]。今后圖書館應(yīng)該與企業(yè)溝通,作為一種商業(yè)合作條件,讓其對圖書館系統(tǒng)管理員開放本館系統(tǒng)數(shù)據(jù)庫操作,并提供適當(dāng)?shù)募夹g(shù)培訓(xùn),使用透明的數(shù)據(jù)格式并開放系統(tǒng)數(shù)據(jù)庫設(shè)計標(biāo)準(zhǔn),讓系統(tǒng)管理員能夠及時掌握系統(tǒng)核心數(shù)據(jù)庫的數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)庫容量的變化,以便有效管理和利用本館系統(tǒng)所產(chǎn)生的數(shù)據(jù)資源,逐步實現(xiàn)圖書館自動化管理集成系統(tǒng)部分功能的云服務(wù)。
事實數(shù)據(jù)庫系統(tǒng)統(tǒng)計數(shù)據(jù)標(biāo)準(zhǔn)化的問題,是通過主控云層的有效管理實現(xiàn)的,在該云層定義并規(guī)范統(tǒng)計項目名稱、統(tǒng)計項目代碼、統(tǒng)計分類名稱和分類代碼,即基礎(chǔ)云層填報的相關(guān)數(shù)據(jù)項是由主控云層進(jìn)行管理并控制的,基礎(chǔ)云層只有使用數(shù)據(jù)標(biāo)準(zhǔn)的權(quán)限,沒有定義和規(guī)范相關(guān)數(shù)據(jù)標(biāo)準(zhǔn)的權(quán)限。區(qū)域云層在滿足主控云層要求上報的統(tǒng)計項目之外,可以對本區(qū)域內(nèi)的圖書館增加統(tǒng)計項目,其相關(guān)統(tǒng)計名稱規(guī)范標(biāo)準(zhǔn)可由區(qū)域內(nèi)的相關(guān)人員統(tǒng)一制定。
“統(tǒng)計云服務(wù)”的數(shù)據(jù)遷移問題是數(shù)據(jù)標(biāo)準(zhǔn)化的重要組成部分,圖書館的歷史數(shù)據(jù)需要遷移到“云端”才能利用統(tǒng)計云服務(wù)的統(tǒng)計功能,這必然要進(jìn)行數(shù)據(jù)遷移。數(shù)據(jù)遷移分為動態(tài)遷移和靜態(tài)遷移。動態(tài)數(shù)據(jù)遷移是指“云”與“云”之間能夠相互操作共享數(shù)據(jù)庫資源,或者“云”能夠與地面上的數(shù)據(jù)庫進(jìn)行實時的互操作,因而數(shù)據(jù)遷移的數(shù)據(jù)量不受系統(tǒng)客觀條件的限制,即可以說是無條件的數(shù)據(jù)完全遷移;靜態(tài)數(shù)據(jù)遷移是指“云”與“云”之間相互操作共享數(shù)據(jù)庫資源,是受用戶選擇條件限制的固定數(shù)據(jù)字段的內(nèi)容和數(shù)量,即可以說是有條件的數(shù)據(jù)部分遷移或者增量遷移。動態(tài)數(shù)據(jù)遷移需要企業(yè)之間完全達(dá)成默契,完全或者部分開放各自系統(tǒng)的數(shù)據(jù)庫操作,這對異構(gòu)系統(tǒng)來說,可望不可及,只有當(dāng)“云”中所有用戶使用的是同構(gòu)系統(tǒng)的時候,才能實現(xiàn)動態(tài)數(shù)據(jù)完整的遷移。因此,我們可以借助靜態(tài)數(shù)據(jù)遷移的方法,通過用戶對統(tǒng)計數(shù)據(jù)字段的選擇和統(tǒng)計內(nèi)容時間段的選擇來確定我們需要遷移到“云”端的數(shù)據(jù),再通過增量數(shù)據(jù)遷移的方式不斷充實和完善“云”端的數(shù)據(jù),從而,通過云服務(wù)特定統(tǒng)計數(shù)據(jù)結(jié)構(gòu)的獲取方式及存儲方式獲取圖書館所需要的統(tǒng)計結(jié)果。
“統(tǒng)計云服務(wù)”數(shù)據(jù)遷移接口沒有統(tǒng)一的標(biāo)準(zhǔn),但是要滿足三個基本條件:一是要有可讀取的關(guān)系型數(shù)據(jù)庫,如通過ODBC連接的數(shù)據(jù),接收 TXT文本文件、EXCEL文件、Access格式文件等[4];二是允許系統(tǒng)管理員通過數(shù)據(jù)遷移窗口對遷移數(shù)據(jù)進(jìn)行條件過濾、控制冗余數(shù)據(jù)進(jìn)入“云”數(shù)據(jù)庫;三是要做好數(shù)據(jù)遷移的斷點保護(hù),防止網(wǎng)絡(luò)中斷給數(shù)據(jù)遷移帶來損失。數(shù)據(jù)遷移的內(nèi)容主要涉及文獻(xiàn)采訪數(shù)據(jù)、文獻(xiàn)編目數(shù)據(jù)、文獻(xiàn)典藏數(shù)據(jù)、文獻(xiàn)流通數(shù)據(jù)、讀者數(shù)據(jù)等。滿足上述條件,則可實現(xiàn)零成本數(shù)據(jù)遷移。所謂零成本,是指不需要企業(yè)提供數(shù)據(jù)遷移的相關(guān)操作,而是由本館系統(tǒng)管理員通過本地系統(tǒng)的數(shù)據(jù)輸出接口和“云”服務(wù)數(shù)據(jù)接口的相關(guān)操作,完成數(shù)據(jù)遷移工作。
統(tǒng)計參數(shù)主要包括統(tǒng)計所需要的統(tǒng)計輸入項目管理、計算公式管理、數(shù)據(jù)字典管理、系統(tǒng)配置參數(shù)管理、權(quán)限管理等,由系統(tǒng)主控云層統(tǒng)一管理。
統(tǒng)計輸入項目是統(tǒng)計輸出的原始數(shù)據(jù),完整、規(guī)范、靈活的輸入項目界面是統(tǒng)計輸出內(nèi)容完整、準(zhǔn)確、靈活、多變的基本保證。
事實數(shù)據(jù)庫系統(tǒng)的統(tǒng)計輸入項目參照《普通高等學(xué)校本科教學(xué)工作水平評估指標(biāo)和等級標(biāo)準(zhǔn)》,主要涉及八個方面的統(tǒng)計類別:A圖書館基本情況,B年度經(jīng)費,C文獻(xiàn)資源積累量,D當(dāng)年新增文獻(xiàn)量,E閱覽室情況,F開館時間,G電子資源開發(fā)情況,H資源利用情況。每一統(tǒng)計類別,可以細(xì)分為二級、三級類目。通過統(tǒng)計類別的定義,規(guī)范了統(tǒng)計項目名稱、統(tǒng)計項目代碼、統(tǒng)計分類名稱和分類代碼,具體內(nèi)容請登錄“全國高校圖書館事實數(shù)據(jù)庫”[5]。各高校圖書館必須采用教育部高校圖書情報工作指導(dǎo)委員會通過主控云層制定的統(tǒng)計輸入項目填報,在保證必須填報的數(shù)據(jù)之外,可根據(jù)本館或本區(qū)域的需要,自行增加經(jīng)過定義并規(guī)范的統(tǒng)計輸入項目,但是不能減少或刪除主控云層已經(jīng)制訂的統(tǒng)計輸入項目。
計算公式管理是統(tǒng)計數(shù)據(jù)運算的必要元素,是統(tǒng)計輸出項目的科學(xué)依據(jù),不同的統(tǒng)計項目,計算公式可能是不一樣的,為了保證系統(tǒng)應(yīng)用的實用性和靈活性,事實數(shù)據(jù)庫統(tǒng)計所需要的計算公式可根據(jù)統(tǒng)計工作需要自行定義。
數(shù)據(jù)字典是保證系統(tǒng)輸入項目使用規(guī)范詞的有效工具,是防止垃圾數(shù)據(jù)進(jìn)入系統(tǒng)的重要手段,是規(guī)范統(tǒng)計條件并確定檢索關(guān)鍵詞的必要措施。
系統(tǒng)配置參數(shù)是系統(tǒng)運行所必需的參數(shù),不同的用戶系統(tǒng)運行參數(shù)可能是不一樣的,為了保證系統(tǒng)應(yīng)用的實用性和靈活性,系統(tǒng)配置參數(shù)可在系統(tǒng)參數(shù)管理中統(tǒng)一管理。
權(quán)限管理是統(tǒng)計云服務(wù)安全應(yīng)用的重要保證,統(tǒng)計云服務(wù)要根據(jù)不同云層的角色進(jìn)行權(quán)限配置,并對各云層中的各種角色進(jìn)行權(quán)限配置。
統(tǒng)計參數(shù)的統(tǒng)一、有效的管理,極大地增強了統(tǒng)計服務(wù)的實用性和靈活性,使之適應(yīng)各種環(huán)境下的統(tǒng)計需求。
統(tǒng)計條件主要包括統(tǒng)計數(shù)據(jù)輸出的限定條件,如統(tǒng)計數(shù)據(jù)的時間、區(qū)域、值域等范圍的選擇,統(tǒng)計項目、輸出項目的選擇與匹配。
靈活的統(tǒng)計參數(shù)配置和科學(xué)的統(tǒng)計限定條件選擇,使用戶能夠比較完整、準(zhǔn)確、清晰地表述自己的選擇,建立統(tǒng)計條件與統(tǒng)計需求之間比較完美的內(nèi)在聯(lián)系。在事實數(shù)據(jù)庫系統(tǒng)中有效注冊的圖書館,只要填報了本館的數(shù)據(jù),就可以查詢并統(tǒng)計其他有效注冊圖書館的相關(guān)統(tǒng)計數(shù)據(jù),可以根據(jù)本館統(tǒng)計需要,選擇某段時間范圍內(nèi)、再選擇某個區(qū)域內(nèi)、再選擇某些統(tǒng)計項目、再選擇統(tǒng)計輸出方式,系統(tǒng)即可輸出符合檢索條件的填報數(shù)據(jù)。
圖書館“統(tǒng)計云服務(wù)”要與時俱進(jìn),我們不能停留在事實數(shù)據(jù)庫系統(tǒng)現(xiàn)有的服務(wù)水平上,應(yīng)該在以下六個方面進(jìn)一步充實和完善圖書館統(tǒng)計服務(wù),即圖書館業(yè)務(wù)統(tǒng)計、圖書館館藏建設(shè)統(tǒng)計、圖書館讀者服務(wù)統(tǒng)計、圖書館人事管理統(tǒng)計、圖書館資產(chǎn)管理統(tǒng)計、圖書館運行管理統(tǒng)計等。通過事實數(shù)據(jù)庫的統(tǒng)計服務(wù)實踐,我們在技術(shù)上采用科學(xué)的統(tǒng)計參數(shù)確定方法,靈活的統(tǒng)計條件選擇界面,簡易高效的操作方式,豐富多樣的輸出內(nèi)容,使系統(tǒng)的實用性能得到了基本保障。
統(tǒng)計結(jié)果是依據(jù)統(tǒng)計條件的選擇和統(tǒng)計參數(shù)的設(shè)定所輸出的各種統(tǒng)計數(shù)據(jù),它獲取方式是通過云的服務(wù)方式展示在網(wǎng)頁上,并可通過用戶所選擇的輸出方式獲取并存儲統(tǒng)計結(jié)果。統(tǒng)計云服務(wù)應(yīng)采用先進(jìn)的軟件設(shè)計技巧并充分利用數(shù)據(jù)字典的優(yōu)勢,使服務(wù)界面設(shè)計能夠充分考慮用戶的使用習(xí)慣,僅用鼠標(biāo)選擇操作,就可得到滿足個性化需求的統(tǒng)計報表,使統(tǒng)計結(jié)果的獲取方式及存儲方式,統(tǒng)計項目的參數(shù)配置,數(shù)據(jù)字典的管理更加靈活便捷。
統(tǒng)計輸出方式是滿足用戶多種需求關(guān)系的重要手段,統(tǒng)計云服務(wù)應(yīng)具有寬泛的統(tǒng)計時間選擇和統(tǒng)計輸出方式選擇,通常應(yīng)具有如下統(tǒng)計輸出方式:
1)統(tǒng)計輸出的報表維數(shù)可根據(jù)用戶的選擇自動生成二維或三維統(tǒng)計報表。
2)統(tǒng)計輸出的數(shù)據(jù)格式可根據(jù)用戶的選擇自動生成 EXCEL/HTML/PDF/等格式。
3)統(tǒng)計輸出的圖形式樣可根據(jù)用戶的選擇自動生成直方圖、餅型圖、折線圖等格式。
4)統(tǒng)計輸出可生成圖文并茂的報表式樣,在圖形界面上配有表格輸出,既滿足了圖書館統(tǒng)計數(shù)據(jù)的微觀需求,又滿足了圖書館統(tǒng)計數(shù)據(jù)的宏觀需求。
5)統(tǒng)計輸出的數(shù)據(jù)去向可根據(jù)用戶的選擇發(fā)送到指定部門的指定個人。
事實數(shù)據(jù)庫基礎(chǔ)云層的統(tǒng)計數(shù)據(jù)集中統(tǒng)一存儲在北京大學(xué)圖書館機房專用服務(wù)器上,統(tǒng)計結(jié)果的獲取與存儲方式是通過層級權(quán)限管理來實現(xiàn)的,統(tǒng)計結(jié)果可下載到本地電腦中進(jìn)行存儲。
“統(tǒng)計云服務(wù)”關(guān)鍵在于要尋找一種能夠適應(yīng)“統(tǒng)計云服務(wù)”技術(shù)、應(yīng)用和管理的解決方案?!敖y(tǒng)計云服務(wù)”的價值,不能用傳統(tǒng)的、平面的、本位的眼光去考量,降低服務(wù)和管理成本這是社會永恒的主題?!敖y(tǒng)計云服務(wù)”不是一個“無中生有”的創(chuàng)新性服務(wù),而是從孕育滋長在“地面”幾十年的圖書館統(tǒng)計工作中提煉、升華出來的一種新型的服務(wù)模式。通過“云”的品質(zhì)和服務(wù)能力的不斷提高,人們對“云服務(wù)”的方式也會逐步適應(yīng),進(jìn)而產(chǎn)生新的需求,并將逐步發(fā)展成為圖書館的專業(yè)統(tǒng)計云。通過事實數(shù)據(jù)庫系統(tǒng)的開發(fā)與應(yīng)用,我們總結(jié)出“統(tǒng)計云服務(wù)”之所以在沒有“云”概念誕生的時候就成功地施展了“云”的魅力,關(guān)鍵不在“技術(shù)”,而在于有效地發(fā)揮了教育部高校圖書情報工作指導(dǎo)委員會的組織與管理作用,各省高校圖書情報工作指導(dǎo)委員會逐層發(fā)揮作用,各高等院校積極響應(yīng),有效的組織行為是“統(tǒng)計云服務(wù)”成功的關(guān)鍵。OCLC若沒有在全世界范圍內(nèi)各層級的圖書館團體會員,沒有這些團體會員所提供、整理并匯集的海量級的基于WorldCat的書目數(shù)據(jù)與館藏數(shù)據(jù),它推出的WEB級協(xié)作型圖書館的管理與服務(wù)是不會引起圖書館界強烈關(guān)注的。雖然本文重點闡述的是“統(tǒng)計云服務(wù)”的若干技術(shù)問題,我們還是要強調(diào),在中國現(xiàn)行體制中,“公有云”、“私有云”、“混合云”的成功開發(fā)與應(yīng)用,絕大多數(shù)要優(yōu)先有占有“云”的資源并且具有構(gòu)成“云”的組織結(jié)構(gòu),其后才有“云服務(wù)”。技術(shù)永遠(yuǎn)是為市場服務(wù)的工具,無論IT企業(yè)想出什么樣的高招充實和完善“云”服務(wù)的技術(shù),都要回到市場這個主題上來,回歸到研究圖書館相關(guān)組織行為學(xué)的軌道上?!霸啤苯M織管理與“云服務(wù)”通常不是一個機構(gòu),通常由圖書館的協(xié)作組織或者區(qū)域行政主管部門構(gòu)成,而云服務(wù)機構(gòu)通常是一個 IT企業(yè),他們之間會自然形成默契的分工,一個側(cè)重應(yīng)用的組織與管理,一個側(cè)重技術(shù)開發(fā)與服務(wù)管理,這是一個完美的結(jié)合。只有充分發(fā)揮圖書館協(xié)作組織的作用,提高政府或事業(yè)單位的行政效能,有效利用區(qū)域經(jīng)濟所構(gòu)成的市場氛圍,才能建立比較完整的“云服務(wù)”體系結(jié)構(gòu),才能使圖書館放心地將自己本館所擁有的數(shù)據(jù)聚集到相關(guān)云端,使各館的數(shù)據(jù)資源最大限度地發(fā)揮作用,同時通過相關(guān)的“云”組織與管理機構(gòu)限制數(shù)據(jù)資源及其衍生產(chǎn)品的生產(chǎn)與應(yīng)用,這會有效地規(guī)避由于“云”服務(wù)而引發(fā)的數(shù)據(jù)的知識產(chǎn)權(quán)問題。
科學(xué)的系統(tǒng)構(gòu)架,零成本的數(shù)據(jù)遷移方式,靈活的參數(shù)配置與條件選擇的方法和豐富的統(tǒng)計結(jié)果獲取和存儲方式,有效的組織與管理,是圖書館“統(tǒng)計云服務(wù)”逐步形成、發(fā)展與完善成為圖書館專業(yè)統(tǒng)計工具和服務(wù)平臺的必備條件。
1 法新社.美國政府帶頭推廣云計算.參考消息,2009-9-19(7)
2 胡小菁,范并思.云計算給圖書館管理帶來挑戰(zhàn).大學(xué)圖書館學(xué)報,2009,27(4):7-12
3 劉煒.圖書館需要一朵怎樣的“云”?.大學(xué)圖書館學(xué)報,2009,27(4):2-6
4 王曉成.什么是 BI?2008-10-15.[2009-7-5].http://www.cnblog.com/abcdwxc/archive/1312018.html
5 教育部高校圖書情報工作指導(dǎo)委員會.高校圖書館事實數(shù)據(jù)庫.2003-10-10.[2009-06-02].http://162.105.140.111/calis/default.asp