盧鳳玲
(中共上海市委黨校圖書館 上海 200233)
隨著信息技術(shù)的發(fā)展,數(shù)據(jù)的價(jià)值被不斷挖掘。黨的十九屆四中全會(huì)在戰(zhàn)略層面提出將數(shù)據(jù)作為新型生產(chǎn)要素,要求培育和健全數(shù)據(jù)要素市場(chǎng),提升數(shù)據(jù)治理能力現(xiàn)代化水平。數(shù)據(jù)作為基礎(chǔ)性戰(zhàn)略資源,在社會(huì)經(jīng)濟(jì)領(lǐng)域受到重視,并在政府、教育等公共領(lǐng)域取得了顯著的實(shí)踐成效。圖書館作為知識(shí)信息服務(wù)機(jī)構(gòu),在信息化浪潮下,經(jīng)歷著從數(shù)字化向數(shù)據(jù)化的變革,同樣面臨著數(shù)據(jù)資產(chǎn)的服務(wù)創(chuàng)新和價(jià)值創(chuàng)造難題,而引入數(shù)據(jù)治理有利于解決這一難題。國(guó)際上已有圖書館開展數(shù)據(jù)治理的相關(guān)實(shí)踐,如英國(guó)格拉斯哥大學(xué)研發(fā)了DAF數(shù)據(jù)資產(chǎn)框架[1],美國(guó)康奈爾大學(xué)實(shí)施的嵌入式科研數(shù)據(jù)治理案例[2]。國(guó)內(nèi)目前關(guān)于圖書館數(shù)據(jù)治理方面的研究仍處于理論引入階段,如研究圖書館引入數(shù)據(jù)治理可行性[3]、圖書館科研服務(wù)領(lǐng)域引入數(shù)據(jù)治理,并開始探討高校和公共圖書館數(shù)據(jù)治理框架模式構(gòu)建[4-5]。
隨著智慧圖書館理論研究與實(shí)踐的深入開展,研究者意識(shí)到數(shù)據(jù)在智慧圖書館建設(shè)與服務(wù)中的核心價(jià)值。楊新涯提出沒有數(shù)據(jù)就沒有智慧圖書館[6]。徐瀟潔、洪亮先后提出數(shù)據(jù)驅(qū)動(dòng)的智慧圖書館服務(wù)體系和框架構(gòu)建[7-8]。筆者認(rèn)為,在智慧圖書館建設(shè)中融入數(shù)據(jù)治理理論和架構(gòu),有利于智慧圖書館實(shí)現(xiàn)長(zhǎng)期可持續(xù)發(fā)展,并可實(shí)現(xiàn)數(shù)據(jù)治理從理論到實(shí)踐的跨越。基于此,筆者探索構(gòu)建融合數(shù)據(jù)治理體系的智慧圖書館框架的方法,以期在智慧圖書館建設(shè)和實(shí)踐中實(shí)現(xiàn)數(shù)據(jù)治理,進(jìn)而推動(dòng)智慧圖書館數(shù)據(jù)價(jià)值和智慧服務(wù)的實(shí)現(xiàn)。
自2004年H. Watson 最早提出“數(shù)據(jù)治理”概念以來(lái),數(shù)據(jù)治理逐漸引起企業(yè)界和政府的關(guān)注。DAMA(國(guó)際數(shù)據(jù)管理協(xié)會(huì))將數(shù)據(jù)治理定義為“對(duì)數(shù)據(jù)資產(chǎn)管理實(shí)施權(quán)威、保證質(zhì)量的綜合活動(dòng)”[9]。張寧等認(rèn)為數(shù)據(jù)治理是圍繞數(shù)據(jù)資產(chǎn)開展的一系列工作,以服務(wù)組織層決策為目標(biāo),涉及有關(guān)數(shù)據(jù)管理的技術(shù)、過(guò)程、標(biāo)準(zhǔn)和政策的集合[10]。嚴(yán)昕認(rèn)為數(shù)據(jù)治理是針對(duì)數(shù)據(jù)資產(chǎn)而開展的包括政策、技術(shù)、管理、控制等環(huán)節(jié)的整套工作流程[5]。綜上所述,數(shù)據(jù)治理建立在數(shù)據(jù)管理之上,對(duì)數(shù)據(jù)管理活動(dòng)進(jìn)行指導(dǎo)、監(jiān)督和評(píng)估,目的是實(shí)現(xiàn)數(shù)據(jù)資產(chǎn)管理。沒有數(shù)據(jù)管理就不會(huì)提到數(shù)據(jù)治理,而數(shù)據(jù)管理方面出現(xiàn)問題,其根源是數(shù)據(jù)治理層面的混亂或缺失。數(shù)據(jù)治理的目標(biāo)是確保數(shù)據(jù)管理活動(dòng)始終處于規(guī)范、有序和可控的狀態(tài),確保數(shù)據(jù)資產(chǎn)得到正確有效的管理,并最終實(shí)現(xiàn)數(shù)據(jù)資產(chǎn)價(jià)值的最大化。
構(gòu)建數(shù)據(jù)治理框架,需要將數(shù)據(jù)治理原則、組織架構(gòu)、過(guò)程和規(guī)則等基本概念通過(guò)邏輯結(jié)構(gòu)組織起來(lái),以實(shí)現(xiàn)數(shù)據(jù)治理的總體戰(zhàn)略和目標(biāo)。數(shù)據(jù)治理概念自提出以來(lái),已經(jīng)形成了四個(gè)具有代表性的框架:DAMA框架、DGI框架、IBM框架和我國(guó)數(shù)據(jù)治理規(guī)范國(guó)家標(biāo)準(zhǔn)[5]。我國(guó)數(shù)據(jù)治理規(guī)范國(guó)家標(biāo)準(zhǔn)于2019年正式實(shí)施,結(jié)合國(guó)際數(shù)據(jù)治理標(biāo)準(zhǔn)研制思路,明確數(shù)據(jù)治理規(guī)范實(shí)施的方法和過(guò)程,包括四個(gè)部分:頂層設(shè)計(jì)、數(shù)據(jù)治理環(huán)境、數(shù)據(jù)治理域、數(shù)據(jù)治理過(guò)程[11],是具有中國(guó)特色的數(shù)據(jù)治理規(guī)范標(biāo)準(zhǔn)。
伴隨著時(shí)代變遷,圖書館作為生長(zhǎng)著的有機(jī)體,其服務(wù)模式正向智慧圖書館方向發(fā)展。以物聯(lián)網(wǎng)、大數(shù)據(jù)、區(qū)塊鏈及智能計(jì)算技術(shù)為基礎(chǔ),智慧圖書館將圖書館專業(yè)化管理和智能感知、計(jì)算相結(jié)合,通過(guò)智能采集圖書館各類資源與業(yè)務(wù)數(shù)據(jù),進(jìn)行智慧分析與處理,進(jìn)而有效、精準(zhǔn)、快捷地為用戶提供所需的文獻(xiàn)、信息、數(shù)據(jù)等資源,經(jīng)過(guò)深加工的知識(shí)服務(wù)以及智能共享空間和特色文化空間[12]。智慧圖書館賦予數(shù)字圖書館中大量的文獻(xiàn)資源數(shù)據(jù)和用戶行為數(shù)據(jù)以“生命”,根據(jù)數(shù)據(jù)分析進(jìn)行決策,再有針對(duì)性地圍繞用戶需求實(shí)現(xiàn)智慧管理和智慧服務(wù)。數(shù)據(jù)是智慧圖書館賴以存在的核心資產(chǎn),如果不關(guān)注數(shù)據(jù)質(zhì)量和數(shù)據(jù)安全,數(shù)據(jù)的準(zhǔn)確性、一致性、相關(guān)性、安全性無(wú)法得到長(zhǎng)期保證,智慧圖書館無(wú)法在真正意義上實(shí)現(xiàn)。
根據(jù)國(guó)家數(shù)字圖書館對(duì)圖書館數(shù)據(jù)類型的劃分,圖書館數(shù)據(jù)大致可以被歸納為資源數(shù)據(jù)、用戶數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù)和管理數(shù)據(jù)四類[13]。資源數(shù)據(jù)是圖書館賴以生存和服務(wù)的核心數(shù)據(jù)資源,包括圖書館收藏的各類紙質(zhì)和數(shù)字資源數(shù)據(jù)以及描述和揭示這些資源數(shù)據(jù)的元數(shù)據(jù)。從文獻(xiàn)類型來(lái)講,圖書館資源一般包括紙質(zhì)和電子的圖書和報(bào)刊、研究論文、會(huì)議論文資料。隨著現(xiàn)代圖書館的發(fā)展,機(jī)構(gòu)知識(shí)庫(kù)、科研數(shù)據(jù)、政府開放數(shù)據(jù)等各類數(shù)據(jù)也陸續(xù)被納入圖書館資源管理范圍。此外,智慧圖書館需要采集業(yè)務(wù)數(shù)據(jù)和用戶數(shù)據(jù),進(jìn)行大數(shù)據(jù)分析并構(gòu)建算法,提供智慧服務(wù)。在互聯(lián)網(wǎng)環(huán)境下,圖書館的數(shù)據(jù)資源具有量大且類型結(jié)構(gòu)復(fù)雜、生成速度快、規(guī)模龐大、價(jià)值大密度低的特點(diǎn),為圖書館目前的數(shù)據(jù)管理帶來(lái)挑戰(zhàn)。
3.2.1 數(shù)據(jù)管理難度增大
隨著數(shù)字圖書館的日益發(fā)展,圖書館服務(wù)方式越來(lái)越靈活,由于數(shù)字資源類型復(fù)雜,載體形式、媒體格式和運(yùn)行方式多種多樣,半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)的增多加劇了圖書館數(shù)據(jù)管理的難度。對(duì)象數(shù)據(jù)和元數(shù)據(jù)來(lái)源多樣、數(shù)據(jù)量大、重復(fù)率高,如果出現(xiàn)數(shù)據(jù)質(zhì)量問題,將嚴(yán)重影響數(shù)字資源的利用效果?;ヂ?lián)網(wǎng)大數(shù)據(jù)時(shí)代,圖書館無(wú)時(shí)無(wú)刻不在產(chǎn)生和創(chuàng)造數(shù)據(jù),圖書館的空間數(shù)據(jù)、設(shè)施數(shù)據(jù)、人員數(shù)據(jù)以及在服務(wù)過(guò)程產(chǎn)生的服務(wù)數(shù)據(jù),是圖書館開展智慧服務(wù)必須依托的重要數(shù)據(jù)。只有依據(jù)數(shù)字圖書館數(shù)字資源標(biāo)準(zhǔn)規(guī)范進(jìn)行數(shù)據(jù)管理,才能保證數(shù)據(jù)質(zhì)量和數(shù)據(jù)服務(wù)質(zhì)量。這些規(guī)范包括數(shù)字資源對(duì)象數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)字資源元數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)字資源組織管理標(biāo)準(zhǔn)、數(shù)字資源長(zhǎng)期保存標(biāo)準(zhǔn)等等。雖然國(guó)家層面和行業(yè)層面制定了相關(guān)的數(shù)字資源標(biāo)準(zhǔn)規(guī)范,但其在精細(xì)程度上仍不夠完善,同時(shí)在具體落實(shí)上仍有不足,應(yīng)用效果并不明顯。
3.2.2 數(shù)據(jù)孤島問題嚴(yán)重
當(dāng)前圖書館為讀者提供服務(wù)的系統(tǒng)多樣,數(shù)據(jù)庫(kù)種類較多,數(shù)據(jù)異構(gòu)情況普遍存在。數(shù)據(jù)異構(gòu)導(dǎo)致數(shù)據(jù)之間缺乏互聯(lián)性,進(jìn)而影響數(shù)據(jù)之間的交換與共享,造成數(shù)據(jù)孤島。同樣,圖書館為了向讀者提供便捷的服務(wù),建設(shè)與引進(jìn)了多個(gè)系統(tǒng)平臺(tái),常用的系統(tǒng)包括圖書館集成管理系統(tǒng)、圖書館知識(shí)服務(wù)門戶以及移動(dòng)圖書館、圖書館智能客服、RFID自助借還系統(tǒng)、座位管理系統(tǒng)等等,各系統(tǒng)之間的相互孤立、無(wú)法互通導(dǎo)致系統(tǒng)無(wú)法互操作,造成系統(tǒng)孤島,而圖書館在管理方面的缺位則造成業(yè)務(wù)孤島和管控孤島。圖書館要解決數(shù)據(jù)孤島問題,同時(shí)解決好系統(tǒng)孤島、業(yè)務(wù)孤島和管控孤島問題,才能實(shí)現(xiàn)數(shù)據(jù)流通,實(shí)現(xiàn)圖書館各平臺(tái)、業(yè)務(wù)系統(tǒng)與服務(wù)應(yīng)用的無(wú)縫銜接與互操作,最終提升大數(shù)據(jù)應(yīng)用與服務(wù)水平。
3.2.3 數(shù)據(jù)安全問題突出
圖書館數(shù)據(jù)安全主要涉及圖書館文獻(xiàn)信息資源的安全使用和管理、用戶數(shù)據(jù)的安全使用與管理,以及與數(shù)據(jù)資源安全相關(guān)的應(yīng)用軟件和硬件設(shè)施設(shè)備、網(wǎng)絡(luò)的安全運(yùn)行管理。文獻(xiàn)信息安全包括如何在知識(shí)產(chǎn)權(quán)保護(hù)前提下實(shí)現(xiàn)對(duì)文獻(xiàn)信息資源的合理合法使用。對(duì)圖書館用戶個(gè)人隱私的保護(hù)要在保證個(gè)人數(shù)據(jù)安全的前提下對(duì)數(shù)據(jù)進(jìn)行合理利用以實(shí)現(xiàn)智慧增值服務(wù),以及圖書館館藏電子資源的長(zhǎng)期保存和生命周期管理。隨著新一代信息技術(shù)的發(fā)展和應(yīng)用,圖書館資源與應(yīng)用的服務(wù)、存儲(chǔ)與管理也要向云上遷移,云服務(wù)對(duì)數(shù)據(jù)安全提出更高的要求,這對(duì)圖書館來(lái)說(shuō)是一項(xiàng)新的挑戰(zhàn)。
3.2.4 數(shù)據(jù)服務(wù)績(jī)效難以審計(jì)
由于數(shù)據(jù)孤島和系統(tǒng)孤島問題,圖書館難以對(duì)數(shù)字資源管理服務(wù)和數(shù)字圖書館管理服務(wù)進(jìn)行績(jī)效評(píng)估和審計(jì)。數(shù)字化時(shí)代,圖書館為服務(wù)讀者一般會(huì)引進(jìn)數(shù)十個(gè)甚至上百個(gè)數(shù)字資源產(chǎn)品,而資源商提供的資源服務(wù)平臺(tái)各不相同,圖書館對(duì)資源商提供的數(shù)據(jù)在客觀性、準(zhǔn)確性上存疑,并且不同資源商提供的統(tǒng)計(jì)口徑難以統(tǒng)一,時(shí)效性難以保證。同時(shí),圖書館需要將為讀者提供各類服務(wù)的不同應(yīng)用系統(tǒng)中的統(tǒng)計(jì)數(shù)據(jù)進(jìn)行匯總,據(jù)此實(shí)現(xiàn)對(duì)服務(wù)績(jī)效的審計(jì)和評(píng)估。當(dāng)前圖書館賴以進(jìn)行績(jī)效統(tǒng)計(jì)的數(shù)據(jù)在可靠性、準(zhǔn)確性和及時(shí)性方面存在不足,圖書館需要以更加科學(xué)、準(zhǔn)確、高效的方式實(shí)現(xiàn)服務(wù)績(jī)效考評(píng)。
智慧圖書館是在數(shù)字圖書館基礎(chǔ)上的轉(zhuǎn)型升級(jí),是賦予數(shù)字圖書館中大量的文獻(xiàn)資源數(shù)據(jù)和用戶行為“生命”,通過(guò)數(shù)據(jù)分析進(jìn)行決策,實(shí)現(xiàn)對(duì)資源的充分利用。智慧圖書館關(guān)注數(shù)據(jù)價(jià)值,強(qiáng)調(diào)通過(guò)對(duì)用戶行為數(shù)據(jù)的研究,提供有針對(duì)性、個(gè)性化、精細(xì)化的服務(wù)。數(shù)據(jù)治理的目標(biāo)是實(shí)現(xiàn)數(shù)據(jù)價(jià)值,這與智慧圖書館的目標(biāo)一致。
智慧圖書館建設(shè)離不開對(duì)數(shù)據(jù)的采集與管理、分析與利用,數(shù)據(jù)管理和數(shù)據(jù)價(jià)值提煉是圖書館智慧化的核心工作,讓數(shù)據(jù)管理活動(dòng)始終處于規(guī)范、有序和可控的狀態(tài),使數(shù)據(jù)資產(chǎn)得到正確有效的管理和利用。在技術(shù)手段和管理方法的應(yīng)用上,智慧圖書館可借鑒數(shù)據(jù)治理的手段方法,完善自身建設(shè)的底層架構(gòu)。
智慧圖書館通過(guò)技術(shù)手段組合實(shí)體空間、硬件設(shè)施、信息技術(shù)、資源數(shù)據(jù)等要素實(shí)現(xiàn)智慧服務(wù),而各要素之間傳遞、接受、處理的對(duì)象是圖書館賴以提供服務(wù)的數(shù)據(jù)。從數(shù)字圖書館過(guò)渡到智慧圖書館,需要進(jìn)行頂層設(shè)計(jì)、業(yè)務(wù)流程重組、資源重新配置以及智慧館員能力培養(yǎng)。數(shù)據(jù)治理戰(zhàn)略規(guī)劃、組織構(gòu)建和架構(gòu)設(shè)計(jì)可以為智慧圖書館戰(zhàn)略規(guī)劃和組織構(gòu)建提供參考。
運(yùn)營(yíng)合規(guī)、風(fēng)險(xiǎn)可控、價(jià)值實(shí)現(xiàn)是數(shù)據(jù)治理的目標(biāo)。運(yùn)營(yíng)合規(guī)是保證數(shù)據(jù)及其應(yīng)用的合規(guī)。公共圖書館以《公共圖書館法》為基本遵循,各級(jí)各類圖書館還應(yīng)遵守國(guó)家、地方和行業(yè)相關(guān)法規(guī)與政策性文件,遵守知識(shí)產(chǎn)權(quán)保護(hù)的相關(guān)法律,依法使用各類文獻(xiàn)信息資源,有序開展各項(xiàng)業(yè)務(wù)活動(dòng)。風(fēng)險(xiǎn)可控是指對(duì)潛在的數(shù)據(jù)安全風(fēng)險(xiǎn)進(jìn)行識(shí)別和預(yù)判,保障其完整性、一致性、可用性以及信息系統(tǒng)的安全性。2020年7月,《數(shù)據(jù)安全法(草案)》公布,為數(shù)字經(jīng)濟(jì)時(shí)代堅(jiān)持?jǐn)?shù)據(jù)安全與數(shù)據(jù)流通利用提供了前瞻性指引。價(jià)值實(shí)現(xiàn)是開展數(shù)據(jù)治理的核心要求,體現(xiàn)在數(shù)據(jù)流通、數(shù)據(jù)服務(wù)和數(shù)據(jù)洞察三個(gè)方面。通過(guò)數(shù)據(jù)的采集、清洗、組織以及整合與分發(fā),消除質(zhì)量缺陷,實(shí)現(xiàn)數(shù)據(jù)關(guān)聯(lián),最終實(shí)現(xiàn)數(shù)據(jù)價(jià)值。
智慧圖書館的建設(shè)要避免流于對(duì)技術(shù)的片面追求,而應(yīng)該把握智慧圖書館的實(shí)質(zhì)。智慧圖書館是將“人”“資源”“空間”互聯(lián)和融合,基于圖書館數(shù)據(jù)的收集、挖掘、分析和知識(shí)發(fā)現(xiàn),使過(guò)去相互獨(dú)立的各要素能相互關(guān)聯(lián),依據(jù)數(shù)據(jù)生命周期的規(guī)律,實(shí)現(xiàn)數(shù)據(jù)—信息—知識(shí)—智慧的全過(guò)程,形成新的增值產(chǎn)品,為用戶提供一體化服務(wù)。在這個(gè)過(guò)程中,構(gòu)建服務(wù)體系是關(guān)鍵。在服務(wù)體系中融入數(shù)據(jù)治理體系架構(gòu),制定數(shù)據(jù)標(biāo)準(zhǔn),實(shí)施數(shù)據(jù)管控,構(gòu)建數(shù)據(jù)模型,規(guī)劃數(shù)據(jù)治理的組織、制度和流程,制定相應(yīng)的實(shí)施細(xì)則,形成相關(guān)流程要求,有利于保障數(shù)據(jù)質(zhì)量和數(shù)據(jù)安全,最終實(shí)現(xiàn)數(shù)據(jù)價(jià)值。
基于數(shù)據(jù)驅(qū)動(dòng)的智慧圖書館,其現(xiàn)實(shí)功能已經(jīng)涵蓋了大部分?jǐn)?shù)據(jù)管理的功能,數(shù)據(jù)治理是搭建在其上的統(tǒng)領(lǐng)性的功能,進(jìn)一步規(guī)范、指導(dǎo)、評(píng)估智慧圖書館建設(shè)中的數(shù)據(jù)管理與數(shù)據(jù)應(yīng)用。智慧圖書館運(yùn)行中的數(shù)據(jù)量大且類型復(fù)雜、業(yè)務(wù)范圍廣,服務(wù)內(nèi)容雜,所以對(duì)數(shù)據(jù)的采集、存儲(chǔ)、分析與應(yīng)用的要求高。搭建數(shù)據(jù)治理子平臺(tái),目的是將數(shù)據(jù)治理落到實(shí)處,實(shí)現(xiàn)對(duì)元數(shù)據(jù)、數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)質(zhì)量的管理和監(jiān)控,實(shí)現(xiàn)數(shù)據(jù)監(jiān)測(cè)和評(píng)估。由此可見,在智慧圖書館服務(wù)系統(tǒng)上建設(shè)數(shù)據(jù)治理子系統(tǒng),是智慧圖書館健康發(fā)展的必然要求。
經(jīng)過(guò)近幾年的高速發(fā)展,關(guān)于智慧圖書館架構(gòu)已經(jīng)形成了一些較成熟的理論框架與建設(shè)實(shí)踐。陳進(jìn)等提出基于智慧協(xié)同體概念的SLSP架構(gòu)[14],其頂層架構(gòu)包括服務(wù)平臺(tái)和服務(wù)體系兩部分,是一個(gè)基于數(shù)據(jù)云和元數(shù)據(jù),整合紙電和數(shù)字等各類資源實(shí)現(xiàn)一站式發(fā)現(xiàn)與獲取,帶有標(biāo)準(zhǔn)化接口并支持各類(移動(dòng))終端,具備統(tǒng)計(jì)功能并支持知識(shí)管理與服務(wù)管理的智能化平臺(tái)。洪亮等提出基于信息生態(tài)鏈構(gòu)建大數(shù)據(jù)驅(qū)動(dòng)的智慧圖書館服務(wù)體系[15],包括基礎(chǔ)設(shè)施層、數(shù)據(jù)資源層和服務(wù)應(yīng)用層,認(rèn)為要建立集成的數(shù)據(jù)存儲(chǔ)機(jī)制以防止數(shù)據(jù)冰山效應(yīng),實(shí)現(xiàn)對(duì)數(shù)字資源的良好治理,為實(shí)現(xiàn)數(shù)據(jù)挖掘與利用奠定基礎(chǔ)。在智慧圖書館建設(shè)的實(shí)踐探索方面,重慶大學(xué)圖書館于2016年啟動(dòng)規(guī)劃建設(shè)“三庫(kù)四系統(tǒng)”[16],通過(guò)建設(shè)元數(shù)據(jù)庫(kù)、運(yùn)行數(shù)據(jù)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù),以及全面圖書館管理系統(tǒng)、統(tǒng)一搜索平臺(tái)、讀者知識(shí)社區(qū)和數(shù)據(jù)挖掘四個(gè)系統(tǒng),探索建設(shè)新一代智慧圖書館系統(tǒng)。南京大學(xué)智慧圖書館建設(shè)實(shí)踐主要涉及三個(gè)方面的建設(shè):實(shí)體場(chǎng)館的建設(shè)和改造、智慧信息服務(wù)平臺(tái)系統(tǒng)的建設(shè)以及智慧型服務(wù),其構(gòu)成要素主要包括智慧系統(tǒng)、智能基礎(chǔ)設(shè)施、智慧服務(wù)[17],并提出“數(shù)據(jù)驅(qū)動(dòng)的智慧圖書館服務(wù)框架”[18],認(rèn)為提供以數(shù)據(jù)為基礎(chǔ)、以用戶需求為根本、圍繞“知識(shí)”“空間”“管理”核心要素的智慧化服務(wù)是智慧圖書館的發(fā)展方向。上述理論框架與建設(shè)實(shí)踐對(duì)智慧圖書館建設(shè)具有重要的指導(dǎo)意義,有力地推動(dòng)了我國(guó)智慧圖書館的發(fā)展。不足之處在于,建設(shè)理念中雖有提及要進(jìn)行數(shù)據(jù)管理或數(shù)據(jù)治理,然而均未涉及建立數(shù)據(jù)治理體系。
圖1 融合數(shù)據(jù)治理體系的智慧圖書館框架
基于以上分析,筆者構(gòu)建了融合數(shù)據(jù)治理體系的智慧圖書館框架。該體系框架以數(shù)據(jù)為核心搭建,基于業(yè)務(wù)流驅(qū)動(dòng),包括基礎(chǔ)設(shè)施層、數(shù)據(jù)服務(wù)層和交互應(yīng)用層三個(gè)層次,數(shù)據(jù)治理處于數(shù)據(jù)服務(wù)層?;A(chǔ)設(shè)施層提供智慧圖書館賴以服務(wù)的數(shù)據(jù),包括從業(yè)務(wù)系統(tǒng)、電子資源庫(kù)獲取的本館紙電資源數(shù)據(jù)和元數(shù)據(jù),以及從互聯(lián)網(wǎng)獲取海量動(dòng)態(tài)的多元異構(gòu)數(shù)據(jù)、政府開放數(shù)據(jù)等各類開放獲取資源;通過(guò)接口從各系統(tǒng)獲取的讀者數(shù)據(jù)、服務(wù)數(shù)據(jù)和業(yè)務(wù)數(shù)據(jù);從RFID、監(jiān)控器、傳感器、機(jī)器人等傳感設(shè)備智能感知的服務(wù)數(shù)據(jù)。數(shù)據(jù)服務(wù)層包括大數(shù)據(jù)平臺(tái)、數(shù)據(jù)治理平臺(tái)和數(shù)據(jù)分析平臺(tái)三個(gè)子系統(tǒng)。大數(shù)據(jù)平臺(tái)通過(guò)API接口和中間件采集數(shù)據(jù)并進(jìn)行清洗、標(biāo)引、整理和分類歸檔;數(shù)據(jù)治理平臺(tái)負(fù)責(zé)理清數(shù)據(jù)資產(chǎn),實(shí)現(xiàn)元數(shù)據(jù)管理,建立數(shù)據(jù)標(biāo)準(zhǔn)體系、數(shù)據(jù)質(zhì)量管理體系及數(shù)據(jù)安全管理體系,規(guī)范、維護(hù)并監(jiān)督數(shù)據(jù)質(zhì)量;數(shù)據(jù)分析平臺(tái)對(duì)處理好的數(shù)據(jù)進(jìn)行知識(shí)抽取和知識(shí)發(fā)現(xiàn)、知識(shí)推理和深度學(xué)習(xí),通過(guò)挖掘和算法實(shí)現(xiàn)智慧應(yīng)用。
數(shù)據(jù)治理平臺(tái)內(nèi)嵌在數(shù)據(jù)服務(wù)層,起到數(shù)據(jù)中樞控制中心的作用,通過(guò)數(shù)據(jù)治理平臺(tái)定義智慧圖書館大數(shù)據(jù)平臺(tái)的數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)標(biāo)準(zhǔn)和質(zhì)量規(guī)則,實(shí)現(xiàn)大數(shù)據(jù)平臺(tái)的數(shù)據(jù)管控和治理。同時(shí),大數(shù)據(jù)平臺(tái)的數(shù)據(jù)處理結(jié)果進(jìn)一步反哺數(shù)據(jù)治理平臺(tái),進(jìn)而形成更多可信賴的數(shù)據(jù)服務(wù)。
元數(shù)據(jù)管理:智慧圖書館要支持不同類型資源元數(shù)據(jù)的一體化管理與服務(wù),支持靈活可擴(kuò)展的、適合各種資源類型的元數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范,并支持元數(shù)據(jù)從采集、編目、加工、服務(wù)到統(tǒng)計(jì)、分析、評(píng)估、交換的完整生命周期的應(yīng)用和管理需求,實(shí)現(xiàn)業(yè)務(wù)流程和系統(tǒng)功能的整合,達(dá)到數(shù)據(jù)在不同應(yīng)用之間順暢交換,最終實(shí)現(xiàn)在知識(shí)組織層面上的融合。
數(shù)據(jù)標(biāo)準(zhǔn)管理:管理的內(nèi)容包括數(shù)據(jù)標(biāo)準(zhǔn)的定義、標(biāo)準(zhǔn)的版本管理、數(shù)據(jù)標(biāo)準(zhǔn)的落地、數(shù)據(jù)評(píng)估檢測(cè)規(guī)范等。數(shù)字圖書館標(biāo)準(zhǔn)一般包括數(shù)字資源元數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)字資源對(duì)象數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)字資源組織管理標(biāo)準(zhǔn)、數(shù)字資源服務(wù)標(biāo)準(zhǔn)等[19]。
數(shù)據(jù)質(zhì)量管理:通過(guò)規(guī)劃和運(yùn)用相應(yīng)的技術(shù)和方法,對(duì)不同來(lái)源的數(shù)字資源實(shí)施科學(xué)有效的質(zhì)量管理。圖書館基礎(chǔ)的數(shù)據(jù)質(zhì)量管理是館藏紙本書目數(shù)據(jù)和規(guī)范數(shù)據(jù)質(zhì)量的管理,而電子書元數(shù)據(jù)、數(shù)字資源元數(shù)據(jù)質(zhì)量關(guān)系到數(shù)據(jù)整合與發(fā)現(xiàn)系統(tǒng)的質(zhì)量[20]。制定質(zhì)量管理制度和規(guī)范,利于通過(guò)技術(shù)手段從數(shù)據(jù)采集源頭、系統(tǒng)集成和數(shù)據(jù)應(yīng)用多個(gè)節(jié)點(diǎn)實(shí)現(xiàn)對(duì)數(shù)據(jù)質(zhì)量的把控。
數(shù)據(jù)交換管理:為將圖書館分散的應(yīng)用系統(tǒng)進(jìn)行整合,實(shí)現(xiàn)應(yīng)用子系統(tǒng)的數(shù)據(jù)傳輸和共享,分布異構(gòu)系統(tǒng)之間的互聯(lián)互通,要構(gòu)造統(tǒng)一的數(shù)據(jù)處理和交換,完成數(shù)據(jù)的抽取、集中、加載和展現(xiàn)。數(shù)據(jù)交換管理要對(duì)中間件、服務(wù)、Web Service接口及中心數(shù)據(jù)庫(kù)的接口進(jìn)行管理,實(shí)現(xiàn)數(shù)據(jù)集成、信息集成和可靠通信。
數(shù)據(jù)安全管理:在數(shù)據(jù)共享、數(shù)據(jù)開發(fā)的大趨勢(shì)下,數(shù)據(jù)安全和個(gè)人隱私是大數(shù)據(jù)運(yùn)營(yíng)中的重要關(guān)注點(diǎn)。數(shù)據(jù)安全管理保障智慧圖書館數(shù)據(jù)管理與服務(wù)活動(dòng)風(fēng)險(xiǎn)可控、運(yùn)營(yíng)合規(guī)。圖書館要在物理安全、運(yùn)行安全、長(zhǎng)期保存、訪問權(quán)限、知識(shí)產(chǎn)權(quán)、隱私保護(hù)等方面進(jìn)行管理和規(guī)范,實(shí)現(xiàn)安全存儲(chǔ)、安全傳輸以及對(duì)網(wǎng)絡(luò)信息內(nèi)容的安全審計(jì)。
數(shù)據(jù)生命周期管理:數(shù)據(jù)資產(chǎn)生命周期包含數(shù)據(jù)采集、數(shù)據(jù)傳輸、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)處理、數(shù)據(jù)交換和數(shù)據(jù)銷毀六個(gè)階段[21]。通過(guò)對(duì)圖書館數(shù)據(jù)進(jìn)行評(píng)價(jià)與分類,依據(jù)策略實(shí)施數(shù)據(jù)管理方案,科學(xué)調(diào)配存儲(chǔ)系統(tǒng),將利用率很低的數(shù)據(jù)確定為價(jià)值較低的資源進(jìn)行歸檔存儲(chǔ),圖書館能夠以最低成本實(shí)現(xiàn)信息價(jià)值最大化。
頂層設(shè)計(jì)是數(shù)據(jù)治理工作成敗的決定性因素。圖書館應(yīng)通過(guò)數(shù)據(jù)治理頂層設(shè)計(jì),對(duì)數(shù)據(jù)治理、數(shù)據(jù)管理、數(shù)據(jù)應(yīng)用服務(wù)進(jìn)行自上而下的指導(dǎo)和自下而上推進(jìn)的多層次、多維度的構(gòu)建;要在適應(yīng)的內(nèi)外部環(huán)境(技術(shù)、文化、組織)條件下,制定戰(zhàn)略、實(shí)現(xiàn)架構(gòu)流程、明確組織構(gòu)建[11];要以制度規(guī)范為約束,以技術(shù)工具為支撐,通過(guò)組織機(jī)制保障。組織構(gòu)建一般有決策層、管理層和執(zhí)行層三個(gè)層面。決策層負(fù)責(zé)制定治理目標(biāo),對(duì)治理工作進(jìn)行指導(dǎo)、監(jiān)督,對(duì)治理成效進(jìn)行考評(píng)。管理層負(fù)責(zé)實(shí)施數(shù)據(jù)治理體系建設(shè),協(xié)調(diào)落實(shí)數(shù)據(jù)管理運(yùn)行機(jī)制,實(shí)現(xiàn)數(shù)據(jù)治理的歸口管理和監(jiān)督。業(yè)務(wù)部門(執(zhí)行層)對(duì)本部門數(shù)據(jù)標(biāo)準(zhǔn)進(jìn)行定義確認(rèn),按照業(yè)務(wù)流程進(jìn)行數(shù)據(jù)錄入和維護(hù),跟蹤解決本部門的數(shù)據(jù)質(zhì)量問題。圖書館可在條件成熟的情況下引入獨(dú)立第三方,對(duì)數(shù)據(jù)治理過(guò)程和成效進(jìn)行檢查與評(píng)價(jià),提出存在的問題和改進(jìn)的建議,促進(jìn)圖書館數(shù)據(jù)治理目標(biāo)的實(shí)現(xiàn)。