高 健,梁學(xué)明,秦 奮
(大連理工大學(xué)圖書館,遼寧 大連 116024)
圖書館作為高校的文獻(xiàn)保障中心,主要職責(zé)是負(fù)責(zé)館藏資源的建設(shè)與管理,其中數(shù)字資源的長期保存是一項(xiàng)長期而艱巨的任務(wù),是全球?qū)W術(shù)界普遍關(guān)注的熱點(diǎn)課題。數(shù)字資源的特點(diǎn)是規(guī)模龐大、格式各異、增長迅速,獲取和利用條件各不相同,異構(gòu)數(shù)據(jù)庫互操作繁瑣,缺乏統(tǒng)一規(guī)范的維護(hù)與管理標(biāo)準(zhǔn)。相對于傳統(tǒng)媒介資源,數(shù)字資源在使用、保管等環(huán)節(jié)也面臨很高風(fēng)險(xiǎn),容易被清除、篡改,同時(shí),技術(shù)手段的迭代、新材質(zhì)的應(yīng)用、新媒體的興起也極易導(dǎo)致數(shù)字資源存儲媒介被淘汰、獲取方式面臨更新等問題,因此,長期保存及可持續(xù)性應(yīng)用成為數(shù)字資源揭示與管理工作中面臨的一個(gè)巨大挑戰(zhàn)。
所謂數(shù)字資源是指以電子化、數(shù)字化的形式存儲、傳播與使用的信息資源的總稱,存儲介質(zhì)多為縮微膠片、磁帶、光盤、硬盤、閃存等磁光電物理設(shè)備,通過網(wǎng)絡(luò)及計(jì)算機(jī)終端存取、傳播和顯示,在不同場合也可冠以電子出版物、電子資源等名稱。
數(shù)字資源長期保存可被描述為:為保證數(shù)字資源不受各種環(huán)境因素影響,內(nèi)容信息完整準(zhǔn)確,且能長期安全存儲和有效傳遞,被現(xiàn)在或?qū)碛脩繇樌斫舛M(jìn)行的持續(xù)維護(hù)更新的目標(biāo)導(dǎo)向活動(dòng)。美國學(xué)者Priscilla Kaplan提出的數(shù)字保存金字塔模型清晰描繪出數(shù)字資源長期保存流程整個(gè)生命周期中各節(jié)點(diǎn)的具體實(shí)現(xiàn)目標(biāo)。
國外對數(shù)字資源長期保存與利用的研究開展于20世紀(jì)90年代,以項(xiàng)目經(jīng)驗(yàn)為依據(jù),制定和修訂制度、標(biāo)準(zhǔn)、規(guī)范,指導(dǎo)現(xiàn)實(shí)中的資源長期保存工作。
1994年,歐洲保存與獲取委員會(huì)(ECPA)宣告成立,委員會(huì)的宗旨是聯(lián)合組織成員共同研究人類文獻(xiàn)資源的保存和使用問題。迄今為止,ECPA已成為全球最大的數(shù)字資源長期保存的協(xié)會(huì)組織。2003年,OAIS參考模型(Open Archival Information System)作為ISO標(biāo)準(zhǔn)頒發(fā),該模型推廣一個(gè)參考模型和基本概念框架,旨在規(guī)范數(shù)字資源長期保存的標(biāo)準(zhǔn)化流程,如今已被眾多數(shù)字資源的生產(chǎn)與傳播系統(tǒng)和組織所采用,為數(shù)字資源長期保存的實(shí)踐應(yīng)用奠定了基礎(chǔ)。
國外數(shù)字資源長期保存項(xiàng)目包括澳大利亞的PANDARA項(xiàng)目(保護(hù)和存取澳大利亞網(wǎng)絡(luò)信息資源項(xiàng)目)、美國斯坦福大學(xué)的LOCKSS項(xiàng)目(多備份資源保存系統(tǒng))以及美國的NDIIPP項(xiàng)目(國家數(shù)字信息基礎(chǔ)設(shè)施和保存計(jì)劃)等。
理論研究主要包括以下四個(gè)方面:一是基礎(chǔ)性研究,包括長期保存相關(guān)標(biāo)準(zhǔn)、規(guī)則、框架的制定與完善,體系建設(shè)研究等。二是元數(shù)據(jù)技術(shù)及相關(guān)應(yīng)用,包括大量文獻(xiàn)研究元數(shù)據(jù)類型,元數(shù)據(jù)技術(shù)在數(shù)字資源長期保存中的應(yīng)用等。三是生命周期及技術(shù)流程,主要研究長期保存生命周期的特征,以及實(shí)操中的相關(guān)技術(shù)流程。四是其他方面的研究,包括長期保存成本分析研究、知識產(chǎn)權(quán)及法律問題研究等。
我國對數(shù)字資源長期保存課題的研究開展于21世紀(jì)初,相關(guān)合作性實(shí)踐項(xiàng)目的開展也處于起步階段。近年來,相關(guān)研究內(nèi)容已擴(kuò)展到數(shù)字資源長期保存的策略及體系建設(shè)、風(fēng)險(xiǎn)管理、成本分析、法律問題等領(lǐng)域。同時(shí),圖書館也開始參與國際合作項(xiàng)目,包括WICP項(xiàng)目(中國國家圖書館主持實(shí)施的數(shù)字資源長期保存項(xiàng)目)、Web Info Mall項(xiàng)目(中國Web信息博物館項(xiàng)目)以及中國記憶項(xiàng)目(國家圖書館主持開展)等。
選擇性采集也就是傾向性專門領(lǐng)域采集,主要面向特定領(lǐng)域內(nèi)具有豐富歷史價(jià)值、文化價(jià)值、科研價(jià)值、社會(huì)價(jià)值的珍貴信息,針對采集對象的選擇通常事先制定有相關(guān)的遴選標(biāo)準(zhǔn)或規(guī)范。選擇性采集是一種小而精的采集模式。
全面采集是利用網(wǎng)絡(luò)爬蟲技術(shù)在腳本中設(shè)置爬取周期和頻率,定向獲取指定網(wǎng)絡(luò)路徑下所有可獲得的數(shù)字資源,采集到的原始資源再通過后臺腳本進(jìn)行自動(dòng)分類和標(biāo)引,分門別類地保存在存儲設(shè)備中,面向的對象可以是一個(gè)領(lǐng)域也可以是多個(gè)相關(guān)領(lǐng)域。全面采集是一種大而全的采集模式。
聯(lián)合采集方式是全面采集和選擇性采集的綜合利用,在采集方式上通常采用全面采集的模式,用網(wǎng)絡(luò)爬蟲收集原始資源,在數(shù)字對象選擇方面則采用選擇性采集模式中的標(biāo)準(zhǔn)與規(guī)范,在保證全面性的基礎(chǔ)上優(yōu)先處理高價(jià)值資源。
呈繳制度是實(shí)施部門與數(shù)字資源生產(chǎn)者或所有者(出版商或個(gè)人)簽訂協(xié)議,數(shù)字資源以固定格式的呈繳本形式定期或不定期提交到相關(guān)機(jī)構(gòu),所涉版權(quán)問題應(yīng)在協(xié)議中提及并保證履行。
國外典型的長期保存項(xiàng)目多數(shù)應(yīng)用選擇性采集方式,其優(yōu)勢是收集的數(shù)字資源質(zhì)量有保障,體量較小,但也存在遴選標(biāo)準(zhǔn)的問題,容易出現(xiàn)遺漏珍貴資源的現(xiàn)象,因此,筆者建議我國項(xiàng)目選擇聯(lián)合式采集方式為宜。
采集對象通常包括電子期刊、電子圖書、會(huì)議文集、數(shù)字化多媒體資源、源代碼、網(wǎng)頁、商業(yè)記錄、政府出版物、地理空間數(shù)據(jù)等,一些國家還特別關(guān)注本國本地區(qū)特色資源的采集。除常規(guī)類型采集對象外,一些專業(yè)項(xiàng)目往往采集特定方向和領(lǐng)域的數(shù)字資源對象,如:Pandora項(xiàng)目主要面向政府出版物、科研出版物、專題數(shù)據(jù)庫等,資源類型包括書籍、圖表、音視頻、地圖等數(shù)字資源。
數(shù)字資源保存內(nèi)容包括資源載體的保存與維護(hù)、資源內(nèi)容的長期保存、元數(shù)據(jù)的保存與維護(hù)。
2.3.1 資源載體的保護(hù)和維護(hù)。數(shù)字資源的載體和內(nèi)容是可分離的,載體媒介隨著技術(shù)的發(fā)展可能面臨淘汰或升級,同時(shí),電子設(shè)備本身壽命較短,定期或不定期的數(shù)據(jù)遷移工作非常必要。數(shù)據(jù)遷移的原則是出現(xiàn)可替代的新技術(shù)媒介產(chǎn)品,同時(shí)可獲得相應(yīng)的功能擴(kuò)展,或原有媒介壽命到期、可靠性降低。
2.3.2 資源內(nèi)容的長期保存。內(nèi)容是數(shù)字資源的核心,是以特定數(shù)據(jù)格式存儲的電子文件,電子技術(shù)的迭代會(huì)經(jīng)常性地產(chǎn)生更優(yōu)設(shè)計(jì)、更高規(guī)格的新媒體格式,在必要的情況下應(yīng)考慮數(shù)字內(nèi)容的格式升級,在保證原始內(nèi)容完整無損的前提下將數(shù)字資源無損升級到新格式是數(shù)字資源內(nèi)容保存的一個(gè)重要手段。
2.3.3 元數(shù)據(jù)信息的保存與維護(hù)。元數(shù)據(jù)是關(guān)于數(shù)據(jù)的數(shù)據(jù),是用來描述數(shù)字內(nèi)容的重要信息資源,元數(shù)據(jù)可以引導(dǎo)使用者更好地檢索、甄別和閱讀數(shù)字內(nèi)容,也有助于維護(hù)人員管理和分析相關(guān)資源。元數(shù)據(jù)的質(zhì)量保證了數(shù)字內(nèi)容的真實(shí)性、可靠性和可獲得性,是數(shù)字資源內(nèi)容信息的重要補(bǔ)充,也可單獨(dú)作為原始數(shù)字資源應(yīng)用于各類數(shù)據(jù)庫檢索、統(tǒng)計(jì)分析研究。因此,元數(shù)據(jù)信息是數(shù)字資源長期保存與利用的重要內(nèi)容之一。
數(shù)字資源長期保存的相關(guān)規(guī)范與標(biāo)準(zhǔn)隨著時(shí)代的發(fā)展和技術(shù)進(jìn)步始終處于不斷的演進(jìn)與更新狀態(tài),當(dāng)前需要重點(diǎn)關(guān)注的有以下標(biāo)準(zhǔn)與規(guī)范:一是PREMIS(保存元數(shù)據(jù):實(shí)現(xiàn)策略標(biāo)準(zhǔn))和METS(數(shù)字對象進(jìn)行封裝的描述性、管理型和結(jié)構(gòu)性元數(shù)據(jù)標(biāo)準(zhǔn)),一個(gè)用于定義元數(shù)據(jù)框架,一個(gè)用于進(jìn)行數(shù)字對象封裝,二者的結(jié)合可以實(shí)現(xiàn)對元數(shù)據(jù)框架方案的架構(gòu)。二是長期保存領(lǐng)域最重要的標(biāo)準(zhǔn)是OAIS,目前已發(fā)布了第三版更新草案,新版本將包含多項(xiàng)變更,如引入“保存目標(biāo)”概念;保存描述信息PDI組件的指向有所變更;功能模型、透視圖截取等功能得到更新;提高存儲庫的可審核性等。三是在信息包規(guī)范與存儲標(biāo)準(zhǔn)方面。E-ARK的信息包通用規(guī)范CSIP與版本保存文件組織規(guī)范OCFL,CSIP定義符合OAIS標(biāo)準(zhǔn)信息包的邏輯結(jié)構(gòu)和內(nèi)容,OCFL描述了以易于保存的方式將數(shù)字對象布局映射到物理文件系統(tǒng),以及如何識別管理此類對象所需的基本操作。OCFL可保證獨(dú)立于專門系統(tǒng)之外的原始數(shù)字文件的持久性,可用于數(shù)據(jù)災(zāi)難恢復(fù),重新構(gòu)建數(shù)據(jù)存儲。
聯(lián)盟建設(shè)是指通過分工協(xié)作的方式共建數(shù)字資源長期保存項(xiàng)目的模式,目前國內(nèi)外已有的大型長期保存項(xiàng)目在資源采集、存儲方面通常存在兩種模式可供選擇,即集中式或分布式。常規(guī)的選擇是集中式采集或分布采集元數(shù)據(jù)收割、分布式存儲的模式,聯(lián)盟建設(shè)的組織及管理機(jī)制其實(shí)也面臨模式選擇的問題,在架構(gòu)設(shè)計(jì)、運(yùn)營模式等方面有多重選擇,大致可分為以下幾種:集中式建設(shè)模式、分布式建設(shè)模式,以及融二者特點(diǎn)于一體的混合式建設(shè)模式。
集中式建設(shè)模式是指長期保存聯(lián)盟建立的聯(lián)合體選擇金字塔式管理模式,聯(lián)盟中的核心成員機(jī)構(gòu)負(fù)責(zé)建設(shè)和運(yùn)營數(shù)據(jù)平臺及維護(hù)后臺倉儲,其他成員館遵循統(tǒng)一制定的元數(shù)據(jù)標(biāo)準(zhǔn)及數(shù)據(jù)開放獲取協(xié)議,使用平臺配套工具包分別采集分包之內(nèi)的數(shù)字資源,并將數(shù)據(jù)上傳至中心數(shù)據(jù)庫,或者由中心數(shù)據(jù)庫定時(shí)收割原始數(shù)據(jù)及元數(shù)據(jù)。
分布式建設(shè)模式是指本身擁有或擬建長期保存平臺的機(jī)構(gòu)間組成聯(lián)盟,遵循相同的數(shù)據(jù)交互標(biāo)準(zhǔn)及開放獲取協(xié)議,以資源共享為目的,鼓勵(lì)各成員館在各自平臺中分享聯(lián)盟中所有數(shù)字資源,或者在各自平臺之外再設(shè)計(jì)統(tǒng)一的聯(lián)盟檢索平臺,實(shí)現(xiàn)一站式檢索,方便各成員館用戶訪問。
顧名思義,混合式聯(lián)盟建設(shè)模式是集中式聯(lián)盟和分布式聯(lián)盟的結(jié)合體,試圖兼顧二者的優(yōu)點(diǎn),并使各自存在的問題得到相對完善的解決?;旌鲜铰?lián)盟的構(gòu)想是由一個(gè)或幾個(gè)技術(shù)力量雄厚、資金充足的大型機(jī)構(gòu)組成核心成員,負(fù)責(zé)相關(guān)標(biāo)準(zhǔn)、規(guī)范、協(xié)議的制定和選擇,負(fù)責(zé)數(shù)據(jù)采集、收割流程的規(guī)劃,負(fù)責(zé)中心平臺設(shè)計(jì)與建設(shè),負(fù)責(zé)中心元數(shù)據(jù)倉儲的建設(shè),對之前沒有長期保存平臺和倉儲的成員機(jī)構(gòu)按集中式聯(lián)盟管理的方法,按分發(fā)的任務(wù)和方向用統(tǒng)一的配套工具進(jìn)行數(shù)字資源的采集和上傳工作;對之前已有平臺不想放棄自身特色的成員機(jī)構(gòu),則采用分布式聯(lián)盟的模式,通過專門的協(xié)議提供收割接口,允許中心元數(shù)據(jù)倉儲定期收割數(shù)據(jù),數(shù)字資源的采集則依舊按自有平臺模式進(jìn)行,對聯(lián)盟中心平臺具有完全的訪問權(quán)?;旌鲜浇ㄔO(shè)模式見下頁圖1。
圖1 混合式建設(shè)模式
混合式聯(lián)盟的管理組織架構(gòu)可以設(shè)計(jì)得更加靈活,對需要聯(lián)盟更多技術(shù)指導(dǎo)、資金資助的成員機(jī)構(gòu),核心機(jī)構(gòu)有義務(wù)提供更多服務(wù),而對更注重自身特色的成員機(jī)構(gòu)則允許其保留更大的自由度。事實(shí)上,對中心平臺來說,最重要的是各成員機(jī)構(gòu)提交的元數(shù)據(jù)資源,在此前提下凡是有利于元數(shù)據(jù)順利收割的做法都是被允許的,凡是能導(dǎo)致元數(shù)據(jù)提交、收割困難的問題都需要成員機(jī)構(gòu)間共同合作、鼎力幫助。
依據(jù)高校圖書館數(shù)字資源的不同引進(jìn)途徑,館藏?cái)?shù)字資源可以分為兩大部分:商業(yè)數(shù)據(jù)庫資源及自建數(shù)字資源。商業(yè)數(shù)據(jù)庫資源是當(dāng)前高校圖書館的主要數(shù)字收藏,也是購置經(jīng)費(fèi)的主要投入方向,訂購數(shù)據(jù)庫的多少以及對學(xué)校主要專業(yè)的覆蓋情況是高校文獻(xiàn)資源保障評估的一個(gè)重要指標(biāo),也是學(xué)校師生特別是科研教師與研究生對學(xué)校資源的一個(gè)主要需求。商業(yè)數(shù)據(jù)庫資源由高校圖書館通過與數(shù)據(jù)商或代理商接洽商談、簽約購買。在購買方式方面,數(shù)據(jù)商通常提供數(shù)字資源使用權(quán)和購買數(shù)字資源所有權(quán)兩種購買方式,二者的購買價(jià)格相差很大,附加條款也不盡相同,大多數(shù)高校圖書館購買的是數(shù)據(jù)庫的使用權(quán),在合同期內(nèi)校內(nèi)用戶可以獲得數(shù)據(jù)庫資源的正常瀏覽、下載權(quán)限,這就意味著一旦合同因故終止(如數(shù)據(jù)庫續(xù)訂價(jià)格漲幅過高、高校文獻(xiàn)購置費(fèi)出現(xiàn)缺口),高校的用戶將完全失去對數(shù)據(jù)庫資源的訪問權(quán)限,前期若干年投入的資金無法獲得穩(wěn)定的回報(bào),這種現(xiàn)象成為我國高校圖書館資源建設(shè)過程中的極大隱患。
高校圖書館自建數(shù)字資源主要通過各種數(shù)字化轉(zhuǎn)換技術(shù)實(shí)現(xiàn),涉及的主要技術(shù)包括掃描識別技術(shù)(OCR)、圖像無損壓縮存儲技術(shù)、網(wǎng)絡(luò)安全傳輸技術(shù)、數(shù)據(jù)庫存儲技術(shù)等。資源的類型主要包括以下三個(gè)方面:①本校學(xué)位論文資源。我國高校的畢業(yè)論文管理大多實(shí)行呈繳本制度,這也是教育部相關(guān)學(xué)位條例實(shí)施辦法的硬性要求。呈繳本制度的普及極大地方便了高校數(shù)字化學(xué)位論文資源長期保存系統(tǒng)的建立健全,也是各高校普遍實(shí)現(xiàn)的,完成度、延續(xù)度很高的資源長期保存項(xiàng)目。有條件的高校還會(huì)組織人力物力對這部分資源進(jìn)行回溯建設(shè),將早期以紙本形式保藏的歷史學(xué)位論文進(jìn)行數(shù)字化轉(zhuǎn)換,再提交到管理系統(tǒng)中,從而形成了本校完整的數(shù)字化學(xué)位論文長期保存和檢索平臺。②數(shù)字科研信息資源。高校的科研信息資源主要指學(xué)校的科研產(chǎn)出成果,以及科研成果完成過程中形成的各種中間信息或階段性記錄。目前,多數(shù)高校積極開發(fā)或引進(jìn)的機(jī)構(gòu)知識庫系統(tǒng)就屬于數(shù)字科研信息長期保存系統(tǒng)的一種,機(jī)構(gòu)知識庫系統(tǒng)通過Web爬取或呈繳本制度,收集本校研究者主要文獻(xiàn)類型的科研成果,如著作、期刊論文、會(huì)議論文、專利、國家省市各類課題等,采集的數(shù)據(jù)按預(yù)定的規(guī)范進(jìn)行元素提取、轉(zhuǎn)換,生成元數(shù)據(jù),原始數(shù)據(jù)保存至數(shù)據(jù)庫存儲中,后臺系統(tǒng)針對元數(shù)據(jù)提供各種檢索、統(tǒng)計(jì)、分析服務(wù),有條件的高校也會(huì)對本校的科研信息資源進(jìn)行回溯建設(shè),基本方法與數(shù)字化學(xué)位論文的回溯相同。這是我國高校目前主流的針對科研信息資源數(shù)字化長期保存的方案,該方案還有很大的提升空間,除元數(shù)據(jù)挖掘及系統(tǒng)配套功能升級外,在文獻(xiàn)類型、資源內(nèi)容上也有巨大的挖掘潛力,如對科研中間產(chǎn)出,包括實(shí)驗(yàn)數(shù)據(jù)、階段總結(jié)報(bào)告、錯(cuò)誤分析、仿真結(jié)果、模型數(shù)據(jù),乃至項(xiàng)目來源信息、課題組概況信息、經(jīng)費(fèi)使用信息等,都可以作為數(shù)字資源的有機(jī)組成部分。③特色資源自建數(shù)據(jù)庫。特色文獻(xiàn)是很重要的收藏類型,我國地域廣大、歷史悠久,散布在全國各地的高校圖書館通常都會(huì)有自己的特藏資源,如善本古籍、珍稀地方史料、少數(shù)民族史料、藝術(shù)品、冷門技術(shù)資料、名人手稿、歷史影像圖片、珍稀圖譜/曲譜/膠片/地圖等,這些資源往往被當(dāng)作所在圖書館的“鎮(zhèn)館之寶”,極富歷史價(jià)值、文化價(jià)值、藝術(shù)價(jià)值和研究價(jià)值。因此,針對這部分資源的長期保存項(xiàng)目的建設(shè)就非常有必要。
我國高校圖書館的館藏電子資源主要以外購的商業(yè)數(shù)據(jù)庫資源為主,在購買方式上多數(shù)是購買數(shù)據(jù)庫的使用權(quán),由于知識產(chǎn)權(quán)方面的制約,僅有使用權(quán)的商業(yè)資源是無法作為機(jī)構(gòu)本地長期保存對象的,而可以作為長期保存對象的資源包括:買斷的電子書、訂購數(shù)據(jù)庫綁定的電子期刊,以及商業(yè)數(shù)據(jù)庫中的OA刊源(不穩(wěn)定)。如果考慮建立長期存儲并揭示以上數(shù)字資源的機(jī)制,高校在解決方案的選型上應(yīng)優(yōu)先參考斯坦福大學(xué)的LOCKSS項(xiàng)目(多備份資源保存系統(tǒng))。LOCKSS由美國國家自然基金組織贊助,斯坦福大學(xué)圖書館組織實(shí)施,是基于JAVA平臺的分布式開源系統(tǒng),系統(tǒng)設(shè)計(jì)遵循OAIS規(guī)范,在通用功能外也提供可擴(kuò)展功能及互操作訪問。LOCKSS與眾多出版社簽約,可直接收割多個(gè)出版社的數(shù)字資源,并面向用戶提供開放服務(wù)。LOCKSS聯(lián)盟是一個(gè)非營利的組織,在申請加入LOCKS聯(lián)盟后,圖書館可以很便捷地在LOCKS平臺上構(gòu)建本館的數(shù)字資源板塊,在獲取相應(yīng)權(quán)限和許可后通過網(wǎng)絡(luò)管理工具配置本館的LOCKSS存檔箱,將買斷電子書、綁定電子刊及OA刊等資源配置到存檔箱中,經(jīng)過平臺的一些常規(guī)驗(yàn)證,就可以完成這部分資源在LOCKSS平臺上的存儲和發(fā)布。
自建資源大致可以分為兩個(gè)部分:一是本機(jī)構(gòu)的核心科研產(chǎn)出及教學(xué)成果,包括科技論文、專著、學(xué)位論文、專利、會(huì)議論文、課題報(bào)告、教學(xué)課件、電子講義,以及科研與教學(xué)過程產(chǎn)生的中間附帶成果,如實(shí)驗(yàn)數(shù)據(jù)、階段性報(bào)告、CAD模型、源代碼資源等。二是特色資源,即收藏館特有的、獨(dú)有的珍貴資源。目前情況下,自建資源的數(shù)字化長期保存策略優(yōu)先選擇利用各高校已有的知識機(jī)構(gòu)庫平臺,同時(shí)也是為了規(guī)避相似項(xiàng)目重復(fù)建設(shè)的問題。我國高校數(shù)字資源長期保存項(xiàng)目建設(shè)的最優(yōu)解、最理想的方案是未來建設(shè)高校聯(lián)盟模式的長期保存聯(lián)合體,而當(dāng)前各高校知識機(jī)構(gòu)庫的建設(shè)可以看作聯(lián)盟形成之前的基礎(chǔ)性建設(shè),從知識機(jī)構(gòu)庫到高校聯(lián)盟最重要的工作是在各自機(jī)構(gòu)知識庫下本機(jī)構(gòu)數(shù)字資源的完整采集以及元數(shù)據(jù)質(zhì)量的穩(wěn)定控制。
當(dāng)前形勢下,高校圖書館以聯(lián)盟模式開展數(shù)字資源長期保存項(xiàng)目建設(shè)無疑是最佳選擇,聯(lián)盟模式下的項(xiàng)目建設(shè)可以統(tǒng)一標(biāo)準(zhǔn)規(guī)范,綜合技術(shù)優(yōu)勢,規(guī)范管理流程,減少成本支出,同時(shí)也是高校資源共享建設(shè)的核心需要。改革開放以來,在科技興國的方針指引下,我國高等教育事業(yè)進(jìn)入了突飛猛進(jìn)的發(fā)展階段,高校圖書館的文獻(xiàn)購置費(fèi)也在不斷增多,商業(yè)文獻(xiàn)數(shù)據(jù)庫資源迅速成為高校科研教師的主要參考資源,但必須關(guān)注的是,高校的發(fā)展并沒有形成合力,資源的重復(fù)訂購、項(xiàng)目的重復(fù)建設(shè)、科技攻關(guān)的各自為政,都造成了極大的資源浪費(fèi)現(xiàn)象,圖書館領(lǐng)域也是這樣。因此,數(shù)字資源長期保存項(xiàng)目的協(xié)同開展給我國高校圖書館提供了一個(gè)合作發(fā)展的契機(jī),有利于科研資源的有效整合,有利于先進(jìn)技術(shù)方案的普及應(yīng)用,有利于科研資源的合理分配。
在聯(lián)盟模式選擇方面,聯(lián)盟式高校數(shù)字資源長期保存項(xiàng)目在選型方面應(yīng)首選混合模式,主要原因是高校發(fā)展水平并不均衡,“雙一流”高校、京津地區(qū)高校、東南沿海發(fā)達(dá)地區(qū)高校占有更多的教育資源,而普通高校、內(nèi)陸偏遠(yuǎn)地區(qū)高校即使有相當(dāng)?shù)募夹g(shù)實(shí)力和豐富的特色資源,在獨(dú)立開展資源保存項(xiàng)目時(shí)很難獲得持續(xù)的經(jīng)費(fèi)支持或基金贊助?;旌鲜铰?lián)盟開展模式可以有效解決這個(gè)問題,發(fā)達(dá)地區(qū)高校更多地承擔(dān)平臺運(yùn)營支出,內(nèi)陸地區(qū)高校專注提供資源,這符合國家的基本發(fā)展戰(zhàn)略,也符合我國高等教育的發(fā)展規(guī)律。
在資源平臺建設(shè)方面,各高校應(yīng)充分考慮類似項(xiàng)目的已有基礎(chǔ),避免資源浪費(fèi)。近年來,各校普遍建設(shè)的機(jī)構(gòu)知識庫系統(tǒng)是一個(gè)不錯(cuò)的基礎(chǔ),盡管現(xiàn)有機(jī)構(gòu)知識庫平臺可能存在諸如元數(shù)據(jù)格式不標(biāo)準(zhǔn)、存儲方式落后、采集方式簡陋、平臺技術(shù)含量低、功能欠缺、開放性差等問題,但數(shù)字資源本身及元數(shù)據(jù)才是最重要的,各高校累積處理和存儲的海量數(shù)據(jù)資源將成為高校聯(lián)盟項(xiàng)目最寶貴的基礎(chǔ)性資源。
在組織管理架構(gòu)方面,與資源平臺建設(shè)方面的考量一樣,從成本分析、實(shí)現(xiàn)難易等角度出發(fā),全新創(chuàng)建一個(gè)聯(lián)盟不如以原有類似聯(lián)盟為基礎(chǔ),修訂聯(lián)盟宗旨、擴(kuò)充服務(wù)功能、拓展覆蓋范圍,綜合來看DRAA聯(lián)盟就是最佳的選擇。DRAA聯(lián)盟是以高校圖書館為核心成員的數(shù)字資源集團(tuán)采購組織,以DRAA聯(lián)盟為基礎(chǔ)建設(shè)我國高??蒲袛?shù)據(jù)長期保存合作性組織具有較高的可行性和可持續(xù)性。
以DRAA采購聯(lián)盟為基礎(chǔ)構(gòu)建的數(shù)字保存聯(lián)盟采用混合模式的聯(lián)盟策略,具有兼顧集中統(tǒng)籌與自愿協(xié)議式管理的優(yōu)勢,管理與組織形式相對靈活。規(guī)模不一、能力各異的成員可以根據(jù)自身稟賦自由選擇適合自身的建設(shè)模式,可以更貼切地滿足其內(nèi)部數(shù)字資源管理與利用需求,也能在更大范圍內(nèi)與外部聯(lián)盟成員間實(shí)現(xiàn)資源共享及技術(shù)分享,在充分尊重各成員自主性的基礎(chǔ)上,通力協(xié)作,共享技術(shù),分擔(dān)成本,實(shí)現(xiàn)數(shù)據(jù)的分工協(xié)作、分布保存,為各高校數(shù)字資源長期保存打下堅(jiān)定的基礎(chǔ)。
隨著大數(shù)據(jù)時(shí)代的來臨,信息技術(shù)的進(jìn)步和新興理念的出現(xiàn),為數(shù)字資源長期保存課題提供了更多的思路、選擇和技術(shù)手段。近年來,國內(nèi)外的學(xué)術(shù)理論研究和實(shí)踐探索也逐漸走向成熟和穩(wěn)定,出現(xiàn)了眾多的理論分支、解決方案、平臺工具和實(shí)踐項(xiàng)目,但也必須看到,數(shù)字資源長期保存策略的具體實(shí)施及保存體系的建立健全受多方面因素的制約和影響,如技術(shù)因素、經(jīng)濟(jì)因素、法律因素等。資源長期保存課題面臨的發(fā)展前景是復(fù)雜的,面臨的挑戰(zhàn)也是巨大的,我國文獻(xiàn)收藏機(jī)構(gòu),特別是高校圖書館應(yīng)肩負(fù)起自己的責(zé)任,從現(xiàn)狀研究和需求分析入手,全面洞悉長期保存課題的發(fā)展脈絡(luò),遵循我國科研與社會(huì)發(fā)展的實(shí)際情況,利用已有的有效平臺基礎(chǔ),采用成熟的理念、全新的技術(shù),建立健全長期保存制度,建設(shè)完善的長期保存機(jī)制,為廣大科研人員構(gòu)建高水平的學(xué)術(shù)交流與分享平臺,為國家科技興國方略夯實(shí)數(shù)據(jù)基礎(chǔ)。