王興婭 顏祥林
(南京大學(xué)信息管理學(xué)院,江蘇南京,210093)
基于LISA數(shù)據(jù)庫(kù)的國(guó)外
數(shù)字檔案資源保存與安全研究動(dòng)向分析*
王興婭 顏祥林
(南京大學(xué)信息管理學(xué)院,江蘇南京,210093)
文章通過(guò)對(duì)LISA中收錄的2008-2010年數(shù)字檔案資源保存與安全方面文獻(xiàn)的統(tǒng)計(jì)分析,從期刊、作者、主題等角度揭示了國(guó)外數(shù)字檔案資源保存與安全的研究狀況,發(fā)現(xiàn)國(guó)外該領(lǐng)域的研究主要集中在數(shù)字檔案資源存儲(chǔ)、相關(guān)理論研究、災(zāi)難恢復(fù)、保存格式、載體及方法等方面。
數(shù)字檔案 資源保存 資源安全 LISA
在檔案信息化過(guò)程中,如何對(duì)數(shù)字資源進(jìn)行有效保存,是需要面對(duì)的首要問(wèn)題。正因?yàn)槿绱?,相關(guān)問(wèn)題的研究得到了檔案界的持續(xù)關(guān)注。近年來(lái),國(guó)外相關(guān)學(xué)術(shù)數(shù)據(jù)庫(kù)中的檔案學(xué)文獻(xiàn)已經(jīng)作為一種重要的情報(bào)源,成為了國(guó)內(nèi)檔案界關(guān)注國(guó)外檔案學(xué)研究動(dòng)向、評(píng)述檔案學(xué)研究進(jìn)展的基本途徑?;诖?,本文以主流英文數(shù)據(jù)庫(kù)LISA(Library&Information Science Abstracts,即圖書(shū)館學(xué)信息學(xué)文摘數(shù)據(jù)庫(kù))為數(shù)據(jù)來(lái)源,通過(guò)對(duì)2008-2010年國(guó)外數(shù)字檔案資源保存與安全方面題錄的統(tǒng)計(jì)分析,系統(tǒng)總結(jié)國(guó)外此類(lèi)研究的熱點(diǎn),以期對(duì)我國(guó)檔案學(xué)發(fā)展有所借鑒與啟示。
本文首先以KW=(archiv*or fi1e*or record*)and PY=(2008 or2009 or2010)為檢索式,以2010年10月23日作為時(shí)間截點(diǎn)進(jìn)行數(shù)據(jù)檢索,得到2524條記錄。由于數(shù)據(jù)中含有情報(bào)、圖書(shū)館等其他與檔案學(xué)不相關(guān)的記錄,經(jīng)過(guò)人工篩選,最終形成由1248條記錄組成的題錄庫(kù);其次,結(jié)合國(guó)內(nèi)一些關(guān)于檔案學(xué)研究主題方面的分類(lèi)方案或觀點(diǎn)形成本文研究的主題分類(lèi)表[1],并通過(guò)對(duì)題錄庫(kù)的初步整理和分類(lèi),在信息化一級(jí)類(lèi)目下得到資源保存與安全二級(jí)類(lèi)目題錄為141條;最后,在對(duì)這141條題錄的題名、關(guān)鍵詞和文摘進(jìn)行較為詳細(xì)的翻譯基礎(chǔ)上,進(jìn)一步對(duì)主題進(jìn)行分析與提煉,并增添從檔案信息化其他分類(lèi)中剔除出來(lái)的有關(guān)資源保存與安全的文章,最終整理得出屬于資源保存與安全類(lèi)題錄的有160條。
表1 期刊載文分布情況
通過(guò)對(duì)發(fā)文期刊的統(tǒng)計(jì)發(fā)現(xiàn),160篇文章分布在58種期刊中,平均每種期刊載文章3篇,載文量5篇及以上期刊有8種,其中RecordsManagement Bu1-1etin(即《文件管理報(bào)告》)和Library Trends(即《圖書(shū)館趨勢(shì)》)兩本期刊各刊發(fā)了19篇和13篇,見(jiàn)表1。這8種期刊相關(guān)論文共73篇,占總數(shù)的45.63%,由此可見(jiàn),這8種期刊是有關(guān)資源保存與安全類(lèi)研究的主要陣地。
對(duì)作者主體的分析主要包括國(guó)別分析、機(jī)構(gòu)分析和核心作者分析。通過(guò)這三個(gè)方面的分析,我們可對(duì)國(guó)外此類(lèi)研究的主體有一個(gè)更加直觀的了解,并從中得到一定的借鑒和啟發(fā)。
(1)國(guó)別分析。在可確定國(guó)別的139條記錄中,作者共來(lái)自13個(gè)國(guó)家。發(fā)文超過(guò)5篇的有5個(gè)國(guó)家,分別是英國(guó)、美國(guó)、南非、法國(guó)和荷蘭。其中,英國(guó)和美國(guó)是主要發(fā)文國(guó)家,發(fā)文量分別為62篇和50篇,各占文獻(xiàn)總數(shù)的38.75%和31.25%。
表2 核心作者及發(fā)文情況
(2)機(jī)構(gòu)分析。從可確定作者所屬機(jī)構(gòu)的114條記錄來(lái)看,大學(xué)、圖書(shū)館、檔案館和博物館為主要發(fā)文單位,具有較強(qiáng)的研究實(shí)力,高校發(fā)文48篇,圖書(shū)館、檔案館和博物館發(fā)文32篇,其余機(jī)構(gòu)發(fā)文量比例如圖1所示。由于數(shù)字檔案資源保存與安全研究涉及相關(guān)技術(shù)因素,因此一些有技術(shù)背景的研究機(jī)構(gòu)和公司也是不可忽視的研究主體。
(3)核心作者分析。160條記錄中除去1條以機(jī)構(gòu)名義發(fā)文,實(shí)際參與統(tǒng)計(jì)的記錄有159條。第一作者共有149人,其中發(fā)文一篇的有141人,占第一作者總?cè)藬?shù)的94.6%,這說(shuō)明數(shù)字檔案資源保存與安全領(lǐng)域研究者隊(duì)伍還不太穩(wěn)定,流動(dòng)性較大。發(fā)表文章2篇及以上的作者有8位,筆者將這8位定義為該領(lǐng)域的核心作者,其中Prisci11a Cap1an和Jane Hedberg各發(fā)表了3篇。
圖1 機(jī)構(gòu)性質(zhì)及發(fā)文比例
表3 資源保存與安全文獻(xiàn)分布情況
通過(guò)對(duì)這160條記錄進(jìn)行詳細(xì)的分析,將數(shù)字資源保存與安全的研究主題進(jìn)行了細(xì)分,可以得到12個(gè)左右的小類(lèi),如表3。
(1)存儲(chǔ)。該主題是資源保存與安全研究的重點(diǎn),共96篇,占總數(shù)的60%。研究者們的視角各有偏重,有的研究者探討了一些存儲(chǔ)項(xiàng)目,這些項(xiàng)目的發(fā)起主體主要是國(guó)家政府機(jī)構(gòu)以及圖書(shū)館和檔案館等。如由美國(guó)國(guó)會(huì)圖書(shū)館國(guó)家數(shù)字信息基本建設(shè)和保存工程贊助,四個(gè)及與數(shù)據(jù)庫(kù)描述性文件的連接等[12];有研究者介紹了數(shù)字錄音磁帶數(shù)據(jù)遷移的方法;還有介紹由美國(guó)博物館及圖書(shū)服務(wù)中心(IMLS)贊助的致力于解決庫(kù)庫(kù)轉(zhuǎn)移的語(yǔ)義問(wèn)題的TIPR(可共操作保存數(shù)據(jù)庫(kù))項(xiàng)目。
(8)加密。研究者介紹了一些加密技術(shù),如“統(tǒng)一加密管理”;針對(duì)外部設(shè)備利用硬件加密芯片進(jìn)行無(wú)縫式加密和解密數(shù)據(jù)的嵌入式加密方法。
(9)災(zāi)難預(yù)防。有研究者介紹由波蘭、德國(guó)和捷克三國(guó)組成的工作小組建立的一個(gè)關(guān)于災(zāi)難預(yù)防和災(zāi)難管理信息的網(wǎng)絡(luò)EURANED(歐洲檔案災(zāi)難管理網(wǎng)絡(luò)),該網(wǎng)絡(luò)將涵蓋災(zāi)難預(yù)防和管理的各方面信息,還包含短期指導(dǎo)方針以及應(yīng)對(duì)緊急情況時(shí)處理或處置某些類(lèi)型的受損檔案材料的方法[13];還有的討論了博茨瓦納(Botswana)首都哈博羅內(nèi)(Gaborone)的信息中心如何進(jìn)行災(zāi)難預(yù)防,指出該信息中心對(duì)災(zāi)難的準(zhǔn)備不充分,缺少災(zāi)難預(yù)防計(jì)劃,且政策和程序不適當(dāng),災(zāi)難管理人員配備不足,缺少保存和恢復(fù)設(shè)施,在此基礎(chǔ)上提出了若干建議,包括對(duì)相關(guān)人員進(jìn)行災(zāi)難預(yù)防知識(shí)的培訓(xùn),為信息中心配備一定的工具和資源等[14]。
(10)仿真。有研究者介紹了一個(gè)計(jì)算機(jī)硬件仿真設(shè)備Dioscuri,它用于確保過(guò)去的文件和程序在將來(lái)的可獲取性,還介紹了歐洲的一個(gè)相關(guān)項(xiàng)目——保持仿真環(huán)境的便攜(KEEP)等。
(11)權(quán)限。有研究者描述了限制用戶利用數(shù)字信息的技術(shù)保護(hù)措施的使用情況。從控制查找方面來(lái)說(shuō),大部分調(diào)查對(duì)象采取了IP地址的限制和授權(quán)系統(tǒng)的網(wǎng)絡(luò)ID;從控制使用方面來(lái)說(shuō),采取了權(quán)限的可靠性鑒別、刪減范圍和可視化的水印。還有部分機(jī)構(gòu)結(jié)合自身需求開(kāi)發(fā)了一定的保護(hù)技術(shù),如彈出式、無(wú)權(quán)限的使用復(fù)制件和存儲(chǔ)功能、不可視水印以及構(gòu)建審查者或機(jī)構(gòu)鑒定系統(tǒng)[15]。
(12)風(fēng)險(xiǎn)評(píng)估。介紹了一個(gè)信息管理小組的風(fēng)險(xiǎn)評(píng)估經(jīng)驗(yàn),他們將行州政府協(xié)力完成的數(shù)字地理資料的保存項(xiàng)目;斯坦福大學(xué)圖書(shū)館的數(shù)字資源長(zhǎng)期保存項(xiàng)目(CLOCKSS)。有的研究者討論了多種類(lèi)型電子文件的存儲(chǔ),包括電子期刊、法律文件、個(gè)人文件、當(dāng)?shù)匦侣?、視?tīng)檔案、電子郵件、博客、地理空間數(shù)據(jù)和電子稅務(wù)文件等。也有研究者探討了存儲(chǔ)格式、歸檔經(jīng)驗(yàn)、歸檔面對(duì)的相關(guān)問(wèn)題、存儲(chǔ)資料的收集等,其中澳大利亞國(guó)家檔案館的數(shù)字歸檔經(jīng)驗(yàn)是值得借鑒的,這些經(jīng)驗(yàn)包括推進(jìn)政府文件保管的改革,開(kāi)展數(shù)字保存項(xiàng)目以及進(jìn)行點(diǎn)對(duì)點(diǎn)數(shù)字歸檔[2]??傮w來(lái)說(shuō),國(guó)外對(duì)存儲(chǔ)的研究比重較大,且研究視角比較廣泛。
(2)相關(guān)理論研究。主要是對(duì)數(shù)字保存經(jīng)驗(yàn)、發(fā)展、原則和面對(duì)的問(wèn)題進(jìn)行理論性論述。如來(lái)源原則和原始整理原則在數(shù)字時(shí)代的適用性研究;荷蘭國(guó)家圖書(shū)館數(shù)字檔案管理的經(jīng)驗(yàn)介紹,包括資料收集、技術(shù)、組織和安全等方面[3];長(zhǎng)期存取的經(jīng)濟(jì)可持續(xù)性研究;信息安全立法的必要性分析;有研究者在文中指出應(yīng)把數(shù)據(jù)保護(hù)劃分成四個(gè)階段:檢索、保護(hù)、管理和維護(hù)[4];有研究者討論分布式過(guò)程導(dǎo)向的醫(yī)療信息安全標(biāo)準(zhǔn)存在的缺陷,并提出相關(guān)改善意見(jiàn)[5]??傮w來(lái)說(shuō),國(guó)外的資源保存與安全的相關(guān)理論研究主要是為了增強(qiáng)社會(huì)對(duì)數(shù)字信息長(zhǎng)期保存和安全的意識(shí),以引起對(duì)面臨的迫在眉睫的保存和安全問(wèn)題的關(guān)注和思考。
(3)災(zāi)難恢復(fù)。主要討論了有關(guān)圖書(shū)館、檔案館以及相關(guān)組織的災(zāi)難恢復(fù)經(jīng)驗(yàn),如杜蘭大學(xué)圖書(shū)館遭遇卡特里娜颶風(fēng)后,在災(zāi)后恢復(fù)專家的幫助下對(duì)受災(zāi)資料進(jìn)行恢復(fù)[6];惠靈頓競(jìng)技俱樂(lè)部如何拯救其處于惡劣存儲(chǔ)環(huán)境下的檔案[7]。成功的恢復(fù)經(jīng)驗(yàn)可為后人所借鑒,可以使災(zāi)難發(fā)生后受損檔案盡快得到拯救。
(4)格式轉(zhuǎn)換。該類(lèi)主題的7篇文章主要研究了格式過(guò)時(shí)帶來(lái)的問(wèn)題或威脅,并指出了進(jìn)行格式轉(zhuǎn)換的必要性和價(jià)值。如討論了格式過(guò)時(shí)的機(jī)制以及過(guò)去和現(xiàn)在的影響,確定處于危險(xiǎn)中格式的特征以及為格式轉(zhuǎn)換所做的準(zhǔn)備。另有介紹當(dāng)前的主要格式和今后有應(yīng)用前景的格式,如JPEG 2000格式,荷蘭國(guó)家圖書(shū)館對(duì)他們當(dāng)前使用的未壓縮的TIFF格式和JPEG 2000的適用性進(jìn)行了對(duì)比,分析了存儲(chǔ)能力、圖像質(zhì)量、長(zhǎng)期持續(xù)性和功能性四個(gè)方面,認(rèn)為JPEG 2000是可被推薦的未來(lái)檔案存儲(chǔ)格式[8]。也有討論格式轉(zhuǎn)換的標(biāo)準(zhǔn)問(wèn)題,如有的闡述相關(guān)標(biāo)準(zhǔn)的發(fā)展、文件和信息管理標(biāo)準(zhǔn)的作用和需求、當(dāng)前發(fā)展中存在的問(wèn)題以及標(biāo)準(zhǔn)發(fā)展中協(xié)作的必要性。
(5)載體轉(zhuǎn)換。有研究者論述相關(guān)信息小組在將紙質(zhì)學(xué)術(shù)論文向縮微膠卷再向PDF格式轉(zhuǎn)化過(guò)程中,選擇數(shù)字版權(quán)管理工具的原因和標(biāo)準(zhǔn)以及進(jìn)行載體轉(zhuǎn)換的一些驅(qū)使因素;另有介紹奧地利維也納視聽(tīng)檔案館參與的視聽(tīng)檔案數(shù)字化項(xiàng)目,包括來(lái)自羅馬尼亞科學(xué)研究院、俄羅斯的圣彼得堡音響檔案館、阿爾巴尼亞科學(xué)研究院的文化人類(lèi)學(xué)和藝術(shù)研究協(xié)會(huì)以及近期的埃塞俄比亞國(guó)家檔案館和圖書(shū)館聲音檔案的數(shù)字化[9];也有介紹由11所大學(xué)圖書(shū)館組成的大學(xué)圖書(shū)館聯(lián)合委員會(huì)進(jìn)行的在線期刊紙質(zhì)備份的項(xiàng)目。
(6)備份。討論了使用U盤(pán)或其他存儲(chǔ)設(shè)備進(jìn)行備份時(shí)如何保護(hù)數(shù)據(jù)安全的問(wèn)題;有研究者提出數(shù)據(jù)保護(hù)最新趨勢(shì)——“鏡像法”,即數(shù)據(jù)在線保存在多重存儲(chǔ)單元上[10];也有介紹聯(lián)機(jī)計(jì)算機(jī)圖書(shū)館中心(OCLC)數(shù)字檔案館的安全措施,即利用多重本地磁盤(pán)陣列驅(qū)動(dòng)進(jìn)行檔案維護(hù)以及經(jīng)常進(jìn)行磁帶備份,以使數(shù)字檔案館任何時(shí)刻都有多份拷貝存儲(chǔ)在離線設(shè)備上,并且有一份在線存儲(chǔ),并對(duì)磁盤(pán)存儲(chǔ)設(shè)備的生命周期進(jìn)行監(jiān)視,定期更換記錄介質(zhì)[11]。
(7)數(shù)據(jù)遷移。有文章介紹了一種視聽(tīng)檔案向數(shù)字文件遷移的框架,主要是利用高速遷移和機(jī)器人技術(shù)相結(jié)合的自動(dòng)化方法,包括一個(gè)遷移財(cái)產(chǎn)管理系統(tǒng)、處理物理和邏輯資料的后臺(tái)、存儲(chǔ)以為管理方法與風(fēng)險(xiǎn)管理系統(tǒng)結(jié)合起來(lái),為信息處理的風(fēng)險(xiǎn)評(píng)估提供證據(jù)。同時(shí)指出建立穩(wěn)妥的信息管理規(guī)劃是極其重要的,此規(guī)劃可以有效地對(duì)持續(xù)變化的信息管理過(guò)程進(jìn)行風(fēng)險(xiǎn)評(píng)估[16]。
(13)其他。剩下的13篇文章主題比較分散,分別討論電子文件管理標(biāo)準(zhǔn)、數(shù)字信息的自動(dòng)化鑒定、電子文件的管理環(huán)境調(diào)查、安全管理的私有化、數(shù)字信息審查等問(wèn)題以及數(shù)字保存的相關(guān)新聞。
從上述的分析中我們可以看出,資源的存儲(chǔ)問(wèn)題是國(guó)外數(shù)字檔案資源保存與安全近年研究的主流方向,相關(guān)理論研究依然得到一定的關(guān)注,同時(shí)災(zāi)難恢復(fù)、保存格式、保存載體、保存方法等方面也受到越來(lái)越多的重視。同時(shí),國(guó)外檔案學(xué)者非常重視解決資源保存過(guò)程中面臨的實(shí)際問(wèn)題,研究偏重技術(shù)層面,特別注重研究的實(shí)踐價(jià)值,且相關(guān)國(guó)家的信息化項(xiàng)目取得了一定的成功經(jīng)驗(yàn),這些均值得國(guó)內(nèi)檔案學(xué)界關(guān)注、借鑒和學(xué)習(xí)。
注釋
[1]王婷婷.基于LISA數(shù)據(jù)庫(kù)的國(guó)外檔案學(xué)研究動(dòng)向分析[D].南京:南京大學(xué)信息管理學(xué)院,2011.
[2] Cunningham, Adrian.Digita1 Curation/Digita1Archiving:A View from the Nationa1Archives of Austra1ia[J].The American Archivist,vo1.71,no.2,pp.530-543,Fa11-Winter2008.
[3]Marce1Ras.The KBE-Depot:Bui-1ding and Managing a Safe P1ace for E-Journa1s[J].Liber Quarter1y:The Journa1 of European Research Libraries,vo1.19,no.1,2009.
[4]Peter M itteregger.Top ten tips to data security [J].Records Management Bu11etin,no.143,pp.24-25,May 2008.
[5]Eva Soderstrom,Rose-Mharie Ah1fe1dt,Nom ie Eriksson.Standards for Information Security and Processes in Hea1thcare [J].Journa1 of Systems and Information Techno1ogy,vo1.11,no.3,pp.295-308,2009.
[6]Kin1ey Levack.By the book:the recovery effort at Tu1ane University[J].EContent,vo1.31,no.5,pp.16-17,Jun 2008.
[7]Stephen Ham i1ton.Ga11opers and Guano:Rescuing the Archive of theWe11-ington Racing C1ub[J].
[8]Hannes Ku1ovits,AndreasRauber,Anna Kug1er; Markus Brant1, Tobias Beinert,Astrid Schoger.From TIFF to JPEG 2000?Preservation P1anning at the Bavarian State Library Using a Co11ection of Digitized 16th Century Printings[J].D-Lib Magazine,vo1.15,no.11-12,Nov-Dec2009.
[9]Wa11aszkovits,Nadja.Digitisation of Research Sound Co11ections: Practica1 App1ication of IASA Guide1ines in Sma11-Sca1e Digitisation Projects[J].IASA Journa1,no.35,pp.89-98,June2010.
[10]Dougherty,Wi11iam C.Preservation of Digita1Assets: One Approach[J].The Journa1of Academ ic Librarianship, vo1.35,no.6,pp.599-602,Nov 2009.
[11]Harris,Sian.Keeping Data Safe[J].Research Information,no.38,pp.26,Oct-Nov 2008.
[12]Jacobson,Martin.M igration of 1.5 m i11ion hours of audio-visua1materia1[J].IASA Journa1,no.31,pp.25-35,Ju1y 2008.
[13]Barte1eit,Sebastian.EURANED:An European Project for Disaster Prevention and Disaster Management[J].Internationa1Preservation News,no.49,pp.17,Dec 2009.
[14]H1abaangani,Kabe1o;Mnjama,Nathan. Disaster preparedness in information centres in Gaborone,Botswana[J].A frican Journa1 of Library,Archives&Information Science,vo1.18,no.1,pp.63-73,Apr2008.
[15]Eschenfe1der,Kristin R.;Agnew,Grace.Techno1ogies Emp1oyed to Contro1 Access to or Use of Digita1 Cu1tura1 Co11ections:Contro11ed On1ine Co11ections[J].D-Lib Magazine,vo1.16,no.1-2,Jan/Feb 2010.
[16]Sm ith,Robin.P1aying thenumbers gameandw inning![J].RecordsManagement Bu11etin,no.145,pp.8-10,Sept2008.
*本文系國(guó)家檔案局軟科學(xué)項(xiàng)目《基于網(wǎng)絡(luò)英文信息資源調(diào)研下的國(guó)外檔案學(xué)研究進(jìn)展分析》(項(xiàng)目編號(hào):2009-R-04)階段性成果之一。
Research Motivation Analysis to the Preservation and Safety of Foreign DigitalArchives Resources Based on the LISA Database
Wang Xingya,Yan Xiang1in
(Schoo1of Information Management,Nanjing University,Nanjing,Jiangsu,210093)
Theartic1e statesand ana1yzes the papersaboutpreservation and safety of digita1archives resources from 2008 to 2010 in the LISA database,revea1ing the research status of the preservation and safety of foreign digita1archives resources from severa1aspectssuch as journa1,author,subject and so on.The research focuses in this fie1d inc1udesdigita1archives resourcesstorage,theoretica1research,disaster recovery,preservation format,carrier,strategiesand so on.
Digtia1Archives;Resources Preservation;Resources Safety;LISA
G27
王興婭,1988年生,女,江蘇宿遷人,南京大學(xué)信息管理學(xué)院2010級(jí)檔案學(xué)碩士研究生。顏祥林,1964年生,男,江蘇鎮(zhèn)江人,管理學(xué)博士,南京大學(xué)信息管理學(xué)院教授,碩士生導(dǎo)師。研究方向:信息政策法規(guī)、知識(shí)產(chǎn)權(quán)戰(zhàn)略、數(shù)字檔案信息資源管理等。