余亞榮 吳振宇
摘? 要:本文回顧了中國電子檔案長期保存工作的歷程,并從目的性出發(fā)加以審視,指出傳統(tǒng)備份方式存在的瓶頸,引入電子檔案數(shù)據(jù)保全理念,闡述基于電子憑證效力維護的電子檔案長期安全保管模式,以期為檔案業(yè)務部門開展電子檔案長期保存提供參考。
關鍵詞:檔案備份;數(shù)據(jù)保全;電子證據(jù);長期保存
Abstract:? This article reviews and examines the process of long-term preservation of electronic Archives in China, pointing out the bottleneck of traditional Archives backup methods. It introduces the concept of electronic archival data preservation, and expounds the long-term security management mode of electronic Archives based on electronic evidence preservation, so as to provide suggestions for archival department to carry out long-term preservation of electronic Archives.
Keywords:? Electronic archives backup; Archival data preservation; Electronic evidence; Long-termpreservation.
本文通過對電子檔案異質(zhì)異地備份模式和檔案數(shù)據(jù)保全模式開展研究和對比,分析基于長期保存視角的電子檔案保存方案。
1 傳統(tǒng)電子檔案備份的目的及瓶頸分析
1.1 電子檔案備份的目的。從目的性角度來分析,開展電子檔案備份工作的根本目的在于檔案機構要確保館藏檔案在長期保管過程中的絕對安全,這里的安全既包括載體安全也包括內(nèi)容安全。從傳統(tǒng)意義上的備份策略來看,載體安全主要用備份多套來規(guī)避存儲載體的老化或損傷,內(nèi)容安全主要依賴傳統(tǒng)載體檔案的數(shù)字化和電子檔案的紙質(zhì)副本或電子縮微品來實現(xiàn),這也是我們常見的電子檔案異質(zhì)異地備份保管。
1.2 電子檔案備份存在的瓶頸
1.2.1 電子檔案存儲載體不穩(wěn)定,數(shù)據(jù)易丟失。與紙張等介質(zhì)相比,電子檔案存儲所依賴的磁性介質(zhì)、光介質(zhì)、電離介質(zhì)均不同程度存在易老化、穩(wěn)定性不足等問題。根據(jù)國外數(shù)據(jù)公司Crashplan發(fā)布的《存儲介質(zhì)使用壽命情況》顯示,包括硬盤、固態(tài)硬盤等在內(nèi)的諸多存儲介質(zhì),在常規(guī)使用情況下僅有數(shù)十年的使用壽命,完全無法滿足電子檔案所需的長期或永久保存需求,存在極大的數(shù)據(jù)丟失風險。
1.2.2 電子檔案原始性保護無有效手段,數(shù)據(jù)易被篡改。電子檔案在管理模式上與傳統(tǒng)載體檔案存在較大差異,最顯著的就是針對電子檔案“原始性”的維護,電子檔案特有的“載體與信息內(nèi)容的可分離性”“信息內(nèi)容易修改”[1]給保存帶來風險,基于保護載體就是保護內(nèi)容的模式不再適用,而能夠?qū)崿F(xiàn)電子檔案固化的技術工具尚未在管理中加以運用,采用異質(zhì)異地備份模式,可以在一定程度上降低因誤操作或有意篡改而造成的電子檔案內(nèi)容失真的風險。
1.2.3 電子檔案對技術環(huán)境具有依賴,數(shù)據(jù)存在識讀風險。檔案機構在開展電子檔案保管工作中,不但需要確保電子檔案內(nèi)容的原始性維護有效,還需要對電子檔案的技術環(huán)境進行管理,更為致命的在于,文件格式、操作系統(tǒng)、應用軟件等關系電子檔案識讀的技術環(huán)境也擁有自己的生命周期,早前產(chǎn)生的部分熱門和常見文件格式現(xiàn)在已經(jīng)走向式微,這與電子檔案永久保管的需求不相適應。檔案機構開展電子檔案備份,將電子檔案轉(zhuǎn)換成紙質(zhì)文件等形式進行存儲,部分原因也是出于對上述風險的無奈應對。
1.2.4 人為安全事故或自然災害頻發(fā),安全保管風險加大。除上述三個因電子檔案自身特性而必須采取備份手段加以規(guī)避的因素外,因內(nèi)部管理不到位所導致的人為安全事故或因自然災害原因使電子檔案受到安全威脅也是各地開展這一工作的主要原因。伴隨著社會信息化的深入推進和電子檔案備份工作大規(guī)模展開,采用該模式的瓶頸也逐步顯現(xiàn)。
首先,電子檔案備份造成業(yè)務工作效率降低。信息化系統(tǒng)和工具在日常工作、生活中普及后,經(jīng)由信息系統(tǒng)或計算機設備直接形成電子文件成為主流,業(yè)務活動中大量形成的電子文件在進入檔案管理環(huán)節(jié)時卻需要按照規(guī)定形成其他載體形式,而這其中絕大部分的工作是由文件形成部門在歸檔前需要完成的任務,這對于業(yè)務部門而言變成了負擔,且因大量重復性文書工作的羈絆,造成業(yè)務工作效率降低。
其次,電子檔案備份增大檔案管理難度。電子檔案備份需要形成多套數(shù)據(jù),并存儲于不同空間和介質(zhì),數(shù)據(jù)的拷貝、檢測等工作極大地耗費檔案工作者的時間和精力,并在一定程度上形成無形的管理壓力,如多套數(shù)據(jù)的定期檢測、數(shù)據(jù)一致性的檢查與維護、數(shù)據(jù)存儲載體遷移等。
再者,電子檔案備份造成資源大量浪費。電子檔案的備份工作需要使用大量的紙張、存儲器、存放空間及配套環(huán)境,同一份檔案需要在多種介質(zhì)、多個空間下進行存儲,需要消耗數(shù)倍的資源。
更為重要的是,電子檔案備份無法完全確保電子檔案的長久安全保全需要。依賴多套數(shù)據(jù)備份無法從根本上確保電子檔案的安全存儲,且因電子檔案憑證效力的維護與傳統(tǒng)載體檔案在方法上的不同,使用傳統(tǒng)的異質(zhì)異地備份模板無法滿足“數(shù)字轉(zhuǎn)型”背景下的檔案長期存儲與利用。
2 檔案數(shù)據(jù)保全
2.1 檔案數(shù)據(jù)保全的含義?;谏衔牡年U述,僅僅采用異質(zhì)異地備份模式無法實現(xiàn)電子檔案的長久安全管理,也無法徹底根除信息技術存在的瓶頸。
隨著信息技術的深入發(fā)展,新出現(xiàn)的技術工具成為推動解決電子檔案安全風險的有力手段,如2004年《中華人民共和國電子簽名法》頒布施行,其中明確“可靠的電子簽名與手寫簽名或者蓋章具有同等的法律效力”,并在法條中規(guī)范了提供電子認證服務機構的相應要求。
近些年來,區(qū)塊鏈、可信時間戳、哈希特征值校驗等證據(jù)收集、固定和防篡改的技術手段陸續(xù)進入司法機構關于“電子數(shù)據(jù)證據(jù)”采信的規(guī)則之中 ,則在相當大程度上給予了檔案管理機構以啟示,檔案界也在此方面展開了諸多有益的探索,如“區(qū)塊鏈技術在突發(fā)公共衛(wèi)生事件檔案管理中的應用”[2]“基于區(qū)塊鏈技術的檔案數(shù)據(jù)共享策略”[3]等。
2018年,蘇州大學成立檔案數(shù)據(jù)保全中心,首次提出“檔案數(shù)據(jù)保全”理念,采取電子檔案數(shù)據(jù)固化、第三方數(shù)據(jù)存證[4]、數(shù)據(jù)狀態(tài)實時性監(jiān)管等技術和管理方案,實現(xiàn)對電子檔案的長期安全管理。根據(jù)張照余教授的觀點,“檔案數(shù)據(jù)保全是指采用一定的技術手段和管理措施將檔案數(shù)據(jù)的內(nèi)容固定并長久保管,確保檔案數(shù)據(jù)的準確、完整、可用和安全,維護數(shù)字檔案的真實性和法定證據(jù)價值”。
2.2 檔案數(shù)據(jù)保全的實現(xiàn)
2.2.1 電子檔案數(shù)據(jù)丟失監(jiān)測。從業(yè)務部門長期實踐的經(jīng)驗來看,電子檔案數(shù)據(jù)丟失的主要原因有三個,一是因存儲載體老化失效造成保存于其上的電子檔案發(fā)生信號丟失;二是因存儲環(huán)境中存在強磁環(huán)境而造成數(shù)據(jù)丟失,三是在管理過程中因人為或其他因素發(fā)生的數(shù)據(jù)誤刪除等。
基于上述原因,避免電子檔案數(shù)據(jù)丟失的關鍵在于對電子檔案數(shù)據(jù)開展科學的監(jiān)測,及時獲取電子檔案數(shù)據(jù)存儲狀態(tài)。檔案數(shù)據(jù)保全模式基于系統(tǒng)算法,對存儲數(shù)據(jù)開展實時監(jiān)測與預警,并根據(jù)數(shù)據(jù)狀態(tài)的異常變化開展數(shù)據(jù)保全與數(shù)據(jù)修復,恢復電子檔案原始狀態(tài),確保數(shù)據(jù)內(nèi)容安全。
2.2.2 電子檔案數(shù)據(jù)篡改控制。電子檔案因存在信息的可操作性和易變性等技術特性,電子檔案內(nèi)容極易發(fā)生改變?,F(xiàn)有技術環(huán)境下,電子檔案存儲過程的內(nèi)容真實性、完整性維護大多采用諸如權限控制、元數(shù)據(jù)記錄、數(shù)據(jù)冗余備份等形式予以實現(xiàn)。
檔案數(shù)據(jù)保全模式從數(shù)據(jù)固化角度審視電子檔案能否與傳統(tǒng)載體一樣,用信息記錄載體或其他中間要素去固定檔案內(nèi)容,并能從信息記錄載體或中間要素在長期保存過程中的變化情況校驗電子檔案內(nèi)容的原始性。
檔案數(shù)據(jù)保全借助區(qū)塊鏈技術中的防篡改機制,采用散列算法生成完整性校驗值并予以存證,實現(xiàn)電子檔案內(nèi)容的固化。在日常監(jiān)測中,對電子檔案按周期重新生成完整性校驗值并與初次形成的完整性校驗值進行比對,以此來判定電子檔案原始性情況。
2.2.3 電子檔案長期可讀管控。電子檔案的可讀、可用是影響電子檔案長期保存的重要因素。傳統(tǒng)的電子檔案備份多采用轉(zhuǎn)換成紙質(zhì)檔案的方式解決可能存在的電子檔案識讀問題。然而,單套制管理模式的推進、復雜數(shù)據(jù)結構(如三維模型、聲像文件等)的發(fā)展均對簡單的打印輸出方式提出挑戰(zhàn)。
檔案數(shù)據(jù)保全模式對電子檔案數(shù)據(jù)存儲格式建立格式數(shù)據(jù)庫,開展數(shù)據(jù)格式全生命周期管控,對諸如數(shù)據(jù)格式名稱、版本、維護者、讀取軟件、遷移路徑等信息進行記錄與跟蹤,并結合檔案長期保存需要開展數(shù)據(jù)遷移與轉(zhuǎn)換方案研究,極大地提升了數(shù)據(jù)管理質(zhì)量,能夠有效解決電子檔案在長期保存過程中的使用問題。
2.2.4 電子檔案憑證效力維護。電子檔案憑證效力的維護是電子檔案能夠以電子形式提供利用的核心前提。電子檔案憑證效力的發(fā)揮主要基于電子檔案自身“四性”的保障及長期保存過程中的管理紀實。
檔案數(shù)據(jù)保全模式采用可信數(shù)據(jù)存儲、電子檔案數(shù)據(jù)固化、數(shù)據(jù)狀態(tài)監(jiān)測、數(shù)據(jù)存證等方案實現(xiàn)對電子檔案真實性、完整性、可用性及安全性的維護。
與此同時,該模式倡導以電子檔案憑證效力維護為中心,對接電子數(shù)據(jù)證據(jù)的司法規(guī)則適用,從證據(jù)的高度開展電子檔案收集、監(jiān)管、轉(zhuǎn)換和使用等工作,切實履行在全生命周期中對電子檔案實施管理紀實和技術保障,維護電子檔案作為證據(jù)的證明力。
基金項目:國家檔案局科技項目“電子檔案數(shù)據(jù)法律證據(jù)價值的保全策略與方法研究”(編號:2019-R-22);本研究得到江蘇高校“青藍工程”資助;蘇州大學人文社會科學團隊項目“檔案數(shù)據(jù)保全研究”(批準號:NH33712620)。
參考文獻:
[1]馮惠玲.電子文件管理學[M].北京:中國人民大學出版社,2017:31.
[2]薛慶香,于英香.區(qū)塊鏈技術在突發(fā)公共衛(wèi)生事件檔案管理中的應用研究[J].山西檔案,2021(02):62-70.
[3]楊鵬.基于區(qū)塊鏈技術的檔案數(shù)據(jù)共享策略探究[J].山西檔案,2020(04):105-112.
[4]余亞榮.蘇州大學推出首個對外服務檔案數(shù)據(jù)保全平臺[N].中國檔案報,2018-12-06(01).
(作者單位:余亞榮,蘇州城市學院;吳振宇,張家港市城建檔案館 來稿日期:2021-10-20)