摘 要:電子檔案文件保存技術在“互聯(lián)網(wǎng)+”時代面臨一系列問題與挑戰(zhàn),為解決這個難題,本文試圖在電子檔案長期保存的技術中提出從技術路線、文件格式、存儲載體、元數(shù)據(jù)管理和軟件功能等方面的需求。
關鍵詞:電子檔案文件 長期保存 技術
中圖分類號:G27文獻標識碼:A文章編號:1003-9082(2020)03-00-01
隨著互聯(lián)網(wǎng)時代的到來,新科技新技術的飛速發(fā)展,政府無紙化辦公逐步推進,紙質版檔案文件慢慢將被電子檔案文件替代,以幾何級的速度迅速增加。
電子文件(檔案)是指國家機構、社會組織或者個人在履行其法定職責或處理事務過程中,通過計算機等電子設備形成、辦理、傳輸和存儲的數(shù)字格式的各種信息記錄。
如何長期保存電子檔案,這一課題迅速擺在每一個檔案文件管理者的面前。電子文件(檔案)長期保存,是指用一種可靠的,科學合理的方式,長期維護電子文件(檔案)真實完整有效的行為。重要的信息資源是電子文件(檔案)。它們是從事政治、軍事、經濟、科技、文化、等活動的國家機關、社會團體和個人形成的對國家和社會具有重要價值的各種文字、圖表、音像等形式的直接歷史記載。它們也是社會數(shù)字資產不可或缺的一部分。實現(xiàn)電子文件(檔案)的長期保存,既是文件與檔案部門的重要問題,也是全人類的共同使命。
電子文件(檔案)長期保存的解決問題,一定要確定長期保存電子文件(檔案)的要求,制度、管理、技術、安全等方面包括其中。必須明確電子文件長期保存的要求,包含制度、管理、技術、安全等方面。本文是重點是從技術層面進行探討,包括技術路線、文件格式、存儲載體、軟件功能和元數(shù)據(jù)管理等。
2012年,全國電子文件管理工作聯(lián)席會議發(fā)布了《電子文件真實性保障和長期保存等關鍵技術研究》課題。本文對電子文件長期保存的關鍵技術進行了研究,并提出了初步的解決方案。電子文件(檔案)長期保存的研究成果,在國內外相關部門都沒有提出完整、權威的技術要求。目前這方面的難題遠遠超出取得的成績,這與電子文檔管理面臨的五大技術挑戰(zhàn)相關。
一是數(shù)據(jù)規(guī)模大,在這個信息資源持續(xù)快速增長的大數(shù)據(jù)時代,管理部門面臨電子文件(檔案)日益增多的形勢,管理部門面臨著電子文件(檔案)不斷膨脹、承載范圍超出管理部門能力的局面。
二是格式多樣化,它主要體現(xiàn)在多樣性的電子文件的數(shù)字格式,這意味著管理部門需要處理電子文件各種不斷變化的格式。
三是類型復雜性,電子文件不僅格式多樣,而且數(shù)據(jù)類型也越來越繁雜。除了傳統(tǒng)類型的文本、圖形、圖像、音頻和視頻文件外,各種新的媒體文件和數(shù)據(jù)文件也是層出疊現(xiàn),讓人目不暇接。
四是生命周期短,在信息技術飛速成長的前提下,具有生命周期相對較短的特點是硬件、軟件、文件格式、存儲載體等。倘若不是按照文件生命周期的特點來定制解決方案,問題就無法解決,將會使問題更加復雜。
五是技術變化快,信息技術一直處于不斷成長蛻變的過程中,如何使用相對穩(wěn)定前瞻的技術發(fā)現(xiàn)、傳遞和處理過去的電子文件,保證改進后的新技術含量的方法與以往保存技術的相容性和連續(xù)性是管理部門面臨的挑戰(zhàn)。
面對以上這些問題和挑戰(zhàn),我們文件和檔案部門和從事這項工作的工作人員應該如何解決呢?在對國內外相關研究項目進行分析、總結的基礎上,充分考慮電子文件(檔案)的特點,從技術路線、文件格式、存儲載體、存儲方式等方面提出了電子文件(檔案)長期保存的技術要求,元數(shù)據(jù)管理和軟件功能。各部分技術要求的主要內容如下:
1.技術路線:技術路線需求主要包括更新、遷移、仿真、封裝、再生五個方面內容。
信息更新是指原始的技術環(huán)境下,適時重寫信息數(shù)據(jù),將數(shù)據(jù)流從舊存儲介質轉移到新存儲介質上,防止由于存儲介質物理性能變化而引起信息丟失的方法。例如:將過去的磁盤、光盤上的信息轉存到硬盤中存儲,因為過去的磁盤、光盤容易損壞,信息易丟失。遷移是持續(xù)的將電子信息從一種技術環(huán)境轉移到另一種技術環(huán)境,這意味著基于字符的信息可以從一種存儲介質傳輸?shù)搅硪环N存儲介質,以便長期保存電子信息。仿真是用一個計算機系統(tǒng)克隆另一個計算機系統(tǒng),使兩者的操作系統(tǒng)功能完全的相同,也就是說,前者接收的數(shù)據(jù)與后者相同,并且后者相同的程序可以執(zhí)行。封裝技術是指通過規(guī)范電子檔案文件的封裝過程,為電子檔案文件提供統(tǒng)一的封裝格式,保證電子檔案文件及其元數(shù)據(jù)的完整合一性。封裝技術是指電子檔案的封裝過程,為電子檔案提供統(tǒng)一的封裝格式,確保電子檔案(文件)及其元數(shù)據(jù)的完整性。再生性保護技術是一種保護措施,如建筑物數(shù)據(jù)、圖紙等,能將過去一些有價值的電子信息及時轉換成微型或紙質媒體。
2.文件格式:文件格式需求主要包括格式開放、文件自包含、格式字描述、可轉換、支持技術認證機制等方面內容,結合各種格式電子檔案的特點,對其進行了擴展。
格式開放主要包括公開發(fā)布的相應標準和技術規(guī)范,確保簡潔明了的格式標準和技術規(guī)范,不受專利、許可等限制。文件自包含主要是指文件中呈現(xiàn)的所有信息必須完全包括所有字體的字形描述信息或嵌入式字體程序信息、光柵圖像、矢量圖形、顏色信息、音視頻編碼信息等。格式自描述主要指設置標準元數(shù)據(jù)集可以與國際國內相關標準建立映射),以文本方式(通常是XML)嵌入到文件中,并且易于提取和檢索等。支持電子檔案其他格式和長期保存格式的相互轉換,還支持電子檔案過時的長期保存格式向新的長期保存格式的轉換。支持數(shù)字簽名的技術認證機制,各種操作系統(tǒng)和硬件平臺支持使用數(shù)字簽名,并且數(shù)字簽名的所有信息都是完全獨立的。
3.存儲載體:一般來說,電子檔案的存儲周期比存儲載體的壽命長,這使得電子檔案的長期保存受到存儲載體技術發(fā)展的制約,就電子文件(檔案)的存儲載體類型而言,磁性載體目前比較成熟和普遍,光學載體和電(半導體)載體三類,每種載體都有自己的應用領域。一般有以下幾種存儲方式:
在線存儲,電子檔案一般直接存儲在信息系統(tǒng)中,通過應用軟件可以實時存取,在目前的技術條件下,硬盤和基于硬盤的各種存儲系統(tǒng)(磁盤陣列、NAS存儲、SAN存儲、集群存儲等)仍然是主流的存儲方式;對于具有高安全性要求的數(shù)據(jù),可以考慮使用特殊的WORM磁盤(一次寫入和幾次讀取硬盤)。
在線備份與在線存儲結合使用,定期將數(shù)據(jù)備份到本地備份設備,彌補了在線存儲中數(shù)據(jù)丟失等安全風險。目前,磁帶機(庫)設備(以磁帶為載體)或虛擬磁帶庫設備(以硬盤為載體)是主流。
本地備份、異地保存:一種是將在線備份數(shù)據(jù)直接發(fā)送到磁帶或光盤到另一個地方存儲;另一種是在本地再做一次備份,送到另一個地方保管,他們大多使用光盤作為備份介質,為了避免數(shù)據(jù)損壞或修改,要求采用一次性寫入只讀光盤。近線存儲可用于實時性要求較低的數(shù)據(jù)。
在以往的解決方案中,以光盤為存儲載體的光盤庫等設備主要用于近線存儲,隨著硬盤成本的降低和安全性的提高,近線存儲也逐漸采用各種基于硬盤的存儲系統(tǒng)。
異地(容災)存儲,通常,數(shù)據(jù)通過網(wǎng)絡直接傳輸?shù)竭h程存儲設備,例如,當今廣泛使用的網(wǎng)絡云硬盤也是以硬盤為基礎,以硬盤為主要載體的各種存儲系統(tǒng)。主要防止地震、水災、火災等不可抗力對信息資源的破壞。
異質備份,對于特別重要的電子文件,為了電子文件的長期存儲和安全存儲,如將電子文件從數(shù)字信號轉換為模擬信號并存儲在縮微膠卷上的多格式備份。
4.元數(shù)據(jù)管理:元數(shù)據(jù)保證并證明了電子檔案的真實性和憑證價值,它對電子檔案的保護和長期保存、電子檔案的有效管理、電子檔案的方便查詢和利用具有重要作用。
5.軟件功能:軟件功能需求包括存儲策略管理、存儲環(huán)境管理、備份載體管理、文件倉庫、文件檢測、格式轉換、文件遷移、文件提取和系統(tǒng)管理。軟件功能需求是電子檔案長期保存需求的固化,把理論研究成果轉化為實際應用是關鍵。
以上歸納總結的電子檔案文件長期保存需求,特別是軟件功能需求還需在電子檔案文件接受和長期保存系統(tǒng)建設工程項目中得到實踐驗證。但是隨著信息技術不斷高速的發(fā)展,各種新技術新媒體文件、數(shù)據(jù)文件層出不窮,電子檔案文件的管理人員和研發(fā)人員還需要結合實際應用過程中反饋的問題進行進一步的梳理總結,提煉電子檔案文件長期保存的新技術,使其更為完備。
參考文獻
[1]王賀芹.電子文件及電子檔案管理初探[J].現(xiàn)代圖書情報技術,2002:66-68+77.
[2]邱曉威.電子文件與電子檔案的管理問題與對策[J].中國檔案,1999,(03):32-34.
[3]劉偉晏.電子文件歸檔后的保存、維護與利用[J].中國檔案,1999,(05):31-33.
[4]馮惠玲.電子文件與紙質文件管理的共存與互動[J].中國檔案,2003,(12):40-42.
[5]魏招秀.談電子檔案的長期保存[J].蘭臺世界,2010(24):14-15.
作者簡介:孫進,男,(1971-)安徽巢湖人,安徽省檔案學會會員,主要從事信息技術和檔案管理研究。