文/李耀斌
隨著5G、云計算、物聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能等數(shù)據(jù)信息技術(shù)的快速發(fā)展,全球數(shù)據(jù)流量呈現(xiàn)出幾何級增長之勢。《中國大數(shù)據(jù)白皮書(2020)》公布的數(shù)據(jù)顯示,2020年全球產(chǎn)生的數(shù)據(jù)量達(dá)47ZB(1ZB=10萬億GB),到2035年將達(dá)到2142ZB,中國產(chǎn)生的數(shù)據(jù)量將達(dá)到全球數(shù)據(jù)量的1/5,人類已經(jīng)步入了大數(shù)據(jù)時代。大數(shù)據(jù)時代,電子文件、數(shù)字資源、信息資源都給傳統(tǒng)檔案行業(yè)帶來了巨大沖擊,檔案管理已經(jīng)從“管文件”向“管數(shù)據(jù)”轉(zhuǎn)型。
大數(shù)據(jù)時代,區(qū)塊鏈、云計算、大數(shù)據(jù)等信息技術(shù)的應(yīng)用,以電子文件形式流轉(zhuǎn)、歸檔、保存、利用成為必然趨勢。單軌制模式下,電子文件生成、流轉(zhuǎn)、歸檔、利用、銷毀等過程均以電子文件形式實現(xiàn)。從電子文件到電子檔案,要做好元數(shù)據(jù)建立、確保電子檔案真實和安全,經(jīng)歷完善的整理歸檔過程,使其符合檔案標(biāo)準(zhǔn)。
《電子文件歸檔與電子檔案管理規(guī)范》(GB/T 18894—2016)規(guī)定,電子文件(electronic document)是指國家機(jī)構(gòu)、社會組織或個人在履行其法定職責(zé)或處理事務(wù)過程中,通過計算機(jī)等電子設(shè)備形成、辦理、傳輸和存儲的數(shù)字格式的各種信息記錄。內(nèi)容、結(jié)構(gòu)及背景共同構(gòu)成電子文件。
《電子文件歸檔與電子檔案管理規(guī)范》(GB/T 18894—2016)規(guī)定,電子檔案(electronic records)是指具有憑證、查考和保存價值并歸檔保存的電子文件。電子檔案在電子文件范圍之內(nèi)。但電子文件與電子檔案二者還是有著明顯的區(qū)別:一是價值不同。電子文件側(cè)重于憑證價值,不論其保存期限的長短,可以只有臨時保存的價值,在業(yè)務(wù)結(jié)束后便失去保存價值,如電子會議通知。而電子檔案除了憑證價值外,還突出強(qiáng)調(diào)其檔案價值,超出業(yè)務(wù)周期的保存價值。換言之,如業(yè)務(wù)結(jié)束不具有保存價值的電子文件,則不作為電子檔案。二是形成時間不同。電子檔案僅包括歸檔后的文件生命階段,主要是在業(yè)務(wù)活動結(jié)束以后,電子文件則包括文件整個生命周期。
從電子文件與電子檔案的概念來看,二者并非等同概念。電子文件只有經(jīng)過歸檔處理,符合檔案標(biāo)準(zhǔn),才可稱之為電子檔案。可見,電子文件檔案化是指電子文件進(jìn)行歸檔處理為檔案的過程?!皻w檔管理”與“檔案化管理”也是兩個不同的管理措施。前者,是指電子文件形成后,將文件認(rèn)定為檔案,然后將電子文件移交至檔案部門管理。后者,“檔案化管理”則是指使電子文件檔案化而采取的一系列舉措,電子文件形成伊始需要建立元數(shù)據(jù)著錄機(jī)制,等等。
電子文件主要來自辦公自動化(OA)系統(tǒng)與電子政務(wù)系統(tǒng),產(chǎn)生的電子文件有XLS、DOC、PDF、JPEG等格式,其存儲及記憶方式不同。只有將電子文件按照一定規(guī)范化處理,使其具有檔案標(biāo)準(zhǔn),才可稱之為電子檔案。將電子文件進(jìn)行檔案化處理具有其現(xiàn)實必要性:
傳統(tǒng)文件可通過確保其載體的原始性,能夠在其形成的“末端”進(jìn)行歸檔管理。而電子文件有其自身特性,若在“末端”實施“歸檔管理”,電子文件歸檔前的真實性將難以保證。電子文件檔案化管理強(qiáng)調(diào)的是“前端”控制和全過程控制。只有做好電子文件“檔案化管理”,才能使電子文件前端、全過程得到有效落實。電子文件檔案化管理是建立在電子文件科學(xué)有效歸檔為前提,在這基礎(chǔ)上,采取科學(xué)有效的方法和舉措,對XLS、DOC、PDF、JPEG等不同類型電子文件的“歸檔管理”,這是電子文件科學(xué)有效歸檔的前提和基礎(chǔ)。
電子文件格式多樣,有XLS、DOC、PDF、JPEG等不同類型;與傳統(tǒng)紙質(zhì)文件相比,電子文件具有易改性,且這種易改性還不容易被察覺;電子文件依賴于計算機(jī)實現(xiàn)讀寫,但計算機(jī)又極易受到諸如木馬病毒的攻擊而發(fā)生電子文件的丟失或篡改。電子文件的上述特性,使其不能直接作為憑證或依據(jù),應(yīng)經(jīng)過歸檔處理、符合檔案標(biāo)準(zhǔn)的檔案化管理,才能具有檔案的屬性和功能。
電子文件內(nèi)容與載體可分離、可變等特點,要求檔案管理需要前延至電子文件形成階段,從傳統(tǒng)的末端管理前延至前端管理或超前端管理、全過程管理。從電子文件的實際需要來看,從一開始就對其進(jìn)行檔案化管理,能夠保證電子文件隨時可被認(rèn)定為檔案或者可被作為檔案來使用。因此,主動、提早介入電子文件,對其進(jìn)行檔案化管理,才能確保電子文件的真實、完整和有效。
電子檔案具有信息非人工可讀性、電子文件系統(tǒng)依賴性和載體的無信息性等特點,使其在從電子文件到電子檔案的過程中,面臨著一些需要解決的現(xiàn)實問題:
傳統(tǒng)的紙質(zhì)文件,其載體與信息是同一的,紙質(zhì)載體安全,承載于載體上的信息便具有自然而然的可識讀性。電子文件通常承載于磁盤、軟盤等,并借助計算機(jī)硬件、解密等方式實現(xiàn)可讀性,一旦硬件、軟件、編碼方式等環(huán)境發(fā)生變化,電子文件信息便不再具有可讀性。此外,隨著信息技術(shù)的快速發(fā)展,不斷有新的編碼代替了原來的編碼,電子文件所使用的編碼方式與快速發(fā)展變化的計算機(jī)應(yīng)用系統(tǒng)運(yùn)行環(huán)境之間的矛盾日益尖銳,電子文件可讀性問題成為了電子檔案管理的制約因素之一。
電子文件實體歸檔是指電子文件形成后,經(jīng)網(wǎng)絡(luò)傳輸或磁盤等形式,將電子文件移交至檔案管理部門。電子文件邏輯歸檔,則是指在網(wǎng)絡(luò)環(huán)境條件下,告知檔案管理部門某電子文件的存儲的路徑,而不改變電子文件的原存儲位置、存儲方式。電子文件邏輯歸檔下,電子文件、歸檔者、電子文檔接受者未必需要面對面,有可能相距甚遠(yuǎn),只需要借助互聯(lián)網(wǎng)、計算機(jī),便能夠?qū)崿F(xiàn)歸檔。但邏輯歸檔也面臨著電子文件在網(wǎng)絡(luò)環(huán)境下的安全問題。
電子文件檔案化需要檔案人員不僅要熟練掌握檔案學(xué)知識,還要掌握一定的計算機(jī)信息技術(shù)方面的專業(yè)知識,以及相應(yīng)的公文處理知識,等等。但從現(xiàn)實情況來看,檔案部門人員既熟悉檔案知識,也掌握計算機(jī)信息技術(shù)的“全能型”人才缺乏,這也是在一定程度上制約電子文件檔案化的重要因素。此外,電子文件檔案化的思維轉(zhuǎn)變問題,也是影響電子文件能否轉(zhuǎn)化為電子檔案的又一影響因素。習(xí)慣于傳統(tǒng)紙質(zhì)文件“看得見、摸得著”的檔案,而常常將電子文件拒之門外,即便保存了電子文檔,往往還“不放心”,將電子文件打印成紙質(zhì)文檔,“單軌制”落實不到位,不僅造成資源浪費(fèi),也增加了電子文件歸檔工作量。
電子檔案具有原始記錄性、相對穩(wěn)定性和證據(jù)性,電子文件只有經(jīng)過歸檔處理,符合檔案標(biāo)準(zhǔn),通過電子文件檔案化管理,才能最終形成電子檔案。為此,根據(jù)電子文件的特點,以及電子文件檔案化的要求,電子文件檔案化過程中需要把握和解決的問題主要有:
從電子文件的概念可知,是機(jī)關(guān)、團(tuán)體、企事業(yè)單位通過計算機(jī)等設(shè)備形成的各種不同形式的信息記錄,電子文件是處理公務(wù)過程中產(chǎn)生的。如“某局文件20220808.pdf”,如果直接將該電子文件歸檔,顯然不符合歸檔要求。因此,在將其納入應(yīng)歸檔范圍后,還需要將該文件的背景信息和元數(shù)據(jù)等一并歸檔保存。元數(shù)據(jù)的歸檔保存,能全面顯示該電子檔案的制發(fā)時間、審批領(lǐng)導(dǎo)、辦理單位、辦理結(jié)果等?!峨娮游募w檔與電子檔案管理規(guī)范》(GB/T 18894—2016)規(guī)定,“元數(shù)據(jù)”是指“描述電子文件和電子檔案的內(nèi)容、背景、結(jié)構(gòu)及其管理過程的數(shù)據(jù)”??梢?,建立元數(shù)據(jù)是保證電子文件檔案化的重要基礎(chǔ),按照電子文件歸檔的標(biāo)準(zhǔn)和規(guī)范執(zhí)行,才能保證電子文化檔案化達(dá)到要求。建立元數(shù)據(jù),應(yīng)包括title(文件名)、creator(創(chuàng)建者)、subject(關(guān)鍵詞)、description(說明)、date(日期)、type(類型)、source(來源)、relation(關(guān)聯(lián))等。建立元數(shù)據(jù)要尊重檔案,確保元數(shù)據(jù)與檔案內(nèi)容信息之間的整體聯(lián)系,構(gòu)建起元數(shù)據(jù)與電子檔案之間的邏輯關(guān)系,實現(xiàn)信息共享與數(shù)據(jù)交換。電子文件元數(shù)據(jù)管理涉及元數(shù)據(jù)生成、捕獲、封裝和維護(hù)。其中,元數(shù)據(jù)生成主要是對元數(shù)據(jù)值域及潛在選項進(jìn)行篩選,確定元數(shù)據(jù)內(nèi)容。元數(shù)據(jù)捕獲,可利用人工著錄+計算機(jī)方式,捕獲生成的元數(shù)據(jù),包括元數(shù)據(jù)的名稱、形成時間、數(shù)據(jù)格式、專題類別注釋等內(nèi)容。元數(shù)據(jù)封裝是實現(xiàn)系統(tǒng)與檔案功能模塊數(shù)據(jù)交換、信息共享的關(guān)鍵。將捕獲的元數(shù)據(jù)按照檔案卷宗級、文件級、全宗級等進(jìn)行封裝,最后按照《基于XML的電子文件封裝規(guī)范》,將若干文件封裝,獲得全宗級數(shù)據(jù)文件。元數(shù)據(jù)維護(hù),是保障電子檔案與院數(shù)據(jù)之間的持續(xù)鏈接,防止因保管及檔案遷移過程中導(dǎo)致電子檔案間關(guān)聯(lián)穩(wěn)定性和文件完整性,通常采用元數(shù)據(jù)規(guī)范嵌入和切入文本方式進(jìn)行維護(hù)。
與傳統(tǒng)的紙質(zhì)文件相比,電子文件更易被修改性,以及電子文件對計算機(jī)軟硬件技術(shù)的高度依賴性。隨著軟硬件環(huán)境的改變,電子文件在遷移、格式轉(zhuǎn)換過程中,電子文件中的某些信息會發(fā)生變化,如果未采取必要的控制措施,勢必會影響電子文件的真實性。因此,電子文件檔案化過程要重點關(guān)注其真實性。
電子文件真實性可從管理和技術(shù)兩個方面予以保障。管理方面,根據(jù)《電子檔案移交與接收辦法》相關(guān)規(guī)定,明確要求“合格后方可接收”??苫陔娮游募芷冢龊檬虑翱刂?、跟蹤記錄和事后審查等。如電子文件歸檔移交時進(jìn)行真實性檢測。重點是要通過技術(shù)手段,確保電子文件檔案化結(jié)果的真實性。具體來說,包括電子簽名技術(shù)、身份認(rèn)證技術(shù)、區(qū)塊鏈技術(shù)、加密技術(shù)、數(shù)據(jù)備份技術(shù)、可信時間戳技術(shù)等。其中,電子簽名技術(shù),就是數(shù)據(jù)信息中以電子形式存在,用于識別簽名人身份,并表明簽名人認(rèn)可其簽署的文件內(nèi)容的數(shù)據(jù)技術(shù)。電子印章技術(shù)作為電子簽名技術(shù)的一種應(yīng)用,是基于可信密碼技術(shù)而生成的一種身份標(biāo)識,是將電子簽名變成簽名+印章模式。公鑰基礎(chǔ)設(shè)施技術(shù)(PKI),基于公鑰理論,利用密鑰管理平臺,為電子文件生成、傳輸應(yīng)用提供信息加密和數(shù)字簽名。PKI技術(shù)的核心,解決了信息網(wǎng)絡(luò)空間中的信任問題。區(qū)塊鏈技術(shù)利用加密算法、共識機(jī)制、點對點傳輸、分布存儲和非對稱加密等新型技術(shù),解決了電子文件數(shù)據(jù)信任問題,有效保障電子文件真實性。目前,電子文件真實性常用的技術(shù)有軟簽名證書、加密設(shè)備應(yīng)用等。
電子文件檔案化為電子檔案,需要嚴(yán)格執(zhí)行相關(guān)歸檔標(biāo)準(zhǔn)和檔案管理制度,使其符合檔案標(biāo)準(zhǔn),具有憑證、查考和保存價值。因此,確保電子檔案安全性,是電子文件檔案化過程中必須要解決的問題之一。目前,電子文件檔案化,以及電子檔案的安全技術(shù)包括:身份認(rèn)證法,通過鑒別或標(biāo)識用戶身份,防止非法訪問。具體到電子檔案中,應(yīng)從用戶及節(jié)點的身份認(rèn)證入手,由應(yīng)用系統(tǒng)實現(xiàn)。應(yīng)用密碼法,數(shù)字簽名、消息摘要、加密、密鑰等密碼技術(shù)可有效保障電子檔案信息的完整性和保密性。訪問控制法,根據(jù)主體與客體關(guān)系,將存儲電子檔案的計算機(jī)訪問進(jìn)行限制,具體包括自主性訪問控制(如讀、寫及執(zhí)行等訪問屬性的管理)和強(qiáng)制性訪問控制(采用敏感標(biāo)識來標(biāo)識主客體密級,從而實現(xiàn)訪問控制)。安全審計法,通過訪問日志的具體分析,發(fā)現(xiàn)和追蹤訪問是否屬于非法。安全監(jiān)視法,及時發(fā)現(xiàn)入侵行為,并根據(jù)入侵痕跡及時進(jìn)行漏洞報告、彌補(bǔ)。此外,還包括防火墻法??傊?,利用加密、數(shù)據(jù)封裝、數(shù)據(jù)水印、災(zāi)害恢復(fù)等相關(guān)技術(shù),保證電子文件在進(jìn)行歸檔、整理和檢索利用過程中的安全,并對電子檔案進(jìn)行內(nèi)容補(bǔ)充、載體更換、數(shù)據(jù)監(jiān)測和檔案拷貝,全程監(jiān)控電子檔案管理形成。電子檔案的安全性,除了上述的技術(shù)之外,還需要具體從事檔案管理的人員具備良好的職業(yè)素質(zhì)和道德素質(zhì),增強(qiáng)守法意識,嚴(yán)格執(zhí)行《檔案法》《保密法》的具體規(guī)定。電子文件檔案化過程中要高度重視安全性,一次極小的過失都有可能造成難以挽回的損失。
大數(shù)據(jù)時代,電子文件的數(shù)量和規(guī)模呈現(xiàn)出快速增長態(tài)勢,電子檔案管理的要求越來越高。為了更好地管理好、利用好電子文件,將其檔案化為電子檔案具有很強(qiáng)的必要性和現(xiàn)實性。從電子文件轉(zhuǎn)化為電子檔案,既要嚴(yán)格執(zhí)行各項歸檔標(biāo)準(zhǔn)和要求,也要建立豐富的元數(shù)據(jù),采用相關(guān)的先進(jìn)技術(shù)確保電子檔案真實性、安全性,適應(yīng)大數(shù)據(jù)時代電子檔案管理的現(xiàn)實需要。