王肖波/浙江省檔案局
“增量電子化”工作是今后檔案工作發(fā)展的重點,其目的是使檔案館新接收進館的檔案全部為電子檔案,以實現(xiàn)電子(數(shù)字)檔案資源建設(shè)的總目標。因此,有必要對電子文件形成、收集、積累、鑒定、歸檔到電子檔案移交、存儲、利用、備份等實行全過程管理,確保歸檔的電子文件收集齊全、整理有序、命名科學(xué)、格式規(guī)范、元數(shù)據(jù)合理有效。筆者試從電子文件歸檔的角度,結(jié)合電子文件歸檔的工作實踐,談?wù)剬﹄娮踊瘹w檔全流程管理的認識。
一是電子數(shù)據(jù)比信息系統(tǒng)更有價值。電子文件歸檔系統(tǒng)是信息系統(tǒng)的有機組成部分,然而目前大多數(shù)信息系統(tǒng)缺少這項功能,就算有也與《電子檔案移交與接收辦法》的要求相距甚遠。如果信息系統(tǒng)中的電子文件不按照電子檔案長久保存的要求進行整理歸檔,日后將無法按照檔案移交接收的要求進行導(dǎo)出遷移,電子數(shù)據(jù)的安全也無法保證,今后如遇信息系統(tǒng)升級、平臺改造或者數(shù)據(jù)遷移時,極易造成珍貴數(shù)據(jù)丟失或歷史記憶斷層。有觀點認為,各業(yè)務(wù)系統(tǒng)中所有電子文件資料和過程結(jié)果信息在系統(tǒng)中都可以查詢、檢索、展示,所以只要備份好或以數(shù)據(jù)庫形式歸檔保存就行。但備份并不等于歸檔,信息系統(tǒng)如不具備電子文件(業(yè)務(wù)數(shù)據(jù))定期在線或離線的歸檔功能,沒有電子檔案的長久保存措施,可能會出現(xiàn)數(shù)據(jù)安全風(fēng)險。筆者認為,一定要按照歸檔要求,將信息系統(tǒng)中的電子文件進行有序化和系統(tǒng)化處理,組織整理導(dǎo)出(脫離)原有信息系統(tǒng)進行歸檔。一定要從檔案資源建設(shè)與信息安全的雙重角度,對電子文件和電子檔案進行科學(xué)管理和控制。
二是以事件為單位進行歸檔。目前對“關(guān)系數(shù)據(jù)庫+附件”類型信息系統(tǒng)的電子文件進行歸檔,主要思路有兩種,一是以信息系統(tǒng)數(shù)據(jù)庫為歸檔對象,按照《檔案關(guān)系型數(shù)據(jù)庫轉(zhuǎn)換為XML文件的技術(shù)規(guī)范》(DA/T 57-2014)進行整庫歸檔,筆者認為這樣的方式并不利于電子檔案的管理與有效利用;二是以信息系統(tǒng)所處理的事件為對象,以事件為單位組織電子文件歸檔保存。浙江省檔案局經(jīng)過調(diào)研并考慮無紙化電子文件歸檔與管理的需要,選取第二種思路。以2014年6月25日浙江省正式開通的浙江政務(wù)服務(wù)網(wǎng)為例,該網(wǎng)實現(xiàn)省市縣統(tǒng)一架構(gòu)、三級聯(lián)動并覆蓋全省,總計收納省市縣三級3300余個政府部門、6萬余項行政審批事項,基本實現(xiàn)了權(quán)力事項集中進駐、網(wǎng)上服務(wù)集中提供、數(shù)據(jù)資源集中共享。截至2018年3月,匯聚的辦件已超4200萬件。隨著行政審批辦件越來越多,系統(tǒng)數(shù)據(jù)庫越來越龐大,完成行政審批電子文件歸檔任務(wù)也越來越急迫。2016年,浙江政務(wù)服務(wù)網(wǎng)行政審批電子文件歸檔列入省政府下達給省檔案局的重點工作內(nèi)容,并列入對各廳局的考核。浙江省檔案局在多方研討后將行政審批以事項為單位,按“一事一卷”進行電子文件組卷,提出浙江政務(wù)服務(wù)網(wǎng)行政審批電子文件一般以辦理事項為單位,按“一事一卷”原則整理歸檔,內(nèi)容包括該件審批事項的基本信息描述、辦理流程和相應(yīng)的申請、受理、辦理、辦結(jié)、送達等環(huán)節(jié)的所有電子文件,也包括各種表、證、單、書等文本、數(shù)據(jù)材料及圖像、音頻、視頻等多媒體材料。事先由各廳局準確界定電子文件的歸檔范圍并劃分保管期限,設(shè)定正確的歸檔路線和技術(shù)規(guī)范標準,開發(fā)統(tǒng)建模式電子文件歸檔系統(tǒng)(歸檔模塊),電子文件歸檔功能設(shè)計在行政審批事項辦理完畢之后的辦結(jié)操作環(huán)節(jié),辦理人員可以使用“辦結(jié)并歸檔”的“一鍵歸檔”模式。該功能隱式地設(shè)計在原先審批環(huán)節(jié)的辦結(jié)操作之中,預(yù)先設(shè)置好檔號自動生成規(guī)則、電子文件歸檔范圍和分類排序、保管期限判定等,事件辦理完畢后由審批辦理人員將審批事項電子文件直接進行歸檔,自動完成歸檔電子文件整理、歸檔數(shù)據(jù)打包,系統(tǒng)會及時捕獲電子文件歸檔形成電子檔案。目前該網(wǎng)已成功歸檔行政審批原生電子檔案65萬多件(卷)。
三是明確電子檔案的結(jié)構(gòu)組成。電子文件歸檔時“一事一卷”的“卷”在邏輯結(jié)構(gòu)上指一個歸檔文件夾,文件夾內(nèi)存放該行政審批基本信息描述、辦理流程、存檔信息以及申請、受理、辦理、辦結(jié)、送達等環(huán)節(jié)的所有材料(.xml、.jpg、.pdf等各種格式),包括各種表、證、單、書及其他附件材料。文件夾(電子檔案卷)以室編電子檔號命名,檔號命名規(guī)則為:全宗號(或部門權(quán)力代碼)—權(quán)力事項類型代碼—權(quán)力事項大類代碼—權(quán)力事項小類代碼—年度—保管期限—事件流水號。歸檔文件夾內(nèi)的各種電子歸檔文件要求能夠在脫機狀態(tài)下正確地讀取與打開,數(shù)據(jù)格式以政務(wù)服務(wù)網(wǎng)上保存的原始文件格式為準?!稒n案關(guān)系型數(shù)據(jù)庫轉(zhuǎn)換為XML文件的技術(shù)規(guī)范》(DA/T 57—2014)指出:為實現(xiàn)檔案信息的格式開放、不綁定軟硬件、文件自包含、格式自描述、持續(xù)可解釋和可轉(zhuǎn)換,應(yīng)將檔案關(guān)系型數(shù)據(jù)庫轉(zhuǎn)換為XML文件進行存儲。檔案關(guān)系型數(shù)據(jù)庫轉(zhuǎn)換為一組XML文件,數(shù)據(jù)庫的用戶、角色、權(quán)限、數(shù)據(jù)表結(jié)構(gòu)、數(shù)據(jù)表關(guān)系、視圖、存儲過程、約束、索引、觸發(fā)器等元數(shù)據(jù)信息存儲在一個XML文件中,數(shù)據(jù)庫每個數(shù)據(jù)表的數(shù)據(jù)分別存儲在不同的XML文件中。
四是電子文件的歸檔和電子檔案的管理是一個橫跨兩個信息系統(tǒng)的工作。各單位在信息系統(tǒng)建設(shè)中總是以解決各自專業(yè)業(yè)務(wù)工作需求為導(dǎo)向,目標是業(yè)務(wù)系統(tǒng)建成上線并能正常運行,不會主動考慮電子文件的科學(xué)歸檔。同時由于檔案部門對各個系統(tǒng)無法進行深入了解,缺少技術(shù)上可操作性的指導(dǎo),導(dǎo)致上述要求中的很多內(nèi)容很難被具體執(zhí)行與操作。過多地收集軟件型號、名稱、版本號和相關(guān)參數(shù)手冊、說明資料并歸檔,經(jīng)常讓信息化工作人員、軟件開發(fā)技術(shù)人員一頭霧水,導(dǎo)致電子文件歸檔一拖再拖,這個現(xiàn)象是普遍存在的。數(shù)字檔案資源建設(shè)是數(shù)字檔案館建設(shè)的核心內(nèi)容,包括電子文件接收、傳統(tǒng)載體檔案數(shù)字化、資源整理加工和建立數(shù)字檔案資源庫[1]。檔案館究竟是接收電子檔案還是電子文件,這在一系列文件和規(guī)范中并沒有予以明確,實際工作中大家都各執(zhí)己見,也沒有形成統(tǒng)一思想。筆者認為,檔案館的職能是收集、保存和利用電子檔案,而檔案局的職能則是制訂電子文件歸檔軟件的技術(shù)要求、數(shù)據(jù)的標準規(guī)范,以及加強對電子文件歸檔的業(yè)務(wù)指導(dǎo)、技術(shù)培訓(xùn)和監(jiān)督檢查。
第一,各單位的辦公自動化和信息系統(tǒng)建設(shè)迅猛發(fā)展與數(shù)字檔案室、數(shù)字檔案館系統(tǒng)建設(shè)不配套、不同步,導(dǎo)致許多電子文件和電子業(yè)務(wù)數(shù)據(jù)停滯在各個系統(tǒng)的末端。國家曾花費了大量人力、物力和財力組建了若干個電子文件管理中心(ERMC),筆者認為由于每個中心的定位、模式、功能、標準、技術(shù)和方法各不相同,如何處理好ERMC與數(shù)字檔案館的數(shù)據(jù)交換關(guān)系并厘清二者之間的職能、標準和方法等,一直沒有突破性進展。從電子文件管理中心轉(zhuǎn)變?yōu)殡娮訖n案管理中心,需要綜合考慮電子文件形成、收集、積累、鑒定、歸檔到電子檔案移交、存儲、利用等全過程管理,因此形成正確的、可靠的和安全的電子文件數(shù)據(jù)和電子檔案數(shù)據(jù)流向圖顯得非常重要。從全國范圍來看,目前對電子文件的管理還是缺乏必要的、有效的監(jiān)督與控制。筆者認為,沒有從電子檔案管理的全流程來綜合統(tǒng)籌檔案信息化建設(shè)目標與要求、切實加強電子文件的歸檔,是檔案部門檔案信息化建設(shè)實施起來成效不顯著的一個重要原因。
第二,電子檔案管理一方面要遵從電子環(huán)境下相關(guān)管理工作的規(guī)律和要求,另一方面要遵從檔案管理的一般規(guī)律和基本要求[2]。現(xiàn)在擺在檔案工作者面前的是不同系統(tǒng)產(chǎn)生的不同類型數(shù)據(jù)、各式各樣的電子文件和電子檔案,因此一方面要做好各個信息系統(tǒng)電子文件的歸檔工作,另一方面要有一個電子檔案管理系統(tǒng)作為支撐,依靠人工進行管理的方式必須盡快改變,要實現(xiàn)有效管理各立檔單位產(chǎn)生的電子檔案的目標,沒有一系列妥善的、科學(xué)的制度、方法和實施路徑是不行的。電子文件歸檔客觀上依賴于電子文件歸檔系統(tǒng)(或各種信息系統(tǒng)的歸檔模塊)和電子檔案管理系統(tǒng),電子檔案質(zhì)量很大程度上取決于電子文件的質(zhì)量,還取決于電子文件的歸檔質(zhì)量。要樹立新觀念、新思維,統(tǒng)籌考慮電子文件及時歸檔、技術(shù)檢測、電子檔案移交接收進館、電子檔案長久保存和提供利用。
第三,電子文件歸檔后應(yīng)該組“卷”。電子檔案卷的“卷”我們套用了案卷的“卷”字概念,“卷”在某種意義上可理解為紙質(zhì)檔案的“卷”,也可理解為一個事件(或一個公文)的歸檔電子文件的集合。傳統(tǒng)概念上一個紙質(zhì)文件或一份檔案我們是很清楚的,但在電子檔案管理中一個電子檔案往往是由若干個電子文件組成的,所以這個概念很難讓人理解。應(yīng)歸檔的電子文件(電子檔案)往往是由若干個電子文件組成的,包括這個電子文件的簽發(fā)稿、版式文件、擬稿單或承辦單、歸檔文件元數(shù)據(jù)、附件,以及單位名稱、電子文件號、責(zé)任者、正題名、主題詞、文件編號、日期、主送、抄送、密級、頁數(shù)等。電子文件經(jīng)“四性”檢測合格就會形成一個電子檔案卷(也可稱電子檔案組合)。電子檔案卷也可按全宗、年度、機構(gòu)、問題(事件)、保管期限、密級等因素進行分類,相對集中進行管理。有了電子檔案卷我們還需要給它起個名字,可以叫“電子檔案號”,類似于傳統(tǒng)意義上的檔號。
第四,為了保證電子檔案卷相對集中、便于管理和正常流轉(zhuǎn),一般情況下電子檔案卷需要進行打包或封裝處理,以便于電子檔案的移交、接收和流轉(zhuǎn)。筆者認為,可自主選擇使用目前的兩種主流打包方式zip或rar。完成打包或封裝就相當(dāng)于完成電子檔案組卷并給予 “電子檔案卷皮”,也可稱之為電子檔案數(shù)據(jù)包或存檔信息包,電子檔案數(shù)據(jù)包一般以“電子檔案號”命名。
首先是對歸檔電子文件準確性的認識。筆者認為,電子文件準確性主要取決于各單位信息系統(tǒng)的電子文件歸檔系統(tǒng)(歸檔模塊)的功能,各單位要準確界定電子文件的歸檔范圍和保管期限,按《電子檔案移交與接收辦法》的要求將應(yīng)歸檔的電子文件適時捕獲。獲取電子文件及其元數(shù)據(jù)的方法與過程都是由歸檔系統(tǒng)自動完成的,很少會有人工的干預(yù),而規(guī)則基本上是由各單位檔案室根據(jù)檔案行政管理部門的要求制定的,并由信息化部門執(zhí)行。因此,電子文件的準確性主要依賴于系統(tǒng)事先的設(shè)置規(guī)則與要求,只要符合預(yù)先制定的規(guī)則,準確性就會有保證。檔案館在接收電子檔案時對準確性的檢測,筆者認為最主要是確認正規(guī)的途徑、手續(xù)和來源。
其次是對歸檔電子文件完整性的認識。參照《浙江省省直單位電子公文歸檔與電子檔案管理暫行辦法》,歸檔電子公文內(nèi)容應(yīng)包括簽發(fā)稿(包括修改痕跡)、版式文件、擬稿單或承辦單、歸檔文件元數(shù)據(jù)、附件等。簽發(fā)稿指發(fā)文機關(guān)領(lǐng)導(dǎo)人對電子公文進行最后審定、簽署印發(fā)的稿本;版式文件指正式公文發(fā)文的印制稿;擬稿單或承辦單指公文流轉(zhuǎn)單或簽批單,各項要素內(nèi)容可一并在歸檔文件元數(shù)據(jù)集中記錄;元數(shù)據(jù)文件包括單位名稱、電子文件號、責(zé)任者、正題名、主題詞、文件編號、日期、主送、抄送、密級、頁數(shù)、附件、附注、收發(fā)文類別、定稿時間、文件大小、格式信息、電子簽名標識、業(yè)務(wù)行為、處理人員、處理部門、處理時間、處理意見等;如有附件也需歸檔。筆者認為,電子文件的完整性檢測光依靠人工來執(zhí)行是不可能完成的,只能依靠電子檢測系統(tǒng)來完成。檢測系統(tǒng)能檢測應(yīng)歸項目內(nèi)容是否存在,但并不能檢測內(nèi)容的對與錯,如果有缺漏項檢測系統(tǒng)就會報錯,提示應(yīng)補齊項目內(nèi)容,管理人員可手工操作進行重新歸檔。如內(nèi)容出錯,目前系統(tǒng)還無法檢出,只能依靠人工抽查。
再次是對歸檔電子文件可用性檢測的認識。可用性檢測其實就是檢測電子文件的格式是否存在非主流格式的文件,如有則需要轉(zhuǎn)換成主流格式,以方便讀取和使用。因此要重點關(guān)注電子文件格式登記,建立電子檔案長久保存庫的所有格式登記清單(總表),其目的是為了在將來某些格式被淘汰且技術(shù)無法支撐、系統(tǒng)無法識別時,進行電子檔案長久保存格式的技術(shù)轉(zhuǎn)換。
最后是對歸檔電子文件安全性檢測的認識。安全性檢測主要是應(yīng)用專業(yè)的安全產(chǎn)品對歸檔電子文件進行安全掃描,一旦發(fā)現(xiàn)病毒即進行殺毒處理,然后再進入歸檔環(huán)節(jié)。
目前,電子文件檢測已經(jīng)成功地在“浙江省檔案局電子文件歸檔與接收系統(tǒng)平臺”“浙江省檔案局電子檔案接收進館與長久保存基地”“浙江省檔案局數(shù)字檔案館系統(tǒng)”進行了應(yīng)用。
其一,電子檔案從產(chǎn)生起就處于各個信息系統(tǒng)內(nèi)部歸檔模塊之中,電子檔案數(shù)據(jù)包如何流轉(zhuǎn)?筆者認為,第一步是流轉(zhuǎn)到單位的檔案管理系統(tǒng),一般有在線和離線兩種方式,兩種方式的性質(zhì)都一樣,其中在線方式需要信息系統(tǒng)和檔案管理系統(tǒng)做一個數(shù)據(jù)交換接口調(diào)用或采用數(shù)據(jù)推送方式送達,離線方式則需要對數(shù)據(jù)包進行下載處理并加載到檔案室檔案管理系統(tǒng);第二步由于檔案室檔案管理系統(tǒng)無法直接利用電子檔案數(shù)據(jù)包,因此在收到電子檔案數(shù)據(jù)包后需要進行解包處理,解包后可先將電子檔案描述項中XML文件取出加載,也可理解為傳統(tǒng)的檔案條目信息加載;第三步再將電子檔案數(shù)據(jù)包中的結(jié)論性文件取出或轉(zhuǎn)換成為版式文件(也可以在歸檔時就轉(zhuǎn)好),與電子檔案描述項相關(guān)聯(lián)(掛接),提供正常使用;第四步可將電子檔案數(shù)據(jù)包移交到檔案館進館保存,當(dāng)然在各個環(huán)節(jié)尤其是進館移交過程中,可加上數(shù)字簽名或電子印章或進館時間戳等技術(shù)手段加以進一步驗證,原始數(shù)據(jù)包進行長久保存;第五步進行解包處理,在數(shù)字檔案館利用系統(tǒng)中提供正常利用。
其二,對引入可信時間戳技術(shù)保證電子文件原始性的實踐應(yīng)用流程的認識。浙江政務(wù)服務(wù)網(wǎng)電子文件在歸檔形成電子檔案的同時加蓋了可信時間戳,具體操作是先將電子檔案包經(jīng)過SHA-1算法得出HASH值(數(shù)字摘要),把該數(shù)字摘要和系統(tǒng)身份標識通過浙江政務(wù)網(wǎng)發(fā)送到浙江省檔案局部署在政務(wù)外網(wǎng)的可信時間戳在線保護系統(tǒng),提出蓋戳請求。時間戳在線保護系統(tǒng)在通過身份驗證后將請求信息通過政務(wù)外網(wǎng)的互聯(lián)網(wǎng)出口,轉(zhuǎn)發(fā)給聯(lián)合信任時間戳服務(wù)中心,由該中心與國家法定時間綁定并簽發(fā)TSA可信時間戳證書,再將證書傳回到浙江省檔案局時間戳在線保護系統(tǒng),供歸檔單位下載。歸檔單位可將返回的可信時間戳文件與歸檔電子檔案數(shù)據(jù)包文件并列或關(guān)聯(lián)存放,以便日后進行原始性校驗。這樣從操作上既完成了“一鍵歸檔”,又為今后電子檔案的移交接收提供了“四性”檢測依據(jù)。通過這種方式既可在電子文件歸檔過程中增加浙江省檔案局認可的行政行為,使浙江省檔案局及時了解和掌握電子文件歸檔的實時狀況,也為今后電子檔案的移交接收創(chuàng)造雙方共同認可的原始憑證,同時為“浙江省檔案局電子文件歸檔與接收系統(tǒng)平臺”“浙江省檔案局電子檔案接收進館與長久保存基地”項目建設(shè)提供了良好基礎(chǔ)。
其三,對電子檔案移交數(shù)據(jù)構(gòu)成的認識。電子檔案移交首先要保證真實、完整、可用和安全這“四性”要求,其次要符合數(shù)字檔案館及檔案資源共享等后續(xù)管理利用平臺的技術(shù)要求?!峨娮訖n案移交與接收辦法》規(guī)定,電子檔案移交與接收可采用離線或在線方式進行,必須遵循工作流程并辦理交接手續(xù),電子檔案移交數(shù)據(jù)要達到基本要求后才能移交。電子檔案數(shù)據(jù)構(gòu)可成分兩方面,一是內(nèi)容數(shù)據(jù)構(gòu)成,二是技術(shù)構(gòu)成。電子檔案內(nèi)容構(gòu)成反映了電子檔案的主題信息,如文書類電子檔案主要包括過程稿、簽發(fā)稿、審批過程信息、元數(shù)據(jù)等。電子檔案元數(shù)據(jù)是電子檔案必不可少的組成部分,它體現(xiàn)了電子檔案的原貌性、完整性,并能保證電子檔案可靠和可用。國家檔案局發(fā)布的文書類電子檔案的元數(shù)據(jù)標準都可以參照。為保證電子檔案的完整性和有效性,從有利于電子檔案有效管理和長期保存等角度出發(fā),今后還會陸續(xù)推出各種數(shù)據(jù)類型的電子檔案元數(shù)據(jù)工作方案。對于業(yè)務(wù)類電子檔案,由于其內(nèi)容數(shù)據(jù)構(gòu)成差異性大,建議以浙江政務(wù)服務(wù)網(wǎng)行政審批電子文件歸檔為例,歸檔文件夾內(nèi)存放該行政審批的基本信息描述、辦理流程、存檔信息(.xml保存)和相應(yīng)的申請、受理、辦理、辦結(jié)、送達等環(huán)節(jié)的所有內(nèi)容(.xml、.jpg、.pdf等各種格式),包括各種表、證、單、書及其他附件材料。電子檔案技術(shù)構(gòu)成指電子檔案內(nèi)容組織和存儲方式,技術(shù)構(gòu)成是電子檔案體現(xiàn)的電子化特征,以行政審批事項為單位為例,歸檔時一個審批事項形成一個歸檔文件夾,歸檔文件夾內(nèi)的各種電子歸檔材料要求能夠在脫機狀態(tài)下正確地讀取與打開,數(shù)據(jù)格式以政務(wù)服務(wù)網(wǎng)上保存的原始文件格式為準。在政務(wù)服務(wù)網(wǎng)上以關(guān)系數(shù)據(jù)庫形式存放、顯示時以臨時抽取組合方式形成的歸檔電子材料,如審批單等,應(yīng)轉(zhuǎn)換成PDF或XML或HTML等易于讀取和顯示的格式保存;以數(shù)據(jù)鏈接形式存放的歸檔電子材料,須下載保存真實數(shù)據(jù)文件。完成歸檔時,將歸檔文件夾進行歸檔數(shù)據(jù)打包,每個歸檔文件夾分別打成一個ZIP文件包,ZIP格式的歸檔數(shù)據(jù)包先在網(wǎng)上集中有序(分單位、年度、審批類別等子目錄)存放,并在行政審批事項列表中記錄存放地址。
總之,要從電子文件形成、歸檔和電子檔案移交、接收和利用的全流程管理來綜合統(tǒng)籌檔案信息化建設(shè),促進檔案信息化事業(yè)健康發(fā)展。
注釋與參考文獻:
[1]國家檔案局.數(shù)字檔案館建設(shè)指南[Z].2014.
[2]蔡學(xué)美.《電子檔案移交與接收辦法》解讀[J].檔案工作,2015(2).