譚英
摘要:隨著華能集團數(shù)字檔案館的建設(shè),分子公司數(shù)字檔案資源的采集是重中之重。由于各單位保存的歷史檔案數(shù)據(jù)存在著諸多問題,因此根據(jù)數(shù)字檔案館數(shù)據(jù)采集的標(biāo)準(zhǔn),再結(jié)合企業(yè)歷史電子檔案的管理現(xiàn)狀,制定一套行之有效的數(shù)據(jù)遷移方案變得必不可少。本文詳細(xì)分析了歷史數(shù)據(jù)遷移的不同環(huán)節(jié),對歷史數(shù)據(jù)遷移有效準(zhǔn)確的執(zhí)行有一定的參考價值。
關(guān)鍵詞:數(shù)字檔案館;數(shù)據(jù)遷移;元數(shù)據(jù);數(shù)據(jù)轉(zhuǎn)換;數(shù)據(jù)治理
2015年以來,中國華能集團公司通過“大集中”部署方式建設(shè)數(shù)字檔案館,構(gòu)建了以用戶為中心的數(shù)字檔案管理和利用體系,建立了以數(shù)字檔案館為載體的檔案管理提升平臺。為響應(yīng)集團數(shù)字檔案館下數(shù)字檔案資源建設(shè),我公司積極開展歷史檔案數(shù)據(jù)采集、治理和遷移工作,整合已產(chǎn)生和將要產(chǎn)生的檔案數(shù)據(jù)資源,以更高、更優(yōu)的效率管理公司的檔案資源,為公司今后日常的生產(chǎn)、經(jīng)營管理、業(yè)務(wù)決策提供信息參考服務(wù)。
一、公司檔案管理現(xiàn)狀
公司組建多年來,開展的檔案管理工作較早,收集和保存了大量本單位產(chǎn)生的有價值檔案。公司設(shè)立獨立的檔案管理機構(gòu)—檔案室,并配備專業(yè)、專職的檔案管理人員,形成以檔案室為主,文件資料形成部門為輔的檔案管理體系。檔案室?guī)齑嬉晕臅鴻n案和科技檔案為主,有紙質(zhì)和電子版等多種載體形式,紙質(zhì)檔案和電子檔案尚無法做到統(tǒng)一管理。
雖然大部分電子檔案已上傳掛接至原有檔案管理系統(tǒng),但原有檔案管理系統(tǒng)中數(shù)據(jù)無法與庫房實體檔案一一對應(yīng),存在數(shù)據(jù)混亂、不完全、缺失、重復(fù)、原文無法在線打開以及元數(shù)據(jù)字段信息缺少等諸多問題。同時,原有檔案管理系統(tǒng)與華能集團數(shù)字檔案館系統(tǒng)在數(shù)據(jù)結(jié)構(gòu)上也存在很大的差異,因此給歷史數(shù)據(jù)遷移工作帶來很大的挑戰(zhàn)。
二、歷史檔案數(shù)據(jù)遷移的幾個環(huán)節(jié)
1、制定數(shù)據(jù)遷移方案
為了對歷史數(shù)據(jù)有效遷移,必須考慮原有老舊系統(tǒng)的數(shù)據(jù)結(jié)構(gòu)以及收集的電子檔案數(shù)據(jù)情況,再結(jié)合《華能集團數(shù)字檔案館元數(shù)據(jù)信息采集標(biāo)準(zhǔn)》、《華能集團數(shù)字檔案館數(shù)據(jù)資源建設(shè)要求》等技術(shù)規(guī)范,就異構(gòu)系統(tǒng)的數(shù)據(jù)和歷史收集的電子檔案分類梳理后,制定有效地數(shù)據(jù)遷移方案。
2、數(shù)據(jù)遷移的前期準(zhǔn)備
對于準(zhǔn)備工作,要根據(jù)數(shù)據(jù)遷移的特點,大量的工作都需要在準(zhǔn)備階段完成,充分而周到的準(zhǔn)備工作是順利完成數(shù)據(jù)遷移的重要基礎(chǔ)。具體工作如下:
1) 原有檔案管理系統(tǒng)的詳細(xì)說明:通過對原有檔案管理系統(tǒng)及其數(shù)據(jù)庫的研究分析,主要說明原有數(shù)字化檔案管理系統(tǒng)中各類檔案的目錄數(shù)據(jù)的存放位置和方式、對應(yīng)電子文件的類型和存放方式、目錄數(shù)據(jù)間的關(guān)聯(lián)關(guān)系、目錄數(shù)據(jù)中字段的代碼情況、目錄記錄數(shù)、數(shù)據(jù)字典等信息。
2) 華能集團數(shù)字檔案館系統(tǒng)的詳細(xì)說明:在數(shù)據(jù)遷移的過程中,由于數(shù)據(jù)結(jié)構(gòu)的差異性,原有檔案管理系統(tǒng)和華能集團數(shù)字檔案館系統(tǒng)在數(shù)據(jù)的組織上也會存在很大的不同,所以需要確認(rèn)接收后數(shù)據(jù)在華能集團數(shù)字檔案館系統(tǒng)中的組織形式,進(jìn)一步了解在華能集團數(shù)字檔案館系統(tǒng)中各類檔案的目錄數(shù)據(jù)的存放位置和方式、對應(yīng)電子文件的類型和存放方式、目錄數(shù)據(jù)間的關(guān)聯(lián)關(guān)系、目錄數(shù)據(jù)中字段的代碼情況、目錄記錄數(shù)、數(shù)據(jù)字典等信息。
3) 編寫原有檔案管理系統(tǒng)和華能集團數(shù)字檔案館系統(tǒng)之間的檔案數(shù)據(jù)映射表:在對原有檔案管理系統(tǒng)和華能集團數(shù)字檔案館系統(tǒng)的詳細(xì)了解的前提下,進(jìn)一步確認(rèn)原有檔案管理系統(tǒng)中數(shù)據(jù)遷移的范圍,包括目錄字段信息、電子文件信息等,并建立原有檔案管理系統(tǒng)和華能集團數(shù)字檔案館系統(tǒng)之間的字段對應(yīng)關(guān)系。根據(jù)以上內(nèi)容,編寫相關(guān)技術(shù)說明書。
4)參考華能集團數(shù)字檔案館要求,針對歷史收集的其它形式電子檔案,制定目錄數(shù)據(jù)的元數(shù)據(jù)字段數(shù)量、類型,著錄相關(guān)的數(shù)據(jù)信息,制定電子檔案分類、命名等整理規(guī)則,保持與目錄數(shù)據(jù)的檔號信息一一對應(yīng),以利于后期進(jìn)一步的數(shù)據(jù)轉(zhuǎn)換和治理工作。
3、數(shù)據(jù)轉(zhuǎn)換
開發(fā)數(shù)據(jù)遷移輔助工具軟件,用數(shù)據(jù)遷移輔助工具軟件進(jìn)行數(shù)據(jù)轉(zhuǎn)換和遷移。通過開發(fā)數(shù)據(jù)遷移輔助工具軟件的分階段運行,自動將舊標(biāo)準(zhǔn)數(shù)據(jù)分批次地批量轉(zhuǎn)換遷移成新標(biāo)準(zhǔn)數(shù)據(jù)。數(shù)據(jù)遷移輔助工具軟件能將疑似不符合新標(biāo)準(zhǔn)的數(shù)據(jù)自動識別出來,并遷移到問題數(shù)據(jù)庫中。問題數(shù)據(jù)庫中的數(shù)據(jù),經(jīng)人工干預(yù)、修改和確認(rèn)正確后,再由輔助工具軟件自動批量轉(zhuǎn)換遷移成新標(biāo)準(zhǔn)數(shù)據(jù)。采用科學(xué)的方法,全面檢測已轉(zhuǎn)換和遷移的符合新標(biāo)準(zhǔn)的歷史檔案數(shù)據(jù)集。評估數(shù)據(jù)轉(zhuǎn)換的總體質(zhì)量,對問題數(shù)據(jù)進(jìn)行人工干預(yù)改正。將已檢測合格的數(shù)據(jù),分批上載到華能集團數(shù)字檔案館系統(tǒng)。
4、數(shù)據(jù)治理
為了保證遷移數(shù)據(jù)的真實有效,需要開展數(shù)據(jù)治理工作。數(shù)據(jù)遷移至數(shù)字檔案館系統(tǒng)后,通過系統(tǒng)功能進(jìn)行檔案數(shù)據(jù)規(guī)范性檢查,包括無檔號、分類編碼不全,部門編碼不全、卷(盒)統(tǒng)計信息不一致、檔號異常、重復(fù)、未掛接電子文件等檢查項。同時,也可利用系統(tǒng)四性檢測功能對電子檔案進(jìn)行真實性、完整性、可用性和安全性檢查。檢查列出有問題的數(shù)據(jù),系統(tǒng)按照既定的業(yè)務(wù)規(guī)則智能修復(fù)或人工手動批量操作。如仍有未解決的數(shù)據(jù),需要人工核驗改正,必要時可參考實體庫房紙質(zhì)檔案的原始記錄。
5、數(shù)據(jù)遷移后的檢查
數(shù)據(jù)遷移完成后的檢查是對遷移質(zhì)量的檢查,建立《遷移檢查表》,對遷移后的數(shù)據(jù)進(jìn)行檢查,主要包括以下幾個方面:
1) 日志檢查:通過對遷移日志的檢查,了解數(shù)據(jù)遷移的過程是否正常,是否有明顯的缺陷,如記錄數(shù)、是否存在錯誤等;
2) 抽樣檢查。由軟件開發(fā)商與用戶共同組成抽樣檢查小組,每個小組成員從華能數(shù)字檔案館系統(tǒng)中隨機抽取n(具體數(shù)量由雙方協(xié)商)條遷移后的數(shù)據(jù),與原有歷史數(shù)據(jù)進(jìn)行對比檢查(包括目錄和電子文件);
3) 管理方式檢查。主要是檢查數(shù)據(jù)遷移后,能否符合華能數(shù)字檔案館系統(tǒng)的管理方式。
6、數(shù)據(jù)遷移應(yīng)急預(yù)案
數(shù)據(jù)遷移的過程中,由于某種原因(網(wǎng)絡(luò)、斷電、系統(tǒng)不穩(wěn)定等)導(dǎo)致數(shù)據(jù)遷移意外中斷,在這種情況下,必須啟動應(yīng)急預(yù)案來解決。具體應(yīng)急措施如下:
1)數(shù)據(jù)的備份,包括原有/現(xiàn)有檔案管理系統(tǒng)數(shù)據(jù)庫的備份、電子文件備份以及其它形式的歷史數(shù)據(jù)備份,一旦出現(xiàn)緊急情況,可以切換到原有的狀態(tài);
2)在數(shù)據(jù)的遷移過程中,詳細(xì)記錄轉(zhuǎn)換日志,用以監(jiān)控整個遷移過程,對于出現(xiàn)的意外情況,參考日志的記載,以便技術(shù)人員能根據(jù)數(shù)據(jù)遷移日志采取相應(yīng)的措施。
參考文獻(xiàn)
[1]吳淑瑋,閆訓(xùn)超,曹齊.企業(yè)級信息系統(tǒng)數(shù)據(jù)遷移[J].計算機系統(tǒng)應(yīng)用,2013,22(07):53-57.
[2]鐘越,于穎黎,劉曉璐.建立電力企業(yè)數(shù)字檔案館的探索[J].科技與企業(yè),2012(23):122.