□張子敏
河北省水利廳機關文書檔案數(shù)字化處理流程
□張子敏
根據(jù)河北省水利廳檔案數(shù)字化工作現(xiàn)狀,對文書檔案數(shù)字化處理流程進行了梳理,此文介紹了紙質檔案經(jīng)過掃描、圖像優(yōu)化、質量檢查、圖像掛接、數(shù)據(jù)存儲備份等數(shù)字化處理技術方法,轉換成數(shù)字方式的過程,通過文書檔案數(shù)字化處理為檔案信息化建設提供基礎。
文書檔案;數(shù)字化;流程
河北省水利廳檔案室室藏檔案上萬卷(件),2001年以來以件為單位的紙質檔案就達25048件,另還存有科技檔案、基建檔案、會計檔案、照片檔案、聲像檔案等。室藏的文書檔案是水利工作運行中不可缺少的寶貴財富,長期以來,大量的紙質文書檔案在水利工作中發(fā)揮了重要作用,但由于紙質檔案存在查閱不便、調卷緩慢、原件易損等問題,這些紙質檔案的保存和利用已遠遠不能適應和滿足水利事業(yè)發(fā)展新形勢的需要,加之河北省公布的《河北省機關檔案工作目標管理認定標準》中明確將檔案數(shù)字化建設納入認定標準中,檔案數(shù)字化日益成為檔案信息化建設的一個重要組成部分,河北省水利廳開展紙質文書檔案數(shù)字化建設已勢在必行。
將紙質檔案轉換成計算機可識別的數(shù)字格式通常有兩種方法,一是對紙質檔案掃描并以圖像方式存儲。二是利用已有的縮微膠片影像進行數(shù)字化轉換或者直接用數(shù)碼相機進行拍攝。在操作過程中,考慮到對紙質檔案進行直接掃描的方式比較經(jīng)濟和快捷,因此,河北省水利廳決定采取通過掃描儀掃描的方法將紙質文書檔案變成電子圖像文件直接存儲,再配合正在使用的河北科怡綜合檔案管理軟件信息數(shù)據(jù)庫,實現(xiàn)電子檔案的快速檢索利用。
根據(jù)計算機設備更新周期短,新技術、新設備不斷出現(xiàn)的現(xiàn)實,以及目前我廳紙質文書檔案數(shù)字化的數(shù)量,對于檔案數(shù)據(jù)存儲設備的購置,河北省水利廳決定采取“適度超前、現(xiàn)實夠用、可以擴充、不追求一步到位”的原則,將檔案數(shù)據(jù)直接存儲到現(xiàn)有檔案服務器硬盤中,另購置大容量移動硬盤以滿足數(shù)據(jù)備份的需要,達到數(shù)字化過程的投入最小化,完成效果的最大化。
文書檔案數(shù)字化處理主要是對河北省水利廳2001~2014年以件為單位具有永久保存價值的紙質檔案約7795件進行圖像掃描及處理,按行業(yè)技術規(guī)范化流程進行檔案整理、檔案掃描、圖像處理、圖像存儲、目錄建庫、數(shù)據(jù)掛接、數(shù)據(jù)驗收、數(shù)據(jù)備份等工作。出于保密和經(jīng)費方面的考慮,河北省水利廳放棄了外包給社會上的公司進行數(shù)字化處理工作的選擇,由廳檔案員負責該項工作,規(guī)定對涉密件不進行全文掃描錄入。
2.1 檔案整理過程
一是拆分與裝訂。對于影響掃描工作進行的檔案,要拆除裝訂物,粘連在一起的多份檔案,需在不損壞檔案載體信息量的前提下,細心分開,如實在無法分開則不分,操作中不得對檔案原件有任何損壞。掃描完成后要重新裝訂,注意保持檔案的原版原貌,排序不變、卷皮不換,按檔案原有線孔裝訂,做到安全、準確、無遺漏。
二是修補。檔案如有破損需進行修補,修補方法包括托核、加寬、加邊等;折皺不平的原件應進行壓平或熨平等處理后再進行掃描。
三是區(qū)分掃描件和非掃描件。無關和重份的文件要剔除,有正式件的文件可以不掃描原稿。
四是整理登記。填寫紙質檔案數(shù)字化加工過程登記表單,記錄檔案整理后的件號、年度、題名、頁數(shù)等信息。
2.2 檔案掃描掛接過程
一是圖像掃描。檔案掃描須采用專業(yè)掃描儀,以黑白二值模式為主,對頁面中有紅頭、印章或插有圖片的檔案可采用彩色模式掃描,分辨率不低于100dpi,如文字偏小、密集可適當提高分辨率。
二是圖像優(yōu)化。經(jīng)掃描后形成的電子圖像,按要求須進行后期優(yōu)化,對掃描過程中產生的黑邊、黑點、黑框等應進行去污;圖像出現(xiàn)偏斜應進行糾偏;以彩色模式掃描的圖像應進行裁邊處理,去除多余白邊,保證圖像質量。
三是圖像格式。采用黑白二值模式掃描的圖像文件,一般采用TIFF格式存儲,采用灰度和彩色模式掃描的文件,一般采用JPEG格式存儲。
四是數(shù)據(jù)檢查。對每天完成的數(shù)據(jù)進行檢查,保證圖像文件與卷內文件一致正確,圖像文件名與檔案目錄數(shù)據(jù)庫中該文的檔號一致準確,清晰度和格式符合要求。
五是數(shù)據(jù)掛接。檔案數(shù)字化轉換過程中形成的目錄數(shù)據(jù)庫與圖像數(shù)據(jù)庫及時加載到檔案數(shù)據(jù)服務器端,通過科怡檔案軟件實現(xiàn)目錄數(shù)據(jù)對相關聯(lián)的圖像數(shù)據(jù)的自動搜索,實現(xiàn)檔案目錄和檔案原文的同時查閱。
2.3 檔案數(shù)據(jù)備份過程
對于經(jīng)過檔案整理、掃描、圖像優(yōu)化、數(shù)據(jù)檢查后形成的最終數(shù)據(jù),進行存儲備份,存儲載體的選擇采用兩種方式,一是服務器的自動備份。二是下載保存到另外一臺電腦或移動硬盤中。
河北省水利廳通過紙質文書檔案數(shù)字化加工處理,初步實現(xiàn)了文書檔案信息化,檔案管理的自動化,為工作人員方便快捷地進行檔案的網(wǎng)上查詢、檢索提供了數(shù)據(jù)支持,為廳機關檔案工作目標管理認定任務的完成提供了堅實的數(shù)據(jù)基礎。文書檔案數(shù)字化的實現(xiàn)一定程度上提高了廳機關檔案管理水平,提高了文書檔案在水利業(yè)務和科研工作中的利用效率,最大化發(fā)揮了文書檔案的使用價值?!?/p>
2016-02-15
張子敏,女,漢族,河北省水利廳,檔案員。