王小娟,斯慶
(鄂爾多斯職業(yè)學(xué)院,內(nèi)蒙古鄂爾多斯 017000)
2014年國(guó)家檔案局發(fā)布《數(shù)字檔案室建設(shè)指南》,提出了數(shù)字檔案室的概念、原則、建設(shè)內(nèi)容和要求,開啟了機(jī)關(guān)檔案信息化工作的新篇章。檔案信息化成為檔案事業(yè)發(fā)展的戰(zhàn)略選擇。2015年10月,該院被自治區(qū)檔案局推薦,由國(guó)家檔案局設(shè)為數(shù)字檔案室建設(shè)試點(diǎn)單位。在試點(diǎn)單位建設(shè)和檔案數(shù)字化過程中,也逐漸形成了一套數(shù)字化模式,現(xiàn)通過該文將數(shù)字化過程的經(jīng)驗(yàn)進(jìn)行總結(jié)歸納,以期形成相關(guān)理論。
檔案是歷史發(fā)展的記錄,是人類文明發(fā)展進(jìn)步的真實(shí)憑證,是一個(gè)國(guó)家、單位、組織、個(gè)人等身份中的重要組成部分。保護(hù)好、利用好檔案非常重要。隨著計(jì)算機(jī)技術(shù)的日益發(fā)展,數(shù)字化技術(shù)已經(jīng)滲透到人們?nèi)粘9ぷ鳌,F(xiàn)階段,檔案管理工作已經(jīng)向數(shù)字化時(shí)代發(fā)展。將計(jì)算機(jī)技術(shù)與檔案管理相結(jié)合,即進(jìn)行檔案數(shù)字化建設(shè),可在有效利用檔案的同時(shí)更好的長(zhǎng)久的保存檔案。
檔案數(shù)字化是隨著數(shù)字?jǐn)z影技術(shù)、掃描技術(shù)、多媒體技術(shù)及存儲(chǔ)技術(shù)等計(jì)算機(jī)技術(shù)的發(fā)展而產(chǎn)生的一種新型檔案信息形態(tài)。它將以各種載體形式保存的檔案資源轉(zhuǎn)化為數(shù)字化的檔案信息,也就是將傳統(tǒng)的機(jī)械記錄、模擬記錄數(shù)字化成二進(jìn)制數(shù)字副本記錄,以數(shù)字信息的形式存儲(chǔ);利用網(wǎng)絡(luò)互連、計(jì)算機(jī)管理,形成一個(gè)有序結(jié)構(gòu)的檔案信息庫(kù),方便用戶利用,實(shí)現(xiàn)檔案資源共享。
該院為高職高專院校,且為老校合并的“新”建院校,目前檔案室現(xiàn)有檔案種類主要有文書類、教學(xué)類、科研類、基建類、設(shè)備類、財(cái)會(huì)類、音視頻類、實(shí)物類;按保存形式可以分為紙質(zhì)類、電子類、聲像類、實(shí)物類四種形式,不同形式的檔案,其數(shù)字化的方法是不同的。
文書類、教學(xué)類、科研類、基建類、設(shè)備類、財(cái)會(huì)類檔案都有紙質(zhì)類保存的形式,對(duì)于目前很多紙質(zhì)文件來源于電子版打印,在數(shù)字化的時(shí)候?qū)㈦娮影姹4胬茫纱蟠蠊?jié)約數(shù)字化成本;對(duì)于無電子版的紙質(zhì)檔案,需要進(jìn)行專業(yè)數(shù)字化。
紙質(zhì)檔案數(shù)字化是利用掃描儀或數(shù)碼照相機(jī)等設(shè)備對(duì)紙質(zhì)檔案進(jìn)行數(shù)字化加工,將其轉(zhuǎn)化為可存儲(chǔ)在光盤、 磁盤等載體上并可被計(jì)算機(jī)識(shí)別的數(shù)字文本或數(shù)字圖像。
紙質(zhì)檔案數(shù)字化過程主要分成四步。
(1)確定數(shù)字化對(duì)象。明確需要進(jìn)行數(shù)字化的檔案,了解數(shù)字化檔案的實(shí)際情況、紙張大小、有無損壞是否需要修補(bǔ)及字跡清晰程度,根據(jù)情況準(zhǔn)備相應(yīng)設(shè)備,并制定合理工作計(jì)劃與技術(shù)方案。
(2)確定數(shù)字化模式。數(shù)字化模式?jīng)Q定了進(jìn)行掃描的工具、模式選擇、掃描參數(shù)設(shè)定及存儲(chǔ)格式選擇。掃描工具有數(shù)碼相機(jī)、掃描儀;掃描模式有直接拍攝或掃描模式、制作縮微品再掃描的間接模式;存儲(chǔ)模式可用文本模式、圖像模式、雙模式(雙層PDF)。
(3)準(zhǔn)備數(shù)字化設(shè)備。檔案數(shù)字化設(shè)備主要有硬件設(shè)備和軟件設(shè)備。硬件設(shè)備主要包含掃描儀、照相機(jī)、計(jì)算機(jī)、存儲(chǔ)設(shè)備及其他附屬設(shè)備。紙質(zhì)數(shù)字化結(jié)果一般為文本文件或圖像文件,因此所需數(shù)字化軟件一般為設(shè)備驅(qū)動(dòng)軟件、圖像處理軟件、雙層PDF 自動(dòng)提取與文字識(shí)別軟件、檔案或電子文件管理軟件。
(4)規(guī)范數(shù)字化操作環(huán)節(jié)。通常檔案數(shù)字化操作總體流程包括:
第一步:檔案調(diào)卷。
即指定的檔案室?guī)旆抗芾砣藛T將要數(shù)字化的檔案從庫(kù)房搬運(yùn)到掃描室,搬前和搬后分別要對(duì)檔案進(jìn)行逐份清點(diǎn),并與數(shù)字化掃描人員辦理檔案交接記錄,雙方確定檔案的數(shù)量和內(nèi)容無誤后方可進(jìn)行拆卷環(huán)節(jié)的工作。
第二步:整理及著錄。
檔案目錄的整理是檔案數(shù)字化操作的前提條件,如果前期的檔案目錄做的不規(guī)范或不準(zhǔn)確,會(huì)嚴(yán)重影響數(shù)字化的進(jìn)度和準(zhǔn)確度,所以在數(shù)字化操作之前必須有完整且準(zhǔn)確的檔案目錄。那么對(duì)于準(zhǔn)備進(jìn)行數(shù)字化的檔案,制作上述提到的檔案目錄。通常有兩種編制方法:即使用數(shù)字化操作軟件的數(shù)據(jù)錄入功能,進(jìn)行目錄制作,或者使用傳統(tǒng)的Excel 表格方式制作。接著就進(jìn)入檔案掃描環(huán)節(jié)。
第三步:檔案掃描。
檔案掃描就是將紙質(zhì)檔案通過相關(guān)設(shè)備轉(zhuǎn)變成電子材料的過程,掃描的操作順序:首先,將前期做好的并確認(rèn)無誤的檔案目錄導(dǎo)入到檔案數(shù)字化操作軟件;其次通過生成計(jì)算機(jī)文件目錄結(jié)構(gòu);最后正式開始操作掃描檔案。
第四步:影像處理。
簡(jiǎn)單講就是將掃描后的電子文件進(jìn)行審核,對(duì)于那些與數(shù)字化要求標(biāo)準(zhǔn)相差太大的、 不清晰的直接進(jìn)行刪除處理;對(duì)于圖像頁面出現(xiàn)偏斜及或者圖像頁面中有影響圖像質(zhì)量的雜質(zhì)和陰影的,但是還可以利用的可以進(jìn)行校正和處理后進(jìn)行保存,但有一點(diǎn),影像處理時(shí),如發(fā)現(xiàn)原文件編號(hào)與文件頁碼缺失,即使再清晰,也是無法使用的。總的來說,影像處理要以視覺效果清晰、頁面完整無缺為標(biāo)準(zhǔn)。
第五步:數(shù)據(jù)驗(yàn)收。
首先,依次檢查每份檔案案卷目錄下要掃描的文件,是否全部能打開正常、頁數(shù)是否正確、與掃描目錄順序和登記內(nèi)容是否一致等。
其次,依次檢查每個(gè)數(shù)字文件的格式正確與否、清晰度高低與否、 傾斜度是否達(dá)到淘汰標(biāo)準(zhǔn)、 分辨率高低、雜質(zhì)率高低等。
最后,依次檢查每個(gè)數(shù)字文件是否掃描缺頁、重頁、順序顛倒、頁面信息不完整、方向不準(zhǔn)確等。
第六步:檔案反庫(kù)。
即將掃描完畢后的檔案放回檔案庫(kù),要求反庫(kù)時(shí)還應(yīng)由檔案室?guī)旆抗芾砣藛T完成(庫(kù)房管理人員與提取人員為一人時(shí),要填寫《檔案提取/反庫(kù)登記表》),如大型檔案館的庫(kù)房管理人員和檔案提取人員有明確分工的,需要進(jìn)行檔案交接,雙方交接時(shí)需要填寫《檔案交接登記表》,雙方簽字為效。
第七步:數(shù)據(jù)備份。
掃描期間工作人員要備份不同階段的數(shù)據(jù)至少兩份以上,掃描后進(jìn)行基礎(chǔ)備份,質(zhì)檢后進(jìn)行二次備份,全部掃描完成后,專業(yè)人員經(jīng)驗(yàn)收合格后,進(jìn)行三次最終備份。具體備份載體包括:將全部掃描數(shù)據(jù)刻錄成DVD 光盤進(jìn)行備份;將掃描數(shù)據(jù)在電腦硬盤上進(jìn)行備份;將全部數(shù)據(jù)復(fù)制到專用的檔案服務(wù)器上進(jìn)行備份。
第八步:成果管理。
主要指后期對(duì)于備份的數(shù)據(jù)進(jìn)行不定期的檢查和調(diào)閱,特別是光盤備份,看是否存在光盤損毀或數(shù)據(jù)消失的問題。
聲像檔案主要有畫冊(cè)、錄音、錄像、老照片、數(shù)碼照片等多媒體檔案。我院為新建院校,所產(chǎn)生的數(shù)碼照片、音視頻檔案均以數(shù)字形式保存的,不需再進(jìn)行數(shù)字化。但由于數(shù)碼照片、音視頻檔案較多,若沒有統(tǒng)一的標(biāo)準(zhǔn)進(jìn)行管理,查閱利用起來難度較大。因此需將其按照聲像檔案管理規(guī)范進(jìn)行整理、目錄建庫(kù)、數(shù)據(jù)掛接、刻錄光盤保存。
照片檔案有照片、圖片、底片等。根據(jù)不同類型采用專業(yè)平板掃描儀、高級(jí)底片掃描儀、數(shù)碼照相機(jī)。照片檔案數(shù)字化的基本程序?yàn)椋呵捌跍?zhǔn)備→確定掃描參數(shù)→掃描→圖像處理→圖像存儲(chǔ)→數(shù)據(jù)掛接→數(shù)據(jù)驗(yàn)收→數(shù)據(jù)備份→編寫說明文件→成果管理。
聲像檔案的保存要注意編寫說明文件,注明文件標(biāo)題、日期、文字說明、地點(diǎn)、人物、拍攝者/攝影者/錄音者、活動(dòng)主辦者等信息。
實(shí)物檔案是檔案員將具有保存價(jià)值的實(shí)體物質(zhì)進(jìn)行收集整理后形成的檔案。實(shí)物檔案包含錦旗、牌匾、獎(jiǎng)杯、字畫、證書等,載體種類多樣。根據(jù)不同的載體,實(shí)物檔案數(shù)字化方法也不同。
對(duì)于紙質(zhì)載體,例如證書、字畫,可用掃描的方式數(shù)字化。根據(jù)不同規(guī)格大小的檔案選擇合適的掃描儀,如果沒有大型掃描儀,也可使用小型掃描儀進(jìn)行后期拼接。
對(duì)于非紙質(zhì)的實(shí)物檔案,例如錦旗、牌匾可選擇拍攝的方法。拍攝時(shí)應(yīng)注意相機(jī)分辨率和拍攝者技術(shù)。因獎(jiǎng)杯載體形式特殊,需要使用三維掃描技術(shù)數(shù)字化。三維掃描是集光、電和計(jì)算機(jī)技術(shù)于一體的高新技術(shù),主要用來對(duì)物體的空間結(jié)構(gòu)和外形進(jìn)行掃描,來獲得物體表面的空間坐標(biāo),能夠?qū)⑽矬w的立體信息轉(zhuǎn)換為計(jì)算機(jī)能直接處理保存的數(shù)字信息,為實(shí)物數(shù)字化提供了條件。
實(shí)物檔案數(shù)字化基本程序?yàn)椋呵捌跍?zhǔn)備→檔案處理 (去污處理等)→掃描或拍攝→圖像處理→圖像存儲(chǔ)→數(shù)據(jù)掛接→數(shù)據(jù)驗(yàn)收→數(shù)據(jù)備份→編寫說明文件→成果管理。
數(shù)字檔案的管理和利用依托檔案管理軟件,即檔案信息管理平臺(tái)。利用平臺(tái)管理檔案信息,通過網(wǎng)絡(luò)提供利用與服務(wù)。檔案平臺(tái)應(yīng)包括收集功能、管理功能、保存功能和利用功能,應(yīng)能對(duì)各類數(shù)字化檔案進(jìn)行整理、比對(duì)、分類、著錄、掛接、鑒定、檢索、統(tǒng)計(jì)等操作,將無序信息變有序,并能實(shí)施有效控制。
綜上所述,檔案數(shù)字化是數(shù)字檔案室建設(shè)的基礎(chǔ)步驟,也是當(dāng)下趨勢(shì)所趨。檔案數(shù)字化工作涉及檔案整理、鑒定、轉(zhuǎn)換、存儲(chǔ)、利用、保管、保護(hù)等多個(gè)環(huán)節(jié),每一個(gè)環(huán)節(jié)都非常關(guān)鍵。該文結(jié)合該院現(xiàn)存的紙質(zhì)檔案、聲像檔案、實(shí)物檔案正在進(jìn)行的數(shù)字化過程進(jìn)行研究,總結(jié)歸納,初步形成了不同載體檔案數(shù)字化的模式。在檔案數(shù)字化操作過程中還應(yīng)注意保證檔案載體的安全、保證數(shù)字化內(nèi)容原真、維護(hù)檔案的保密性。