鐘美瑜
摘要檔案數(shù)字化建設(shè)的社會背景就是網(wǎng)絡(luò)信息時代,將網(wǎng)絡(luò)環(huán)境特性和檔案管理組織機(jī)構(gòu)服務(wù)特點相互結(jié)合,深入研究并分析檔案工作的發(fā)展十分有必要。在這種情況下,文中把檔案的數(shù)字化建設(shè)當(dāng)做重點研究內(nèi)容,針對與其相關(guān)的問題展開深入地研究與分析,希望能夠提供有價值的參考依據(jù)。
關(guān)鍵詞檔案 數(shù)字化建設(shè) 發(fā)展探析
伴隨數(shù)字化技術(shù)的快速發(fā)展,我國數(shù)字文件的數(shù)量顯著提-高,為檔案數(shù)字化管理的工作也備受國內(nèi)大部分專家與學(xué)者的重視?;诖?,數(shù)字化檔案的發(fā)展也將成為檔案工作未來的必然趨勢,有效地轉(zhuǎn)變了檔案工作人員自身的思想。所以,針對檔案數(shù)字化的建設(shè)以及發(fā)展展開進(jìn)一步地探究十分有必要。
一、檔案數(shù)字化建設(shè)概述
(一)基本內(nèi)容
新時期背景下,檔案的數(shù)字化建設(shè)與發(fā)展一般可以涵蓋兩個不同的層面,具體表現(xiàn)在目錄數(shù)字化與全文數(shù)字化。其中,目錄數(shù)字化具體指的是通過對檔案著錄標(biāo)引的應(yīng)用,科學(xué)合理地制定目錄數(shù)據(jù)庫結(jié)構(gòu),而全文數(shù)字化指的則是對檔案的全文以圖像文件的方式保存,或者是通過光學(xué)字符技術(shù)識別完成保存。
通常情況下,檔案數(shù)字化工作的開展,其主要包含的內(nèi)容可以細(xì)化成三個不同的部分:
首先,檔案資源整理的數(shù)字化。具體指的就是借助數(shù)字技術(shù),通過數(shù)字化形式保存檔案信息,確保電子文件的規(guī)范性,增強(qiáng)辦公自動化效果。
其次,檔案數(shù)字化信息資源庫。主要的功能就是維護(hù)并升級檔案信息軟件。
最后,在有效構(gòu)建數(shù)字化檔案信息網(wǎng)絡(luò)的過程中,應(yīng)將檔案信息的內(nèi)容上傳至互聯(lián)網(wǎng)當(dāng)中,這樣就能夠在網(wǎng)絡(luò)的作用下實現(xiàn)檔案信息資源的全面共享。作為用戶即可借助開放式網(wǎng)絡(luò)檢索國內(nèi)與國外檔案資源。
(二)具體特點
眾所周知,檔案數(shù)字化的應(yīng)用建設(shè)不可或缺的載體就是現(xiàn)代技術(shù),能夠?qū)一蛘呤巧鐣?dāng)中具有較高保存價值的文字、圖表以及聲像等予以保存。特點一般表現(xiàn)為四個方面:
1.識讀信息的非人工.勝。在檔案數(shù)字化建設(shè)應(yīng)用的過程中,數(shù)字代碼是記錄的主要形式,通過對計算機(jī)軟件程度的應(yīng)用達(dá)到解碼的目標(biāo),并且恢復(fù)到初始狀態(tài)加以識讀。
2.系統(tǒng)的依賴性。管理檔案數(shù)字化的過程中,必須充分利用計算機(jī)軟件系統(tǒng),將系統(tǒng)作用充分發(fā)揮出來。如果面對計算機(jī)軟件系統(tǒng)和原有系統(tǒng)無法兼容的情況,要及時采取調(diào)配的措施,確保檔案信息內(nèi)容可讀。
3.信息內(nèi)容易變性。如果全新計算機(jī)系統(tǒng)與程序無法實現(xiàn)解碼,原有信息資料被刪除的幾率會更高,但這同樣也是檔案信息管理工作中無法規(guī)避的問題。
4.其他特征。對于檔案數(shù)字化應(yīng)用建設(shè)的過程來講,其他的特點具體表現(xiàn)在檔案信息的可流動性方面,而且信息和媒體還能夠有效集成。
二、檔案數(shù)字化建設(shè)中存在的問題以及解決措施闡釋
(一)檔案資源數(shù)字化建設(shè)優(yōu)化取舍
較之于傳統(tǒng)的紙質(zhì)檔案文件,數(shù)字化檔案的運用在資源使用、文件保護(hù)與文件檢索方面的優(yōu)勢顯而易見。在館藏海量資源中,實現(xiàn)所有資源的數(shù)字化建設(shè)并不是必要工作,不僅會消耗大量的人力與財力,浪費的情況也時常發(fā)生。
針對以上問題,在開展檔案數(shù)字化建設(shè)的過程中,應(yīng)遵循基本原則,科學(xué)合理地選擇并確定需要實現(xiàn)數(shù)字化的館藏檔案原件。在實踐過程中,應(yīng)保證珍貴、重點與特色檔案優(yōu)先實現(xiàn)數(shù)字化建設(shè),特別是與檔案館特色以及文化相吻合的檔案資源,將其當(dāng)做數(shù)字化建設(shè)的優(yōu)先對象。
(二)檔案數(shù)字化文件忠實還原原件
全面建設(shè)紙質(zhì)檔案的數(shù)字化建設(shè)目標(biāo)有兩方面:一方面,為永久保存檔案,其一就是借助數(shù)字化載體將紙質(zhì)原件進(jìn)行替代,達(dá)到長期保管目標(biāo),其二則是針對關(guān)鍵性紙質(zhì)原件予以復(fù)制保管,以實現(xiàn)數(shù)字化復(fù)本的目標(biāo)。另一方面,便于讀者的利用。在利用過程中,可以細(xì)化成兩種類別,即網(wǎng)絡(luò)化利用與非網(wǎng)絡(luò)化利用。而網(wǎng)絡(luò)化利用也是數(shù)字化建設(shè)的目標(biāo),非網(wǎng)絡(luò)化利用通常被應(yīng)用在重要文獻(xiàn)發(fā)行與出版領(lǐng)域。
在建設(shè)檔案資料數(shù)字化的過程中,明確指出要保留檔案原有內(nèi)涵,偏差與出入都是不允許出現(xiàn)的,有效地規(guī)避對于檔案使用價值的負(fù)面作用。為此,在檔案的數(shù)字化建設(shè)方面,要將檔案資料內(nèi)容真實地體現(xiàn)出來。在此基礎(chǔ)上,檔案數(shù)字化建設(shè)還要嚴(yán)格遵循《數(shù)字化加工規(guī)范》具體要求,并將其當(dāng)做重要的參考依據(jù)。對檔案數(shù)值化制作方面,掃描選擇使用的分別率應(yīng)為bit真彩并超過300dpi。另外,在選擇保存格式方面,最常見的是JPG格式,如果在光盤中保存,需選擇使用DJYU的壓縮格式,進(jìn)而將檔案進(jìn)行高清還原,使得實際顯示的音像或者是圖像都和原有檔案資料保持一致。
(三)數(shù)字檔案保存技術(shù)應(yīng)用
基于信息化建設(shè)的深入推進(jìn)與電子政務(wù)發(fā)展,檔案信息化建設(shè)工作隨之開展,特別是聲像與數(shù)字化檔案數(shù)量不斷增加。其中,光盤的保存方式能夠確保較大的存儲量,而且價格不高,使用的壽命較長,實際的應(yīng)用便利,為此在長期發(fā)展的過程中成為檔案系統(tǒng)應(yīng)用最普遍的電子數(shù)據(jù)存儲方式。但需要注意的是,使用光盤對電子檔案存儲的過程中,還會遇到光盤選用指標(biāo)與數(shù)據(jù)刻錄方式等諸多問題。
基于此,在檔案數(shù)字化建設(shè)的過程中,要保證數(shù)字檔案載體光盤的合理選擇,在歸檔方面使用檔案級光盤,積極開展光盤數(shù)據(jù)的安全監(jiān)控工作,以保證全面監(jiān)管光盤的性能以及相關(guān)參數(shù),增強(qiáng)光盤當(dāng)中的檔案數(shù)據(jù)安全水平。在此基礎(chǔ)上,應(yīng)積極構(gòu)建數(shù)字檔案長期保管與維護(hù)的數(shù)據(jù)倉儲TDR系統(tǒng),將數(shù)字倉儲與保存領(lǐng)域國際標(biāo)準(zhǔn)要求合理地選用OAIS參考模型,從而確保數(shù)字檔案資源保存的時效性。
(四)人工校對問題與解決措施
在檔案數(shù)字化建設(shè)的過程中,對掃描技術(shù)、存儲技術(shù)以及多媒體技術(shù)等相關(guān)高新技術(shù)進(jìn)行了合理地運用,使得不同類型檔案載體資源能夠向數(shù)字化信息方面轉(zhuǎn)化,但在實際轉(zhuǎn)化的過程中,受到操作系統(tǒng)偏差因素與工作人員失誤因素的影響,直接影響了檔案資料的真實性。
針對以上問題,在糾偏時應(yīng)借助人工抽檢與補(bǔ)充的方式。在文字檔案數(shù)字化建設(shè)方面,在OCE識別技術(shù)的作用下,將掃描圖片有效地轉(zhuǎn)變成雙層PDF。但因為OCR識別技術(shù)對紙質(zhì)檔案的要求相對較高,所以如果紙質(zhì)檔案的保存時間較長且保存效果不理想,那么在識別率方面也不會取得理想成績,對檢索的質(zhì)量與效果帶來嚴(yán)重的影響?;诖?,應(yīng)將人工校對和OCR識別技術(shù)有機(jī)結(jié)合,如果文字無法被OCR識別技術(shù)識別出來,應(yīng)通過手工方式著錄。這樣一來,就能夠保證文獻(xiàn)全文的檢索效率得以提升,縮短了實際消耗的時間,一定程度上增強(qiáng)了檔案數(shù)字化建沒效率。
三、結(jié)語
綜上所述,在檔案數(shù)字化應(yīng)用建設(shè)方面,主要是對多樣化現(xiàn)代技術(shù)予以應(yīng)用,實際的資金投入較大,且開發(fā)周期長,具有一定的復(fù)雜性。在這種情況下,有必要加深對檔案數(shù)字化應(yīng)用建設(shè)的探索力度。但在實踐過程中,檔案的數(shù)字化建設(shè)始終存在一定的問題需要解決,為此,應(yīng)始終秉承積極向上的態(tài)度,對檔案數(shù)字化的建設(shè)內(nèi)容以及特點形成正確地認(rèn)知,并且綜合考慮其中的問題,科學(xué)合理地選擇具有一定可行性的解決策略,最終達(dá)到全面建設(shè)檔案信息化的發(fā)展目標(biāo)。