王 然
紙質(zhì)檔案數(shù)字化是檔案信息化建設(shè)的重要組成部分。在國(guó)家檔案局未批準(zhǔn)《紙質(zhì)檔案數(shù)字化技術(shù)規(guī)范》行業(yè)標(biāo)準(zhǔn)之前,紙質(zhì)檔案的數(shù)字化工作一直處于探索階段??偨Y(jié)前一段的工作,筆者認(rèn)為有幾個(gè)與紙質(zhì)檔案數(shù)字化相關(guān)的問題需要提出來和大家一起共同探討。
一、圖像文件的組織結(jié)構(gòu)
圖像文件最常見的是由檔案掃描后獲得的,是紙質(zhì)檔案數(shù)字化的成果之一。圖像文件的大量形成產(chǎn)生了如何管理的問題,其核心是圖像文件的組織結(jié)構(gòu)。圖像文件的組織結(jié)構(gòu)與圖像文件的命名關(guān)系緊密,圖像文件的命名方式能夠反映圖像文件的組織結(jié)構(gòu)形式。對(duì)于計(jì)算機(jī)來說,圖像文件的命名問題一點(diǎn)不復(fù)雜,只要遵循計(jì)算機(jī)系統(tǒng)文件的命名規(guī)則、確保圖像文件無重名即可。但是,僅僅這樣做不利于檔案數(shù)據(jù)的管理,一旦圖像文件與檔案目錄檢索系統(tǒng)分離,圖像文件就會(huì)變成無序狀態(tài),無法利用。圖像文件應(yīng)該與紙質(zhì)檔案實(shí)體相關(guān)聯(lián),紙質(zhì)檔案實(shí)體現(xiàn)已有規(guī)范的編號(hào)體系,圖像文件的命名可以利用紙質(zhì)檔案實(shí)體的檔號(hào),這樣既可以解決與紙質(zhì)檔案實(shí)體相關(guān)聯(lián)的問題,又不必?fù)?dān)心圖像文件單獨(dú)出現(xiàn)時(shí)“身份不明”。
用檔號(hào)直接命名該檔案的圖像文件是圖像文件組織結(jié)構(gòu)中最簡(jiǎn)單的形式,這種命名方法簡(jiǎn)單、直觀、易操作。但是,這種形式存在著缺點(diǎn)。如在脫機(jī)存儲(chǔ)檔案數(shù)據(jù)時(shí),一般使用的載體的存儲(chǔ)量不能夠滿足將數(shù)據(jù)全部存放在一起的要求,而是需要把檔案數(shù)據(jù)分割成塊分別存儲(chǔ),簡(jiǎn)單的組織結(jié)構(gòu)形式不能使數(shù)據(jù)分割的界限清晰,容易發(fā)生操作錯(cuò)誤。另外,大量的圖像文件以松散的形式存儲(chǔ)也不利于管理。
為解決這個(gè)問題,我們可以采用多層次文件夾的組織結(jié)構(gòu)形式。例如,以卷為保管單位的文書檔案的圖像文件的組織結(jié)構(gòu)可以采用三個(gè)層次的文件夾的形式。實(shí)際操作是建立三個(gè)層次的文件夾,第一層為全宗目錄級(jí),第二層為案卷級(jí),第三層為文件級(jí)。文件級(jí)文件夾中單獨(dú)存放一份文件(卷內(nèi)目錄中一個(gè)順序號(hào)為一份文件),文件夾名為本份文件的順序號(hào);案卷級(jí)文件夾存放同一案卷的文件級(jí)文件夾,文件夾名為本卷的案卷號(hào);全宗目錄級(jí)文件夾存放同一目錄的案卷級(jí)文件夾,文件夾名為本目錄的全宗號(hào)——目錄號(hào)(例:全宗號(hào)26,目錄號(hào)1,文件夾名為26-1);全宗目錄級(jí)文件夾要放置在根目錄下。
采用多層次文件夾的組織結(jié)構(gòu)形式管理圖像文件,一方面可以解決清晰劃分目錄與目錄之間的界限、案卷與案卷之間的界限,有利于檔案數(shù)據(jù)存儲(chǔ)時(shí)的數(shù)據(jù)分割;另一方面在組織形式上更加貼近紙質(zhì)檔案實(shí)體的管理模式,便于對(duì)檔案實(shí)體進(jìn)行鑒定、調(diào)整保管期限、銷毀等工作時(shí)對(duì)圖像文件做相應(yīng)的工作。
檔案目錄檢索系統(tǒng)與圖像文件的關(guān)聯(lián),最簡(jiǎn)便、常用的方法是超鏈接,鏈接的路徑應(yīng)為相對(duì)路徑:全宗目錄級(jí)文件夾名/案卷級(jí)文件夾名/文件級(jí)文件夾名,如上述舉例全宗號(hào)26,目錄號(hào)1,案卷號(hào)1,順序號(hào)1的文件的鏈接路徑為26-1/1/1。
二、檔案目錄檢索系統(tǒng)中檔案著錄字段和字段數(shù)據(jù)類型的選擇
紙質(zhì)檔案數(shù)字化后,檔案目錄檢索系統(tǒng)的功能在原有對(duì)檔案實(shí)體管理的基礎(chǔ)上,增加與圖像文件鏈接的功能就可以滿足檔案原文的利用。檔案著錄字段的設(shè)置與之前沒有大的區(qū)別,如文書檔案的案卷目錄字段的基本設(shè)置應(yīng)該包括:全宗號(hào)、目錄號(hào)、案卷號(hào)、案卷題名、年度、頁數(shù)、期限、備注等,為避免案卷目錄中的題名與卷內(nèi)目錄中的題名字段名相同,將案卷目錄中的題名改為案卷題名。卷內(nèi)目錄字段的基本設(shè)置應(yīng)該包括:全宗號(hào)、目錄號(hào)、案卷號(hào)、順序號(hào)、文號(hào)、責(zé)任者、題名、日期、頁號(hào)、備注。要充分利用已有的工作成果,在原有的檔案目錄檢索系統(tǒng)的基礎(chǔ)上,根據(jù)檔案館對(duì)檔案數(shù)據(jù)管理的要求增加字段,如圖像文件的鏈接字段等,形成新的檔案目錄檢索系統(tǒng)。
在確定字段的數(shù)據(jù)類型時(shí),要考慮周全。如:卷內(nèi)目錄日期字段的數(shù)據(jù)類型的選擇,不能簡(jiǎn)單地定為日期型。因?yàn)?,?duì)于年代久遠(yuǎn)的檔案,其日期的不完整是經(jīng)常能夠遇到的,日期型的字段不接受不完整的日期數(shù)據(jù),所以這個(gè)字段應(yīng)該考慮使用文本型數(shù)據(jù)類型。
三、脫機(jī)存儲(chǔ)檔案數(shù)據(jù)載體的選擇和管理
紙質(zhì)檔案數(shù)字化成果的表現(xiàn)形式是檔案數(shù)據(jù),無論是數(shù)據(jù)備份還是脫機(jī)存儲(chǔ)都是確保檔案數(shù)據(jù)安全所必須采取的措施。選擇什么載體是數(shù)據(jù)備份、脫機(jī)存儲(chǔ)工作中非常重要的一個(gè)問題。在選擇載體時(shí)要優(yōu)先考慮載體的可靠性,數(shù)據(jù)是依托載體而獲得生命的,在條件允許時(shí),可以使用不同形式的載體實(shí)施數(shù)據(jù)備份、脫機(jī)存儲(chǔ),如可移動(dòng)硬盤、光盤、磁帶機(jī)等。
在現(xiàn)有的條件下,我們常常選擇光盤作為檔案數(shù)據(jù)備份和脫機(jī)存儲(chǔ)的載體,這樣做的理由有以下幾點(diǎn):
1、容易操作。光盤驅(qū)動(dòng)器目前已經(jīng)在計(jì)算機(jī)上得到普及,一般人員也比較容易掌握光盤刻錄機(jī)的使用。目前,光盤的制作和使用已經(jīng)不需要在人員的培訓(xùn)上投入較大的精力。
2、安全性能較好。據(jù)國(guó)家檔案局《影響光盤信息讀取的環(huán)境因素研究》科研課題組對(duì)光盤預(yù)期壽命實(shí)驗(yàn)的結(jié)果表明,質(zhì)量好、使用和保管得當(dāng)?shù)墓獗P其預(yù)期壽命可達(dá)幾十年以上。
3、性能價(jià)格比高,非常經(jīng)濟(jì)。目前質(zhì)量比較好的品牌DVD光盤售價(jià)僅幾元人民幣,可存儲(chǔ)約4.7G的數(shù)據(jù),光盤價(jià)格的低廉是其他載體不能夠相比的。
使用光盤作為檔案數(shù)據(jù)的備份、脫機(jī)存儲(chǔ)的載體,檔案館要管理大量光盤的趨勢(shì)已定。對(duì)此檔案館應(yīng)該盡快做好應(yīng)對(duì)的準(zhǔn)備工作,認(rèn)真考慮光盤的管理方法,制定出光盤規(guī)范化管理標(biāo)準(zhǔn),早日實(shí)現(xiàn)光盤的規(guī)范化管理。
四、接收檔案數(shù)據(jù)進(jìn)館需要考慮的問題
這里的檔案數(shù)據(jù)進(jìn)館是指立檔單位對(duì)室藏檔案進(jìn)行數(shù)字化后,將形成的檔案數(shù)據(jù)移交檔案館。立檔單位為了本單位利用檔案便利,將本單位的室藏檔案數(shù)字化,形成了大量的檔案數(shù)據(jù)。對(duì)于這些檔案數(shù)據(jù)檔案館是否接收進(jìn)館,在什么時(shí)間接收進(jìn)館,接收的方法等問題需要我們認(rèn)真、全面地考慮。
1、檔案數(shù)據(jù)進(jìn)館后,能否在短時(shí)間內(nèi)對(duì)社會(huì)開放檔案館?是否有能力將數(shù)據(jù)提供給同級(jí)政府各部門利用?如果在這兩方面得到的都是否定的回答,就意味著進(jìn)館的檔案數(shù)據(jù)在一段時(shí)間內(nèi)將處于“冷藏”的狀態(tài)。這些檔案數(shù)據(jù)與檔案實(shí)體處于分離狀態(tài),給檔案數(shù)據(jù)管理上造成許多不便,如檔案數(shù)據(jù)與檔案實(shí)體的一致性的確認(rèn),利用檔案數(shù)據(jù)權(quán)限的控制等。筆者認(rèn)為,對(duì)于不能即刻提供利用的檔案數(shù)據(jù)暫緩接收進(jìn)館較為妥當(dāng)。
2、確保檔案數(shù)據(jù)與檔案實(shí)體的一致性。在檔案實(shí)體進(jìn)館時(shí),檔案室與檔案館需要對(duì)檔案實(shí)體做進(jìn)館前的二次鑒定工作,這是優(yōu)化館藏、糾正歸檔時(shí)一次鑒定產(chǎn)生錯(cuò)誤的必要環(huán)節(jié)與措施。如果在進(jìn)館鑒定時(shí),對(duì)檔案實(shí)體進(jìn)行了調(diào)整,檔案數(shù)據(jù)也必須做相應(yīng)的調(diào)整,檔案數(shù)據(jù)要與檔案實(shí)體保持一致。檔案數(shù)據(jù)與檔案實(shí)體一起進(jìn)館,檔案館同時(shí)驗(yàn)收檔案數(shù)據(jù)與檔案實(shí)體,是避免檔案實(shí)體與檔案數(shù)據(jù)發(fā)生不一致的可行方法之一。
3、光盤的壽命。雖然光盤的預(yù)期壽命可達(dá)幾十年以上,但是目前這僅是一個(gè)理論數(shù)據(jù)。對(duì)于一種新型載體,其壽命的長(zhǎng)短還要經(jīng)過時(shí)間的驗(yàn)證,對(duì)于光盤的保管條件、保護(hù)措施等還有待于實(shí)踐的檢驗(yàn)和總結(jié)。為了確保檔案數(shù)據(jù)的安全,目前采用的常見措施之一是增加檔案數(shù)據(jù)備份的套數(shù),這樣光盤數(shù)量會(huì)翻倍增長(zhǎng);措施之二是縮短光盤質(zhì)量的檢測(cè)周期,這些都給保管工作帶來很大負(fù)擔(dān),工作量迅速攀升,在此情況下進(jìn)館大量不能利用的檔案數(shù)據(jù),對(duì)檔案館工作只會(huì)是增加負(fù)擔(dān),而不能產(chǎn)生實(shí)際的積極作用。
4、異地保存。作為立檔單位為保證檔案數(shù)據(jù)的安全,申請(qǐng)將其檔案數(shù)據(jù)異地保存在檔案館,檔案館應(yīng)該給予支持。但是,檔案館應(yīng)只提供保管場(chǎng)所,對(duì)檔案數(shù)據(jù)的準(zhǔn)確、檢測(cè)和利用等不承擔(dān)責(zé)任。此類檔案數(shù)據(jù)要與進(jìn)館的檔案數(shù)據(jù)在管理上區(qū)別對(duì)待。
作者單位:北京市西城區(qū)檔案館