1 數(shù)字檔案信息標(biāo)準(zhǔn)問(wèn)題
這是制約數(shù)字檔案信息長(zhǎng)期保存的首要“瓶頸”。數(shù)字檔案信息的長(zhǎng)期保存主要涉及兩個(gè)方面,一是防止數(shù)字檔案信息被非法變更與破壞,另一個(gè)是維護(hù)數(shù)字檔案信息的長(zhǎng)期真實(shí)可讀性。前者,IT界極為重視,國(guó)內(nèi)外已開(kāi)發(fā)了不少技術(shù)產(chǎn)品來(lái)防范非法變更與破壞數(shù)字檔案信息,只要技術(shù)措施與管理手段科學(xué)地融合,就有可能在一定程度上解決問(wèn)題。然而,對(duì)于維護(hù)數(shù)字檔案信息長(zhǎng)期有效讀出,全球范圍都在研究與努力,但至今,仍在探索完美的解決方案。因?yàn)?,它涉及的?wèn)題太多,其中,最重要的是標(biāo)準(zhǔn)問(wèn)題。標(biāo)準(zhǔn)是緩解技術(shù)更新與數(shù)字檔案信息讀出矛盾的一劑“良方”,但在這方面存在一些問(wèn)題,一是某些標(biāo)準(zhǔn),特別是行業(yè)標(biāo)準(zhǔn)嚴(yán)重滯后。二是完全按照標(biāo)準(zhǔn)操作,目前,還有難度。制定標(biāo)準(zhǔn)應(yīng)當(dāng)廣泛地征求相關(guān)技術(shù)人員的意見(jiàn),但現(xiàn)在有些行業(yè)標(biāo)準(zhǔn)的制定,僅僅是少數(shù)人在撰寫,有些甚至是“閉門造車”,使指導(dǎo)與規(guī)范大家行為的標(biāo)準(zhǔn)嚴(yán)重滯后于國(guó)際發(fā)展水平。三是現(xiàn)實(shí)工作中存在標(biāo)準(zhǔn)兼容與選擇的問(wèn)題,如A軟件與B軟件都是符合標(biāo)準(zhǔn)的,但A與B又各有特點(diǎn),這個(gè)特點(diǎn)就不在標(biāo)準(zhǔn)范圍之內(nèi)了,這為我們提出了一個(gè)棘手的問(wèn)題,我們應(yīng)當(dāng)以哪個(gè)軟件為主。如果以A軟件為主,則B軟件形成的非標(biāo)準(zhǔn)數(shù)據(jù),或另類標(biāo)準(zhǔn)特色信息就要向A軟件形成的平臺(tái)上遷移。因此,作為被保存的數(shù)字檔案信息應(yīng)當(dāng)采用最穩(wěn)定的技術(shù)與通用的標(biāo)準(zhǔn)歸檔,與行業(yè)標(biāo)準(zhǔn)及國(guó)際標(biāo)準(zhǔn)相互兼容,這也是我們首先應(yīng)考慮解決的問(wèn)題。令人遺憾的是,至今,尚未形成一套全球公認(rèn)的數(shù)字檔案信息長(zhǎng)期保存的國(guó)際標(biāo)準(zhǔn)。
2 數(shù)字檔案信息安全問(wèn)題
隨著數(shù)字檔案信息的日益增多,數(shù)字檔案信息較易受到干擾和攻擊,給數(shù)字檔案信息長(zhǎng)期保存帶來(lái)嚴(yán)峻的安全“瓶頸”。那么,如何解決數(shù)字檔案信息的安全問(wèn)題呢?筆者認(rèn)為,具體實(shí)施數(shù)字檔案信息安全管理可從以下五個(gè)方面著手:一是采用社會(huì)法律、法規(guī)手段,建立數(shù)字檔案信息安全管理標(biāo)準(zhǔn)和規(guī)則。二是加強(qiáng)檔案信息用戶認(rèn)證。檔案信息用戶認(rèn)證在數(shù)字檔案信息的安全中屬于技術(shù)措施的第一道大門,主要目的是提供訪問(wèn)控制和不可抵賴的作用。檔案信息用戶認(rèn)證方法按其層次不同,可以根據(jù)檔案信息用戶持有的證件、檔案信息用戶密碼、檔案信息用戶特有的生物特征三種因素提供認(rèn)證。三是授權(quán)。這主要為特許檔案信息用戶提供合適的訪問(wèn)權(quán)限,并監(jiān)控檔案信息用戶的活動(dòng),使其不越權(quán)使用。四是加密。加密是檔案信息安全應(yīng)用中最早開(kāi)展的有效手段之一,數(shù)據(jù)通過(guò)加密,可以保證在存取與傳送的過(guò)程中不被非法查看、篡改、竊取等。五是審計(jì)、監(jiān)控和數(shù)據(jù)備份。保證數(shù)字檔案信息的安全,重要的是,國(guó)家或部門應(yīng)當(dāng)制定一個(gè)備份機(jī)制與規(guī)范,對(duì)記錄的備份規(guī)范時(shí)間要求、格式要求與份數(shù)要求予以規(guī)范,并給予財(cái)力的支持。備份規(guī)范也要考慮不同的工作環(huán)境,對(duì)于數(shù)字檔案記錄保存部門,應(yīng)規(guī)定定期備份。
3 數(shù)字檔案信息管理問(wèn)題
在數(shù)字檔案信息資源長(zhǎng)期保存中,管理是從整體上進(jìn)行宏觀規(guī)劃、組織和控制,是數(shù)字檔案信息資源長(zhǎng)期保存的基礎(chǔ)與保障。但現(xiàn)今,在管理上缺乏統(tǒng)一規(guī)劃、統(tǒng)籌兼顧,“各自為是”的現(xiàn)象較嚴(yán)重。數(shù)字檔案信息管理的主要內(nèi)容包括:保存政策、責(zé)任體系及合作機(jī)制、知識(shí)產(chǎn)權(quán)等。保存政策是有效實(shí)施數(shù)字檔案信息資源長(zhǎng)期保存的管理上的保證,內(nèi)容應(yīng)該涉及技術(shù)、組織、人文、法律、權(quán)益管理等方面,還應(yīng)該包括國(guó)際國(guó)內(nèi)合作、商業(yè)運(yùn)作、相關(guān)者培訓(xùn)、質(zhì)量管理和審計(jì)策略等內(nèi)容。對(duì)于保存目標(biāo),許多專家認(rèn)為,基本的選擇標(biāo)準(zhǔn)是首先保存那些容易丟失的、與未來(lái)有關(guān)聯(lián)的、有重要價(jià)值的數(shù)字檔案信息資源,保存重要的科學(xué)數(shù)據(jù),特別是“原始數(shù)據(jù)”。數(shù)字檔案信息資源長(zhǎng)期保存不僅僅是檔案館的職責(zé),內(nèi)容創(chuàng)造者也應(yīng)當(dāng)承擔(dān)相應(yīng)的責(zé)任。為了有效實(shí)施對(duì)數(shù)字檔案信息的長(zhǎng)期保存,需要數(shù)字檔案信息對(duì)象生產(chǎn)者(如機(jī)關(guān)、團(tuán)體、企事業(yè)單位)、提供者(如檔案館)、傳播者(網(wǎng)站)等之間相互合作,需要檔案館之間相互合作,需要國(guó)家、國(guó)際層面上的合作。另外,數(shù)字檔案信息資源長(zhǎng)期保存中還面臨一些法律問(wèn)題,在制定數(shù)字檔案信息資源長(zhǎng)期保存策略時(shí),不僅要考慮版權(quán)法,而且,還要考慮相應(yīng)軟件版權(quán)保護(hù)問(wèn)題。目前,數(shù)字檔案信息資源所有者主要通過(guò)許可方式授權(quán)合法檔案信息用戶使用數(shù)字檔案信息資源。如果我們希望長(zhǎng)期保存這些數(shù)字檔案信息資源,就在協(xié)議中增加“永久保存”條款。進(jìn)行數(shù)字檔案信息資源的長(zhǎng)期保存,如果未獲得版權(quán)所有者的許可,也沒(méi)有法律“合理使用”、“法定許可”等條款的支持,就很容易觸犯知識(shí)產(chǎn)權(quán)法。如何有效地解決這些問(wèn)題,還有待于進(jìn)一步研究。
4 數(shù)字檔案信息存儲(chǔ)介質(zhì)的選擇問(wèn)題
數(shù)字媒介的高創(chuàng)新性使信息技術(shù)日新月異,各種大容量的存儲(chǔ)介質(zhì)不斷涌現(xiàn)。這使得數(shù)字檔案信息存儲(chǔ)的熱點(diǎn)將不再是技術(shù)本身,而是如何選擇存儲(chǔ)介質(zhì)高效地對(duì)存儲(chǔ)資源進(jìn)行管理。存儲(chǔ)媒體的好壞是影響數(shù)字檔案信息長(zhǎng)期存取的一大因素。因此,要保證數(shù)字檔案信息的長(zhǎng)期存取,就必須涉及存儲(chǔ)媒體的選擇問(wèn)題。我國(guó)國(guó)家標(biāo)準(zhǔn)《電子文件歸檔與電子檔案管理規(guī)范》對(duì)長(zhǎng)期歸檔保存的檔案媒體選擇進(jìn)行了推薦,“本標(biāo)準(zhǔn)推薦采用的媒體,按優(yōu)先順序分別是:只讀式光盤、一次寫入光盤、硬磁盤、可擦式光盤等。禁正使用軟盤作為歸檔電子文件長(zhǎng)期保存的媒體”。選擇數(shù)字檔案信息存儲(chǔ)媒體時(shí),需要考慮多種因素,如相關(guān)的國(guó)際、國(guó)家標(biāo)準(zhǔn)或推薦意見(jiàn)、數(shù)字檔案信息的生命周期(產(chǎn)生、利用、歸檔、刪除或永久性歸檔保存)、存儲(chǔ)媒體的自身因素(媒體壽命、存儲(chǔ)容量、系統(tǒng)獨(dú)立性、成本)、部門的具體情況(如保存目的、效益、經(jīng)濟(jì)承受能力)。筆者認(rèn)為,媒體選擇標(biāo)準(zhǔn)不是絕對(duì)的,機(jī)構(gòu)在選擇存儲(chǔ)介質(zhì)時(shí),既要考慮到符合標(biāo)準(zhǔn)的檔案信息數(shù)據(jù)保存要求,也要權(quán)衡自身的經(jīng)濟(jì)承受能力?;谝陨峡紤]因素,提出如下參考選擇方案。
其一,數(shù)字檔案信息直接存儲(chǔ)器介質(zhì)。它是檔案信息數(shù)據(jù)產(chǎn)生后直接進(jìn)行記錄的介質(zhì)。這類介質(zhì)極多,應(yīng)視檔案信息數(shù)據(jù)重要程度的不同加以選用。對(duì)于重要的檔案信息數(shù)據(jù),5.25英寸的MO光盤因記錄數(shù)據(jù)比較穩(wěn)定,更適于作為存儲(chǔ)介質(zhì)。WORM光盤適于檔案信息數(shù)據(jù)量不大的記錄的錄入,WORM磁帶適于檔案信息數(shù)據(jù)量很大的記錄的寫入。對(duì)于一般的檔案信息數(shù)據(jù),硬盤、MO盤都可以作為記錄介質(zhì)。
其二,數(shù)字檔案信息備份介質(zhì)。對(duì)于海量檔案信息數(shù)據(jù)備份介質(zhì),磁帶存儲(chǔ)技術(shù)是一種安全、可靠、易使用和相對(duì)投資小的備份方式,其容量大,可以在相對(duì)比較短的時(shí)間內(nèi)備份大容量的檔案信息數(shù)據(jù),并可十分簡(jiǎn)單地對(duì)原有系統(tǒng)進(jìn)行恢復(fù),因而,磁帶是備份大容量檔案信息數(shù)據(jù)的理想介質(zhì)。對(duì)于檔案信息數(shù)據(jù)量較小的文件備份,自動(dòng)光盤機(jī)、自動(dòng)光盤庫(kù)以及硬盤等存儲(chǔ)設(shè)備都可用來(lái)備份?;顒?dòng)硬盤作為備份介質(zhì)使用較多,它比光盤具有更多的有利于檔案信息數(shù)據(jù)的讀寫的優(yōu)勢(shì),如讀取檔案信息數(shù)據(jù)更快等,但其易丟失檔案信息數(shù)據(jù)的弱點(diǎn),使它不能用作長(zhǎng)期存儲(chǔ)數(shù)據(jù)的介質(zhì),只適合于備份當(dāng)前重要檔案的信息數(shù)據(jù),并短期保存。
其三,檔案信息數(shù)據(jù)存儲(chǔ)介質(zhì)。WORM盤、WORM磁帶都可以考慮作為檔案信息數(shù)據(jù)存儲(chǔ)介質(zhì)。
其四,用于檔案信息數(shù)據(jù)交換的臨時(shí)存儲(chǔ)介質(zhì)。一般說(shuō)來(lái),軟盤具有廣泛的通用性和便于攜帶的特點(diǎn),可作為普通計(jì)算機(jī)用戶交換檔案信息數(shù)據(jù)的介質(zhì),但其不穩(wěn)定性,不適于作為重要檔案信息數(shù)據(jù)的交換介質(zhì)。相對(duì)而言,活動(dòng)硬盤以及U盤等更合適。
5 數(shù)字檔案信息保存的關(guān)鍵技術(shù)問(wèn)題
隨著數(shù)字檔案信息保存研究的發(fā)展,多種應(yīng)用技術(shù)方案應(yīng)運(yùn)而生。確定某種方案是否適用,需要充分考慮它的可行性、可持續(xù)性、實(shí)用性和合理性。目前,常用的保存數(shù)字檔案信息的關(guān)鍵技術(shù)方法主要有:
其一是遷移(Migration)。遷移是目前實(shí)際運(yùn)行中使用比較成熟和頻繁的方法。為保證當(dāng)前存儲(chǔ)的數(shù)字檔案信息總能被當(dāng)前系統(tǒng)讀取,采用數(shù)據(jù)“遷移”的方法,持續(xù)地將數(shù)字檔案信息從舊的軟硬件環(huán)境轉(zhuǎn)換到新的計(jì)算機(jī)環(huán)境,是一種隨著技術(shù)變化定期改變信息格式的處理過(guò)程。遷移主要有兩種情況,一是把數(shù)字檔案信息從種類繁多的格式下遷移到當(dāng)前廣泛使用的幾個(gè)標(biāo)準(zhǔn)格式中;二是將數(shù)字檔案信息從穩(wěn)定性低的媒體遷移到穩(wěn)定性更高的媒體上,從對(duì)軟硬件環(huán)境依賴強(qiáng)的格式遷移到對(duì)軟硬件環(huán)境依賴程度低的格式下。但在遷移中,可能會(huì)破壞文件的原貌、格式、結(jié)構(gòu)甚至是內(nèi)容,所以,在遷移過(guò)程中要格外小心。
其二是仿真(Emulation)。仿真與遷移都是為了解決數(shù)字檔案信息的讀取問(wèn)題。但與遷移不同,它不是著眼于信息的格式,而是關(guān)注讀取信息的應(yīng)用軟件環(huán)境。所謂“仿真”,就是制作一個(gè)仿真器,模仿數(shù)字檔案信息產(chǎn)生時(shí)的軟硬件環(huán)境,使數(shù)字檔案信息能夠以原始狀態(tài)重現(xiàn),而不管現(xiàn)在的技術(shù)環(huán)境如何。仿真法不僅能使在過(guò)時(shí)系統(tǒng)上形成的數(shù)字檔案信息以原始面貌(初始格式、版面與內(nèi)容等)顯示出來(lái),其功能性也隨之得到保護(hù)。因而,仿真引起了人們的重視,它有助于保護(hù)、辨認(rèn)那些極大依賴特殊硬件與軟件而又無(wú)法在新、舊技術(shù)平臺(tái)間進(jìn)行遷移的數(shù)字檔案信息等(如超文本、多媒體等復(fù)雜文件)。仿真被視為理想的保存策略,但由于其技術(shù)的復(fù)雜性,仿真還處于研究和試驗(yàn)階段,沒(méi)有真正可操作的系統(tǒng)能投入使用。
其三是數(shù)據(jù)恢復(fù)(Resume)。數(shù)據(jù)恢復(fù)是從原始的字節(jié)流中恢復(fù)數(shù)字資源的原貌,并保證數(shù)據(jù)資源的可讀性和可用性。數(shù)據(jù)恢復(fù)包括數(shù)據(jù)災(zāi)難恢復(fù)、數(shù)據(jù)格式恢復(fù)等。數(shù)據(jù)恢復(fù)是具有技術(shù)挑戰(zhàn)的技術(shù)方法,值得注意的是,如果已經(jīng)無(wú)法獲取數(shù)字檔案信息資源的原貌,就無(wú)法評(píng)估數(shù)據(jù)恢復(fù)的成果。因此,在正常的檔案館數(shù)字檔案信息資源保存過(guò)程中,不贊成使用這種方法作為長(zhǎng)期保存的技術(shù)方法,而是采用更為實(shí)際的運(yùn)作方法。該方法僅在其長(zhǎng)期保存方法無(wú)法發(fā)揮作用時(shí)使用。總之,確定某種方案是否適用,需要充分考慮它的可行性、可持續(xù)性、實(shí)用性和合理性。
(作者單位:河南省濮陽(yáng)市林業(yè)科學(xué)院 來(lái)稿日期:2012-02-17)