陳怡
摘 要:文字、圖形、聲音、影像等多媒體信息均可以單獨(dú)或相互搭配構(gòu)成電子文件檔案的內(nèi)容,在網(wǎng)絡(luò)環(huán)境下,只有明白電子文件檔案的特性,才能更好的發(fā)揮電子文件檔案的作用。
關(guān)鍵詞:電子文件;檔案; 特征
電子文件檔案某些持性與紙質(zhì)文件有很大區(qū)別,要管理好電子文件就必須了解其特性。綜合國(guó)內(nèi)外對(duì)此問題的研究,電子文件的主要特性可概括為以下幾個(gè)方面。
一、電子文件是數(shù)字化信息技術(shù)的產(chǎn)物。
電子文件是在計(jì)算機(jī)中產(chǎn)生和處理的,其信息形態(tài)是數(shù)字化的。人們?cè)谟?jì)算機(jī)屏幕上看到由文字、圖形等構(gòu)成的電子文件形態(tài)只不過是電子文件的某些輸出形式而已。而在計(jì)算機(jī)內(nèi)部,無論是傳輸還是存儲(chǔ)等處理,電子文件均是以數(shù)字編碼的形式存在。
計(jì)算機(jī)錄入漢字的方法有多種,如鍵盤錄入法、掃描錄入法、用鍵盤錄入漢字、首先是在輸入時(shí)對(duì)漢字進(jìn)行計(jì)算機(jī)的外碼轉(zhuǎn)換。可以用漢語(yǔ)拼音、五筆字型等外碼錄入漢字。計(jì)算機(jī)接收了其個(gè)別漢字外碼之后,接著就把外碼代表的漢字用計(jì)算機(jī)內(nèi)碼記錄下來。計(jì)算機(jī)內(nèi)碼是以16位二進(jìn)制的數(shù)字表示的,也就是兩個(gè)字節(jié)長(zhǎng),計(jì)算機(jī)內(nèi)進(jìn)行文件信息的存儲(chǔ)、傳輸?shù)忍幚砭褪菍?duì)這些內(nèi)碼的處理。只有當(dāng)需要將文件輸出時(shí),才將其漢字內(nèi)碼所對(duì)應(yīng)的字形點(diǎn)陣。也就是字模,以及眾多字模按格式組成文章在屏幕或者打印機(jī)上輸出。
在計(jì)算機(jī)多媒體技術(shù)的支持下,信息數(shù)據(jù)還可以包括聲音、影像等多種形式。不過這些信息形態(tài)就計(jì)算機(jī)內(nèi)部處理來說,也都是二進(jìn)制的數(shù)字編碼而已,只是在輸入和輸出時(shí),才有其各自的特殊形式。
二、電子文件對(duì)設(shè)備的依賴性
電子文件的形成和各種處理均是在計(jì)算機(jī)等設(shè)備的支持下完成的,離開計(jì)算機(jī)等設(shè)備,電子文件即看不見也摸不著。其對(duì)設(shè)備依賴性主要體現(xiàn)在:一是數(shù)字編碼,二是硬件,三是軟件,四是技術(shù)設(shè)備更新,五是加密。例如電子文件對(duì)其他設(shè)備環(huán)境的不兼容性,使其只能在設(shè)備上處理,不同軟、硬件環(huán)境形成的電子文件載體,有時(shí)難以互換。
電子文件的運(yùn)作、管理是建立在一套標(biāo)準(zhǔn)化體系之上的。其嚴(yán)格程度和對(duì)系統(tǒng)性的要求,均遠(yuǎn)遠(yuǎn)超過紙質(zhì)文件的標(biāo)準(zhǔn)化體系。例如,其制作生成要有代碼標(biāo)準(zhǔn),其存儲(chǔ)要有機(jī)讀載體的格式標(biāo)準(zhǔn),信息壓縮存儲(chǔ)的算法標(biāo)準(zhǔn),其查找要有檢索語(yǔ)言標(biāo)準(zhǔn)等。標(biāo)準(zhǔn)化是極為重要的基礎(chǔ)工作,建立和熟悉電子文件的標(biāo)準(zhǔn)化體系,是保證電子文件妥善歸檔的重要前提。
在網(wǎng)絡(luò)環(huán)境下,人們對(duì)信息的處理標(biāo)準(zhǔn)化問題解決的好一些。但對(duì)記錄載體的交換問題仍然很多。尤其是在格式、字符集、壓縮方式等方面產(chǎn)生不兼容的問題。出于安全保密上的考慮,還常常通過特殊的軟、硬件設(shè)備人為地進(jìn)行復(fù)雜而獨(dú)特的編碼加密,或信息拆分處理,使需要保密的電子文件檔案只能在特定的環(huán)境下被讀取。計(jì)算機(jī)更新?lián)Q代很快,常常只能隔代兼容,對(duì)于需要長(zhǎng)期歸檔保存的電子文件檔案來說,設(shè)備依賴性造成的問題會(huì)更加嚴(yán)重。一般計(jì)算機(jī)設(shè)備8年左右就會(huì)更新,而耐久性光盤載體可以保存更長(zhǎng)時(shí)間。若干年之后,很可能出現(xiàn)保管完成的電子文件檔案載體找不到讀取設(shè)備的問題。設(shè)備老化和頻繁更新,給電子文件檔案長(zhǎng)久保存帶來的問題,遠(yuǎn)比文件載體本身的壽命長(zhǎng)短更為嚴(yán)重。
三、電子文件載體的非直讀性
電子文件的非直讀性體現(xiàn)在很多方面,一是數(shù)字偏碼記錄于載體上肉眼無法分辨,何況磁載體上的“磁疇”極性是物質(zhì)內(nèi)部的物理性質(zhì),根本不可能看到。此外,載體上的信息記錄密度極大,例如一張容量可達(dá)600MB-4000MB的光盤,刻寫激光斑點(diǎn)的直徑小于百萬分之一毫米,可存35萬張打印紙上的文字信息,或10萬圖形信息,即使在高信顯微鏡下可以看見光盤上的記錄痕跡,也不可能讀懂那些小點(diǎn)表示什么。另外,載體上的數(shù)字信息往往進(jìn)行了壓縮編碼、加密等處理,即使有設(shè)備,如果不解密也不能讀取其內(nèi)容。以上種種因素均決定了電子文件載體的非直讀性。
四、電子文件物理結(jié)構(gòu)與邏結(jié)構(gòu)的復(fù)雜性及對(duì)元數(shù)據(jù)和背景信息的依賴性。
文件的物理結(jié)構(gòu)是指其信息存儲(chǔ)于載體上的位置及分布的情況,例如文件的正文、圖形、批示、附件等都分各自在載體上的存儲(chǔ)位置。文件的邏輯結(jié)構(gòu)是通信息自身的結(jié)構(gòu),例如文件中的文字系列。章節(jié)構(gòu)成、各項(xiàng)的先后順序、插圖、標(biāo)號(hào)等。
紙質(zhì)文件的信息物理結(jié)構(gòu)與邏輯結(jié)構(gòu)是一致的,而且是直觀的。例如,排錯(cuò)了文件頁(yè)碼,就不僅破壞文件信息物理結(jié)構(gòu)也同時(shí)破壞其邏輯結(jié)構(gòu)。電子文件的信息物理結(jié)構(gòu)和邏輯結(jié)構(gòu)往往是不一致的。同一份電子文件中的正文、圖形、批示、附件等可以不在載體上連續(xù)存放,甚至可以存放在不同的載體,而不影響其正常地顯示輸出。在電子文件信息的處理過程中,其物理結(jié)構(gòu)經(jīng)常發(fā)生變化,而其邏輯結(jié)構(gòu)卻可以保持不變,電子文件的邏輯結(jié)構(gòu)通常也需要專門的信息予以描述,當(dāng)然這些信息可能是隱含的,無特殊需要而不顯示出來,正是由于這種原因,電子文件的物理結(jié)構(gòu)和邏輯結(jié)構(gòu)之間關(guān)系是很復(fù)雜的。在電子文件歸檔時(shí),如何保持其物理結(jié)構(gòu)和邏輯結(jié)構(gòu)的復(fù)雜關(guān)系,是保證電子文件不被破壞而必須注意的關(guān)鍵問題之一。
元數(shù)據(jù)是關(guān)于數(shù)據(jù)的數(shù)據(jù),例如文件上、下文件的關(guān)系和結(jié)構(gòu)就是元數(shù)據(jù),對(duì)于紙質(zhì)文件來說,元數(shù)據(jù)往往直接體現(xiàn)在其形態(tài)上,如一份印好的文件,紙上的文字、圖形排列及格式等。電子文件的這種元數(shù)據(jù)必須特意附在文件信息中,否則將無法恢復(fù)電子文件的原貌。此外,紙質(zhì)文件由于在傳遞和處理過程中離不開行政部門的實(shí)際往來和人工辦理各種手續(xù),由其生成和運(yùn)作的背景信息也就自然地記錄在文件上了。電子文件的運(yùn)作往往是在網(wǎng)絡(luò)上進(jìn)行的,操作者互不見面,體現(xiàn)行政背景關(guān)系的信息可能存放在其他地方。如不特意提供可補(bǔ)充這些元數(shù)據(jù)或背景信息,就可能給電子文件的運(yùn)作和歸檔帶來問題。
五、電子文件信息與載體相分離性
電子文件的存放位置不是固定的,而是可以變化的,甚至可以從一個(gè)載體轉(zhuǎn)換到另一個(gè)載體。其內(nèi)容信息卻不發(fā)生任何變化。同樣還可以通過網(wǎng)絡(luò)傳給遠(yuǎn)方的一個(gè)或多個(gè)接收者。在一些對(duì)保密有特殊要求的網(wǎng)絡(luò)中,還采取把電子文件分解后分別通過不同途徑傳遞,存放在不同地點(diǎn)的不同設(shè)備上,只是在需要時(shí)臨時(shí)把文件裝配起來,這些情況,不僅造成電子文件與載體分離性,也是長(zhǎng)期處于共享計(jì)算機(jī)網(wǎng)絡(luò)資源環(huán)境的使用者,淡漠了對(duì)電子文件存儲(chǔ)于哪臺(tái)計(jì)算機(jī)、哪個(gè)載體以及什么位置的關(guān)心。這個(gè)特征給電子文件的保管帶來許多新問題,處理不好會(huì)直接影響其真實(shí)性、完整性和可靠性。
文字、圖形、聲音、影像等多媒體信息均可以單獨(dú)或相互搭配構(gòu)成電子文件的內(nèi)容,這就是造成了電子文件的多媒體集成性,使得電子文件的信息形態(tài)及其組成要比紙質(zhì)文件復(fù)雜的多。例如不同的載體往往適合存儲(chǔ)不同的媒體信息,就會(huì)造成一份電子文件中的文、圖、聲、像在存儲(chǔ)時(shí)載體分離現(xiàn)象。如果脫機(jī)保管,就可以造成混亂,甚至破壞電子文件的完整性。