?
網(wǎng)絡(luò)背景下檔案信息資源的收集與保存策略
賈文琴
黑龍江省蘿北縣人力資源和社會保障局 154200
[摘要]當(dāng)前我國的網(wǎng)絡(luò)信息技術(shù)不斷的發(fā)展,同時檔案信息資源的形式也有了非常大的轉(zhuǎn)變,網(wǎng)絡(luò)檔案信息資源也逐漸成為了信息資源的一個非常重要的組成部分,但是在檔案工作發(fā)展的過程中,檔案信息資源的收集和保存也就成了非常重要的一個問題,和傳統(tǒng)的檔案工作相比,其工作的方法和模式發(fā)生了非常大的轉(zhuǎn)變,這也是我們需要著重關(guān)注的一個問題,本文主要分析了網(wǎng)絡(luò)背景下檔案信息資源的收集與保存策略,以供參考和借鑒。
[關(guān)鍵詞]檔案信息資源;網(wǎng)絡(luò);收集;保存
簡單來說,網(wǎng)絡(luò)檔案資源一般就是通過計(jì)算機(jī)網(wǎng)絡(luò)對數(shù)字化檔案進(jìn)行收集、整理和利用的綜合,它主要涵蓋了三方面的內(nèi)容,一個是檔案部門當(dāng)中的相關(guān)信息,一個是和檔案本身有關(guān)的信息,最后一種就是數(shù)字化代碼形式下的檔案信息,但是在這一過程中需要注意的一點(diǎn)就是計(jì)算機(jī)網(wǎng)絡(luò)上的檔案信息不僅僅只是局限于我們經(jīng)常使用的萬維網(wǎng),不同的網(wǎng)絡(luò)傳輸協(xié)議也就有不同的形式,因此我們應(yīng)該根據(jù)實(shí)際的情況去對網(wǎng)絡(luò)檔案信息資源進(jìn)行系統(tǒng)的收集和處理。
網(wǎng)絡(luò)檔案信息源收集和保存的范圍和其他類型的信息資源有著非常大的相似性,只要是有參考和利用價值的網(wǎng)絡(luò)檔案信息和相關(guān)的元數(shù)據(jù)以及一些支持信息開發(fā)使用的軟件都在收集和保存的范圍之中,但是在這里我們需要強(qiáng)調(diào)的是不管檔案信息的形成著是什么,這些檔案內(nèi)容都是應(yīng)該由國家的檔案館進(jìn)行征集和保存的,在確定保存范圍的過程中,工作人員一定要參考國家出臺的多項(xiàng)規(guī)范,同時在這一過程中還要充分的考慮到網(wǎng)絡(luò)檔案信息自身存在的一些特征,同時對數(shù)據(jù)的類型和格式進(jìn)行詳細(xì)的劃分。
當(dāng)前對于網(wǎng)絡(luò)文件是否和其他類型的電子文件一樣,應(yīng)該采取何種方式進(jìn)行歸檔處理或者是其收集的時間到底多長還沒有一個統(tǒng)一的觀點(diǎn)或者是規(guī)定,但是最好的一種狀態(tài)就是要在實(shí)際的工作中對完整的元數(shù)據(jù)進(jìn)行收集和保存處理。相關(guān)的政策當(dāng)中已經(jīng)指出政策當(dāng)中并沒有具體的要求各個檔案機(jī)構(gòu)應(yīng)該在什么時候?qū)W(wǎng)絡(luò)資源進(jìn)行適當(dāng)?shù)恼{(diào)整和處理。除此之外,我們還要對機(jī)構(gòu)文件保管的需求進(jìn)行適當(dāng)?shù)奶幚砗驼{(diào)整,了解網(wǎng)站信息的具體內(nèi)容,引發(fā)法律問題或者是法律訴訟的概率有多大等等。
傳統(tǒng)的文件檔案在收集和保存方面的要求實(shí)際上用在當(dāng)前網(wǎng)絡(luò)檔案信息資源的相關(guān)工作中也是非常實(shí)用的,在實(shí)際的工作中應(yīng)該保證網(wǎng)絡(luò)檔案資源信息自身的完整性和可靠性,同時還要在這一過程中充分的尊重網(wǎng)絡(luò)文件形成過程中的一些規(guī)律和特點(diǎn),這樣就使得文件當(dāng)中的內(nèi)在聯(lián)系能夠有所體現(xiàn),從而也就為其保管和使用提供了更好的條件,當(dāng)前在我國的相關(guān)法律法規(guī)中也已經(jīng)規(guī)定了相關(guān)的內(nèi)容,這樣一來也就為網(wǎng)絡(luò)檔案信息資源的收集和保存帶來了很多有益的借鑒,但是在這一過程中需要注意的一點(diǎn)是網(wǎng)絡(luò)信息資源的形式充滿了變化性,其類型也非常的多,不同類型的檔案信息資源在自身的特點(diǎn)上存在著非常明顯的不同,所以這也使得信息檔案資源的收集保存和管理工作具有了更強(qiáng)的復(fù)雜性,不同類型的檔案信息在收集和保存的要求上可能會出現(xiàn)非常大的不同。
當(dāng)前我國的網(wǎng)絡(luò)技術(shù)越來越強(qiáng)大,同時在檔案機(jī)構(gòu)運(yùn)行的過程中所面對的環(huán)境也比較復(fù)雜,技術(shù)方面的要求也越來越高,所以在這樣的情況下,要想為網(wǎng)絡(luò)信息資源的收集和保存提供更多的唯一性指導(dǎo)是非常難的,在技術(shù)層面我們主要可以采取以下幾項(xiàng)措施:
首先是對象驅(qū)動,這種方法在應(yīng)用的過程中側(cè)重點(diǎn)主要是利用對象和與之相關(guān)的元數(shù)據(jù),這種方法比較適合使用在HTML文檔的集成工作中,同時它也不需要借助互動性的網(wǎng)站作為其發(fā)展的平臺。采用這種方式可以很好的對網(wǎng)絡(luò)資源實(shí)際的變化情況進(jìn)行適當(dāng)?shù)牧私?,同時還能夠?qū)σ恍┆?dú)立的網(wǎng)絡(luò)資源進(jìn)行實(shí)時的了解,同時在工作中還可以根據(jù)實(shí)際的需要去重建網(wǎng)站。
其二,事件驅(qū)動該方法重點(diǎn)收集網(wǎng)站及其用戶之間發(fā)生的事件和業(yè)務(wù)。該方法最適合于動態(tài)性網(wǎng)站,如果網(wǎng)站屬于高度互動性或應(yīng)用驅(qū)動型的網(wǎng)站,那么捕獲“事件”(網(wǎng)站和用戶之間單一的事務(wù))可能比捕獲業(yè)務(wù)處理時構(gòu)成網(wǎng)站的對象更可行。事件驅(qū)動歸檔方法將需要收集以下信息:事件日期和時間,用戶IP或域地址(domain address),用戶概況,提問或其他操作行為,為用戶提供的資源及其相關(guān)元數(shù)據(jù)。
其三,“快照”?!翱煺铡蓖ǔJ窃谀骋粫r刻生成的完整準(zhǔn)確的網(wǎng)絡(luò)資源文件拷貝。我們可以將該“快照”收集到機(jī)構(gòu)文件保管系統(tǒng),并根據(jù)利用時間的長短來決定其保管期限。當(dāng)我們對網(wǎng)絡(luò)資源集合進(jìn)行快照時,必須盡可能地確保對網(wǎng)站及其構(gòu)成網(wǎng)頁進(jìn)行不間斷處理的能力。這意味著各機(jī)構(gòu)應(yīng)該努力保持通過技術(shù)平臺復(fù)制網(wǎng)站內(nèi)容、層次和功能,同時沒有損害數(shù)據(jù)完整性的能力。
該策略通過開展風(fēng)險評估來確定生成拷貝和歸檔的頻率,具有較強(qiáng)的可操作性。“快照”屬于對象驅(qū)動方法,它對于靜態(tài)網(wǎng)絡(luò)資源特別有用,而不應(yīng)該將它用于保管高度互動的動態(tài)性網(wǎng)站或資源(數(shù)據(jù)庫、事務(wù)處理服務(wù))。該方法的不足在于,一個“快照”只能提供某個網(wǎng)站在某一時刻的“照片”。如果捕獲的“快照”缺乏其他網(wǎng)絡(luò)活動文件的話,它就不可能完整重建某一時刻的網(wǎng)站及其功能。由于這種收集保存方法無法使機(jī)構(gòu)準(zhǔn)確確定何時能夠獲取網(wǎng)站資源,因此,采用“快照”策略的機(jī)構(gòu)還需要生成和保管兩個“快照”之間的網(wǎng)站資源變化日志。為了確保能夠完整地重建網(wǎng)站功能,一個“快照”應(yīng)該包括網(wǎng)站的所有方面,即包括腳本、程序、插件和瀏覽器軟件等所有能夠使“快照”充分有效的組件。
其四,跟蹤變化。本方法涉及到跟蹤某段時間內(nèi)網(wǎng)絡(luò)資源的變化,并生成變化或活動日志。為了滿足利用需求,我們需要將活動日志收集到文件保管系統(tǒng)進(jìn)行管理維護(hù)。如果與網(wǎng)絡(luò)資源“快照”結(jié)合使用的話,本方法將是保管靜態(tài)網(wǎng)站的可靠選擇。跟蹤變化方法所產(chǎn)生的主要問題是,如果活動日志的元數(shù)據(jù)不完整,那么就會導(dǎo)致無法解釋過去的日志。因此,至關(guān)重要的是要明確元數(shù)據(jù)要求,文件保管系統(tǒng)所收集的元數(shù)據(jù)要完整、充分。我們可以使用不斷出現(xiàn)的網(wǎng)絡(luò)技術(shù)來跟蹤網(wǎng)站變化。例如Web robots, spiders或crawlers等自動化程序,它們訪問網(wǎng)站時,能夠?yàn)樗阉饕鎸φ军c(diǎn)進(jìn)行索引。如果這些程序能夠收集足夠的信息,滿足文件保管要求的話,它們對跟蹤網(wǎng)站變化來說可能是有用的。
在當(dāng)前的社會發(fā)展中,網(wǎng)絡(luò)技術(shù)已經(jīng)延伸到了社會生產(chǎn)過程中的眾多領(lǐng)域,同時在實(shí)際的工作中,我們一定要轉(zhuǎn)變自己的思想,只有這樣才能更好的做好網(wǎng)絡(luò)檔案信息的收集與保存工作,提高檔案信息收集保管的質(zhì)量和水平,為我國檔案事業(yè)的發(fā)展提供良好的條件。
參考文獻(xiàn)
[1]向菁,吳振新.網(wǎng)絡(luò)信息資源保存發(fā)展現(xiàn)狀及趨勢分析[J].中國圖書館學(xué)報,2009(02)
[2]鄭惠萍.談網(wǎng)絡(luò)管理機(jī)制中檔案信息資源的收集與保存[J].鄭州鐵路職業(yè)技術(shù)學(xué)院學(xué)報,2009(02)
[3]龐博,彭麗娟.網(wǎng)絡(luò)博客的檔案價值初探[J].檔案學(xué)研究,2009(04)]
[4]蔡娜,吳開平.一種特殊的網(wǎng)絡(luò)檔案信息資源——博客的收集保存初探[J].檔案學(xué)通訊,2008(05)