●權麗桃 (河南師范大學 圖書館,河南 新鄉(xiāng) 453007)
20世紀90年代,隨著以因特網為基礎的全球信息高速公路建設的全面鋪開,世界各國開始建設“電子政府”,政府實現網上“無紙化辦公”,政府門戶網站成為政府信息公開的主要渠道之一。政府通過網站發(fā)布信息以及與企業(yè)、公民、其他政府之間進行網上互動,從而產生了大量的電子政務信息。因為這些信息資源常常比一般的信息資源更有價值,質量和可信度也較高,因而具有重要的研究參考價值。雖然政府信息上網有利于資源共享,但是與其他物理載體的政府信息相比,政府網絡信息資源生命更為脆弱,消失速度也很驚人。Cho和Garcia-Molina在其統(tǒng)計報告中指出,政府網絡信息資源的平均壽命僅為4個月。[1]當前,我國很多政府機構還未將其網絡信息資源納入本單位的電子文件歸檔保存范圍,使得這些重要的信息,特別是原生性信息處于自生自滅的狀態(tài)。政府網絡信息資源的重要性和易失性,使得歸檔保存政府網絡信息資源成為一個不容忽視的緊迫問題。
政府網絡信息資源作為我們文化遺產的重要組成部分,其保存問題已引起越來越多人的關注。但是,政府信息資源歸檔保存的責任主體目前還不很明確,究竟應該由哪一個部門承擔,目前的法律和法規(guī)還沒有明確的責任界定。如何確定保存主體,劃定各方的保存責任并確保其貫徹實施,是制定政府網絡信息資源保存戰(zhàn)略必須緊迫解決的問題。
一直以來,圖書館和檔案館肩負著保存人類文化遺產的重任。在印本時代,圖書館和檔案館對于記錄人類社會前進的足跡立下了汗馬功勞,從最初的龜甲獸骨,到近代的印刷型圖書,再到現代的磁盤、光盤、磁帶、膠片等等,它們真實而忠實地再現了歷史的原貌與發(fā)展軌跡。對于同樣記錄我們這個時代軌跡的政府信息資源,毫無疑問也應該納入到圖書館和檔案館的視野之內。
早在1996年,澳大利亞國家圖書館(NLA) 就啟動了PANDORA(保護與存取澳大利亞網上文獻資源)項目,并與其他保存機構(包括國家檔案館)合作建立了Pandora檔案館,以確保所選擇的澳大利亞網絡出版物及其他Web信息可長期讀取。澳大利亞國家檔案館(NAA)也積極參與政府Web文件的保存研究。2000年3月,國家檔案館頒布了《歸檔Web資源:聯邦政府Web文件保存政策》,2001年3月,國家檔案館又頒布了《歸檔Web資源:聯邦政府Web文件保存行動指南》。作為國家兩大文獻遺產保存機構,澳大利亞國家檔案館與國家圖書館在保存政府Web信息方面進行了卓有成效的分工與合作。而英國國家檔案館認為,采集和保存作為電子政務重要渠道的政府網站,責無旁貸,并于2003年9月,建立了專門選擇性收藏英國政府網站的檔案館--英國政府Web檔案館 (UKGovernment Web Archive)。
有學者曾經指出:數字信息的存貯及存取環(huán)境與數字信息的產生環(huán)境是一致的,數字信息只有在其產生的環(huán)境中加以保存與維護才是最經濟、最可行的,這也是維護其長期存取的可靠方式,如果信息在形成伊始,就不便存取,那今后的存取將更加困難,所以,數字信息的形成者應該對數字信息的長期存取負有主要責任與最初責任。[2]美國數字歸檔小組在其研究報告中也指出:避免有價值的網絡信息丟失的第一道防線應是信息的形成者與提供者。美國研究圖書館協會在其提出的建立分布式網絡信息資源保存責任體系中也指出:網絡信息資源的生產者或提供者首先應承擔起各自網絡信息產品的存儲和保護責任。[3]
對于政府網站來說,政府機構就是該網站信息資源的形成者。政府機構應明確其對網上內容的保存與管理之責任,并指定專人負責,保存本機構所有上網的資源及其來源信息,以及網上任何活動的記錄等;同時,對所保存的內容進行初步鑒定,以便建立真實、可靠、準確和能夠長期保存的政府網上活動記錄。
國際上對于網絡信息資源的采集有兩種方式:一種是總括性采集,其原則是只要符合總體標準的Web資源都盡可能收集,做到“一網打盡”。采取這種方式的以瑞典的Kulturarw項目和芬蘭的EVA項目為代表。另一種是選擇性采集,其原則是根據Web資源的歷史文化、研究和經濟價值,針對一部分具有特殊價值的資源,“選我所需”地進行采集。采取這種方式的以澳大利亞國家圖書館PANDORA項目和加拿大國家圖書館EPPP(電子出版物導航項目)為代表。筆者認為,不管是哪種采集方式,都必須建立網絡信息資源選擇的總指導原則。中國國家圖書館的WICP(網絡信息采集與保存項目)從2005年開始鏡像采集并保存中國政府網站,制定選擇性采集原則,并基于中國政府網站的特點,確定采集范圍是域名以 .gov.cn結尾的所有站點,包括網站的靜態(tài)、動態(tài)網頁;圖片,doc、pdf文件等,以確保盡可能全面地覆蓋中國政府網站信息。
每個網頁都包含有大量的動態(tài)特征,比如音頻、視頻、圖像等,還具有豐富的外觀特征,比如字體、顏色、圖表、代碼等,同時還有專門的瀏覽軟件和插件。是保存網站所有特征還是只保留部分特征?在保存政府網站時應必須明確。國外有人建議為了便于將來的讀取,直接保存網頁的純文本信息,而不保存其他特征。
政府網站信息更新頻率僅次于商業(yè)網站信息,因此保存項目必須預測政府網站信息更新周期,明確采集頻率。英國“政府Web檔案館”作為一個試驗項目,對于一些重要網站(如國防部、外交部、首相辦公室網站) 每周采集一次,其他的每6個月采集一次;對于關鍵時期(如選舉期間),隨時跟蹤相關政府網站的更新頻率,并隨之調整采集頻率。
網站存在大量的內部和外部鏈接,在保存一個網站時,這些內外鏈接是否需要保存?保存到什么程度(內部鏈接的保存深度以及外部鏈接的保存廣度)?因為一旦不保存這些鏈接,網站原有的鏈接功能都可能失去。而網絡又彼此互連,保存所有鏈接既不現實也無必要,因此采集時需要對保存邊界進行劃定。
2004年12月12日,中央《關于加強信息資源開發(fā)利用工作的若干意見》中指出:“……對具有經濟和社會價值、允許加工利用的政府信息資源,應鼓勵社會力量進行增值開發(fā)利用。有關部門要按照公平、公正、公開的原則,制訂政策措施和管理辦法,授權申請者使用相關政務信息資源,規(guī)范政務信息資源使用行為和社會化增值開發(fā)利用工作”。[4]政府網絡信息資源作為政府信息資源的一種特殊形式,在其歸檔后應進行開發(fā)并對公眾提供服務,使其在全社會優(yōu)化配置和有效利用,并使政府信息資源發(fā)揮最佳的社會效益和經濟效益,為更多用戶提供有價值的信息。
網站保存的目的不僅是為當前需要,更是為將來能供人們方便利用。如果在保存之初就采用統(tǒng)一的元數據標準、數據存儲轉換格式標準等,就會避免因標準不統(tǒng)一而導致各保存項目信息無法共享的問題。1996年,我國國家檔案局專門成立電子文件歸檔與電子檔案管理研究領導小組,加強對存儲于磁帶、磁盤、光盤等載體的電子文件保存研究工作的指導,制定了電子文件管理的行業(yè)標準《電子文件歸檔與電子檔案管理規(guī)范》以及國家標準《CAD電子文件光盤存儲、歸檔與檔案管理要求》,以規(guī)范政府電子信息資源規(guī)檔工作。
在保存政府網絡信息時往往會涉及到知識產權以及公民的隱私權,這就需要國家制定相關的法律法規(guī),避免糾紛,使保存機構在采集與保存政府網站時有法可依。國家還應完善電子出版物呈繳制度,把網絡信息資源納入呈繳之列。希望在將來的《中國圖書館法》中,對保存機構在網絡信息的復制、編輯、保存和服務權限等方面加以闡述。同時建議國家修改《著作權法》,賦予保存機構為保存的目的而對被保存文獻進行格式或者是內容的局部修改等。
據中國互聯網絡信息中心2005年1月發(fā)布的最新統(tǒng)計報告顯示,截至2004年12月31日,我國以.gov為域名的政府網站已經達到16326個,與半年前相比增加了2363個,增長率為16.9%。倘若僅僅由圖書館、檔案館或相關機構負責這么多政府網絡信息資源的保存工作,其難度可想而知,而如果采取合作的方式,則有利于技術、資金、人力等方面的充分共享與合理分工。因此,加強與政府部門的溝通,建立多種形式的合作機制十分必要。
網絡信息資源保存工作是一項長期的系統(tǒng)工程,需要較為穩(wěn)定的資金來源作為經費保證,因此一般的圖書館、信息機構等單位均無法承擔這樣高額的保存費用,只有建立一個可持續(xù)的資金支持體系才能完成這項任務??梢圆扇彝顿Y和成員機構自籌資金相結合的方式對網絡信息資源實施保存。
[1]唐瓊.政府網絡信息資源長期保存研究[J].圖書館理論與實踐,2007(2):62-64.
[2]劉家真.維護數字信息長期存取的管理策略[J].中國圖書館學報,1999(5):56-58.
[3]翟慧杰.數字信息長期保存的責任主體及其合作模式 [J].檔案,2008(1):17-19.
[4]中央辦公廳.關于加強信息資源開發(fā)利用工作的若干意見 [Z].2004-12-12.