閆曉創(chuàng)/新華社辦公廳
網(wǎng)頁存檔(Web Archive,下簡(jiǎn)稱WA)是對(duì)互聯(lián)網(wǎng)上的信息資源進(jìn)行收集、保存并確保其能被長(zhǎng)期安全使用的活動(dòng)。2003年7月,美國、加拿大、英國、法國等國家的十幾個(gè)機(jī)構(gòu)聯(lián)合成立了國際互聯(lián)網(wǎng)保存聯(lián)盟(以下簡(jiǎn)稱IIPC)[1],目前該聯(lián)盟已擁有超過40個(gè)成員機(jī)構(gòu),這些機(jī)構(gòu)涵蓋世界上著名的圖書館、檔案館、大學(xué)、非營利組織以及商業(yè)服務(wù)供應(yīng)商,成員機(jī)構(gòu)的多元化極大地促進(jìn)了國際上關(guān)于網(wǎng)頁存檔的合作和交流共享。IIPC還在結(jié)構(gòu)、元數(shù)據(jù)、標(biāo)準(zhǔn)規(guī)范等諸多方面建立了一系列技術(shù)規(guī)范,并資助成員機(jī)構(gòu)開發(fā)能夠?qū)崿F(xiàn)網(wǎng)絡(luò)資源采集、管理、存儲(chǔ)、利用等功能的高質(zhì)量、具有較高易用性的開源性軟件工具[2]。
IIPC的成員包含了目前世界上絕大多數(shù)在WA領(lǐng)域具有極高研究水平的機(jī)構(gòu)。這些成員機(jī)構(gòu)共有32個(gè),分布在世界各個(gè)大洲,其中亞洲2個(gè)、非洲1個(gè)、歐洲20個(gè)、大洋洲2個(gè)、北美洲7個(gè),成員機(jī)構(gòu)主要WA項(xiàng)目及基本情況如表1。
表1 IIPC成員及其WA項(xiàng)目基本情況
國家 負(fù)責(zé)機(jī)構(gòu) 開始時(shí)間存檔語言 獲取方式 收割方式西班牙 加泰羅尼亞圖書館 2005加泰羅尼亞語、西班牙語、英語URL檢索、關(guān)鍵詞檢索、字母順序?yàn)g覽、主題瀏覽、熱門搜集區(qū)域內(nèi)域名收割、大量收割、選擇收割、事件收割、主題收割法國 法國國家圖書館 2002 法語URL檢索、關(guān)鍵詞檢索、全文檢索、熱門搜集全國域名內(nèi)收割、大量收割、選擇性收割、事件收割、主題收割法國 法國國家圖書館 2009 法語URL檢索、關(guān)鍵詞檢索、字母順序?yàn)g覽、主題瀏覽、熱門搜集選擇性收割、主題收割愛沙尼亞愛沙尼亞國家圖書館2010愛沙尼亞語URL檢索、關(guān)鍵詞檢索、局部瀏覽選擇性收割、事件收割、主題收割克羅地亞克羅地亞國家圖書館2004克羅地亞語、英語URL檢索、關(guān)鍵詞檢索、高級(jí)檢索、字母順序?yàn)g覽、主題瀏覽選擇性收割、全國域名內(nèi)收割、主題收割荷蘭 互聯(lián)網(wǎng)記憶基金會(huì)2005英語URL檢索、關(guān)鍵詞檢索全國域名內(nèi)收割、選擇性收割、事件收割冰島 冰島國家和大學(xué)圖書館1996冰島語、少量英語URL檢索全國域名內(nèi)收割、選擇性收割、事件收割芬蘭 芬蘭國家圖書館 2006芬蘭語、瑞典語、英語URL檢索、全文檢索全國域名內(nèi)收割、區(qū)域內(nèi)域名收割、事件收割、主題收割瑞典 瑞典國家圖書館 1997 瑞典語 URL檢索全國域名內(nèi)收割、大量收割、選擇性收割丹麥丹麥皇家圖書館、奧胡斯州和大學(xué)圖書館2005丹麥語、英語 URL檢索全國域名內(nèi)收割、大量收割、選擇收割、事件收割挪威 挪威國家圖書館2001挪威語關(guān)鍵詞檢索全國域名內(nèi)收割、事件收割斯洛文尼亞斯洛文尼亞國家和大學(xué)圖書館2007斯洛文尼亞語URL檢索、字母順序?yàn)g覽、全文檢索選擇收割、事件收割英國 英國國家檔案館 1996 英語U R L檢索、全文檢索、字母順序?yàn)g覽、主題瀏覽、熱門搜集選擇性收割、事件收割、主題收割英國 英國國家圖書館 2005 英語URL檢索、字母順序?yàn)g覽、全文檢索、主題瀏覽選擇性收割、事件收割、主題收割荷蘭 荷蘭國家圖書館2007荷蘭語URL檢索、字母順序?yàn)g覽、全文檢索選擇收割捷克 捷克國家圖書館2000捷克語URL檢索、主題瀏覽全國域名內(nèi)收割、事件收割?yuàn)W地利 奧地利國家圖書館 2008 德語 URL檢索、熱門搜集全國域名內(nèi)收割、大量收割、選擇收割、事件收割、主題收割瑞士 瑞士國家圖書館 2008德語、法語、意大利語、英語URL檢索、關(guān)鍵詞檢索、全文檢索、主題瀏覽、熱門搜集選擇性收割、事件收割、主題收割拉脫維亞拉脫維亞國家圖書館 2005拉脫維亞語、俄語、英語URL檢索、關(guān)鍵詞檢索、熱門搜集選擇性收割、事件收割、主題收割新西蘭 新西蘭國家圖書館 1999 英語URL檢索、關(guān)鍵詞檢索、字母順序?yàn)g覽、主題瀏覽選擇收割澳大利亞澳大利亞國家圖書館 1996 英語URL檢索、關(guān)鍵詞檢索、字母順序?yàn)g覽、主題瀏覽、全文檢索選擇收割、事件收割
國家 負(fù)責(zé)機(jī)構(gòu) 開始時(shí)間存檔語言 獲取方式 收割方式韓國 韓國國家圖書館2005韓語URL檢索、關(guān)鍵詞檢索、主題瀏覽選擇收割日本 日本國會(huì)圖書館2002日語關(guān)鍵詞檢索、全文檢索、熱門搜集大量收割、選擇收割埃及 亞歷山大圖書館 1996 英語 URL檢索 大量收割
目前全球范圍內(nèi)IIPC成員開發(fā)的WA工具和軟件的功能涵蓋了網(wǎng)絡(luò)資源采集、保存、檢索、利用這幾個(gè)方面,是比價(jià)成熟的開源軟件。表2從軟件名稱、簡(jiǎn)要情況說明、開發(fā)情況等進(jìn)行了較為詳細(xì)的說明。
表2 IIPC成員開發(fā)的WA應(yīng)用軟件[3]
JHOVE2開源的格式描述工具,主要用于描述ARC、WARC和GZIP等格式加利福尼亞數(shù)字圖書館、斯坦福大學(xué)圖書館、法國國家圖書館及NETARKIVET.DK MediaWiki Memento Extension存儲(chǔ)和保管(Collection storage and maintenance)用于MediWiki的插件,它支持用戶找到過去某一時(shí)刻MediWiki 所呈現(xiàn)的內(nèi)容美國奧多明尼昂大學(xué)和美國洛斯阿拉莫斯國家實(shí)驗(yàn)室Site Story針對(duì)事務(wù)性文件的存檔工具,該工具可選擇性地獲取和存儲(chǔ)分別對(duì)應(yīng)在web瀏覽器和服務(wù)器中的內(nèi)容美國洛斯阿拉莫斯國家實(shí)驗(yàn)室WebArchive Transformation(WAT) Format用于網(wǎng)絡(luò)資源存檔的格式 互聯(lián)網(wǎng)檔案館(Internet Archive)WebArchive Transformation(WAT) Utilities用于從WARC格式的文件中提取元數(shù)據(jù)進(jìn)行數(shù)據(jù)分析的數(shù)據(jù)集互聯(lián)網(wǎng)檔案館(Internet Archive)WarcManager 用于檢索WARC格式文件內(nèi)容的工具 美國馬里蘭大學(xué)WARC Tools用于讀取和操作WARC格式文件,并將ARC格式文件轉(zhuǎn)化為WARC格式的工具集美國半藏檔案公司和互聯(lián)網(wǎng)檔案館( Internet Archive)TimeTravel Portal通過輸入原始的URL、時(shí)間等來查找存檔網(wǎng)絡(luò)資源的檢索入口L y u d m i l a B a l a k i r e v a,HariharShankar,Ilya Kremer,Herbert Van de Sompel Time Travel APIs用于降低檢索存檔網(wǎng)絡(luò)資源時(shí)所遇到的障礙并實(shí)現(xiàn)對(duì)存檔網(wǎng)絡(luò)資源自由利用的APIs Lyudmila Balakireva,Harihar Shankar, Herbert Van de Sompel Memento Time Travel chrome的擴(kuò)展程序,它支持網(wǎng)站的時(shí)間瀏覽,并能夠規(guī)避死鏈接。該程序使用Memento協(xié)議,發(fā)現(xiàn)分布式網(wǎng)絡(luò)檔案資源,以此方式規(guī)避死鏈接Harihar Shankar NutchWAX(Nutch with WA eXtensions)獲取和檢索工具(Access and finding aids)利用Nutch搜索引擎和擴(kuò)展程序來檢索網(wǎng)絡(luò)資源的工具互聯(lián)網(wǎng)檔案館(Internet Archive)和北歐國家圖書館聯(lián)盟WERA (WEbaRchive Access)網(wǎng)頁存檔的搜索和導(dǎo)航應(yīng)用程序,利用NWA工具集進(jìn)行構(gòu)建,可通過一個(gè)網(wǎng)絡(luò)歸檔程序進(jìn)行網(wǎng)頁存檔并且允許全文檢索互聯(lián)網(wǎng)檔案館(Internet Archive)和挪威國家圖書館Wayback Machine ARC或WARC格式的網(wǎng)絡(luò)存檔資源回放工具,允許對(duì)網(wǎng)絡(luò)存檔資源進(jìn)行臨時(shí)瀏覽互聯(lián)網(wǎng)檔案館(Internet Archive)Xinq (XML INQuire)用于XML數(shù)據(jù)庫檢索和瀏覽的工具 澳大利亞國家圖書館
采集獲取工具。從功能角度看,采集工具中的Heritrix支持復(fù)雜的爬行定義和過濾,具有豐富的可配置功能,如抓取頻率可設(shè)置為每天、每周、每月等。它采用廣度優(yōu)先算法,用來抓取完整的、精確的站點(diǎn)內(nèi)容,并進(jìn)行深度復(fù)制;在重新抓取相同的URL時(shí),不刪除之前的版本,實(shí)現(xiàn)多個(gè)版本的同時(shí)保存。從開發(fā)角度看,該應(yīng)用程序采用模塊化設(shè)計(jì),用戶可以在運(yùn)行時(shí)選擇適用的模塊。Heritrix由核心類和插件模塊構(gòu)成,核心類可以配置,但不能被覆蓋;插件模塊可以由第三方模塊取代,所以用戶可以用第三方模塊來取代默認(rèn)的插件模塊,滿足個(gè)性化需要。其他幾個(gè)采集工具在不同的機(jī)構(gòu)也都有相應(yīng)應(yīng)用。該軟件適合大規(guī)模的網(wǎng)絡(luò)存檔。目前北歐國家圖書館聯(lián)盟采用該采集工具,并取得較好成果。
采集管理工具。IIPC提供的采集相關(guān)的工具包括Building Collections on the Web(BCWeb)、CINCH、Net archive Suite、WebCurator Tool(WCT)。其中BCWeb是一個(gè)允許圖書管理員來定義選擇性收割(正在進(jìn)行的和主題事件)的管理工具,主要由法國國家圖書館負(fù)責(zé)運(yùn)營和維護(hù)。Net archive Suite和WCT都是通過底層調(diào)用Heritrix進(jìn)行資源采集的,其中Net archive Suite是一個(gè)可以讓圖書管理員定義和控制網(wǎng)絡(luò)材料收割的管理工具,支持主題采集、選擇性采集和國家頂級(jí)域名采集;WCT主要用于實(shí)現(xiàn)選擇性采集,支持圖書館和其他收藏機(jī)構(gòu)管理web收割過程,并且支持非技術(shù)用戶對(duì)收割過程實(shí)現(xiàn)完全控制。
存儲(chǔ)保管工具。在存儲(chǔ)和保管工具方面,IIPC提供了HTTrack2ARC、Java Web Archive Toolkit(JWAT)、Site Story、WARC Tools等9個(gè)相關(guān)的工具。這些工具主要用于對(duì)采集的數(shù)據(jù)進(jìn)行格式轉(zhuǎn)換、內(nèi)容抽取、內(nèi)容識(shí)別驗(yàn)證。數(shù)據(jù)的封裝有AFF、ARC、WARCIP等格式,各種格式幾期特點(diǎn)如表3。其中WARC格式是運(yùn)用較為廣泛的存檔格式,它在平臺(tái)獨(dú)立性、易用性、支持更新、標(biāo)準(zhǔn)化、開發(fā)性等八個(gè)方面均占優(yōu)勢(shì),更適合對(duì)網(wǎng)絡(luò)資源進(jìn)行長(zhǎng)久保存。
表3 數(shù)據(jù)封裝的格式與特點(diǎn)
獲取檢索工具。IIPC提供的獲取檢索工具主要有Time Travel Portal、NutchWAX(Nutch with WA eXtensions)、Wayback Machine等,其中使用最廣泛的為Wayback Machine。該工具主要由IA研發(fā),集索引、摘要、呈現(xiàn)等多種功能于一體,可實(shí)現(xiàn)WARC文檔的增量索引,并提供基于URL的檢索訪問WA資源的服務(wù)。
開源性。這些軟件都具有良好的開源性,在互聯(lián)網(wǎng)上可以獲取這些軟件,并且可以結(jié)合實(shí)際做多次開發(fā),以適應(yīng)自身情況。WA項(xiàng)目中各環(huán)節(jié)的開源軟件均可在開源網(wǎng)站Source Forge上找到[4],并且可以找到同一個(gè)功能軟件的若干版本。
功能齊全。IIPC成員所開發(fā)出來的軟件包含了WA項(xiàng)目的各個(gè)環(huán)節(jié),這些環(huán)節(jié)包括了資源的獲取、管理、存儲(chǔ)和保管、獲取和檢索等,各個(gè)環(huán)節(jié)都有配套軟件程序來實(shí)現(xiàn)相關(guān)功能。
IIPC在WA項(xiàng)目的發(fā)展中做出了相當(dāng)重要的貢獻(xiàn)。具體來說,IIPC作為國際組織,為相關(guān)發(fā)展WA項(xiàng)目的機(jī)構(gòu)提供了一個(gè)平臺(tái),各個(gè)機(jī)構(gòu)在此平臺(tái)開展充分的交流和協(xié)作,從而極大地促進(jìn)了WA項(xiàng)目的發(fā)展。IIPC針對(duì)WA項(xiàng)目的各個(gè)環(huán)節(jié)成立不同的協(xié)作組,并針對(duì)相關(guān)難題進(jìn)行公關(guān),同時(shí)資助項(xiàng)目成員開展新的研究項(xiàng)目。IIPC成員針對(duì)WA項(xiàng)目的采集、管理、存儲(chǔ)、利用等環(huán)節(jié)開發(fā)了大量的軟件,這些軟件基本都為開源性,各個(gè)成員可以針對(duì)自身的實(shí)際情況進(jìn)行個(gè)性化調(diào)整。
互聯(lián)網(wǎng)檔案館(Internet Archive,下簡(jiǎn)稱IA)是IIPC的代表性成員,它作為一個(gè)全球性的非營利組織,在WA領(lǐng)域中的發(fā)展較為深入,是IIPC成員中唯一個(gè)面向全球網(wǎng)頁進(jìn)行選擇性采集、存檔的機(jī)構(gòu)[5]。IA作為一個(gè)非營利性的公益組織,它的發(fā)展較為全面、深入,對(duì)其他國家、機(jī)構(gòu)發(fā)展WA具有很強(qiáng)的引領(lǐng)和指導(dǎo)作用,如為方便較小的組織機(jī)構(gòu)開展WA項(xiàng)目,IA開發(fā)了ARCHVIE-IT軟件,僅需通過簡(jiǎn)易的設(shè)置,就可對(duì)一定范圍內(nèi)需要存檔的網(wǎng)頁進(jìn)行相關(guān)操作[6]。
WA項(xiàng)目的價(jià)值會(huì)隨著時(shí)間變遷顯得越來越重要,未來的世界必定是互聯(lián)網(wǎng)高度繁榮的世界,WA項(xiàng)目在互聯(lián)網(wǎng)上進(jìn)行存檔以備未來查考,因?yàn)橥ㄟ^互聯(lián)網(wǎng)查閱相關(guān)資料,將會(huì)是未來查考?xì)v史的主要手段,這正是互聯(lián)網(wǎng)時(shí)代發(fā)展的必然結(jié)果。較之于傳統(tǒng)的史料,WA項(xiàng)目可更為真切地反映歷史事件,且通過WA項(xiàng)目我們可以在未來的任何一個(gè)時(shí)刻更為全面地了解一個(gè)重要?dú)v史事件,以及這一事件的前因后果。此外,IIPC的成員機(jī)構(gòu)為圖書館、博物館以及高校等,它們通過發(fā)展WA項(xiàng)目,能夠?qū)崿F(xiàn)對(duì)現(xiàn)有業(yè)務(wù)的補(bǔ)充與完善。
合作性。中國互聯(lián)網(wǎng)信息中心(CNNIC)發(fā)布的《第36次中國互聯(lián)網(wǎng)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》顯示,截至2015年6月,中國的網(wǎng)站總數(shù)為357萬個(gè);國家在線數(shù)據(jù)統(tǒng)計(jì)網(wǎng)站于2014年9月16日更新的數(shù)據(jù)顯示,全球互聯(lián)網(wǎng)網(wǎng)站數(shù)量已經(jīng)超過10億,且仍在急速增長(zhǎng)。面對(duì)如此龐大的數(shù)據(jù)資源,僅僅依靠某個(gè)機(jī)構(gòu)的力量完成歷史記憶記錄,顯然是不可能的。必須加強(qiáng)國家之間、機(jī)構(gòu)之間的密切協(xié)作,成立專門的協(xié)調(diào)組織來完成此項(xiàng)工作。IIPC作為一個(gè)國際范圍內(nèi)的互聯(lián)網(wǎng)保存聯(lián)盟,對(duì)于推動(dòng)相關(guān)機(jī)構(gòu)間的國際合作起到了非常重要的作用,如,IIPC的成員機(jī)構(gòu)針對(duì)Web Archive項(xiàng)目的各個(gè)環(huán)節(jié)成立了若干工作組,包括標(biāo)準(zhǔn)組、收割組、獲取組、保存組、結(jié)構(gòu)組、研究人員需求組、獲取工具組、內(nèi)容管理組、深層網(wǎng)頁組、度量和測(cè)試平臺(tái)組、互操作性工作組,等等。這些工作組針對(duì)所負(fù)責(zé)的領(lǐng)域進(jìn)行深入探討研究,極大推動(dòng)了世界范圍內(nèi)WA項(xiàng)目的發(fā)展[7]。
開放性。網(wǎng)絡(luò)的一個(gè)最大、最明顯的特征就是自由(在相應(yīng)的法律規(guī)范之下)與多元,這樣的特性能夠便于成員機(jī)構(gòu)對(duì)接工作、開展研究。
技術(shù)性。WA項(xiàng)目具有較強(qiáng)的技術(shù)性,項(xiàng)目中網(wǎng)頁資源的采集、網(wǎng)頁資源的保存、網(wǎng)頁資源的查找、網(wǎng)頁資源的深層次開發(fā)等都會(huì)牽涉到非常多的技術(shù)問題。如WA項(xiàng)目的存檔策略在各個(gè)項(xiàng)目之間有不同的實(shí)現(xiàn)方式,IA是基于外部索引的壓縮存檔,PANDORA是基于多文件服務(wù)的存檔,NWA(瑞典、芬蘭、冰島、挪威四國合作的web資源存檔項(xiàng)目)是基于格式遷移的存檔,ERA(美國國家檔案館開展的一項(xiàng)對(duì)電子記錄進(jìn)行保存和訪問的研究項(xiàng)目)是基于特征抽取的存檔等。其他如WA的采集流程、檢索利用等也都有很強(qiáng)的技術(shù)性。
公益性。WA項(xiàng)目是功在當(dāng)代、利在千秋的事業(yè),正是由于其公益性且實(shí)踐工作耗資巨大,因此在國內(nèi)該項(xiàng)目的進(jìn)展非常緩慢,進(jìn)行項(xiàng)目研究的只有幾家公共單位。在國外,該項(xiàng)目由于擁有資金扶持,加之公眾具有較強(qiáng)的資源保存與開發(fā)利用意識(shí),因此進(jìn)展速度較快。如,Internet Archive作為一個(gè)非營利組織,它依靠捐款開展研究工作,從1996年至今它已近保存了超過1600億個(gè)網(wǎng)頁資源,為人類留下了寶貴財(cái)富。
WA項(xiàng)目研究主題非常豐富,包括存檔技術(shù)、系統(tǒng)、工作流程、法律規(guī)范、人員、組織、項(xiàng)目評(píng)價(jià)等,其中法律規(guī)范、人員、組織與項(xiàng)目評(píng)價(jià)的相關(guān)研究成果最能體現(xiàn)一國或地區(qū)的特色,不容忽視。目前,國內(nèi)關(guān)于WA項(xiàng)目的研究尚處于初級(jí)階段,國內(nèi)的研究大部分局限于對(duì)國外研究的淺層次介紹和分析,很少有對(duì)WA相關(guān)的技術(shù)、法律等問題進(jìn)行深入討論的。因此,我們要進(jìn)一步強(qiáng)化理論研究,并且突出研究主題。
如何存儲(chǔ)和保存海量的網(wǎng)絡(luò)資源,需要從國家層面加以統(tǒng)籌考慮。網(wǎng)絡(luò)存檔是一個(gè)功在當(dāng)代、利在千秋的偉大事業(yè),我國需要盡早將這項(xiàng)工作納入國家戰(zhàn)略之中。建議國家成立相應(yīng)的機(jī)構(gòu)負(fù)責(zé)統(tǒng)籌工作開展,可參照設(shè)置國家電子文件管理部際聯(lián)席會(huì)議辦公室管理電子文件[8]的模式,成立國家層面的機(jī)構(gòu)負(fù)責(zé)網(wǎng)絡(luò)存檔工作。此外,還要加強(qiáng)國內(nèi)圖書館、檔案館、博物館等單位的溝通與合作。
目前,國內(nèi)對(duì)于網(wǎng)絡(luò)資源存儲(chǔ)的研究較為分散,亟需建立一個(gè)聯(lián)盟性質(zhì)的機(jī)構(gòu)把相關(guān)機(jī)構(gòu)單位統(tǒng)一起來,實(shí)現(xiàn)優(yōu)勢(shì)互補(bǔ)與資源的合理利用,不斷提升研究水平。國內(nèi)WA項(xiàng)目做得較好的國家圖書館、北京大學(xué)、中科院文獻(xiàn)情報(bào)中心等,可聯(lián)合起來建立聯(lián)盟,并吸引國內(nèi)其他有興趣、有實(shí)力的機(jī)構(gòu)參與進(jìn)來,共同推動(dòng)WA項(xiàng)目的開展。在此基礎(chǔ)上,可建立工作試點(diǎn)單位,試點(diǎn)單位應(yīng)從聯(lián)盟內(nèi)部進(jìn)行挑選,優(yōu)先選擇工作起步早、工作基礎(chǔ)扎實(shí)、立足工作前沿的單位進(jìn)行試點(diǎn),開展試點(diǎn)工作時(shí)注意總結(jié)經(jīng)驗(yàn)、發(fā)現(xiàn)問題,并及時(shí)推廣試點(diǎn)經(jīng)驗(yàn),為早日實(shí)現(xiàn)全國范圍內(nèi)的網(wǎng)絡(luò)資源存儲(chǔ)做出貢獻(xiàn)。
目前,國內(nèi)對(duì)于網(wǎng)絡(luò)資源歸檔的工作僅限于學(xué)術(shù)研究領(lǐng)域,政府并未出臺(tái)相應(yīng)的法律法規(guī)。隨著網(wǎng)絡(luò)存檔實(shí)踐的不斷發(fā)展,必須建立健全相關(guān)的法律法規(guī),規(guī)范網(wǎng)絡(luò)資源保存的相關(guān)內(nèi)容。制定法律法規(guī)應(yīng)當(dāng)循序漸進(jìn),要充分借鑒相關(guān)行業(yè)的工作做法,如參照?qǐng)D書館領(lǐng)域的呈繳本制度、考察網(wǎng)絡(luò)資源的版權(quán)保護(hù)問題,還要主動(dòng)學(xué)習(xí)國外的相關(guān)做法,確保法律法規(guī)的完備與齊全。
注釋與參考文獻(xiàn):
[1]IIPC [EB/OL]. [2015-12-05]. http://netpreserve.org/.
[2]張松巖.以IIPC為中心的全球Web Archvie項(xiàng)目研究[J].數(shù)字與縮微影像.2011(3):36-38.
[3]Tools and Software[EB/OL]. [2015-12-05].http://netpre-serve.org/Web-archiving/tools-andsoftware.
[4]S O U R C E F O R G E.h t t p s://sourceforge.net/projects/archive-crawler/?s ource=directory[EB/OL].[2016-2-15].
[5]InternetArchive[EB/OL].[2015-12-05].http://www.interne-tarchive.org/.
[6]About the Internet Archive [EB / OL].[2015-12-28].http : / /archive.org / about /.
[7]林穎,吳振新,張智雄.Web Archive存檔策略分析[J].現(xiàn)代圖書情報(bào).技術(shù).2009(1):16-21.
[8]閆曉創(chuàng).國外Web Archive項(xiàng)目對(duì)我國的借鑒和啟示——以澳大利亞的PANDORA項(xiàng)目為例[J].檔案學(xué)研究.2012(5):79-83.