李彩容 王熳莉
摘要:科學(xué)有效的網(wǎng)頁歸檔項(xiàng)目政策能夠指導(dǎo)機(jī)構(gòu)組織規(guī)范開展網(wǎng)頁歸檔工作,促進(jìn)實(shí)現(xiàn)網(wǎng)頁信息的有序歸檔和長期保存?;赪eb生命周期管理模型,以11個(gè)美國網(wǎng)頁歸檔項(xiàng)目政策為樣本,通過查閱政策文本分析美國網(wǎng)頁歸檔項(xiàng)目政策的優(yōu)勢(shì)與不足,并對(duì)我國網(wǎng)頁歸檔項(xiàng)目政策提出建議。分析結(jié)果顯示,美國網(wǎng)頁歸檔項(xiàng)目政策存在歸檔目標(biāo)明確、重視前端控制、科學(xué)設(shè)置資源和工作流程、網(wǎng)頁檔案獲取途徑多樣合理、綜合使用保存策略、實(shí)施風(fēng)險(xiǎn)管理等優(yōu)勢(shì),同時(shí)存在未主動(dòng)跟蹤用戶檢索利用情況、未深入開發(fā)利用網(wǎng)頁檔案和未全面開展質(zhì)量分析等不足之處?;谝陨戏治?,對(duì)我國網(wǎng)頁歸檔項(xiàng)目政策提出了五點(diǎn)建議。
關(guān)鍵詞:網(wǎng)頁歸檔 項(xiàng)目政策 Web生命周期管理模型
美國是網(wǎng)頁歸檔實(shí)踐領(lǐng)域的領(lǐng)先者。2017年美國國家數(shù)字化管理聯(lián)盟(Nationl Digital Stewardship Aliance,簡稱NDSA)的一份調(diào)查報(bào)告顯示,在美國開展網(wǎng)頁歸檔項(xiàng)目的組織中,高校占比61%。[1]分析美國網(wǎng)頁歸檔項(xiàng)目的經(jīng)驗(yàn)和教訓(xùn),結(jié)合我國國情取長補(bǔ)短,可為我國開展網(wǎng)頁歸檔項(xiàng)目提供建議。
國外學(xué)者自20世紀(jì)90年代開始研究網(wǎng)頁歸檔項(xiàng)目,主要從國外高校和政府網(wǎng)頁歸檔項(xiàng)目的法律法規(guī)[2]、資源挖掘[3]、歸檔政策[4]、和元數(shù)據(jù)[5]等方面進(jìn)行研究。如Margaret E.Phillips和Paul Koerbin[6]介紹了澳大利亞網(wǎng)頁檔案PANDORA的篩選標(biāo)準(zhǔn)、采集技術(shù)、版權(quán)和呈繳問題、元數(shù)據(jù)、目錄、項(xiàng)目員工、可發(fā)展性和館藏。國內(nèi)學(xué)者自2012年開始關(guān)注網(wǎng)頁歸檔項(xiàng)目,研究領(lǐng)域涉及國外網(wǎng)頁歸檔項(xiàng)目的歸檔政策[8]、法律環(huán)境[9]和生態(tài)系統(tǒng)[10]等。如黃新榮和曾薩[10]認(rèn)為相較于國內(nèi)網(wǎng)頁歸檔,國外網(wǎng)頁歸檔項(xiàng)目形成了一個(gè)良好生態(tài)系統(tǒng),提出我國應(yīng)從多方入手構(gòu)建網(wǎng)頁歸檔生態(tài)系統(tǒng)。綜上所述,國內(nèi)外學(xué)者對(duì)網(wǎng)頁歸檔項(xiàng)目的研究,分析角度較為多樣,但缺少對(duì)網(wǎng)頁歸檔項(xiàng)目政策的系統(tǒng)分析。
Web生命周期管理模型是由Web歸檔生命周期模型演變而來。Molly Bragg和Kristine Hanna[11]在Web歸檔生命周期模型將網(wǎng)頁歸檔的政策分成愿景與目標(biāo)、資源和工作流程、獲取/利用/再利用、保存和風(fēng)險(xiǎn)管理五大部分。吳碩娜和黃新榮[12](2018)在該模型的基礎(chǔ)上,在明確機(jī)構(gòu)的歸檔愿景和目標(biāo)后,增加對(duì)網(wǎng)絡(luò)資源生成進(jìn)行前端控制,對(duì)機(jī)構(gòu)資源進(jìn)行審查,制定網(wǎng)頁歸檔計(jì)劃,并在風(fēng)險(xiǎn)管理后,加入對(duì)網(wǎng)頁檔案的利用、處置,最后將該模型命名為Web生命周期管理模型。
本文選取了11個(gè)具有一定影響力的美國網(wǎng)頁歸檔項(xiàng)目作為樣本,這11個(gè)項(xiàng)目中高校、政府和公共圖書館的占比較為貼近NDSA的調(diào)查結(jié)果。其中,大學(xué)圖書館所在大學(xué)在2021年US News排名位于前40,國會(huì)圖書館和醫(yī)藥圖書館是美國國家級(jí)圖書館,蒙大拿州立圖書館是美國的州立圖書館之一,北卡羅來納州政府網(wǎng)站檔案訪問項(xiàng)目是由北卡羅來納州檔案館和北卡羅來納州圖書館開展的項(xiàng)目,阿萊夫檔案館(Aleph Archives)是一家私人公司,專門從事網(wǎng)頁和社交媒體歸檔?;赪eb生命周期管理模型,分析其項(xiàng)目政策,指出其優(yōu)勢(shì)與不足,為我國網(wǎng)頁歸檔項(xiàng)目制定政策提供參考。
2017年美國NDSA對(duì)美國119個(gè)網(wǎng)頁歸檔項(xiàng)目開展調(diào)查,其調(diào)查報(bào)告顯示,在美國開展網(wǎng)頁歸檔項(xiàng)目的機(jī)構(gòu)中,高校占比61%,公共圖書館占比13%,政府占比14%。在這些機(jī)構(gòu)中,有71%隸屬于美國檔案工作者協(xié)會(huì)網(wǎng)絡(luò)存檔部門,54%隸屬于數(shù)字圖書館聯(lián)盟。81%的組織開展的網(wǎng)頁歸檔項(xiàng)目正處于運(yùn)行階段,12%的組織開展的網(wǎng)頁歸檔項(xiàng)目正處于試點(diǎn)階段。
通過閱讀整理密歇根大學(xué)圖書館、哈佛大學(xué)圖書館、斯坦福大學(xué)圖書館、康奈爾大學(xué)圖書館、紐約大學(xué)圖書館、哥倫比亞大學(xué)圖書館、蒙大拿州立圖書館、阿萊夫檔案館、北卡羅來納州政府網(wǎng)站檔案訪問項(xiàng)目、國會(huì)圖書館和醫(yī)藥圖書館開展的網(wǎng)頁歸檔項(xiàng)目相關(guān)政策文件,筆者按照Web生命周期管理模型對(duì)各個(gè)政策條例進(jìn)行分類,總結(jié)出美國網(wǎng)頁歸檔項(xiàng)目政策的特點(diǎn)。
(一)歸檔目標(biāo)明確
美國網(wǎng)頁歸檔項(xiàng)目以網(wǎng)頁資源的價(jià)值性和穩(wěn)定性為中心,有明確的歸檔目標(biāo)。如,密歇根大學(xué)本特利歷史圖書館認(rèn)為網(wǎng)頁歸檔有兩個(gè)目的:第一個(gè)目的是支持和加強(qiáng)密歇根大學(xué)的各項(xiàng)教學(xué)、研究和服務(wù)活動(dòng);第二個(gè)目的是為人類共同利益做出貢獻(xiàn)。蒙大拿州立圖書館認(rèn)為,它的網(wǎng)頁歸檔項(xiàng)目可以促進(jìn)政府之間的合作,同時(shí)鼓勵(lì)圖書館充當(dāng)政府的政務(wù)信息中心的角色。
(二)重視前端控制
網(wǎng)頁歸檔項(xiàng)目的前端控制可分為遵守行業(yè)標(biāo)準(zhǔn)和制定網(wǎng)頁生成指南兩部分。
美國網(wǎng)頁歸檔項(xiàng)目已明確表明,網(wǎng)頁管理者在制作網(wǎng)頁的過程中需遵守相關(guān)行業(yè)標(biāo)準(zhǔn)。如,阿萊夫檔案館則遵循ISO28500國際標(biāo)準(zhǔn)和WARC標(biāo)準(zhǔn)。
美國網(wǎng)頁歸檔項(xiàng)目在政策中提供網(wǎng)頁生成指南,以便于網(wǎng)頁管理者制作更規(guī)范、可歸檔性更高的網(wǎng)頁。雖然各大網(wǎng)頁歸檔項(xiàng)目的指南內(nèi)容有所差異,但是它們會(huì)為網(wǎng)頁管理者提供一些通用建議。在指南中,穩(wěn)定性高、易捕獲的HTML和XHTML文本格式是它們所推薦的網(wǎng)頁歸檔格式。它們?yōu)榫W(wǎng)頁管理者提出四條建議:一是在站點(diǎn)地圖中列舉需要?dú)w檔的資源,幫助抓取工具發(fā)現(xiàn)資源,提高抓取效率;二是合理利用Robot exclusion,幫助抓取工具避開無須歸檔的資源;三是保持網(wǎng)頁URL結(jié)構(gòu)的穩(wěn)定性;四是在網(wǎng)頁代碼中正確標(biāo)識(shí)字符編碼,幫助抓取工具捕獲網(wǎng)頁。
(三)科學(xué)設(shè)置資源和工作流程
資源上,美國網(wǎng)頁歸檔項(xiàng)目設(shè)置了專職工作人員,并為這些工作人員進(jìn)行專業(yè)分工。例如,密歇根大學(xué)本特利歷史圖書館的網(wǎng)頁檔案隸屬于特殊館藏,而特殊館藏中心的員工以館長和檔案工作者為主,不具備解決技術(shù)問題的能力。因此,在技術(shù)問題層面,圖書館會(huì)尋求外部伙伴的幫助,而檔案工作者則可以專注于對(duì)具有歸檔價(jià)值的網(wǎng)頁進(jìn)行評(píng)估,選擇和描述工作。[13]
工作流程上,美國網(wǎng)頁歸檔項(xiàng)目采取多方合作的工作模式來完成網(wǎng)頁歸檔項(xiàng)目。它們的共用合作伙伴是美國互聯(lián)網(wǎng)檔案館(Archive-It)。部分項(xiàng)目也有其他合作伙伴。如哈佛大學(xué)圖書館是常青藤網(wǎng)頁存檔項(xiàng)目成員之一。此外,哈佛大學(xué)圖書館參與網(wǎng)頁歸檔咨詢組和網(wǎng)頁歸檔討論組。美國國會(huì)圖書館與夏威夷大學(xué)馬諾阿分校的夏威夷和太平洋收藏館、新西蘭國家圖書館和澳大利亞國家圖書館合作,開展太平洋島嶼網(wǎng)絡(luò)歸檔項(xiàng)目。國會(huì)圖書館還與國際互聯(lián)網(wǎng)保護(hù)聯(lián)盟和聯(lián)邦政府網(wǎng)絡(luò)歸檔興趣小組合作,開展網(wǎng)頁歸檔工作。
(四)多樣、合理的網(wǎng)頁檔案獲取途徑
美國網(wǎng)頁歸檔項(xiàng)目有多種網(wǎng)頁檔案獲取途徑,這些途徑可分為兩大類。第一類是通過內(nèi)部門戶網(wǎng)站直接訪問,第二類是訪問外部鏈接。相較于采取單一的獲取途徑,美國網(wǎng)頁歸檔項(xiàng)目更傾向于結(jié)合多種網(wǎng)頁檔案獲取途徑。例如,哥倫比亞大學(xué)圖書館為用戶提供ArchiveIt的網(wǎng)站、圖書館官網(wǎng)和圖書館在線目錄或OCLC的Worldcat數(shù)據(jù)庫三種獲取網(wǎng)頁檔案的途徑。
同時(shí),美國網(wǎng)頁歸檔項(xiàng)目對(duì)其網(wǎng)頁檔案設(shè)置三種利用限制,第一種是在Archive-It免費(fèi)開放利用,第二種是在內(nèi)部網(wǎng)站或平臺(tái)開放利用,第三種是設(shè)置適當(dāng)?shù)慕\(yùn)期。有的會(huì)結(jié)合兩種利用限制,例如,康奈爾大學(xué)圖書館的網(wǎng)頁檔案既可以由Archive-It提供開放利用,也可以由其內(nèi)部網(wǎng)站或平臺(tái)提供開放利用。國會(huì)圖書館對(duì)檔案中的所有內(nèi)容設(shè)置一年的禁運(yùn)期。
(五)綜合使用保存策略
美國網(wǎng)頁歸檔項(xiàng)目的網(wǎng)頁檔案保存策略可分為兩種。一種是存儲(chǔ)于Internet Archive的數(shù)據(jù)庫,另一種是存儲(chǔ)于圖書館的數(shù)據(jù)庫。有的網(wǎng)頁歸檔項(xiàng)目采取單一策略,例如斯坦福大學(xué)圖書館將網(wǎng)頁檔案存儲(chǔ)于圖書館數(shù)據(jù)庫。有的網(wǎng)頁歸檔項(xiàng)目會(huì)結(jié)合使用兩種策略,例如美國國會(huì)圖書館以WARC和Internet Archive ARC容器文件格式創(chuàng)建和存儲(chǔ)網(wǎng)頁檔案,其副本由國會(huì)圖書館存儲(chǔ)和管理。網(wǎng)頁歸檔項(xiàng)目會(huì)綜合考量館藏網(wǎng)頁檔案和自身工作資源,決定采取何種保存策略。
(六)實(shí)施風(fēng)險(xiǎn)管理
在網(wǎng)頁歸檔項(xiàng)目中,許多機(jī)構(gòu)會(huì)考慮他們?cè)敢饨邮艿呐c版權(quán)相關(guān)的風(fēng)險(xiǎn)等級(jí)以及如何管理這種風(fēng)險(xiǎn)。美國網(wǎng)頁歸檔項(xiàng)目的風(fēng)險(xiǎn)管理措施可分成三類,一是主動(dòng)獲取網(wǎng)頁管理者許可,二是刪除侵權(quán)網(wǎng)頁檔案,三是遵守相關(guān)法律法規(guī)。
有些美國網(wǎng)頁歸檔項(xiàng)目會(huì)在網(wǎng)頁歸檔之前主動(dòng)獲取網(wǎng)頁管理者的許可。例如,在網(wǎng)頁歸檔之前,哥倫比亞大學(xué)圖書館會(huì)遵循“非侵入式獲取”原則,在歸檔前告知網(wǎng)頁管理者歸檔目的,并獲取網(wǎng)頁管理者的許可。
刪除侵權(quán)網(wǎng)頁檔案也是美國網(wǎng)頁歸檔項(xiàng)目采取的風(fēng)險(xiǎn)管理措施之一。美國網(wǎng)頁歸檔項(xiàng)目刪除侵權(quán)網(wǎng)頁檔案的方式有兩種,一是從數(shù)據(jù)庫中刪除侵權(quán)檔案,二是從提供利用范圍中刪除涉嫌侵權(quán)的網(wǎng)頁檔案。北卡羅來納州政府網(wǎng)站檔案訪問項(xiàng)目和國家醫(yī)藥圖書館采取第一種方式,它們會(huì)依據(jù)網(wǎng)頁管理者的訴求,從已經(jīng)歸檔的網(wǎng)頁中刪除管理者不希望歸檔的網(wǎng)頁。而密歇根大學(xué)本特利歷史圖書館則采取第二種方式。在密歇根大學(xué)本特利歷史圖書館,如果圖書館無法決定網(wǎng)頁檔案是否被允許公開利用,那么它將停止向用戶提供該網(wǎng)頁檔案。
美國網(wǎng)頁歸檔項(xiàng)目在風(fēng)險(xiǎn)管理的過程中會(huì)考慮法律法規(guī)。例如,密歇根大學(xué)本特利歷史圖書館在規(guī)范版權(quán)許可時(shí),對(duì)網(wǎng)頁檔案的劃分標(biāo)準(zhǔn)是以法律中規(guī)定的合理使用范圍為基礎(chǔ)。斯坦福大學(xué)圖書館規(guī)定,在歸檔有關(guān)學(xué)生課程成果的網(wǎng)頁時(shí),檔案工作人員需要遵守《聯(lián)邦家庭教育權(quán)利和隱私法案》[14]。
美國雖然在網(wǎng)頁歸檔項(xiàng)目中存在優(yōu)勢(shì),但也存在未主動(dòng)跟蹤用戶檢索利用情況、未深入開發(fā)利用網(wǎng)頁檔案和未全面開展質(zhì)量分析等不足之處。
(一)未主動(dòng)跟蹤用戶檢索利用情況
相關(guān)反饋(即顯式反饋、隱式反饋和偽反饋)可跟蹤用戶對(duì)信息的檢索利用情況。顯式反饋要比隱式反饋和偽反饋可信度高,但隱式反饋和偽反饋基本沒有影響用戶的檢索過程,用戶友好性強(qiáng)[15]。在網(wǎng)頁檔案的利用環(huán)節(jié),美國網(wǎng)頁歸檔項(xiàng)目采取顯式反饋的技術(shù)手段跟蹤用戶對(duì)網(wǎng)頁檔案的利用情況,即用戶主動(dòng)向圖書館反饋使用體驗(yàn)。這會(huì)導(dǎo)致三個(gè)后果。其一,用戶難以通過語言表達(dá)自身的內(nèi)隱信息需求和意識(shí)到的信息需求,圖書館不能依據(jù)用戶需求改進(jìn)網(wǎng)頁檔案服務(wù)。其二,圖書館無法了解用戶在利用網(wǎng)頁檔案過程中存在的侵權(quán)行為,無法進(jìn)一步降低侵權(quán)風(fēng)險(xiǎn)。其三,顯式反饋被動(dòng)性強(qiáng),能否獲得足量樣本取決于用戶是否愿意主動(dòng)反饋信息。
(二)未深入開發(fā)利用網(wǎng)頁檔案
相較于紙質(zhì)檔案資源,網(wǎng)頁檔案的開發(fā)程度稍顯不足。目前,美國網(wǎng)頁歸檔項(xiàng)目針對(duì)網(wǎng)頁檔案的開發(fā)利用僅停留于主題分類和瀏覽頻次統(tǒng)計(jì)的層面,對(duì)于主題間的關(guān)聯(lián)層面并未進(jìn)行深入開發(fā)。這種缺失導(dǎo)致用戶在檢索網(wǎng)頁檔案時(shí),需要額外花費(fèi)精力進(jìn)行信息加工。
(三)未全面開展質(zhì)量分析
質(zhì)量分析一方面可以幫助網(wǎng)頁歸檔項(xiàng)目組評(píng)估前期工作的質(zhì)量,為后續(xù)圖書館改進(jìn)網(wǎng)頁歸檔工作提供決策基礎(chǔ),另一方面可以幫助網(wǎng)頁管理者優(yōu)化網(wǎng)頁設(shè)計(jì)。然而,美國網(wǎng)頁歸檔項(xiàng)目的質(zhì)量分析有待完善。如斯坦福大學(xué)圖書館的質(zhì)量分析報(bào)告包含按主機(jī)或者M(jìn)IME類型分類的URL數(shù)量、URL列表、數(shù)據(jù)卷、出站主機(jī)以及由于robot.txt指令而無法抓取的資源清單,這份報(bào)告可以幫助網(wǎng)頁管理者了解網(wǎng)頁上的內(nèi)容,準(zhǔn)備更新主要站點(diǎn),并在可歸檔性等方面評(píng)估搜索引擎優(yōu)化。但其分析層面并未涉及到網(wǎng)頁歸檔項(xiàng)目中網(wǎng)頁檔案完整性、可讀性、與原網(wǎng)頁的相似性、訪問深度等層面,難以全面評(píng)估網(wǎng)頁歸檔工作質(zhì)量。
我國曾經(jīng)有網(wǎng)頁歸檔實(shí)踐經(jīng)歷。北京大學(xué)計(jì)算機(jī)系網(wǎng)絡(luò)與分布式系統(tǒng)實(shí)驗(yàn)室曾于2001年開展網(wǎng)頁歸檔項(xiàng)目,創(chuàng)辦中國Web信息博物館。同時(shí),2019年12月16日,國家檔案局發(fā)布了《政府網(wǎng)站網(wǎng)頁歸檔指南》,自2020年5月1日起實(shí)施。[16]相較于美國網(wǎng)頁歸檔項(xiàng)目,我國網(wǎng)頁歸檔項(xiàng)目實(shí)踐經(jīng)驗(yàn)相對(duì)較少。我國可借鑒美國網(wǎng)頁歸檔項(xiàng)目的案例,在未來開展網(wǎng)頁歸檔項(xiàng)目。
(一)夯實(shí)前端基礎(chǔ)
歸檔目標(biāo)和網(wǎng)頁生成指南是網(wǎng)頁歸檔項(xiàng)目政策的前端基礎(chǔ)部分。
歸檔目標(biāo)是指引網(wǎng)頁歸檔項(xiàng)目進(jìn)展的方向標(biāo),是機(jī)構(gòu)制定網(wǎng)頁歸檔項(xiàng)目政策時(shí)面臨的首要問題。我國應(yīng)在制定網(wǎng)頁歸檔項(xiàng)目政策的過程中明確歸檔目標(biāo),具體指引歸檔范圍,規(guī)劃并建設(shè)多個(gè)專題網(wǎng)頁檔案。明確的歸檔目標(biāo)既可以有效引導(dǎo)收集方向,還有利于強(qiáng)化網(wǎng)頁檔案之間的有機(jī)聯(lián)系,形成相對(duì)完整和主題集中的檔案資源,實(shí)現(xiàn)完整地“存”、更好地“用”。[17]
與此同時(shí),我國也需要為網(wǎng)頁管理者提供網(wǎng)頁生成指南。網(wǎng)頁生成指南從網(wǎng)頁可歸檔性的角度告訴網(wǎng)頁管理者如何制作網(wǎng)頁,需要注意哪些元數(shù)據(jù)等問題,并為他們提供一些相關(guān)的優(yōu)秀案例,最終達(dá)到控制網(wǎng)頁檔案質(zhì)量的目的。我國未來既應(yīng)該遵循行業(yè)標(biāo)準(zhǔn),也應(yīng)該依據(jù)實(shí)際情況,定制網(wǎng)頁生成指南,實(shí)現(xiàn)網(wǎng)頁檔案管理中的前端控制。
(二)合理設(shè)置人力資源與工作模式
網(wǎng)頁歸檔項(xiàng)目工作任務(wù)復(fù)雜,對(duì)跨專業(yè)知識(shí)有需求。在專業(yè)方面,網(wǎng)頁歸檔項(xiàng)目的員工可分為檔案管理員、圖書管理員、數(shù)字項(xiàng)目成員、信息技術(shù)人員以及其他人員五大類。這些員工的專業(yè)剛好匹配項(xiàng)目任務(wù)需求。我國可在政策上擴(kuò)展員工專業(yè)范圍,鼓勵(lì)相關(guān)專業(yè)人才加入網(wǎng)頁歸檔項(xiàng)目,并按照員工專業(yè)特長合理設(shè)置崗位,推動(dòng)內(nèi)部員工跨專業(yè)合作,以便于高效高質(zhì)完成網(wǎng)頁歸檔工作。
在工作模式方面,檔案多元論鼓勵(lì)檔案機(jī)構(gòu)牽頭開展多樣化、多主題、跨機(jī)構(gòu)、跨部門的合作,為未來檔案工作奠定館際合作的理論背景。[18]目前,相較于我國網(wǎng)頁歸檔項(xiàng)目,美國網(wǎng)頁歸檔項(xiàng)目一大成功之處在于,其具有良性合作關(guān)系。我國目前缺少類似Archive-It這種長期在網(wǎng)頁歸檔領(lǐng)域開展實(shí)踐的專業(yè)組織。與此同時(shí),在地理、政治、文化差異等因素的影響之下,我國網(wǎng)頁歸檔項(xiàng)目與國外的檔案服務(wù)組織的合作可能會(huì)遇到交流困難等問題。因此,美國網(wǎng)頁歸檔項(xiàng)目的第二種合作模式更適合我國網(wǎng)頁歸檔項(xiàng)目??梢越M成多機(jī)構(gòu)聯(lián)盟,共同探討網(wǎng)頁歸檔的各種問題,可以與政府或者機(jī)構(gòu)合作,共同構(gòu)建專題網(wǎng)頁檔案,還可以與技術(shù)服務(wù)商合作,共同開發(fā)網(wǎng)頁檔案管理軟件。
(三)多種存儲(chǔ)策略結(jié)合
多存儲(chǔ)策略結(jié)合的模式既可以擴(kuò)充存儲(chǔ)空間,也可以保存副本,確保檔案的安全性。雖然我國沒有類似In? ternet Archive數(shù)據(jù)庫這樣通用的網(wǎng)頁檔案數(shù)據(jù)庫,但是可以與國家圖書館、云存儲(chǔ)服務(wù)商等機(jī)構(gòu)合作,借助其存儲(chǔ)資源,也可以利用圖書館的數(shù)據(jù)庫對(duì)網(wǎng)頁檔案進(jìn)行本地存儲(chǔ)。
(四)尊重網(wǎng)頁管理者意愿與版權(quán)
雖然我國的法律與美國法律有較大區(qū)別,但我國仍可以遵循“非侵入式獲取”原則,在歸檔前告知網(wǎng)頁管理者歸檔目的,并獲取網(wǎng)頁管理者的許可。當(dāng)網(wǎng)頁管理者發(fā)現(xiàn)網(wǎng)頁檔案中存在其不愿歸檔或者被公開的內(nèi)容時(shí),我國也應(yīng)遵循網(wǎng)頁管理者反饋的意愿,刪除相關(guān)內(nèi)容,或者限制用戶利用相關(guān)內(nèi)容的權(quán)限。
(五)完善后期分析和開發(fā)利用
后期分析包括質(zhì)量分析和相關(guān)反饋兩個(gè)方面。我國可采取三個(gè)措施加強(qiáng)后期工作。
一是全面開展質(zhì)量分析。對(duì)網(wǎng)頁歸檔項(xiàng)目而言,質(zhì)量分析既可以幫助網(wǎng)頁歸檔項(xiàng)目組發(fā)現(xiàn)前期工作的問題,改進(jìn)網(wǎng)頁歸檔工作,也可以幫助網(wǎng)頁管理者評(píng)估網(wǎng)頁設(shè)計(jì)的效果,改進(jìn)網(wǎng)頁設(shè)計(jì)。我國應(yīng)采取多種手段對(duì)已經(jīng)歸檔的網(wǎng)頁進(jìn)行全面的質(zhì)量分析,利用分析結(jié)果,發(fā)現(xiàn)問題,改進(jìn)工作,為長期開展網(wǎng)頁歸檔項(xiàng)目奠定基礎(chǔ)。
二是綜合利用多種相關(guān)反饋方式。相關(guān)反饋可以幫助信息服務(wù)機(jī)構(gòu)提高信息檢索服務(wù)質(zhì)量。顯性反饋可信度最高,但它無法像隱性反饋和偽反饋一樣對(duì)用戶檢索過程幾乎沒有影響,且無法獲得深入性的結(jié)果。只有綜合利用三種相關(guān)反饋方式才能最大程度提高信息檢索服務(wù)質(zhì)量。我國在未來的網(wǎng)頁歸檔項(xiàng)目中應(yīng)綜合利用這三種相關(guān)反饋方式,以保證反饋結(jié)果可信度、深入性以及減小對(duì)用戶檢索過程的影響。
三是推進(jìn)網(wǎng)頁檔案開發(fā)利用。開發(fā)利用網(wǎng)頁檔案是實(shí)現(xiàn)網(wǎng)頁檔案價(jià)值的重要途徑。我國應(yīng)當(dāng)從政策層面重視網(wǎng)頁歸檔項(xiàng)目的后端開發(fā)利用環(huán)節(jié),推進(jìn)網(wǎng)頁檔案開發(fā)利用。
綜上所述,我國網(wǎng)頁歸檔項(xiàng)目政策需夯實(shí)前端基礎(chǔ)、合理設(shè)置人力資源與工作模式、多種存儲(chǔ)策略結(jié)合、尊重網(wǎng)頁管理者意愿與版權(quán)、完善后期分析和開發(fā)利用,實(shí)現(xiàn)網(wǎng)頁歸檔。
參考文獻(xiàn)
[1] Farrell M, McCain E, Praetzellis M. Web Archiving in the United States: A 2017 Survey[EB/OL]. (2018-10-05)[2021-03-03].https://osf.io/ht6ay/.
[2]ZabiCka, P, Mat[ebreve]jka L. Czech Web Archive Analysis [J]. New Review of Hypermedia and Multimedia, 2007,13(1):27-37.
[3]Aubry S. Introducing Web Archives as a New Li? brary Service: the Experience of the National Library of France [J]. Liber Quarterly: The Journal of European Re? search Libraries, 2010,20(2):179-199.
[4] Brayner A A. UK Web Archive Programme: A Brief History of Opportunities and Challenges [J]. RDBCI: Revis? ta Digital de Biblioteconomia e Ciência da Informacao, 2016,14(2):318-333.
[5]Dooley J M, Farrell K S, Kim T. Developing Web Archiving Metadata Best Practices to Meet User Developing Web Archiving Metadata Best Practices to Meet User Needs[J].JournalofWestern Archives, 2017,8(2):5-15.
[6]Phillips M E, Koerbin P. PANDORA, Australiaa’s Web Archive [J]. Journal of Internet Cataloging, 2007, 7(2): 19-33.
[7] Maches T, Christensn M. Web archiving: Policy and practice[J]. Journal of Digital Media Management, 2020, 8(3),201-214.
[8]王爍,丁宇.加拿大圖書館網(wǎng)頁歸檔項(xiàng)目研究[J].檔案學(xué)研究,2012,(6):83-85.
[9]劉青,孔凡蓮.中國網(wǎng)絡(luò)信息存檔及其與國外的比較——基于國家圖書館WICP項(xiàng)目的研究[J].圖書情報(bào)工作,2013,(18):80-86.
[10]黃新榮,曾薩.網(wǎng)頁歸檔推進(jìn)策略研究——基于網(wǎng)頁歸檔生態(tài)系統(tǒng)視角[J].圖書館學(xué)研究,2018,(16):63-70.
[11] Archive-it.The Web Archiving Life Cycle Model[EB/OL].[2021- 06- 09]. https://archive- it.org/static/ files/archiveit_life_cycle_model.pdf.
[12]吳碩娜,黃新榮. Web歸檔生命周期模型的發(fā)展研究[J].數(shù)字圖書館論壇,2018,(10):41-45.
[13]Bentley Historical Library.Campus Case Studies[EB/OL].[2021- 06- 09].http://files.archivists.org/pubs/ CampusCaseStudies/Case13Final.pdf,2021.
[14] Stanford University Library. Policy[EB/OL].[2021- 06- 09].https://library.stanford.edu/projects/webarchiving/policy, 2021.
[15]《數(shù)據(jù)庫百科全書》編委會(huì).《數(shù)據(jù)庫百科全書》[M].上海:上海交通大學(xué)出版社,2009.
[16]金凡.《政府網(wǎng)站網(wǎng)頁歸檔指南》(DA/T80—2019)內(nèi)容解讀與思考[J].北京檔案,2020,(03):21-25.
[17]劉婧.我國新冠肺炎疫情防控檔案征集現(xiàn)狀調(diào)查與分析——以省級(jí)綜合檔案館為對(duì)象[J].檔案學(xué)通訊,2020,(5):21-28.
[18]李子林.檔案多元論在我國的研究與應(yīng)用[J].檔案學(xué)通訊,2017,(6):36-41.
作者單位:1.湖北大學(xué)歷史文化學(xué)院2.中國人民大學(xué)檔案事業(yè)發(fā)展研究中心