文·裴佳越
數(shù)字化時(shí)代,網(wǎng)絡(luò)已經(jīng)成為人們生活必不可少的重要組成部分,中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC)于2020年9月發(fā)布的第46次《中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》顯示,截至2020年6月,我國(guó)網(wǎng)民數(shù)量達(dá)到9.40億,互聯(lián)網(wǎng)普及率達(dá)67%,其中網(wǎng)民使用手機(jī)上網(wǎng)的比例達(dá)99.2%[1]。隨著網(wǎng)絡(luò)技術(shù)的發(fā)展與移動(dòng)互聯(lián)設(shè)備的普及,社交媒體廣泛應(yīng)用于世界各地人民的生活之中,記錄著社會(huì)活動(dòng)的點(diǎn)點(diǎn)滴滴,形成了海量的信息資源。這些信息資源不僅是對(duì)人類活動(dòng)的證據(jù)與數(shù)字記憶的留存,而且為社會(huì)的發(fā)展進(jìn)步提供了重要的決策支持信息。但由于社交媒體信息具有碎片化、易逝性等特性,若不及時(shí)對(duì)其進(jìn)行歸檔管理,人們將會(huì)遺失大量寶貴的財(cái)富。在此背景下,專題數(shù)字檔案館應(yīng)運(yùn)而生。與專題檔案數(shù)據(jù)庫(kù)不同,專題數(shù)字檔案館更側(cè)重于對(duì)數(shù)字信息資源的分類、整合、開發(fā)與利用,更為契合社交媒體信息歸檔保存的目的,且能滿足社會(huì)公眾對(duì)于真實(shí)、高質(zhì)量網(wǎng)絡(luò)信息的需求。因此,如何利用社交媒體信息參與構(gòu)建專題數(shù)字檔案館成為每個(gè)檔案人值得去思考的問題。本文對(duì)社交媒體信息參與構(gòu)建專題數(shù)字檔案館所面臨的有利條件與障礙因素進(jìn)行分析,結(jié)合我國(guó)國(guó)情,提出相關(guān)建構(gòu)策略。
社交媒體是用戶進(jìn)行工作、學(xué)習(xí)、記錄生活或者彼此間進(jìn)行經(jīng)驗(yàn)分享、互動(dòng)交流的一種工具和平臺(tái),用戶在社交媒體平臺(tái)進(jìn)行活動(dòng)的過程中直接形成了大量的文字、圖像、音頻、視頻等多媒體數(shù)字信息,無疑是對(duì)人們歷史活動(dòng)的清晰、確定的原始記錄。例如,疫情期間,醫(yī)護(hù)人員通過微信、微博等社交媒體平臺(tái)在第一時(shí)間記錄下的個(gè)人防疫抗疫的相關(guān)行動(dòng);工作人員通過釘釘、騰訊會(huì)議等平臺(tái)進(jìn)行的一系列重要辦公記錄等。因此,社交媒體信息具有鮮明的原始記錄性,等同于檔案的本質(zhì)屬性,也決定了社交媒體信息的歸檔價(jià)值。
社交媒體信息符合《電子文件歸檔管理規(guī)范》中對(duì)電子文件的定義,歸檔的社交媒體信息是電子檔案的重要組成部分。2020年6月新修訂的《檔案法》第37條明確規(guī)定:“電子檔案與傳統(tǒng)載體檔案具有同等效力,可以以電子形式作為憑證使用。”《民事訴訟法》第六十三條將電子數(shù)據(jù)列入訴訟證據(jù),在查證屬實(shí)后,便可作為認(rèn)定事實(shí)的根據(jù)。如今,人們愈發(fā)頻繁地使用社交媒體平臺(tái)進(jìn)行交流與記錄,電子數(shù)據(jù)的形式從短信、電郵延伸到微信、微博、QQ等社交媒體,毋庸置疑,這些平臺(tái)的數(shù)據(jù)均具有憑證價(jià)值,在處理爭(zhēng)端問題中發(fā)揮著至關(guān)重要的歷史憑證作用。
社交媒體信息記載著人們生活的方方面面,是對(duì)人類社會(huì)歷史的點(diǎn)滴記錄。歸檔保存的社交媒體信息是真實(shí)可靠的歷史記錄,可以作為學(xué)者查考?xì)v史的第一手資料。人們可以通過對(duì)檔案的深入研究,了解歷史的原貌,掌握特定的信息;通過發(fā)掘社交媒體檔案中特定事物的發(fā)展經(jīng)過,人們可以把握其發(fā)展規(guī)律,為將來相似事件的重演保留參考資料,提供決策支持信息。
社交媒體的影響力已經(jīng)滲入社會(huì)的各個(gè)方面,影響著人們的生活、學(xué)習(xí)與工作,在很大程度上改變了人們的習(xí)慣。政府部門通過社交媒體發(fā)布時(shí)事新聞、應(yīng)對(duì)突發(fā)事件、開展社會(huì)服務(wù);社會(huì)機(jī)構(gòu)運(yùn)用社交媒體宣傳、廣告,創(chuàng)造更多的價(jià)值;人民群眾通過社交媒體獲取新知、分享生活,留住感動(dòng)……如今,人們對(duì)于檔案的認(rèn)知不斷深入,社會(huì)記憶理論迅速發(fā)展,社交媒體平臺(tái)不再僅僅被視為基于用戶關(guān)系的內(nèi)容生產(chǎn)與交換平臺(tái),而是留存人類社會(huì)記憶的重要陣地。社交媒體信息具有記憶屬性,真切地反映了數(shù)字時(shí)代的政治、歷史與文化。
信息化時(shí)代,社會(huì)經(jīng)濟(jì)與各項(xiàng)事業(yè)迅猛發(fā)展,移動(dòng)通訊、網(wǎng)絡(luò)應(yīng)用的迅速普及,倒逼著檔案服務(wù)加速邁入大范圍、高效率的資源共享時(shí)代。隨著市場(chǎng)競(jìng)爭(zhēng)的愈發(fā)激烈、人們信息素養(yǎng)的大幅提升,社會(huì)對(duì)于檔案信息資源的需求量日益增大。因此,面向社會(huì)需求的檔案信息資源共建共享已成為檔案事業(yè)未來發(fā)展的新方向,這一趨勢(shì)在此次新修訂《檔案法》中也有所體現(xiàn),將檔案的封閉年限由原先的30年縮短至25年。特別是在面對(duì)重大突發(fā)事件時(shí),社會(huì)對(duì)于檔案信息資源的需求尤為明顯,例如,此次新冠肺炎采取科學(xué)的防控舉措并取得良好成效,離不開對(duì)“非典”疫情防控決策部署的相關(guān)文書與醫(yī)療檔案的借鑒參考。
隨著微博、微信、知乎等社交媒體平臺(tái)在國(guó)內(nèi)風(fēng)靡至今,國(guó)家對(duì)社交媒體信息的歸檔問題也越來越看重,有關(guān)社交媒體歸檔的法規(guī)與政策在逐年完善。2019年發(fā)布的《中華人民共和國(guó)政府信息公開條例》為微博的政務(wù)信息歸檔提供了政策支持;許多研究機(jī)構(gòu)先后展開對(duì)社交媒體信息的研究,例如,人民網(wǎng)輿情頻道發(fā)布《2019年政務(wù)指數(shù)—微博影響力報(bào)告》,復(fù)旦大學(xué)輿情傳播與研究實(shí)驗(yàn)室發(fā)布《中國(guó)政務(wù)微博研究報(bào)告》,均對(duì)微博的政務(wù)數(shù)據(jù)進(jìn)行研究分析[2]。新修訂《檔案法》規(guī)定:“國(guó)家檔案主管部門應(yīng)當(dāng)建立健全突發(fā)事件應(yīng)對(duì)活動(dòng)相關(guān)檔案收集、整理、保護(hù)、利用工作機(jī)制”,并明確賦予電子文件法律效力,為各級(jí)檔案館通過各類社交媒體平臺(tái)公開征集專題檔案信息提供了有力的法律支持。
隨著國(guó)內(nèi)外對(duì)數(shù)字檔案館建設(shè)的深入研究,學(xué)界愈發(fā)意識(shí)到對(duì)有價(jià)值的網(wǎng)絡(luò)信息進(jìn)行歸檔保存的重要性,在此背景下,中國(guó)“Web信息博物館”在北京大學(xué)網(wǎng)絡(luò)實(shí)驗(yàn)室中誕生,以集中的形式全面展現(xiàn)國(guó)內(nèi)網(wǎng)頁(yè)信息歷史,供人們獲取、利用;中國(guó)國(guó)家圖書館在2003年開啟的WICP(Web Information Collection and Preservation)項(xiàng)目,不斷探索適合中國(guó)網(wǎng)絡(luò)信息歸檔的實(shí)現(xiàn)路徑。此外,還有美國(guó)的互聯(lián)網(wǎng)檔案館項(xiàng)目,面向全球采集和保存網(wǎng)絡(luò)中公開可用的信息資源;英國(guó)的政府網(wǎng)站檔案館社交媒體文件歸檔項(xiàng)目(UKGWA),將英國(guó)政府網(wǎng)站信息歸檔管理,以供科研人員與公眾使用。雖然國(guó)內(nèi)已有許多檔案館入駐各大社交媒體平臺(tái),逐步開展檔案網(wǎng)絡(luò)宣傳與利用服務(wù),但對(duì)于社交媒體信息的接收、歸檔工作仍處于起步階段,國(guó)內(nèi)外有關(guān)網(wǎng)絡(luò)信息歸檔的實(shí)踐先例將為社交媒體信息參與構(gòu)建專題數(shù)字檔案館提供技術(shù)、法律政策、標(biāo)準(zhǔn)規(guī)范等各個(gè)方面的參考與支持。
在大數(shù)據(jù)、Web2.0環(huán)境下,數(shù)字化信息的歸檔管理離不開信息技術(shù)的支撐,對(duì)于社交媒體信息資源的歸檔管理,檔案部門并非處于主導(dǎo)地位。在實(shí)踐工作中,機(jī)構(gòu)、部門各自為政的現(xiàn)象較為普遍,圖書館、博物館、檔案館、藝術(shù)館,大數(shù)據(jù)管理局、運(yùn)營(yíng)商甚至是個(gè)人都在積極探索對(duì)社會(huì)數(shù)字記憶的留存。仍以此次抗疫檔案征集為例,除了各級(jí)各類檔案部門外,圖書館、博物館、企業(yè)事業(yè)單位都積極主動(dòng)地參與到疫情防控檔案的征集工作中,如浙江省圖書館、陜西省旬邑縣黨史研究室、中國(guó)國(guó)家博物館等[3]。這種多元化的責(zé)任主體局面,不僅給檔案部門的歸檔工作帶來了很大的競(jìng)爭(zhēng)力,而且將導(dǎo)致社交媒體信息歸檔的責(zé)任體系的模糊,進(jìn)而造成管理上的混亂。
社交媒體信息的權(quán)屬不明確以及知識(shí)產(chǎn)權(quán)保護(hù)等問題給歸檔工作帶來了一定的難度。目前檔案館接受政務(wù)方面的社交媒體信息,如微博政務(wù)信息,并且已有合理合法的依據(jù)。但政務(wù)信息只是海量社交媒體信息中的一小部分,而那些非政務(wù)信息的形成主體是社會(huì)團(tuán)體與個(gè)人,檔案館是否有資格接收這些信息以及具體的接收流程等問題均沒有被明確。此外在實(shí)際工作中,大多數(shù)網(wǎng)絡(luò)信息長(zhǎng)期保存或者社交媒體信息歸檔管理的實(shí)踐項(xiàng)目是由圖書館主導(dǎo),實(shí)踐經(jīng)驗(yàn)相對(duì)豐富,而在著作權(quán)、隱私保護(hù)、知識(shí)產(chǎn)權(quán)、信息技術(shù)等問題方面,各大社交媒體運(yùn)營(yíng)商在收集整理平臺(tái)發(fā)布的信息上又更具備天生的優(yōu)勢(shì),這些問題在實(shí)際工作中不可回避,并且值得學(xué)者們深入思考。
數(shù)字化時(shí)代,人工實(shí)現(xiàn)社交媒體信息的歸檔管理已不具有可行性,自動(dòng)化、智能化的網(wǎng)絡(luò)信息資源采集系統(tǒng)以及個(gè)性化的檢索工具有待進(jìn)一步開發(fā)。目前國(guó)內(nèi)外已研發(fā)出較多的網(wǎng)絡(luò)信息的采集系統(tǒng),如網(wǎng)絡(luò)爬蟲(web crawler),是公認(rèn)的有效的信息資源自動(dòng)采集工具,又稱為網(wǎng)絡(luò)機(jī)器人(Web Robots),是一種自動(dòng)化獲取網(wǎng)絡(luò)信息的程序[4]。然而在爬行效率,數(shù)據(jù)存儲(chǔ)空間以及對(duì)HTML、圖像、PDF文檔、音視頻等多種格式信息的采集等方面仍存在許多困擾。另外在資源檢索、提供利用服務(wù)這方面,也存在許多技術(shù)障礙。例如,由美國(guó)互聯(lián)網(wǎng)檔案館研發(fā)的“Wayback Machine”——時(shí)光機(jī),集索引、摘要、呈現(xiàn)等多種功能于一體,并且可以實(shí)現(xiàn)WARC文檔的增量索引[5]。即便如此,時(shí)光機(jī)在實(shí)現(xiàn)URL檢索時(shí)依然十分受限,它在迫使用戶記住URL的同時(shí),沒有考慮到鏈接過時(shí)、失效等現(xiàn)實(shí)問題。
現(xiàn)在的網(wǎng)絡(luò)社交媒體信息呈現(xiàn)出數(shù)據(jù)海量性、主體分散性的特點(diǎn),每時(shí)每刻都有無數(shù)的新內(nèi)容在世界各地的平臺(tái)終端上生成,在對(duì)這些信息進(jìn)行歸檔時(shí)最大的障礙是確定信息的接收范圍。不同于檔案工作八大環(huán)節(jié)之一的“鑒定”,對(duì)于社交媒體信息在接收時(shí)便要鑒定其內(nèi)容是否真實(shí)、完整,是否具有歸檔價(jià)值。此外,社交媒體信息的實(shí)時(shí)更新、易刪除的特點(diǎn)對(duì)歸檔工作的及時(shí)性提出極高要求;社交媒體信息格式的多樣性造成了信息的冗余,增加了數(shù)字檔案館的負(fù)擔(dān)。
實(shí)現(xiàn)社交媒體信息高效率、高質(zhì)量的歸檔管理,需要從管理工作的宏觀視角對(duì)歸檔體系進(jìn)行頂層設(shè)計(jì),應(yīng)按照“一元主導(dǎo),多元合作”的思路進(jìn)行專題數(shù)字檔案館的建設(shè)。從各國(guó)的實(shí)踐上看,社交媒體歸檔無法由單一的主體獨(dú)立完成,往往需要檔案館、政府部門、圖書館、學(xué)術(shù)科研機(jī)構(gòu)、數(shù)據(jù)管理局、平臺(tái)運(yùn)營(yíng)商與公眾的參與?!耙辉鲗?dǎo)”便是由檔案部門牽頭,“多元參與”則是指圖書館、數(shù)據(jù)管理局、運(yùn)營(yíng)商等主體共同合作,并吸納社會(huì)公眾參與社交媒體信息的管理,構(gòu)建多元主體協(xié)同的建設(shè)體系。這一體系的優(yōu)勢(shì)十分明顯,首先,檔案部門具有先天的專業(yè)優(yōu)勢(shì),由檔案部門牽頭,可以確保社交媒體信息的歸檔價(jià)值,保證專題數(shù)字檔案館建設(shè)的質(zhì)量水平;其次,通過多元主體間的合作共建,可以加大征集力度,從而保障專題檔案資源收集更為系統(tǒng)全面。最后,鼓勵(lì)公眾參與,是對(duì)館藏專題檔案資源的有益補(bǔ)充與完善,促進(jìn)對(duì)社會(huì)記憶多角度地建構(gòu)。
除了上述領(lǐng)域內(nèi)多主體間的協(xié)作外,社交媒體信息參與構(gòu)建專題數(shù)字檔案館還需要進(jìn)行跨領(lǐng)域的研究合作。一方面,檔案部門要與技術(shù)公司展開合作,吸納第三方機(jī)構(gòu)的參與,降低工作難度與歸檔成本?!渡缃幻襟w文件最佳捕獲白皮書》曾顯示,在美國(guó)有專門為社交媒體信息歸檔提供捕獲服務(wù)的第三方服務(wù)商,數(shù)量超過十家。例如,美國(guó)的推特(Twitter)歸檔項(xiàng)目,是由Gnip公司提供技術(shù)服務(wù),并且與推特平臺(tái)、LOC、Gnip公司進(jìn)行深入研究合作的成果。除了與第三方服務(wù)商進(jìn)行合作外,檔案部門還可以與互聯(lián)網(wǎng)公司進(jìn)行研究合作,主要側(cè)重于特定的歸檔技術(shù),比較具有代表性的是英國(guó)網(wǎng)絡(luò)信息保存聯(lián)盟項(xiàng)目(UK Web Archiving Consortium Project,簡(jiǎn)稱UKWAC)。通過與技術(shù)公司的研究合作,可以避免檔案部門從零開始,進(jìn)一步提高歸檔工作效率。
另一方面,檔案部門要與法律部門開展研究合作,保障社交媒體信息歸檔工作的合法性與規(guī)范性。歐美國(guó)家早已開展對(duì)社交媒體信息歸檔法律層面上的研究工作,研究的重點(diǎn)、難點(diǎn)主要集中于社交媒體用戶著作權(quán)、知識(shí)產(chǎn)權(quán)、隱私權(quán)的保護(hù)以及數(shù)據(jù)權(quán)屬的問題上。目前,國(guó)內(nèi)相關(guān)立法還不夠全面,檔案部門要積極與法律部門合作,進(jìn)一步完善《檔案法》《著作權(quán)法》《信息網(wǎng)絡(luò)傳播權(quán)保護(hù)條例》等法律法規(guī)針對(duì)社交媒體信息歸檔方面的條文內(nèi)容,力求在將來為社交媒體信息歸檔工作的開展提供可靠的法律依據(jù)。
首先是館藏主題的選擇,主題的選擇與確定是專題數(shù)字檔案館建設(shè)最基本,也是最為關(guān)鍵的環(huán)節(jié)。專題數(shù)字檔案館在接收社交媒體信息時(shí)應(yīng)遵循事由原則,即圍繞某一具體事件來收集、整理網(wǎng)絡(luò)資源,進(jìn)行歸檔管理。同時(shí)選題的依據(jù)應(yīng)建立在社會(huì)對(duì)檔案信息資源需求的分析研究之上,館藏建設(shè)要以資源整合與利用服務(wù)為導(dǎo)向,這也是專題數(shù)字檔案館與專題檔案數(shù)據(jù)庫(kù)的主要區(qū)別。
其次是歸檔范圍的確定,除了傳統(tǒng)的政務(wù)信息外,還要將非政務(wù)信息納入歸檔范圍。政務(wù)信息主要是中央各級(jí)政府關(guān)于某一事件的相關(guān)新聞報(bào)導(dǎo)、政策指示、政務(wù)工作安排等;非政務(wù)信息主要包括社交媒體平臺(tái)認(rèn)證的用戶所發(fā)布的信息、微信公眾號(hào)信息以及用戶在平臺(tái)上表達(dá)的觀點(diǎn)與分享的見解等各類民生信息。對(duì)于社交媒體信息可進(jìn)行“選擇性采集”與“全面性采集”相結(jié)合的采集策略,在劃定歸檔信息范圍的基礎(chǔ)上,進(jìn)一步保證專題信息采集的全面性與完整性。
最后,要重視館藏資源長(zhǎng)久保存的前段設(shè)計(jì)。在專題數(shù)字檔案館的建設(shè)與運(yùn)行中,每一項(xiàng)工作都不是孤立的,建設(shè)過程中要為各個(gè)環(huán)節(jié)的連貫開展提供前端支持。社交媒體信息歸檔作為過程性的一環(huán),包含收集、鑒定、整理等多項(xiàng)工作,在未來,對(duì)館藏資源的長(zhǎng)期保管與提供利用時(shí),都要以歸檔工作的分類體系或背景信息作為參考[6]。重視建設(shè)過程中的前段設(shè)計(jì)可有效避免管理流程出現(xiàn)過度繁瑣、銜接困難等問題。
利用社交媒體信息構(gòu)建專題數(shù)字檔案館的最終目的是為廣大群眾提供優(yōu)質(zhì)資源的利用服務(wù),利用平臺(tái)建設(shè)關(guān)乎建館宗旨、用戶體驗(yàn)、數(shù)字記憶的構(gòu)建,乃至人類社會(huì)的進(jìn)步發(fā)展。專題數(shù)字檔案館的利用平臺(tái)一般是以向公眾開放的門戶網(wǎng)站形式來建設(shè),例如,美國(guó)“卡特里娜”颶風(fēng)數(shù)字記憶庫(kù)項(xiàng)目與“9·11數(shù)字檔案館”項(xiàng)目。二者在網(wǎng)站設(shè)置了首頁(yè)、館藏目錄、關(guān)于我們、全宗和加入記憶項(xiàng)目這五大模塊,并設(shè)立快捷檢索渠道供用戶在線免費(fèi)瀏覽各種類型的館藏檔案資源[7]。
我國(guó)可借鑒國(guó)外專題數(shù)字檔案館建設(shè)的成功經(jīng)驗(yàn),對(duì)數(shù)字檔案資源進(jìn)行有序的組織與管理。首先,對(duì)于網(wǎng)站的組織系統(tǒng),要進(jìn)行合理的邏輯分類,做到井然有序;其次,專題內(nèi)容與信息檢索要以利用者的需求為導(dǎo)向,進(jìn)行人性化的信息組織與檢索設(shè)計(jì);最后,在網(wǎng)站的日常維護(hù)與內(nèi)容更新上要做到及時(shí)跟進(jìn)、高效率與高質(zhì)量,為學(xué)術(shù)研究、決策支持與日常利用提供一手參考資料。