周文泓
摘 要:社交媒體信息檔案化管理的研究旨在充分認(rèn)識(shí)實(shí)踐現(xiàn)狀以及檔案理論與方法需相應(yīng)優(yōu)化之處。本文以案例研究法對(duì)美國(guó)國(guó)會(huì)圖書館Twitter檔案館項(xiàng)目展開(kāi)分析,從目標(biāo)、主要任務(wù)、收集對(duì)象、參與主體、成效與不足等方面剖解項(xiàng)目。由此本文提出社交媒體信息檔案化管理應(yīng)明晰檔案化管理對(duì)象提出的挑戰(zhàn)、探析主體協(xié)作深化的方向、面向管理需求構(gòu)建技術(shù)能力、同步社會(huì)環(huán)境規(guī)劃與調(diào)整實(shí)踐方案。
關(guān)鍵詞:社交媒體;檔案化管理;網(wǎng)絡(luò)信息;Twitter 檔案館;國(guó)會(huì)圖書館
Abstract: Study on archiving social media information aims to optimizing practice of archiving and the archival theory and method. The paper took the method of case study of Twitter archives of Library of Congress and presented the project by concluding its components like goal, main missions, collection objects, participation subjects, achievements and problems. Then the paper proposed that archiving social media information should make clear of challenges from collection objects, deepen the collaboration by reason analysis of lacking resources, building technical ability matching management requirements, make plan and adjustment according to social environmental
Keywords: social media; archiving; network information; Twitter archive; Library of Congress
1 引言
社交媒體以各類功能與形態(tài)的平臺(tái)為社會(huì)組織、機(jī)構(gòu)、群體與個(gè)人廣泛用于社會(huì)活動(dòng)中,形成海量記錄人類社會(huì)活動(dòng)的證據(jù)、記憶材料與信息資源,這些信息的管理成為研究與實(shí)踐的熱門議題。
現(xiàn)有研究對(duì)社交媒體信息檔案化管理必要性、挑戰(zhàn)、對(duì)策等正展開(kāi)探索。例如,政務(wù)微博的檔案化管理就從業(yè)務(wù)價(jià)值、證據(jù)價(jià)值、信息價(jià)值得到支持[1]。同時(shí)檔案化管理挑戰(zhàn)如制度不充分、信息量大、多主體形成者、技術(shù)環(huán)境復(fù)雜等得到明晰[2]。為應(yīng)對(duì)這些挑戰(zhàn),機(jī)制、技術(shù)、政策等方面的對(duì)策都在研究中有所提及。例如,提倡建立政府機(jī)構(gòu)、檔案機(jī)構(gòu)以及社交媒體平臺(tái)的協(xié)作機(jī)制[3];使用和升級(jí)已有的檔案化管理工具或開(kāi)發(fā)對(duì)接社交媒體平臺(tái)的API被視作有效的技術(shù)策略[4];從戰(zhàn)略、規(guī)范、標(biāo)準(zhǔn)等方面構(gòu)建完善的制度也得到倡導(dǎo)[5]。然而,關(guān)于如何進(jìn)行系統(tǒng)的社交媒體信息檔案化管理還缺乏全面有效的策略與方案。
本文將以案例研究法對(duì)美國(guó)國(guó)會(huì)圖書館Twitter檔案館項(xiàng)目進(jìn)行介紹,該項(xiàng)目在國(guó)內(nèi)外得到廣泛關(guān)注,在我國(guó)也有一定的案例研究[6]。然而,2017年12月國(guó)會(huì)圖書館關(guān)于該項(xiàng)目發(fā)表了調(diào)整原有方案的聲明,這一定程度上意味著該項(xiàng)目目前還未獲得預(yù)期的效果。因而,相比于此前的研究主要從正面視角學(xué)習(xí)其經(jīng)驗(yàn),本文將基于2010年至今的文本材料對(duì)項(xiàng)目進(jìn)行整體介紹與批判性分析。
2 美國(guó)國(guó)會(huì)圖書館Twitter檔案館項(xiàng)目概覽
2010年4月,美國(guó)國(guó)會(huì)圖書館與Twitter簽訂協(xié)議,協(xié)議規(guī)定Twitter公司將為國(guó)會(huì)圖書館提供公司成立之初開(kāi)始的tweets文本。由此,國(guó)會(huì)圖書館的Twitter檔案館項(xiàng)目正式啟動(dòng)[7]。主要內(nèi)容如下:
2.1 目標(biāo)。國(guó)會(huì)圖書館認(rèn)為Twitter正成為社會(huì)主要的交流與表達(dá)方式,由此補(bǔ)充甚至替代了信件、期刊、系列出版物和其他圖書館日常收集的材料,它對(duì)國(guó)會(huì)與公眾都有重要價(jià)值。因而,開(kāi)展這個(gè)項(xiàng)目的目的是為未來(lái)的研究者在學(xué)術(shù)、立法、創(chuàng)作、教育和其他方面的事務(wù)中提供關(guān)于當(dāng)代的文化規(guī)范、潮流、對(duì)話和事件更全面的利用材料。
2.2 主要任務(wù)。項(xiàng)目主要開(kāi)展如下工作:(1)接收數(shù)據(jù)。2010年,Twitter制定了名為Gnip的公司來(lái)完成數(shù)據(jù)移交事務(wù),之后國(guó)會(huì)圖書館和Gnip在移交“現(xiàn)行”tweets的具體要求和流程達(dá)成共識(shí),移交工作在2011年開(kāi)始。(2)建立穩(wěn)定與持續(xù)的Twitter檔案館,這是指形成穩(wěn)定和可持續(xù)的方式獲取、保存與組織Twitter不斷增長(zhǎng)的信息流。(3)探索實(shí)現(xiàn)Twitter收藏利用方法,Twitter信息在數(shù)量、增速、內(nèi)容和形式等都提出了管理與技術(shù)挑戰(zhàn),如何將這些海量信息整合成可供對(duì)外方便利用的資源需要研究[8]。
2.3 收集對(duì)象。項(xiàng)目對(duì)Twitter的收集對(duì)象主要分為三個(gè)階段:(1)對(duì)2006年至2010年12月的Twitter檔案的文本進(jìn)行全部收集,這是簽訂合約時(shí)明確規(guī)定的。(2)以更加同步的時(shí)間接收Twitter在2011年之后形成的tweets的全部文本類信息。(3)從2017年12月31日起基于國(guó)會(huì)圖書館的收集政策有選擇地收集Twitter的信息,形式上不再僅限于文本,而是包括視頻、圖片、音頻、鏈接等其他形式[9]。
2.4 參與主體。項(xiàng)目的主要參與方包括三個(gè):(1)Twitter公司,主要是明確將Twitter平臺(tái)上的信息提供于國(guó)會(huì)圖書館,并明確捐贈(zèng)、知識(shí)產(chǎn)權(quán)、利用、處置等方面的事項(xiàng)。(2)國(guó)會(huì)圖書館,信息的接收方,依據(jù)協(xié)議對(duì)信息進(jìn)行接收、保管和提供利用。(3)Gnip公司,作為Twitter公司的執(zhí)行代表與國(guó)會(huì)圖書館進(jìn)行具體事項(xiàng)的協(xié)商與落實(shí)。
2.5 成效與不足??偟膩?lái)說(shuō),國(guó)會(huì)圖書館的Twitter檔案館項(xiàng)目獲得相關(guān)領(lǐng)域內(nèi)外的關(guān)注,從項(xiàng)目啟動(dòng)到每一次的項(xiàng)目進(jìn)展都有大量的新聞媒體報(bào)道,圍繞國(guó)會(huì)圖書館選擇的合作平臺(tái)Twitter、投入的資金是否合理、項(xiàng)目的成效與目前的實(shí)踐困境等,更得到各方面的熱議??梢悦鞔_的是,項(xiàng)目確實(shí)形成了一定成果,也為類似實(shí)踐提供參考,同時(shí)也凸顯出部分問(wèn)題供學(xué)界與實(shí)踐領(lǐng)域探索。
自2010年達(dá)成協(xié)議之后,項(xiàng)目成果主要表現(xiàn)為:第一,數(shù)據(jù)接收方面,2012年2月接收了2006年到2010年的檔案,總共包含大約210億的tweets。2012年12月,接收了超過(guò)1500億2010年之后的tweets以及相關(guān)的元數(shù)據(jù)。當(dāng)前,頭12年的公共tweets都得到了接收。第二,在Twitter檔案館建設(shè)上,國(guó)會(huì)圖書館同Gnip已達(dá)成較為統(tǒng)一的整合與移交方式。移交形成了自動(dòng)化的流程,由Gnip從Twitter實(shí)時(shí)獲取tweets,整合之后上傳至安全服務(wù)器供國(guó)會(huì)圖書館全天檢索。一旦可供下載,國(guó)會(huì)圖書館就將其下載至臨時(shí)的服務(wù)器,檢查其完整性與是否損壞,及時(shí)做好統(tǒng)計(jì)工作,將其復(fù)制到磁帶中再將其從臨時(shí)服務(wù)器中刪除。第三,利用環(huán)節(jié)上,制定了部分規(guī)范,如利用應(yīng)遵循三大原則:尊重內(nèi)容形成者的意圖;遵循Twitter的利用要求;管理好納稅人提供的資源。
3 啟示:社交媒體信息檔案化管理的挑戰(zhàn)與對(duì)策
國(guó)會(huì)圖書館的Twitter檔案館項(xiàng)目自公布起便得到廣泛關(guān)注,它得到的是世界上最大的圖書館和最具影響力社交媒體平臺(tái)之一的雙重支持,由此在信息的留存上取得重要成果,形成了記憶機(jī)構(gòu)主導(dǎo)社交媒體信息檔案化的代表性模式。然而,即便是這樣較好的條件,項(xiàng)目依然面臨困境,這源于社交媒體變革了信息的形成與傳播環(huán)境,由此對(duì)信息的檔案化管理提出一系列困惑之處需進(jìn)一步思考,也為明確開(kāi)展類似項(xiàng)目的策略提供探索方向:
第一,明晰檔案化管理對(duì)象提出的挑戰(zhàn)。需要解釋的是雖然在諸多材料中都稱國(guó)會(huì)圖書館是接收所有的Twitter信息,但其實(shí)接收的只是文本類信息,只是在Twitter發(fā)展的頭些年文本信息占主流。國(guó)會(huì)圖書館調(diào)整檔案化政策明確提出從全部接收到部分接收,這確實(shí)也呈現(xiàn)了社交媒體信息檔案化在范圍設(shè)定上的困難:(1)社會(huì)類信息是項(xiàng)目的收集對(duì)象,信息的體量遠(yuǎn)遠(yuǎn)超出管理負(fù)荷。與政務(wù)類社交媒體信息不同,社會(huì)類信息由于海量的個(gè)人形成者有著龐大的信息體量,加之其幾何級(jí)增長(zhǎng)對(duì)存儲(chǔ)空間以及管理設(shè)施與人員配備提出更高的要求。然而,作為知識(shí)與記憶機(jī)構(gòu),國(guó)會(huì)圖書館的任務(wù)并不只是保管Twitter信息,甚至它只是眾多收藏中的一類,如何在多元的信息資源中評(píng)估社交媒體信息的價(jià)值并配備相應(yīng)的資源也是管理難題。(2)形式上當(dāng)前這些信息不再是以文本為主,以視頻、圖片等形式形成的視覺(jué)類信息正海量形成,因而接收的將不僅限于文本類信息,這將進(jìn)一步加重接收與保存工作的負(fù)擔(dān)。(3)如何確定收集范圍極具挑戰(zhàn)。國(guó)會(huì)圖書館提出將按照已有的收集政策,然而社交媒體信息在記錄多樣性如主體、主題、事件、形式、背景等方面都有極高的程度,同時(shí)碎片化信息又存有大量信息噪音,檔案領(lǐng)域一直都未能完全達(dá)成定論的鑒定如何應(yīng)對(duì)這些信息則更具難度,目前的收集政策往往有諸多不適之處。同時(shí),依照主題或事件的收集方式是否會(huì)破壞信息對(duì)其形成者主體的完整與真實(shí)再現(xiàn)也值得反思。(4)明確提供利用依舊是檔案化管理重要的目標(biāo)環(huán)節(jié)。收集政策調(diào)整很大程度在于為后續(xù)的管理環(huán)節(jié)提供更多實(shí)現(xiàn)的可能,國(guó)會(huì)圖書館在提供利用方面進(jìn)度的停滯很大程度在于沒(méi)有在設(shè)計(jì)和啟動(dòng)項(xiàng)目時(shí)充分理解信息整合和利用面臨的挑戰(zhàn),收集方案的變化也是為了盡可能減少技術(shù)與資源壓力,從而盡早實(shí)現(xiàn)提供利用。
第二,為應(yīng)對(duì)資源不足的問(wèn)題探析主體協(xié)作深化的方向。Twitter檔案館項(xiàng)目可謂是三方協(xié)作的成果,這得益于國(guó)會(huì)圖書館網(wǎng)絡(luò)檔案化的前瞻意識(shí)與Twitter公司的社會(huì)責(zé)任意識(shí),且得到Twitter公司指定的執(zhí)行方及時(shí)有效的落實(shí)。然而,從目前的實(shí)踐狀況來(lái)看,無(wú)論是基礎(chǔ)設(shè)施、專業(yè)方法抑或是技術(shù)上都不能提供較佳的資源。從批判視角來(lái)看,目前的協(xié)作本質(zhì)上并不充分,作為信息接收方的國(guó)會(huì)圖書館并沒(méi)有在檔案化及其之后的整合、開(kāi)發(fā)與利用上建立有效的協(xié)作框架。這也對(duì)類似的項(xiàng)目提出:(1)應(yīng)當(dāng)倡導(dǎo)更多記憶機(jī)構(gòu)的參與來(lái)共同配備資源以分解任務(wù)難度。網(wǎng)站檔案化在英、美、澳等國(guó)均有建立相關(guān)的記憶機(jī)構(gòu)聯(lián)盟,通過(guò)圖書館、檔案館、信息協(xié)會(huì)依據(jù)各自的優(yōu)勢(shì)共同制定各有分工的網(wǎng)絡(luò)檔案化并實(shí)施各自分配得到的任務(wù)早有已定傳統(tǒng)。面對(duì)Twitter這樣日活用戶以億來(lái)計(jì)的平臺(tái),若要在檔案化保存的進(jìn)度跟上形成與傳播的速度,聯(lián)合其他記憶機(jī)構(gòu)參與項(xiàng)目可能是較為必要的。(2)引入第三方社會(huì)機(jī)構(gòu)的力量。無(wú)論是商業(yè)公司還是公益性的社會(huì)機(jī)構(gòu),目前都有參與社交媒體信息檔案化的意向與實(shí)踐,如較知名的企業(yè)Archive Social與公益機(jī)構(gòu)互聯(lián)網(wǎng)檔案館,它們都在開(kāi)發(fā)針對(duì)社交媒體信息的工具,互聯(lián)網(wǎng)檔案館的重要收藏也包括這些社交媒體,因而從專業(yè)與技術(shù)角度同這類機(jī)構(gòu)展開(kāi)協(xié)作也是一個(gè)重要方法。(3)充分發(fā)揮社會(huì)公眾的集體智慧也是重要思路。公眾參與記憶機(jī)構(gòu)的資源建設(shè)已有諸多實(shí)踐,例如美國(guó)檔案與文件署的公民檔案員眾包項(xiàng)目。這些很大程度上由信息體量造成的檔案化管理挑戰(zhàn)也可以嘗試通過(guò)公眾的參與以有效分解任務(wù),英國(guó)在開(kāi)展奧運(yùn)會(huì)社交媒體檔案化項(xiàng)目時(shí)就提出類似的解決方法,即由公眾參與形成信息造成的管理困難也應(yīng)當(dāng)由公眾參與檔案化管理解決。在當(dāng)前倡導(dǎo)數(shù)字人文的框架下,公眾參與也是必然趨勢(shì)。只是需要說(shuō)明的是,如何能激發(fā)公眾參與并且提供公眾參與的政策、技術(shù)、設(shè)施等都是需要進(jìn)一步設(shè)計(jì)與規(guī)劃的。
第三,面向管理需求構(gòu)建技術(shù)能力。社交媒體信息檔案化的技術(shù)要求已不用贅述,數(shù)據(jù)的處理、移交、接收、整合、開(kāi)發(fā)、利用等無(wú)一不需要技術(shù)的支持,然而,這些環(huán)節(jié)的貫通卻不是用目前的電子文件、檔案、信息管理系統(tǒng)或是網(wǎng)站檔案化技術(shù)方案能夠解決的。這很大程度是由社交媒體信息在數(shù)量、內(nèi)容、形式、背景等方面的特殊性與復(fù)雜性造成的。例如,由跨媒介信息構(gòu)成的記錄如何實(shí)現(xiàn)整合與語(yǔ)義開(kāi)發(fā)就極具技術(shù)難度。因而,社交媒體信息檔案化管理需要充分構(gòu)建技術(shù)能力。于社交媒體信息檔案化管理而言,自動(dòng)化的流程、智能化的挖掘、即時(shí)性的利用以及充足的存儲(chǔ)空間是關(guān)鍵,這些都需要應(yīng)用各類前沿技術(shù)且需要持續(xù)升級(jí)應(yīng)用。在這其中,電子文件管理系統(tǒng)和已有的網(wǎng)站檔案化平臺(tái)都應(yīng)提供充分的基礎(chǔ)架構(gòu)與經(jīng)驗(yàn),并通過(guò)API工具調(diào)用社交媒體平臺(tái)的程序接口將信息捕獲,只是系統(tǒng)或平臺(tái)需要依據(jù)社交媒體信息的內(nèi)容、形式與背景特征調(diào)整。同時(shí),大數(shù)據(jù)、人工智能、云計(jì)算等技術(shù)應(yīng)當(dāng)充分應(yīng)用于整體的流程中,例如可通過(guò)大數(shù)據(jù)技術(shù)做好信息的組織,人工智能可幫助解決勞動(dòng)量較大的工作任務(wù)如對(duì)照識(shí)別已在平臺(tái)刪除卻在刪除前被捕獲的信息,云計(jì)算可通過(guò)靈活的分布式存儲(chǔ)盡量降低存儲(chǔ)成本。當(dāng)然,使用哪些技術(shù)與如何使用是較為復(fù)雜的問(wèn)題,這需要對(duì)技術(shù)有全面的認(rèn)識(shí),也要對(duì)檔案化管理有深刻理解,亦是在未來(lái)實(shí)踐中重點(diǎn)探索的工作內(nèi)容。
第四,同步社會(huì)環(huán)境規(guī)劃與調(diào)整實(shí)踐方案。當(dāng)前社交媒體信息檔案化管理圍繞不同主體的主導(dǎo)形成不同的模式,國(guó)會(huì)圖書館的Twitter檔案館項(xiàng)目就是典型的記憶機(jī)構(gòu)主導(dǎo)型實(shí)踐。無(wú)論是哪類實(shí)踐,目前均沒(méi)有一蹴而就的方案供參考,而是在不斷的探索中優(yōu)化,國(guó)會(huì)圖書館的收集政策調(diào)整就是如此。為做好實(shí)踐方案的規(guī)劃與調(diào)整,外部環(huán)境的明晰是要點(diǎn):(1)司法背景。社交媒體檔案化往往會(huì)涉及社交媒體平臺(tái)、形成者、記憶機(jī)構(gòu)等利益相關(guān)者的權(quán)益,因而要明確信息檔案化管理所立足的司法環(huán)境,國(guó)會(huì)圖書館與Twitter公司簽訂的合約中就明確了信息的所有接收和處理行為都是在美國(guó)聯(lián)邦的法律框架之下。(2)文化背景。在當(dāng)下社會(huì)愈來(lái)愈多的個(gè)人意識(shí)到信息價(jià)值及其帶來(lái)的隱私、被遺忘權(quán)、知識(shí)產(chǎn)權(quán)等方面的風(fēng)險(xiǎn)時(shí),對(duì)社交媒體信息的檔案化管理不再僅僅是將其作為社會(huì)文化遺產(chǎn),而是要關(guān)注背后的形成者的權(quán)益,這也就是為什么項(xiàng)目一再提及除了技術(shù)挑戰(zhàn)外提供利用不能實(shí)現(xiàn)的原因還在于部分已在平臺(tái)刪除卻在此前被接收的信息的處置方案未能形成,如果提供了這類信息的利用,那么其形成者的權(quán)益就可能受到侵犯。(3)技術(shù)背景。技術(shù)發(fā)展水平是方案設(shè)計(jì)的關(guān)鍵要素,這意味著方案是否能得到落實(shí)。國(guó)會(huì)圖書館對(duì)Twitter信息的“全盤”接收盡管在其價(jià)值和必要性都能得到充分認(rèn)證,但其并未認(rèn)識(shí)到這些信息的整合和提供利用的技術(shù)難度,更未意識(shí)到技術(shù)能力的提升未能跟上隨著跨媒介信息的增長(zhǎng)而提高的技術(shù)難度。因而,做好檔案化管理方案和自身的技術(shù)能力的匹配度評(píng)估是必要之舉。
參考文獻(xiàn):
[1]黃新榮,吳建華.政務(wù)微博檔案化保存[J].檔案與建設(shè),2012(4):4-6.
[2]Jessica Bushey. Convergence, connectivity, ephemeraland performed: new characteristics of digital photographs[J]. Archives & Manuscripts,2014,42(1):33-47.
[3]宋香蕾.政務(wù)微博檔案化模式研究[J].檔案學(xué)研究,2017(1):51-56.
[4]Helen Hockx-Yu. Archiving Social Media in the Context of Non-print Legal Deposit[EB/OL]. [2016-09-09] http://library.ifla.org/999/.
[5]高晨翔;黃新榮.我國(guó)社交媒體文件的檔案化政策研究[J].圖書館研究,2017(7):47-55.
[6]萬(wàn)凱莉.美國(guó)Twitter存檔項(xiàng)目對(duì)我國(guó)社交媒體信息檔案化的啟示[J].浙江檔案,2014 (5):8-11.
[7]LOC. Gift agreement [EB/OLl].2018-02-25 blogs.loc.gov/loc/files/2010/04/LOC-Twitter.pdf.
[8]LOC. 2013 Update on the Twitter Archive at the Library of Congress [EB/OLl]. 2018-02-25 blogs.loc.gov/loc/2013/01/update-on-the-twitter-archive-at-thelibrary-of-congress/.
[9]LOC. Update on the Twitter Archive at the Library of Congress [EB/OLl]. 2018-02-25 blogs.loc.gov/loc/2013/01/update-on-the-twitter-archive-at-thelibrary-of-congress/.
(作者單位:四川大學(xué)公共管理學(xué)院 來(lái)稿日期:2018-08-10)