任洪展
(上海大學(xué)圖書情報檔案系,上海,200444)
現(xiàn)代社會信息技術(shù)日新月異,越來越多的人參與到網(wǎng)絡(luò)生活中,在媒體領(lǐng)域,普通人逐漸掌握了話語權(quán),由此迎來了一個新的媒體時代——自媒體時代。
美國新聞學(xué)會媒體中心于2003年7月發(fā)布了由謝因波曼與克里斯威理斯聯(lián)合提出的“We Media(自媒體)”研究報告,里面對“We Media”下了一個十分嚴(yán)謹(jǐn)?shù)亩x:“We Media是普通大眾經(jīng)由數(shù)字科技強化、與全球知識體系相連之后,一種開始理解普通大眾如何提供與分享他們自身的事實、新聞的途徑?!焙喲灾?,即公民用以發(fā)布自己親眼所見、親耳所聞事件的載體[1]。自媒體平臺包括:博客、微博、微信、貼吧、論壇/BBS 等網(wǎng)絡(luò)社區(qū)。自媒體具有平民化個性化、低門檻易操作、交互強傳播快的特點,當(dāng)今許多社會熱點、突發(fā)事件的傳播與討論,都是以自媒體為重要陣地的。自媒體常被個人或組織作為其對外發(fā)聲的渠道,在自媒體中,每天都產(chǎn)生著不計其數(shù)的海量信息,這些信息雖然內(nèi)容各異,價值差異較大,但不可否認(rèn)的是,這其中有許多重要的信息不僅對現(xiàn)今人們的生產(chǎn)生活具有指導(dǎo)或輔助作用,對未來人們進(jìn)行科學(xué)研究或歷史查證也有潛在價值。這就啟發(fā)我們,在信息快速、大量產(chǎn)生而同時也快速、大量被湮沒的情況下,亟需尋求有效的方法對自媒體網(wǎng)絡(luò)信息加以歸檔保存。
自媒體網(wǎng)絡(luò)信息可分為原創(chuàng)和轉(zhuǎn)載兩種類型,本文主要討論的是原創(chuàng)類自媒體信息的檔案屬性。
人們在工作、學(xué)習(xí)、旅游、休閑等活動中因有感或有訴求而通過自媒體發(fā)布信息、狀態(tài),例如微博或QQ 空間、微信朋友圈等,人們發(fā)布在自媒體上的信息都蘊含著作者的思想,反映了一個時代人們交流方式的嬗變。這種交流平臺的簡易、便捷和有效吸引了越來越多的用戶使用自媒體,并通過這種平臺隨時隨地與別人分享自己的近況或者曝光一些社會的隱秘面,這類原創(chuàng)信息始終是自媒體平臺信息的主體,也是自媒體能夠經(jīng)久不衰的原因所在。以微博為例,公眾人物利用微博建立自己的網(wǎng)上形象,并利用微博宣傳自己;企業(yè)利用微博進(jìn)行形象宣傳、媒體公關(guān)與產(chǎn)品營銷;政府部門使用微博發(fā)布政務(wù)信息,引導(dǎo)社會輿論,維護社會穩(wěn)定……各個社會單位為塑造自身的良好形象,在使用微博發(fā)布信息時會非常注重信息的原創(chuàng)性與真實性。
個人通過自媒體發(fā)布的信息內(nèi)容一般是個人在其日常生活中,有感而發(fā)的一些心情描述或生活記錄,“個人置身于群體的框架中進(jìn)行回憶,而群體的記憶卻是通過個體記憶來傳達(dá)與實現(xiàn)的”[2]。這些“瑣碎”的記憶單個看起來也許價值不大,但從整體來看,無數(shù)條這樣的個人微博組織在一起,就成為能夠反映社會各方面情況的群體記憶。而政府或某些社會團體發(fā)布的信息,則反映了社會各個領(lǐng)域的生產(chǎn)與管理活動情況,這些內(nèi)容同樣具有社會記憶屬性,將這些信息保存起來,可作為未來某個時候考察與復(fù)原當(dāng)代人們生活面貌的重要依據(jù)。
以博客來講,“個人記憶被強烈呼喚,博客從技術(shù)上滿足了這種需要,是對私人或者是人民記憶的最好實踐。作為記錄的博客的存在,被評價為‘私人領(lǐng)域浮現(xiàn)出公共空間’、‘平凡人物群體亮相’,博客雖然是個人寫作,但是對個體的關(guān)注與時代風(fēng)云密切相關(guān),不僅如此,這無數(shù)雙眼睛補充著被時代忽略的記憶”[3]。從這方面的功能上來說,但凡自媒體平臺,大體與之類似。無數(shù)的個體的記憶匯聚在一起,能夠更加全面細(xì)致地反映當(dāng)代社會生產(chǎn)生活的原始面貌。把有價值的自媒體網(wǎng)絡(luò)信息加以歸檔保存,使其發(fā)揮社會記憶功能,對人類社會、歷史的研究與發(fā)展將是一種貢獻(xiàn)。
根據(jù)中國互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC)最新發(fā)布的第36次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計報告》顯示,截至2015年6月,我國微博客用戶規(guī)模為2.04 億,網(wǎng)民使用率為30.6%,手機端微博客用戶數(shù)為1.62億,使用率為27.3%[4]。另外,據(jù)2015微信用戶數(shù)據(jù)報告,截至2015年第一季度末,微信每月活躍用戶已達(dá)到5.49億,用戶覆蓋200多個國家、超過20種語言,各品牌的微信公眾賬號總數(shù)已經(jīng)超過800 萬個[5]。從這些數(shù)據(jù)中我們可以看出,微博客、微信等自媒體的使用范圍極其廣泛,因而其信息生產(chǎn)迅速而分散,且數(shù)量巨大,這對歸檔信息的收集和保存造成了障礙。
與傳統(tǒng)媒體相比,自媒體的信息制作主體發(fā)生了變化,由大眾傳媒的專業(yè)機構(gòu)擴大到?jīng)]有經(jīng)過新聞采編訓(xùn)練的普通大眾個體,自媒體世界中的每個人既是信息的受眾也同時是信息制作者。由于信息制作主體的廣泛性、素養(yǎng)層次不一,其所發(fā)布的信息帶有極強的個人色彩,隨意性比較強。
一方面,在現(xiàn)實社會中,一部分價值觀、理想信念扭曲的小眾對自媒體網(wǎng)絡(luò)的濫用,使自媒體成為制造傳播虛假信息的高效平臺。部分用戶為追求關(guān)注度,提高點擊率,越過自身道德底線,肆意發(fā)布道聽途說或自我編造的虛假信息,給自媒體網(wǎng)絡(luò)造成了信息污染。另一方面,“Web2.0時代,數(shù)字技術(shù)的進(jìn)步引發(fā)了傳播領(lǐng)域的變革,其本質(zhì)便是傳播主題的泛眾化。傳統(tǒng)媒介組織在信息端口把關(guān)的模式發(fā)生改變。網(wǎng)民個體可以不經(jīng)媒介組織,直接在網(wǎng)絡(luò)平臺上發(fā)布信息”[6]。這意味著針對自媒體信息發(fā)布的把關(guān)及管控的缺失或不力,使得任何個體通過自媒體發(fā)布信息處于一種放任的狀態(tài),而現(xiàn)有的法律或規(guī)定偏向于追責(zé),無法從源頭解決自媒體網(wǎng)絡(luò)信息的真實性問題。
自媒體網(wǎng)絡(luò)信息安全主要涉及兩個方面的問題,一是自媒體網(wǎng)絡(luò)中不良的、有攻擊性的信息會對人們產(chǎn)生傷害,二是各種原因造成的自媒體網(wǎng)絡(luò)信息刪除或丟失。
在互聯(lián)網(wǎng)中,網(wǎng)民素質(zhì)參差不齊,如果網(wǎng)民通過自媒體傳播一些不良信息,對他人進(jìn)行謾罵、構(gòu)陷、攻擊,相關(guān)的審查手段是沒有的,自媒體信息更新量大且迅速,即使有信息篩選或?qū)彶闄C制,也難以在其產(chǎn)生不良社會影響前得到根除,事后服務(wù)運營商或政府主管部門責(zé)令其將有害信息刪除或?qū)χ黧w進(jìn)行封號。但對于一些產(chǎn)生過較大社會影響的信息,雖然是虛假或有害的,但也有保存的需要,將這些信息及相關(guān)評論、轉(zhuǎn)發(fā)記錄與相關(guān)后果總結(jié)一并歸檔,能夠便于后人了解這一事件的來龍去脈,從而能夠更加詳實地對我們這個時代的社會狀況進(jìn)行了解與研究。
另外,目前自媒體信息暫存于運營商的數(shù)據(jù)庫中,它依賴于運營商的正常運行,隨著歷史的發(fā)展,事物都是在變化的;另外,地震、火災(zāi)、恐怖襲擊等不確定因素也是自媒體網(wǎng)絡(luò)信息及用戶數(shù)據(jù)保存的潛在威脅。例如美國“911”恐怖襲擊中,眾多大公司因其部分重要檔案、資料、數(shù)據(jù)被毀,從此一蹶不振,而事先做好異地備份的公司則沒有在那次襲擊中受到太大影響。目前我們對自媒體網(wǎng)絡(luò)信息的歸檔留存工作認(rèn)識不足,工作力度太過薄弱,有必要將其作為研究對象,加以討論研究并付諸實踐。
在國外,對網(wǎng)絡(luò)信息保存問題給予關(guān)注的主要是圖書館,有10多個國家啟動了國家級的網(wǎng)絡(luò)信息保存項目,大多以圖書館作為責(zé)任主體,我國由國家圖書館承擔(dān)的WICP項目(網(wǎng)絡(luò)信息資源采集與保存實驗項目)啟動于2003年。受圖書館職能定位的影響,由圖書館主導(dǎo)的網(wǎng)絡(luò)信息保存對象主要是數(shù)字出版物以及Web網(wǎng)頁等信息[7],而美國國家圖書館曾做過微博客信息內(nèi)容的采集與出版。由此可見,針對網(wǎng)絡(luò)信息的保存工作目前仍處于淺層階段,尤其是針對自媒體網(wǎng)絡(luò)信息的歸檔保存,始終沒有一個部門來主導(dǎo)和負(fù)責(zé)。
自媒體網(wǎng)絡(luò)信息內(nèi)容豐富,數(shù)量龐大,從檔案工作的視角來看,將各政府機構(gòu)、社會組織及個人發(fā)布在自媒體中的具有一定價值的原始記錄性信息進(jìn)行采集與歸檔保存,能夠有力地反映和輔助再現(xiàn)社會各項活動的原貌,發(fā)揮與傳統(tǒng)紙質(zhì)檔案同樣的參考與憑證作用。趙展春認(rèn)為,網(wǎng)絡(luò)信息資源的歸檔保存既是檔案部門在網(wǎng)絡(luò)時代工作職能延伸的必然要求,又是適應(yīng)網(wǎng)絡(luò)時代進(jìn)一步發(fā)揮檔案價值功能的必然選擇,網(wǎng)絡(luò)信息資源歸檔保存強調(diào)網(wǎng)絡(luò)信息資源的檔案化處理過程,與圖書館在工作內(nèi)容和目標(biāo)上有所區(qū)別,因此必然要求檔案館成為網(wǎng)絡(luò)信息資源歸檔保存的活動主體。自媒體網(wǎng)絡(luò)信息是整個網(wǎng)絡(luò)信息海洋中的一部分,“檔案工作者是建構(gòu)社會和歷史記憶的積極因素。在此過程中,他們不僅有義務(wù)保護或記錄過去,還有責(zé)任把未來的需要和期望銘記于心”[8]。因此,自媒體網(wǎng)絡(luò)信息的歸檔保存工作自然而然地應(yīng)由檔案館來主導(dǎo)。
然而,自媒體網(wǎng)絡(luò)信息的歸檔工作量大、復(fù)雜、技術(shù)要求高,僅憑檔案館一方的力量難以完成,檔案館需要尋求運營商和第三方的技術(shù)、資金、人才支持,才有可能將這項創(chuàng)新性工作持續(xù)推進(jìn)。比如與運營商合作共同開發(fā)智能應(yīng)用工具,自動篩選有價值的自媒體網(wǎng)絡(luò)信息并保存到本地;也可以招募民間志愿者,比如新浪微博中的“江寧公安在線”、“謠言檔案館”等用戶,他們經(jīng)常會總結(jié)制作一些對社會和人們產(chǎn)生影響的傳謠事件信息發(fā)布在其個人微博上,也幫助網(wǎng)友鑒定一些自媒體信息的真實性,這對減輕謠言對人們的影響,扼止虛假信息的繼續(xù)擴散有積極的作用。
以微博為例,國外應(yīng)用最廣泛的微博客Twitter網(wǎng)站推出了一款微博歸檔工具,這款工具備受用戶青睞,它的主要功能就是允許用戶將他們發(fā)布過的所有微博即他們的全部Twitter消息都下載下來,保存在本地。用戶利用這項功能可以下載的內(nèi)容包括用戶發(fā)布的微博和評論,可按月分期下載,或通過關(guān)鍵字、特定短語、標(biāo)簽和用戶名進(jìn)行搜索,以有選擇地進(jìn)行下載。
其他一些公司如谷歌(微博)和Facebook早就已經(jīng)向它們的用戶提供了下載數(shù)據(jù)的功能。Twitter推出這項功能比其他公司要晚一些,它鼓勵那些活躍的Twitter用戶回復(fù)舊微博,并且給那些微博打上#Twitter Archive的標(biāo)簽,這樣舊微博就可以再次被其他人看到[9]。在我國,自媒體服務(wù)運營商尚未推出類似的歸檔工具,只是一些民間愛好者自行制作出了類似的但功能較為簡單的信息備份工具,這種備份工具能夠使用戶將自己的信息下載保存為TXT格式。
檔案工作者對自媒體信息的采集工作所面臨的困難顯而易見。然而方法還是有的:第一種方法是截屏,這是最簡單但也是最沒有效率的方法;第二種方法是先由自媒體用戶自己下載備份自己所發(fā)布的信息,檔案館再有針對性地進(jìn)行征集,這樣做的好處是避免了用戶與檔案館之間信息使用權(quán)的糾紛,但這種方法的效率也是很難保證的;第三種方法是利用先進(jìn)的網(wǎng)絡(luò)信息采集技術(shù),實現(xiàn)自媒體網(wǎng)絡(luò)信息的智能化、成批量的抓?。坏谒姆N方法是尋求服務(wù)運營商支持,直接從其數(shù)據(jù)庫中獲取有效的自媒體網(wǎng)絡(luò)信息。第三、四種方法看起來要高效許多,但這兩種方法的施行必然會面臨許多法律上的問題,也會加大信息鑒定的工作量。因此,要做好信息采集工作,首先要處理好檔案館、用戶、運營商三方的關(guān)系,這是工作開展的前提。
為了保證所歸檔保存的自媒體網(wǎng)絡(luò)信息具有一定價值,在歸檔前需要對所采集到的信息進(jìn)行鑒定與篩選。鑒定工作主要包括兩個方面,一是對自媒體網(wǎng)絡(luò)信息價值的鑒定,二是對其真實性的鑒定。首先要保證所歸檔的自媒體網(wǎng)絡(luò)信息是有價值的,例如當(dāng)事人對社會、自然重大突發(fā)事件第一時間的親歷性報道,社會熱點話題,名人隨筆,涉及某一案件的相關(guān)文字、照片、視頻或者某項重大活動中重要人物的出席照片、視頻、言論等,這些信息在未來具有可預(yù)見的參考、憑證作用。另外要對所采集到的信息的真實性加以求證,如果信息是虛假的,在歸檔時應(yīng)標(biāo)注清楚,并列明事實。
歸檔信息的描述與組織是其能夠被檢索利用的前提。要做好自媒體網(wǎng)絡(luò)信息歸檔的描述與組織工作,首先要有一定的著錄標(biāo)準(zhǔn),目前在這一方面還有所欠缺。在技術(shù)上可行的一種方法是采用元數(shù)據(jù)格式對自媒體網(wǎng)絡(luò)信息資源進(jìn)行描述與組織,那么,我們所要解決就是元數(shù)據(jù)的采集或制作問題。都柏林核心元數(shù)據(jù)是由計算機專家、網(wǎng)絡(luò)專家和圖書館專家等人員所組成的一個非正式小組于1995年在美國俄亥俄州都柏林開發(fā)的元數(shù)據(jù)元素集。它由3個核心元數(shù)據(jù)集(內(nèi)容屬性、知識產(chǎn)權(quán)屬性、形式屬性)與15個元素(包括標(biāo)題、創(chuàng)作者、主題、摘要等)構(gòu)成。都柏林核心元數(shù)據(jù)簡單易用,并主要用于網(wǎng)絡(luò)資源的著錄和發(fā)現(xiàn),為網(wǎng)絡(luò)信息資源的檢索利用提供了很大便利[10]。構(gòu)架與創(chuàng)建規(guī)范化的元數(shù)據(jù),要按照一定標(biāo)準(zhǔn),從自媒體網(wǎng)絡(luò)信息中抽取出相應(yīng)的特征,設(shè)計一套規(guī)范的元數(shù)據(jù)格式,以實現(xiàn)對信息的規(guī)范化描述。目前在不同領(lǐng)域和不同應(yīng)用項目中已存在多種不同的元數(shù)據(jù)格式,針對自媒體網(wǎng)絡(luò)信息,我們應(yīng)綜合多方面因素,設(shè)計一套最為合適的元數(shù)據(jù)框架,這個框架應(yīng)把主題、來源、語種、創(chuàng)建者、日期、類型等元素包含進(jìn)去。
自媒體的使用群體范圍特別廣泛,因此自媒體網(wǎng)絡(luò)信息的歸檔工作會涉及到許多層面的人和事,這項工作的順利開展需要社會各方面的支持與配合,尤其需要國家層面對自媒體網(wǎng)絡(luò)秩序加以約束和規(guī)范,制訂相關(guān)的法規(guī)制度。目前來看,已有一些相關(guān)的規(guī)定或制度得以實施,比如新浪微博推出的名人、網(wǎng)站、媒體、高校、企業(yè)以及身份通認(rèn)證,微信的公眾號認(rèn)證、賬戶綁定手機號等。另外北京市2011年12月推出《北京市微博客發(fā)展管理若干規(guī)定》,實行“后臺實名,前臺自愿”的原則,此規(guī)定實施后新注冊微博用戶在注冊時必須提供真實身份信息,但用戶昵稱能夠自由設(shè)定;未進(jìn)行實名認(rèn)證的微博老用戶,將不能發(fā)言、轉(zhuǎn)發(fā),只能瀏覽。這些規(guī)定的施行有助于追溯相關(guān)信息的原始制作人,以督促用戶對其所發(fā)布的信息負(fù)責(zé),減少虛假、有害信息的發(fā)布與傳播。
有關(guān)規(guī)定對自媒體網(wǎng)絡(luò)秩序有規(guī)范作用,有助于加強信息采集的針對性,為信息歸檔工作創(chuàng)造方便。然而對于檔案館開展自媒體網(wǎng)絡(luò)信息歸檔工作來說,最有力的支持是從法律層面上賦予檔案館這方面的權(quán)利和義務(wù),這樣才能減少信息采集與歸檔工作的阻力與難度。
自媒體賦予并擴大了社會個體及非媒體組織以往所缺乏的話語權(quán),吸引了學(xué)者、名人等社會各界人士,政府機構(gòu)、社會團體等各類組織參與其中,這使得自媒體的管理與運作必將逐步向規(guī)范化的方向發(fā)展,在自媒體網(wǎng)絡(luò)平臺中生成的信息也將隨之規(guī)范化而更具有保存價值。在當(dāng)今自媒體用戶數(shù)量巨大且仍在增長,以及自媒體硬件平臺由PC端轉(zhuǎn)至移動端的情況下,自媒體網(wǎng)絡(luò)信息歸檔面臨著嚴(yán)峻的形勢,檔案館理當(dāng)審時度勢,對自媒體網(wǎng)絡(luò)信息歸檔進(jìn)行探索與實踐,這是考驗檔案館魄力的時候,也是壯大檔案事業(yè)的機遇。
[1]百 度 百 科[EB/OL].[2014- 12- 18].http://baike.baidu.com/link?url=azAG4pJyE0- mh4bodjuYtypXwVTZA_e7dBG5aT_cWvpluoxEWn1a9rJsplkORo5Ob-YLlKQ_XtcZ6-tuLxXSJervq.
[2]高萍.社會記憶理論研究綜述[J].西北民族大學(xué)學(xué)報(哲學(xué)社會科學(xué)版),2011(3):114.
[3]張莉.新媒介:被釋放的社會記憶[J].新聞與傳播研究,2012(5):28.
[4]中國互聯(lián)網(wǎng)絡(luò)信息心第36 次中國互聯(lián)網(wǎng)絡(luò)發(fā)發(fā)展?fàn)顩r統(tǒng)計報告[EB/OL].[2015-7].http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/hlwtjbg/201507/P020150723549500-667087.pdf.
[5]2015微信用戶數(shù)據(jù)報告[EB/OL].[2015-6-1].http://news.mydrivers.com/1/432/432676.htm.
[6]殷俊,孟育耀.人肉搜索與“把關(guān)人”理論的調(diào)適[J].國際新聞界,2010(2):75.
[7]趙展春.網(wǎng)絡(luò)信息歸檔保存的檔案館責(zé)任主體研究[J].檔案與建設(shè),2014(10):23.
[8][加]T·庫克.銘記未來——檔案在建構(gòu)社會記憶中的作用[J].檔案學(xué)通訊,2002(2):75.
[9]Twitter 證實正在推出用戶微博歸檔下載功能[EB/OL].[2012-12-20].http://tech.qq.com/a/20121220/000012.htm.
[10]劉家真.電子文件管理——電子文件與證據(jù)保留[M].北京:科學(xué)出版社,2009:138.