潘亞楠
(商丘師范學(xué)院 新聞傳播學(xué)院,河南 商丘 476000)
從商業(yè)到新聞業(yè),從政商領(lǐng)袖到學(xué)術(shù)精英,大數(shù)據(jù)的話題正在迅速發(fā)酵和傳播。究竟什么是大數(shù)據(jù)(Big Data)?《大數(shù)據(jù)時代》作者維克托邁爾·舍恩伯格在書中指出,“大數(shù)據(jù)”并非一個確切的概念。最初,這個概念指需要處理的信息量過大,已經(jīng)超出了一般電腦在處理數(shù)據(jù)時所能使用的內(nèi)存量。因此工程師們必須改進處理數(shù)據(jù)的工具。而在互聯(lián)網(wǎng)對數(shù)據(jù)處理技術(shù)發(fā)展到今天,“大數(shù)據(jù)”是指無法在一定時間內(nèi)用常規(guī)軟件工具對其內(nèi)容進行抓取、管理和處理的數(shù)據(jù)集合,其主要特點是海量、非結(jié)構(gòu)化和半結(jié)構(gòu)化、實時處理。大數(shù)據(jù)的本質(zhì)在于“以一種前所未有的方式,通過對海量數(shù)據(jù)進行分析,獲得有巨大價值的產(chǎn)品和服務(wù),或深刻的洞見?!盵1]而業(yè)界通常將大數(shù)據(jù)歸納為4個“V”:Volume(數(shù)據(jù)量大),Variety(數(shù)據(jù)類型多樣),Velocity(處理速度快),Value(價值密度低)。
隨著互聯(lián)網(wǎng)的重心逐步向著移動互聯(lián)轉(zhuǎn)移,各種新型智能移動設(shè)備的迅速普及帶來海量數(shù)據(jù)的猛烈爆發(fā)。美國互聯(lián)網(wǎng)數(shù)據(jù)中心指出,互聯(lián)網(wǎng)上的數(shù)據(jù)每年將增長50%,每兩年便將翻一番,而目前世界上90%以上的數(shù)據(jù)是最近幾年才產(chǎn)生的。2010年,全球數(shù)據(jù)量達到1.2ZB,2011年中國互聯(lián)網(wǎng)行業(yè)持有數(shù)據(jù)量達到1.9EB,2011年全球被創(chuàng)建和復(fù)制的數(shù)據(jù)總量為1.8ZB(1.8萬億GB)。每天,微博twitter平均產(chǎn)生1.9億條微博,社交網(wǎng)站facebook有40億的信息擴散,視頻網(wǎng)站Youtube上傳的影片時長為5萬小時。[2]
大數(shù)據(jù)時代的到來給新聞業(yè)帶來現(xiàn)實而深刻的影響。除了政府、機構(gòu)、企業(yè)等組織發(fā)布的數(shù)據(jù),媒體、網(wǎng)站所擁有的用戶數(shù)據(jù)、互聯(lián)網(wǎng)用戶自己生產(chǎn)的內(nèi)容(UGC),都成為記者重要的數(shù)據(jù)資源。記者需要從這些龐大而碎片化的信息中發(fā)現(xiàn)有價值的新聞線索,并進行合理化地闡釋和解讀。曾長期擔(dān)任《紐約時報》記者的斯坦福大學(xué)教授Geoff于2009—2010年間開始研究數(shù)據(jù)新聞(Data Journalism)。他指出,現(xiàn)在的新聞越來越多的和數(shù)據(jù)有關(guān),媒體的責(zé)任是如何向公眾解釋復(fù)雜難懂的數(shù)據(jù)。數(shù)據(jù)的爆炸式增長使我們需要工具來進行分析,數(shù)據(jù)可視化專家正在開發(fā)工具幫助我們更好地理解和使用數(shù)據(jù),記者的工作是運用數(shù)據(jù)使新聞報道更加有說服力。
大數(shù)據(jù)時代的數(shù)據(jù)顯然具有更為廣泛而深刻的意義,特別是非結(jié)構(gòu)化數(shù)據(jù)挖掘的后臺與數(shù)據(jù)可視化的前臺呈現(xiàn),使得數(shù)據(jù)新聞在互聯(lián)時代已經(jīng)成為一種至關(guān)重要的新聞挖掘和敘事方式。
(一)深度挖掘新聞。數(shù)據(jù)不再僅僅是作為新聞?wù)Z言來呈現(xiàn)事實,而更需要記者對包括非結(jié)構(gòu)化數(shù)據(jù)在內(nèi)的海量數(shù)據(jù)上進行挖掘和深度分析,從而發(fā)現(xiàn)隱藏在數(shù)據(jù)背后的事實與真相。今天的社交媒體已經(jīng)深深滲透并影響我們的生活。除了傳統(tǒng)的采訪手段,社交媒體上大量非結(jié)構(gòu)化的數(shù)據(jù)信息,已經(jīng)成為挖掘新聞事實不可忽視的工具和陣地。2011年12月英國倫敦爆發(fā)的大規(guī)模騷亂震驚了世界,媒體需要找出背后的真正動因。英國首相卡梅倫否認(rèn)貧困因素,而將之歸咎于社交媒體的煽動作用。而《衛(wèi)報》通過對騷亂參與者居住地與英國地區(qū)經(jīng)濟狀況結(jié)合制作動態(tài)地圖,清晰地展示出暴亂參與者多居住在較為貧窮的街區(qū)。此外,研究者對推特信息進行了內(nèi)容分析,分類編碼為:重復(fù)、駁斥、質(zhì)疑、評論,并對數(shù)據(jù)進行可視化處理,指出了推特在糾正謠言方面發(fā)揮了積極作用,而非之前普遍認(rèn)為的煽動作用。
正如彭蘭教授指出的,無論多么優(yōu)秀的記者,他對于事物的觀察都只能是受制于個人的視野與立場,即使是相對深入的,也未必是全面的、充分的。而與記者在某一個視野有限的觀察點上對事物進行的觀察與分析不同的是,有效加工的大規(guī)模數(shù)據(jù)可以揭示更大范圍內(nèi)的或更接近事實的情狀,從而也為報道的深入提供了基礎(chǔ)。[3]
(二)數(shù)據(jù)可視化:更加注重新聞的視覺體驗。廣義上的“數(shù)據(jù)可視化”包括數(shù)據(jù)可視化、信息可視化以及科學(xué)可視化等等多個領(lǐng)域的統(tǒng)稱。狹義上的數(shù)字可視化指的是講數(shù)據(jù)用統(tǒng)計圖表方式呈現(xiàn),它涉足制圖學(xué)、圖形繪制設(shè)計、計算機視覺、數(shù)據(jù)采集、統(tǒng)計學(xué)、圖解技術(shù)、數(shù)形結(jié)合以及動畫、立體渲染、用戶交互等。精確新聞中常見的餅圖、直方圖、散點圖、柱狀圖等,是最原始的統(tǒng)計圖表,它們也是數(shù)據(jù)可視化的最基礎(chǔ)和常見應(yīng)用。
作為網(wǎng)絡(luò)時代至為重要的一種設(shè)計表達,數(shù)據(jù)可視化(Data Viz,data visualization),也稱之為“信息圖表”(Info graphics),其最大的特點就是融合數(shù)據(jù)信息與視覺美學(xué)元素,將冷冰冰的數(shù)據(jù)及信息通過豐富的設(shè)計語言表達,在信息能夠清晰傳達的同時注重受眾的視覺體驗。當(dāng)然,信息圖表本身在互聯(lián)網(wǎng)時代以前就廣泛存在,很多雜志及報刊在傳達數(shù)據(jù)及信息時就曾經(jīng)有過類似的設(shè)計。而在很多編輯軟件中,我們也可以輕易產(chǎn)生一些柱狀及圖餅形的數(shù)據(jù)展示。但以前的圖表著重于數(shù)據(jù)的可讀性,而今天在保證數(shù)據(jù)的可讀性前提下,也著重于數(shù)據(jù)的可觀性。
數(shù)據(jù)可視化,更加強調(diào)呈現(xiàn)方式的美觀和易接受度。除了數(shù)據(jù),圖表本身就是吸引受眾閱讀的工具。例如,《紐約時報》在總統(tǒng)大選后而制作的動態(tài)信息圖,根據(jù)“搖擺州”投票數(shù)描繪出的線條在圖片上“搖擺”,頗為直觀地表達這些“搖擺州”在歷史上是怎么“搖擺”的。網(wǎng)易數(shù)讀頻道在《中國電影票價占人均收入1/57為美國8.5倍》 這篇報道中,編輯在數(shù)據(jù)可視化的展示中,首先用觀影食品爆米花作為視覺焦點,直接點題,然后國旗指代國家,用電影票指代觀影次數(shù),對比鮮明,生動清晰地說明了中國電影票價格昂貴的情況。
正如美國北卡羅來納大學(xué)計算機系副教授、著名信息可視化博客EagerEye的作者Robert Kosara所說,餅圖之外的東西并不是沒有用的。這是一種通過視覺有效傳遞信息的手段。在可視化中如何配色,如何把信息用最自然最符合人們思維的方式傳遞給讀者是非常重要的一塊研究領(lǐng)域。[4]
(三)眾包(Crowd sourcing)與分享。分享是互聯(lián)世界的核心理念,網(wǎng)民不但提供新聞線索,而參與到新聞的制作中來。英國《衛(wèi)報》數(shù)據(jù)新聞總編Simon Rogers在介紹《衛(wèi)報》的數(shù)據(jù)新聞操作理念時就特別提到,“數(shù)據(jù)新聞是80%的努力,10%好的創(chuàng)意,10%的產(chǎn)出?!盵5]事實上,所有致力于做好數(shù)據(jù)新聞的媒體,都要花費大量的人力物力和時間來籌建數(shù)據(jù)庫資源。Rogers表示,“我們花費大量的時間建立數(shù)據(jù)庫,做成PDF文件,并重組數(shù)據(jù)。在向讀者呈現(xiàn)數(shù)據(jù)之前我們做了大量工作。我們搭建起來數(shù)據(jù)和試圖理解這個世界人們之間的橋梁?!盵6]而在數(shù)據(jù)庫的籌建過程中,從政府、商業(yè)機構(gòu)到普通的網(wǎng)民都參與進來。越來越多的國家開始建立自己的數(shù)據(jù)門戶,以促進公眾和商業(yè)機構(gòu)對政府信息的重新利用,諸如美國政府的 data.gov和英國政府的data.gov.uk、datacatalogs.org提供了此類數(shù)據(jù)的全球最新索引。英國《衛(wèi)報》的全球政府?dāng)?shù)據(jù)是一個元搜索引擎,包含許多國家的政府?dāng)?shù)據(jù)分類目錄。此外,大量免費數(shù)據(jù)可視化工具如scraperwiki、Datacouch等,使得普通網(wǎng)民就可以利用元數(shù)據(jù)制作自己的新聞圖表。
大數(shù)據(jù)時代的到來已經(jīng)正在深刻地影響著傳媒生態(tài)。面對新媒體的沖擊,傳統(tǒng)媒體需要在深度新聞的挖掘和可視化呈現(xiàn)兩個方向同時發(fā)力。彭蘭教授指出,“未來越來越多的深度報道將是數(shù)據(jù)驅(qū)動的,是基于大型數(shù)據(jù)的挖掘與分析實現(xiàn)的對新聞事實的深度揭示與解析。這無論是對于只習(xí)慣文字、圖像等思維的傳統(tǒng)新聞人,還是只習(xí)慣于數(shù)據(jù)思維的技術(shù)人,這都會是新的挑戰(zhàn)。進行跨學(xué)科的人才培養(yǎng),是未來的必然。”[7]
華中科技大學(xué)新聞與信息傳播學(xué)院教授、院長吳廷俊曾在談到新聞“復(fù)合人才”的能力培養(yǎng)時特別強調(diào),“既有深厚的人文功底、扎實的傳播理論基礎(chǔ),又具有現(xiàn)代傳播技能”。美國學(xué)者大衛(wèi)·卡拉特爾也認(rèn)為,“高校新聞教育必須讓學(xué)生掌握專門技術(shù)和關(guān)鍵語言技巧”。[8]對于當(dāng)下的“現(xiàn)代傳播技能”和“技術(shù)語言技巧”來說,無疑就是大數(shù)據(jù)帶來的新聞挖掘和敘事方式的變革。培養(yǎng)能夠利用大數(shù)據(jù)深度挖掘新聞、并利用可視化制作工具呈現(xiàn)新聞的跨學(xué)科人才已經(jīng)變得十分急迫。但對于大多數(shù)新聞院校來說,普遍缺乏相關(guān)課程的設(shè)置,甚至在新聞采寫課程中數(shù)據(jù)新聞的教授也沒有被給予重新的定義和重視。而缺乏能夠勝任此類課程的教師,也是數(shù)據(jù)新聞教育遲滯的重要原因。借鑒目前國外的一些做法和經(jīng)驗,筆者認(rèn)為目前可以從以下幾個方面著手:
首先,提高學(xué)生用“數(shù)據(jù)”講故事的能力。在傳統(tǒng)的新聞采訪與寫作課程中,應(yīng)大幅提高過去作為“邊角料”的數(shù)據(jù)新聞授課內(nèi)容。通過豐富的案例教學(xué),幫助學(xué)生深刻認(rèn)識到數(shù)據(jù)在網(wǎng)絡(luò)傳播時代至關(guān)重要的地位,并鼓勵學(xué)生利用利用互聯(lián)網(wǎng)上如政府公開的大量元數(shù)據(jù)主動練習(xí)制作數(shù)據(jù)新聞,通過社交媒體發(fā)布和傳播,提高其學(xué)習(xí)成就感。
其次,促進新聞專業(yè)與計算機專業(yè)教師的緊密合作。目前國內(nèi)很多學(xué)校已經(jīng)開設(shè)了包括網(wǎng)頁制作、數(shù)據(jù)可視化、Photoshop等課程,但這些課程往往由完全不懂新聞的計算機專業(yè)教師講授,使得技術(shù)和新聞實踐脫節(jié)。學(xué)生掌握了技術(shù),卻仍然不懂如何為新聞寫作所用。在美國,許多新聞院校早在上個世紀(jì)末就開設(shè)了數(shù)據(jù)新聞(Data Journalism)、計算機輔助新聞(CAJ,computer assistant journalism)等融合計算機技術(shù)與新聞寫作的課程,往往由具備此類工作經(jīng)驗的教師教授。建議我們在開設(shè)諸如數(shù)據(jù)新聞寫作、數(shù)據(jù)可視化這樣的課程時,應(yīng)由新聞專業(yè)教師和計算機教師共同完成,使得學(xué)生在掌握技術(shù)“武器”的基礎(chǔ)上,真正知道如何利用數(shù)據(jù)工具去挖掘和呈現(xiàn)新聞。此外,這類課程不應(yīng)僅僅針對網(wǎng)絡(luò)傳播專業(yè)的學(xué)生,應(yīng)成為新聞傳播學(xué)專業(yè)學(xué)生的基礎(chǔ)課程,在大一或大二時開設(shè)。
同時,培養(yǎng)儲備熟練掌握大數(shù)據(jù)新聞制作和表達的青年教師??焖僮兓男侣剬嵺`經(jīng)常走在理論之前,目前在國外如火如荼的數(shù)據(jù)新聞實踐也是業(yè)界自發(fā)形成的。媒體的記者和編輯自發(fā)地形成各類學(xué)習(xí)小組,學(xué)習(xí)和交流最新的新聞挖掘和制作工具。國內(nèi)不少網(wǎng)絡(luò)媒體如網(wǎng)易的《數(shù)讀》、騰訊的《大數(shù)據(jù)》以及傳統(tǒng)媒體都已經(jīng)開始積極探索數(shù)據(jù)新聞的實踐方式,應(yīng)鼓勵高校教師參與到這種探索和學(xué)習(xí)中去。
[1]維克托邁爾-施恩伯格,肯尼思·庫克耶. 大數(shù)據(jù)時代[M]. 杭州:浙江人民出版社,2013.
[2]百度百科“大數(shù)據(jù)”[EB/OL]. http://baike.baidu.com/view/6954 399.htm
[3][7]彭蘭. 大數(shù)據(jù)時代:新聞業(yè)面臨的新震蕩[J]. 編輯之友,2013,(1).
[4]視物致知. 統(tǒng)計圖和信息可視化之爭[EB/OL].http://www.civn.cn/p/3859.html.
[5][6]Data Journalism Handbook[EB/OL]. http://www.datajournalism handbook.org/1.0/en/.
[8]田華,李志. 高校新聞教育如何培養(yǎng)特色人才[J]. 青年記者,2006,(4).