申玲玲
(陜西師范大學,西安710062;西北政法大學新聞傳播學院,西安710122)
數據新聞生產的難點與創(chuàng)新研究*
申玲玲
(陜西師范大學,西安710062;西北政法大學新聞傳播學院,西安710122)
文章在觀察與對比國內外數據新聞生產現(xiàn)狀的基礎上,將數據新聞生產的難點概括為六個方面:確定選題難、數據來源少、數據采信難、數據解讀難、視覺呈現(xiàn)難、價值開發(fā)難,并總結出了國內外目前在數據新聞生產領域的五種卓有成效的創(chuàng)新:挖掘分析、新聞應用、整合用戶數據、專業(yè)服務、跨界生產。
數據新聞;數據素養(yǎng);新聞教育;創(chuàng)新研究
《衛(wèi)報》于2009年開始數據新聞報道的實踐,此后,紐約時報等國外傳媒機構紛紛組建專門的數據新聞報道團隊,開創(chuàng)了數據新聞報道這一新的報道形式,國內則主要是四大門戶網站的新聞頻道在2012年開辟了相關欄目。2012年,GEN(Global Editors Network)發(fā)起了首屆數據新聞獎,對于數據新聞這種形式的推廣和質量的提高起到了非常重要的作用。
本文在考察國內外數據新聞生產流程和現(xiàn)狀的基礎上,思考此類新聞在制作過程中的難點和熱點,結合技術發(fā)展、用戶需求與體驗、業(yè)界的探索、傳播學規(guī)律等,探究目前國內外數據新聞的創(chuàng)新路徑。
(一)數據新聞的核心與形式
數據新聞,又稱數據驅動新聞,其前身是精確新聞,對其最早的表述之一是由Every Block的創(chuàng)始人阿德里安·哈羅瓦提于2006年提出。他認為記者應公布結構化的、機器可讀的數據,而拋開傳統(tǒng)的“大量文字”。劉義昆認為,數據新聞就是利用數據挖掘、數據分析、數據統(tǒng)計等技術手段從海量數據中發(fā)現(xiàn)新聞線索,通過可視化技術呈現(xiàn)新聞故事的新聞報道方式。[1]Bradshaw認為數據新聞的產生基于對原始數據的分析并將其放入具體的情境,再通過可視化形成新聞敘事之后在各種平臺發(fā)布而實現(xiàn)社交化?!稊祿侣勈謨浴穭t認為數據新聞就是用數據處理的新聞,它與其他的新聞形式不同之處在于創(chuàng)造了這樣一種可能性——把傳統(tǒng)的新聞敏感性和講故事的能力與大規(guī)模的數字信息結合起來。
基于既有表述,筆者認為,數據新聞的幾個核心要素主要包括:數據、新聞價值和具體的情境、一定的數據挖掘和分析方法、可視化的形式。
數據新聞并非一般意義上以數據為唯一信息表現(xiàn)形態(tài)的新聞形式。借助于相應的編程工具和繪圖軟件,數據新聞的呈現(xiàn)形式主要包括:信息圖、交互式圖表、數據地圖、時間軸、動態(tài)氣泡圖、詞云等。
與一般意義上的新聞側重于“新近發(fā)生的事實”相比,數據新聞是從海量的數據中發(fā)現(xiàn)新聞線索和故事,再對來自不同機構的數據進行篩選、比較、關聯(lián)和挖掘等加工與凸顯的過程中,尋找對公眾有意義和有價值的新聞。
(二)數據新聞的優(yōu)勢
1.過濾與凸顯。互聯(lián)網時代,各國的各級政府部門、商業(yè)公司、社會組織等生產的眾多數據會在互聯(lián)網上公開發(fā)布,但是普通網民要么極少主動地接觸這些數據,要么很難在數據間建立關聯(lián),借助于專業(yè)的數據新聞編輯和記者,這些散亂的、龐大的數據的價值可能被重估。專業(yè)的數據新聞生產者,可以依靠新聞價值和新聞敏感,圍繞特定的選題搜集、抓取業(yè)已存在的各行各業(yè)各地的數據,通過過濾等方式,發(fā)現(xiàn)其間存在的對于公眾有價值的信息,將之進行可視化,呈現(xiàn)給公眾,進而凸顯社會運行過程中的變化及其對公眾的價值,更好地履行傳播功能。
2.挖掘與解讀。數據新聞生產的關鍵在于搜集相互關聯(lián)的數據,捕捉數據背后的變化與亮點,并對此進行嘗試性解讀。數據新聞的策劃大致可以分為三個層次:一是以時間和空間為維度,直接羅列數據展示變化;二是在直接比較的基礎上加入變量,建立數據變化與重要因素之間的相關性;三是將數據放置于一定的背景中,結合其他的輔助性手段或者信息,進行復雜性解讀。當然,第三種層次的數據新聞,又不同于以往的深度報道,它是以數據展示為主,訪談等為輔。見人之所未見,是數據新聞的魅力所在。
3.設計與展示。如果說挖掘與解讀是數據新聞的內在,那么數據新聞的制作與呈現(xiàn)則關乎其吸引力與傳播效果。生理學證明,人的大腦皮層中,40%是視覺反應區(qū),人類的神經系統(tǒng)天生就對圖像化的信息更為敏感。借助于數據可視化,通過圖像在邏輯思維的基礎上進一步激發(fā)人的形象思維和空間想象能力,吸引、幫助用戶洞察數據之間隱藏的關系和規(guī)律。[2]相比于以往以文字為主的網絡新聞,數據新聞能夠脫穎而出,一是數據所反映的變化角度的“不為常人所關注”,二是數據自身的全面性或者專業(yè)性,三是視覺層面的審美,容易獲得關注、共鳴和思考。
(三)數據新聞生產的流程
數據新聞的生產流程大致可以歸納為:策劃選題—采集數據—設計內容—編寫代碼(程序)。與傳統(tǒng)新聞生產的采、編、美、印的獨立式生產流程不同,數據新聞的生產流程,幾個環(huán)節(jié)更多地是一種合作與互動的關系。采編人員負責策劃選題和搜集資料,設計人員根據既有素材和表現(xiàn)意圖等設計圖形,同時與程序員溝通,考慮方案或創(chuàng)意的實現(xiàn)難度,并進行必要的修改。方案設計過程中,有可能需要補充數據和素材。方案確定后,設計、開發(fā)和文案的工作則可以同步進行。
(一)確定選題難
數據新聞生產的核心在于選題和數據的開放程度,這些是數據新聞生產的基礎。相比于國外的“維基解密”或“棱鏡門”這樣的曝光事件帶來的龐大數據,和具有一定社會影響力的數據新聞,國內的數據新聞,則多處于描述某一單一現(xiàn)象的階段。
數據和內容上的單薄,往往用炫目的可視化效果來進行補償,個別網站的數據新聞在追求花哨的基礎上,影響了直觀、醒目的特質,如何在數據的可視化展示層面進行雕琢,還有待于進一步改進。
數據新聞能否產生社會影響力,往往取決于選題能否兼顧公眾利益、發(fā)掘常人所忽視的事件的本質。我們可以通過2013年獲獎的8個數據新聞作品來看:“美國各州同性戀權益交互地圖”、“數字解讀阿根廷內閣2004—2013支出狀況”、“英國社會層級數字計算器”、“威爾士兒童關懷狀況”等,國內數據新聞作品的選題和角度則相對單一,時空跨度較小,表現(xiàn)形態(tài)多為靜態(tài),且缺少對于重大社會問題的關注。
(二)數據來源少
數據之于數據新聞的作用如同采訪對象之于新聞報道,再好的選題都是以數據作為支撐的,數據的來源就變得異常重要。沈浩教授認為國外媒體之所以能做出很多有社會意義的數據新聞,一定程度上跟國外數據開放的政策和完善的數據開放管理機制有關;國內雖然已經開始重視數據開放,但開放的數據有限,即使開放的數據,也缺乏統(tǒng)一的管理和發(fā)布平臺。彭蘭教授認為對新聞生產中的信息圖表制作而言,數據來源一般包括:新聞中的數據資源,網絡用戶數據及網絡公共資源,政府機構、企業(yè)等開發(fā)的公開數據。[3]但是,因為各種原因,目前的數據新聞來源多為政府機構,這種狀況的出現(xiàn)或許有數據質量的考慮,但是在一定程度上卻會對數據新聞的選題形成一定的制約。另外,媒體自有數據庫的建設和發(fā)掘、社交媒體的信息也可以成為數據新聞的富礦,業(yè)界需要在這兩方面做好積累和挖掘工作。
(三)數據采信難
可信、權威的數據是制作數據新聞的基礎,數據的質量關系到數據新聞的可信度,面對公開的、目的各異的、林林總總的數據,甚至是互相“打架”的數據,制作者如何采信則成為一個重要的問題。一般而言,衡量數據質量的指標包括數據的相關度、可信度、準確度、一致性、完整度、及時性和可用性等。[4]如果系統(tǒng)考慮的話,筆者認為在此環(huán)節(jié),可以從以下幾個方面來進行衡量:(1)數據提供的主體,可以細化為主體的身份、發(fā)布數據的目的等;(2)數據獲得的規(guī)范性和專業(yè)性,包括調查具體的執(zhí)行人,調查總體、樣本量、抽樣方式、誤差大小、調查方法和數據分析等;(3)細節(jié)的核實,主要是在對具體概念的界定上要仔細,要不然名稱相同的調研,因為概念界定的不同,數據會有一定的差異。
(四)數據解讀難
數據新聞的生產者,工作的價值就是以專業(yè)的眼光代替普通受眾去發(fā)現(xiàn)生活中的變化,但是對于這種變化的講述方式是數字而非文字,若僅僅是簡單的呈現(xiàn),則低估了數據新聞應有的價值。數字,結合一定的背景信息或者輔助性信息,或者被放置于更為復雜的環(huán)境之中,會起到意想不到的作用,甚至于改變政府決策。
國內的數據新聞頻道,多側重于在圖解的過程中使用數據,直接通過解讀數據來分析事件的作品則相對有限。孤零零的數據,價值較低,但是通過不同數據串起來的信息及其間或顯或隱的關系,提高數據的解釋力,才是數據新聞生產者工作的重點。
(五)效果呈現(xiàn)難
在解讀的基礎上,制作者需要將自己的發(fā)現(xiàn)以簡潔直觀、獨特醒目的視覺效果傳播開來。這一過程更多的體現(xiàn)的是技術與藝術的結合。數據新聞的呈現(xiàn)大致可以分為兩大類:靜態(tài)呈現(xiàn)和動態(tài)交互式呈現(xiàn),國內目前的數據新聞以前者為主,國外的《紐約時報》和《衛(wèi)報》則有不少成功的交互式數據新聞。
數字可以結合新聞的進程、地圖、時間和空間等多維度進行呈現(xiàn),這種呈現(xiàn)還可以結合多媒體的表現(xiàn)方式,并借助于專業(yè)的繪圖軟件,使得情狀、進程等一目了然。
通過觀察國內各大媒體的數據新聞,筆者發(fā)現(xiàn),除了財新網“數字說”頻道有幾期采用了動態(tài)交互式之外,其余的同類頻道基本都是靜態(tài)的“圖解”形式,這種形式制作相對容易,但在視覺表現(xiàn)上比較單一。
作為一個出現(xiàn)時間并不長的新聞表現(xiàn)形式,數據新聞的制作,在當下,需要以團隊的形式來完成,新聞、技術和藝術等相結合的跨專業(yè)人才較少,因此,在制作方面,對于團隊的有效合作與溝通也提出了新的挑戰(zhàn)。環(huán)節(jié)上的難點容易解決,但是不同專業(yè)之間的有效溝通、技術團隊的精干則更為重要。
(六)價值開發(fā)難
數據新聞的生產成本(人力成本與時間成本)較高,但是其傳播的價值若僅僅局限于點擊量,則未免有點可惜。況且不是所有的數據新聞作品都必然獲得高點擊率,持續(xù)性地生產較高成本的數據新聞的動力來自何方?即使不考慮如何實現(xiàn)經濟效益,也應該在生產過程中思考數據新聞的傳播效果與價值開發(fā)。
Propublica制作的(數據)新聞應用《機會鴻溝》,其元數據來自超過全國四分之三的公立學校,由6個人耗時3個月完成,通過收集、整理龐大而細致的數據,向讀者講述了來自不同州的公立大學在人員配置、課程設置等方面的差別。筆者認為,對于已經收集和分析的數據價值,不應僅限于制作一個新聞應用,還應該開發(fā)并延伸其專業(yè)價值。
數據新聞,從形式和制作上都有別于傳統(tǒng)的新聞表現(xiàn)形式,但囿于人才、技術、觀念等因素的影響,能否在未來成為一種普遍性的新聞表現(xiàn)形式,還需打一個問號。但不容置疑的是,它的出現(xiàn),適應了社會化媒體時代民眾接收信息的特點與節(jié)奏,凸顯了專業(yè)媒體在新聞采訪之外的專業(yè)技能——整理、挖掘、呈現(xiàn),雖然存在上述諸多困難,業(yè)界仍然在執(zhí)著地探索與創(chuàng)新。
全球編輯網絡(GEN)數據新聞獎的評選類別可以從一個側面反映數據新聞在業(yè)界和實踐層面的現(xiàn)狀和趨勢。該獎項評選的主題分為四大類:數據驅動的調查性新聞、數據驅動的移動應用軟件(APP)、數據化敘事報道、數據新聞站點或機構。[5]筆者在查閱了歷次獲獎作品的資料后,將數據新聞生產在實踐層面的探索和創(chuàng)新歸納為以下五個方面:
(一)復雜的挖掘分析
“數據新聞”已從簡單描摹事件的表層現(xiàn)象轉為深入挖掘其內在本質。[6]在此期間,以解讀新聞價值、滿足實用性、接近性等需求為出發(fā)點,對復雜數據的挖掘和分析就顯得異常關鍵。
得益于政府層面對于數據開放的重視和社會化媒體的發(fā)展,媒體可以獲得龐大的開放性數據,如何建立數據之間的相關性,挖掘數據潛在的深層次價值,并以問題為導向,將之與社會公眾利益相結合,則有利于提高數據新聞的質量并擴大影響力。在日本福島核泄漏事件之后,《德國時代周報》網站“時代在線”就策劃制作了一則數據新聞:德國有多少人住在核電站附近,又有多少人住在核電站方圓30千米以內,之后用一張互動地圖展示了如果相似情況發(fā)生在德國,有多少人會被疏散。[7]該作品既給網站帶來了超乎想象的訪問量,又在社交媒體中實現(xiàn)了病毒式傳播。2014年GEN的最佳單選題報道獎獲獎作品《移民檔案》(主要從不同的開放數據源整合數據,講述飛往歐洲的移民在半路死亡的悲劇故事,以及這些事件對于歐盟各國移民政策的影響),最初是由來自數據新聞實驗室的16個學生,核查了250個事故,并且記錄每一個致命事故的日期、緯度、經度、死亡或者失蹤的人數以及原因。后由來自6個國家10個記者共同合作完成,用6個拘留中心,2769個事件,13713個移民講述所有的故事。[8]
如果說大眾傳媒具有環(huán)境監(jiān)測功能,那么,借助于高質量的數據新聞產品,在時間、空間等多維度的比較與展示中,這種監(jiān)測可以更全面、精準、細致,更有說服力。
(二)獨立的新聞應用
數據新聞的表現(xiàn)形式中有一類叫做數據新聞應用,雖然目前國內的數據新聞形式中很少見,但是國外的媒體已經做出了不少的嘗試,并且取得了較好的效果。
目前比較主流的如《衛(wèi)報》等媒體的數據新聞多是以數據地圖、交互圖表形式來呈現(xiàn)。而BBC、Propublica等則嘗試了數據新聞應用,尤其是Propublica,專門成立了一個由10位有編程基礎的成員組成的新聞應用程序團隊,新聞應用在其數據新聞(Tools&Data頻道)中的比例近乎40%,具體如“Guns”、“The Opportunity Gap”等新聞應用。
數據新聞應用這一表現(xiàn)形式,主要是用軟件代替了文字和圖片,通過小而簡的游戲或者應用,激發(fā)用戶在線參與,進而獲得大量的、有意義的數據集,幫助用戶加深對某些問題的認識。如果說交互圖表類的數據新聞制作,主要是借助于繪圖軟件,那么新聞應用則需要借助編程工具。例如,BBC網站的《英國社會層級數字計算器》[2013年“數據新聞獎”數據應用類(大型媒體組)的獲獎作品]就是一個成功的互動式新聞應用。該制作團隊與社會學家合作,建立了英國社會階層劃分的新標準,在此基礎上,開發(fā)了“英國社會層級數字計算器”,通過簡化的但又具有科學性的5道在線的單選測試題,英國普通公民可以快速獲知自己的社會階層歸屬,而且還可以表示出答題者在經濟資本、個人社會和文化資本的值的高低。財新網在去年6月推出的“搖車號HTML5游戲”,也是一次成功的嘗試。該團隊將新聞中一句并不引人注意的“去年6月北京搖車號的命中率是1/137”,利用HTML5開發(fā)成了一個搖車號的小游戲,一周的訪問量就達到150萬。
(三)龐大的用戶數據
數據新聞的數據源,一是來自于政府或企業(yè)主動公開的信息,二是依靠媒體自身積累或通過直接調查獲得的數據,但是目前國外的不少數據新聞制作方采用了抓取社交平臺上用戶生產的數據,今后,移動終端的地理信息、各種傳感器捕捉的數據也將成為數據新聞的主要素材。
在具體實踐中,制作方可以鼓勵全球用戶參與到數據新聞的生產過程中??梢圆捎谜{查的形式,直接了解民眾的態(tài)度或者傾向;也可以眾包的形式,吸納志愿者參與數據和信息的采集。其實,用戶同意分享地理位置信息,也是一種參與,這樣通過運營商記錄的數據,就可以獲得不少有價值的信息。例如《衛(wèi)報》在制作相關專題時,就比較注重對用戶調查數據的使用和價值再開發(fā)。針對當時新出爐的大選結果,網站向全球用戶征詢意見,之后根據收到的用戶反饋數據,制作了《奧巴馬再次當選美國總統(tǒng):全球民眾的態(tài)度》動態(tài)數據地圖[9],具有一定的實效性和貼近性。
(四)專業(yè)的數據服務
如何提升數據新聞的再開發(fā)價值,成為面向未來所要思考的一個重要問題。Propublica做出了一定的探索。該網站于2014年2月26日上線了數據商店頻道(Data Store),面向不同的用戶,根據數據價值的不同,制定了詳細的價格進行再銷售。此舉不僅可以彌補其高額的生產成本,擴大制作團隊的影響力,并在數據提供這一新的領域探索收費的可行性。
(五)跨界的新聞生產
數據新聞生產領域一個新的變化是跨界——跨越新聞傳播、計算機、藝術領域,跨越新媒體、研究機構、技術公司,跨越不同國家的團隊成員。正是這種集合了不同領域的智慧成果的整合式生產,數據新聞的制作門檻和專業(yè)水準都比較高。這種跨界合作,如果以合作伙伴的不同,大致可以分為三類:
一是與相關的研究機構合作。后者扮演的是智力指導或者數據提供者的角色。如政見網的“讀圖識政治”欄目,會根據選題的不同,與研究院或者媒體等聯(lián)合出品,使用合作伙伴的數據和成果制作獨一無二的數據新聞。
二是與相關的媒體機構合作。政見網的“讀圖識政治”欄目推出的“中國人的態(tài)度”就是其制作團隊與《南方周末》合作而成。
三是與可以提供龐大數據的技術公司合作。央視在2014年推出的“數據說春運”就是與百度搜索合作制作的大數據新聞報道,央視負責專題選定和新聞制作,百度公司則負責數據采集和挖掘,之后的“數據說兩會”、“數據說就業(yè)”等也采用了這種跨界合作的形式,既豐富了傳統(tǒng)新聞制作的表現(xiàn)形式,也實現(xiàn)了二者的雙贏。
[1]劉義昆.大數據時代的數據新聞生產:現(xiàn)狀、影響與反思[J].現(xiàn)代傳播,2014,(11).
[2]涂子沛.大數據[M].桂林:廣西師范大學出版社2013:101-102.
[3]彭蘭.“信息是美的”:大數據時代信息圖表的價值及運用[J].新聞記者,2013,(6).
[4]盧一波,鄧偉,彭蘭.信息圖表生產中的數據“眾包”[M].新聞界,2013,(14).
[5]http://www.globaleditorsnetwork.org/dja/
[6]史安斌,廖鰈爾.“數據新聞學”的發(fā)展路徑與前景[J].新聞與寫作,2014,(2).
[7]徐銳,萬宏蕾.數據新聞:大數據時代新聞生產的核心競爭力[J].編輯之友,2013,(12).
[8]洪燁林.全球編輯網絡數據新聞獎項揭曉[EB/ OL].djchina.org/2014/07/13/gendja_2014/.
[9]文衛(wèi)華,李冰.從美國總統(tǒng)大選看大數據時代的數據新聞報道[J].中國記者,2013,(6).
(責任編輯木木)
G206.3
A
1001-862X(2015)04-0103-005
本刊網址·在線雜志:www.jhlt.net.cn
2012年教育部人文社會科學重點研究基地重大研究項目"社會化媒體時代的媒介素養(yǎng)研究"(12JJD860005)
申玲玲(1978—),女,陜西人,陜西師范大學博士后,西北政法大學副教授,主要研究方向:新媒體。