王 瓊 劉真真 田 青 王文超??
數(shù)據(jù)新聞的進(jìn)程被認(rèn)為與數(shù)據(jù)時(shí)代的到來(lái),特別是信息自由法案 (FoI,F(xiàn)reedom of Information)在各國(guó)的先后通過(guò)密不可分。①Jonathan Hewett, Data Journalism, Abramis Academic Publishing, 2013, pp.3-14.進(jìn)入數(shù)據(jù)時(shí)代,數(shù)據(jù)的價(jià)值得到前所未有的重視;政府?dāng)?shù)據(jù)、機(jī)構(gòu)數(shù)據(jù)、個(gè)人數(shù)據(jù)極大豐富并逐步開(kāi)放;處理數(shù)據(jù)、分析數(shù)據(jù)、表達(dá)數(shù)據(jù)的技術(shù)日新月異;肩負(fù)傳播信息、揭示真相、檢測(cè)環(huán)境等新聞專(zhuān)業(yè)使命的記者比以往任何時(shí)候更有能力,也“更需要對(duì)大量數(shù)據(jù)進(jìn)行核實(shí)、分析和整合”。②Alex Howard, “Profile of the data journalist: the long form developer”, retrieved on May 22,2013, from the Strata, http: //strata.oreilly.com/2012/05/profile-of-the-data-journalist-10.html.挖掘數(shù)據(jù)、解讀數(shù)據(jù)、呈現(xiàn)數(shù)據(jù)的能力也因此成為新聞媒體競(jìng)爭(zhēng)力的重要構(gòu)成。 “互聯(lián)網(wǎng)之父”Tim Berners-Lee甚至宣稱(chēng):“新聞的未來(lái)就是數(shù)據(jù)分析?!?/p>
放眼全球,美國(guó)奧巴馬政府于2012年3月發(fā)布 《大數(shù)據(jù)研究和發(fā)展倡議》(Big Data Research and Development Initiative),投資2億美元以上,啟動(dòng)“大數(shù)據(jù)發(fā)展計(jì)劃”旨在提升利用大量復(fù)雜數(shù)據(jù)集獲取知識(shí)和洞見(jiàn)的能力。這被認(rèn)為是美國(guó)政府繼信息高速公路 (Information Highway)計(jì)劃之后在信息科學(xué)領(lǐng)域的又一重大舉措。聯(lián)合國(guó)于2012年5月發(fā)表名為 《大數(shù)據(jù)促發(fā)展:挑戰(zhàn)與機(jī)遇》的政務(wù)白皮書(shū),指出大數(shù)據(jù)對(duì)于聯(lián)合國(guó)和各國(guó)政府都是歷史性機(jī)遇。白皮書(shū)還探討了如何利用包括社交網(wǎng)絡(luò)在內(nèi)的大數(shù)據(jù)資源造福人類(lèi)。2013年被海內(nèi)外媒體報(bào)道為 “大數(shù)據(jù)元年”。
在中國(guó),2012年7月出版的 《大數(shù)據(jù)》作為中國(guó)大數(shù)據(jù)領(lǐng)域第一本著作,引領(lǐng)了中國(guó)社會(huì)對(duì)大數(shù)據(jù)戰(zhàn)略、數(shù)據(jù)治國(guó)和開(kāi)放數(shù)據(jù)的討論。人們開(kāi)始認(rèn)知 “大數(shù)據(jù)”的概念。2014年3月 “大數(shù)據(jù)”首次出現(xiàn)在 《政府工作報(bào)告》中,國(guó)務(wù)院常務(wù)會(huì)議一年內(nèi)6次提及大數(shù)據(jù)運(yùn)用。國(guó)務(wù)院總理李克強(qiáng)總理再次強(qiáng)調(diào):“我們正在推進(jìn)簡(jiǎn)政放權(quán),放管結(jié)合、優(yōu)化服務(wù),而大數(shù)據(jù)手段的運(yùn)用十分重要。”2015年10月,習(xí)近平在中國(guó)共產(chǎn)黨第十八屆中央委員會(huì)第五次全體會(huì)議中強(qiáng)調(diào),在 “十三五”時(shí)期,中國(guó)將大力實(shí)施國(guó)家大數(shù)據(jù)戰(zhàn)略。數(shù)據(jù)將在打造社會(huì)治理新模式、經(jīng)濟(jì)運(yùn)行新機(jī)制、民生服務(wù)新體系、創(chuàng)新驅(qū)動(dòng)新格局、產(chǎn)業(yè)發(fā)展新生態(tài)等方面發(fā)揮重要作用。
數(shù)據(jù)浪潮洶涌而至,推動(dòng)數(shù)據(jù)新聞迅猛發(fā)展。新聞業(yè)的求生創(chuàng)新、開(kāi)源軟件對(duì)技術(shù)壁壘的消解、編輯部里人員結(jié)構(gòu)的重組等因素也在其中提供助力。①錢(qián)進(jìn)、周?。骸稄某霈F(xiàn)到擴(kuò)散:社會(huì)實(shí)踐視角下的數(shù)據(jù)新聞》,《新聞?dòng)浾摺?015年第2期。加之信息化、全球化的媒介生態(tài)和 “數(shù)據(jù)”跨越語(yǔ)言、跨文化的傳播特性,使得數(shù)據(jù)新聞不僅具備更廣泛的傳播力,也將面臨更激烈的國(guó)際競(jìng)爭(zhēng)。
數(shù)據(jù)新聞是與數(shù)據(jù)時(shí)代緊密相連的命題,是21世紀(jì)新聞實(shí)踐與研究領(lǐng)域的重要景觀。全球各地的媒體競(jìng)相嘗試、不斷創(chuàng)新,理論界也展開(kāi)了多元的研究與爭(zhēng)論。
2016年3月,武漢新聞傳播學(xué)院鏑次元數(shù)據(jù)傳媒實(shí)驗(yàn)室在NICAR全球數(shù)據(jù)新聞大會(huì)上報(bào)告了中國(guó)數(shù)據(jù)新聞發(fā)展研究的部分成果。以此為起點(diǎn),我們將通過(guò)對(duì)中國(guó)數(shù)據(jù)新聞發(fā)展的持續(xù)觀察和研究,探討數(shù)據(jù)時(shí)代新聞發(fā)展的問(wèn)題和規(guī)律,并在這一前沿領(lǐng)域與國(guó)際學(xué)術(shù)界展開(kāi)交流與對(duì)話(huà)。
“數(shù)據(jù)新聞”的概念眾說(shuō)紛紜。人們嘗試從新聞呈現(xiàn)形態(tài)、新聞生產(chǎn)流程、新聞行業(yè)發(fā)展等不同角度闡釋其內(nèi)涵②方潔:《全球視野下的 “數(shù)據(jù)新聞”:理念與實(shí)踐》,《國(guó)際新聞界》2013年第6期。。對(duì)于數(shù)據(jù)新聞從何而來(lái)的問(wèn)題,國(guó)內(nèi)學(xué)者主要有三種觀點(diǎn):其一,精確新聞報(bào)道是大數(shù)據(jù)新聞的緣起③喻國(guó)明:《從精確新聞到大數(shù)據(jù)新聞——關(guān)于大數(shù)據(jù)新聞的前世今生》,《青年記者》2014年第36期。;其二,數(shù)據(jù)新聞啟蒙于計(jì)算機(jī)輔助報(bào)道④陳力丹、李熠祺、娜佳:《大數(shù)據(jù)與新聞報(bào)道》,《新聞?dòng)浾摺?015年第2期。;其三,計(jì)算機(jī)輔助報(bào)道最先出現(xiàn),其次是精確新聞和數(shù)據(jù)新聞,它們之間有一定的延續(xù)關(guān)系,但并沒(méi)有相互取代。⑤方潔:《全球視野下的 “數(shù)據(jù)新聞”:理念與實(shí)踐》,《國(guó)際新聞界》2013年第6期。
那么這些相關(guān)概念間究竟是怎樣的關(guān)系? “數(shù)據(jù)新聞”到底從何而來(lái)?帶著這兩個(gè)問(wèn)題,我們于2016年3月,在全球數(shù)據(jù)新聞發(fā)展最為興盛的美國(guó),對(duì)14家數(shù)據(jù)新聞媒體和4家數(shù)據(jù)新聞教育和研究機(jī)構(gòu)進(jìn)行了系列專(zhuān)訪(fǎng),并進(jìn)行了大量的英文文獻(xiàn)閱讀。首先,我們發(fā)現(xiàn)這些概念間的關(guān)系難于辨析,相互之間必然不會(huì)取代的原因在于這些命名均來(lái)自于新聞業(yè)界實(shí)踐,是結(jié)合特定時(shí)代背景、個(gè)人理念或技術(shù)創(chuàng)新的產(chǎn)物,并無(wú)統(tǒng)一、可比較的命名標(biāo)準(zhǔn)。例如: “計(jì)算機(jī)輔助報(bào)道”的命名和普及是計(jì)算機(jī)技術(shù)驅(qū)動(dòng)的結(jié)果。 “精確新聞”則倡導(dǎo)運(yùn)用社會(huì)科學(xué)研究方法進(jìn)行新聞報(bào)道,其命名體現(xiàn)的是其創(chuàng)始人Philip Meyer先生對(duì)社會(huì)科學(xué)研究方法的重視和增強(qiáng)新聞報(bào)道 “精確”性的理念追求。而 “數(shù)據(jù)新聞”強(qiáng)調(diào)的是通過(guò)向 “數(shù)據(jù)”提問(wèn)來(lái)進(jìn)行新聞報(bào)道,雖然其中會(huì)運(yùn)用到計(jì)算機(jī)輔助,也可能借助社會(huì)科學(xué)研究方法,但這些在其概念的描述中并未被提及。
在試圖對(duì)這些概念的關(guān)系抽絲剝繭的過(guò)程中,我們還發(fā)現(xiàn),學(xué)界和業(yè)界的思維存在較大差異。學(xué)者試圖弄清概念,建立規(guī)范,展開(kāi)反思。而記者、編輯們更在意新聞作品的獨(dú)家性、創(chuàng)新性、社會(huì)影響和價(jià)值,并不在意它們屬于哪種新聞?lì)愋?,并且他們還傾向于打破規(guī)范和界限,不斷創(chuàng)新。于是, “學(xué)界覺(jué)得業(yè)界不規(guī)范,業(yè)界覺(jué)得學(xué)界太落后”的隔閡就此產(chǎn)生。
為了能夠在學(xué)界與業(yè)界中達(dá)成對(duì)話(huà),在對(duì) “數(shù)據(jù)新聞”進(jìn)行界定時(shí),我們嘗試遵循這樣的原則:學(xué)術(shù)研究負(fù)責(zé)凝練本質(zhì) (核心),而不著重于劃定邊界。反過(guò)來(lái),媒體可以不斷創(chuàng)新、拓展或改變邊界,但應(yīng)堅(jiān)守底線(xiàn)。我們認(rèn)為學(xué)界與業(yè)界對(duì)數(shù)據(jù)新聞的 “核心”和 “底線(xiàn)”達(dá)成共識(shí)的可能性是存在的。
因此,我們將 “數(shù)據(jù)新聞”界定為 “基于數(shù)據(jù)科學(xué)的知識(shí)和技術(shù),通過(guò)或結(jié)合數(shù)據(jù)分析,對(duì)事實(shí)進(jìn)行的新聞報(bào)道”。這樣界定的原因在于,我們理解 “本質(zhì)”應(yīng)該是去掉所有龐雜的、或有或無(wú)的及可能引起誤解或偏見(jiàn)的詞語(yǔ)之后凝練的部分。例如,數(shù)據(jù)抓取、數(shù)據(jù)清洗、數(shù)據(jù)挖掘、數(shù)據(jù)可視分析等詞語(yǔ)時(shí)常出現(xiàn)在一些對(duì)數(shù)據(jù)新聞界定的描述中,但我們認(rèn)為這些都是“數(shù)據(jù)分析”的必然前提或可能的過(guò)程,不必贅述。那么數(shù)據(jù)新聞的底線(xiàn)何在呢?數(shù)據(jù)新聞是數(shù)據(jù)科學(xué)與新聞學(xué)的結(jié)合,因此我們認(rèn)為其底線(xiàn)就是要同時(shí)遵循數(shù)據(jù)科學(xué)倫理和新聞倫理。
原英國(guó)衛(wèi)報(bào)數(shù)據(jù)新聞?dòng)浾逽imon Rogers①Simom Rogers是英國(guó)數(shù)據(jù)新聞界的代表人物,1998年9月至2013年4月供職于英國(guó)衛(wèi)報(bào),曾創(chuàng)辦英國(guó)衛(wèi)報(bào)的數(shù)據(jù)博客 (Data Blog)。2013年5月加入Twitter,開(kāi)始大數(shù)據(jù)新聞的編輯工作。其個(gè)人職業(yè)經(jīng)歷也被視作傳統(tǒng)媒體記者轉(zhuǎn)向數(shù)據(jù)新聞,進(jìn)而轉(zhuǎn)向科技企業(yè)的典型。指出,早在數(shù)據(jù)新聞這一概念出現(xiàn)前,西方記者就已在新聞中使用數(shù)學(xué)計(jì)算方法進(jìn)行輔助報(bào)道,其中代表媒體為英國(guó)的 《衛(wèi)報(bào)》及美國(guó)的 《今日美國(guó)》(USA Today)。②Constance Tabary, Anne-Marie Provost, and Alexandre Trottier, Data Journalism's Actors,Practices and Skills: A Case Study from Quebec, Canada: Université du Québec à Montréal, 2016.Simon Rogers認(rèn)為 “數(shù)據(jù)新聞”的實(shí)踐甚至可追溯到19世紀(jì)。1821年5月5日,英國(guó)《衛(wèi)報(bào)》創(chuàng)刊第一期刊登了一篇調(diào)查未成年人教育系統(tǒng)的報(bào)道,雖然當(dāng)時(shí)數(shù)據(jù)處理的技術(shù)無(wú)法與今天相比,但報(bào)道動(dòng)機(jī)和今天如出一轍。③Simon Rogers, “The First Guardian data Journalism”, May 5,1821, retrieved on May 22, 2013.From the Guardian, http: //www.guaedian.co.uk/news/datablog/2011/sep/26/data-journalismguardian.
同樣在報(bào)道中使用數(shù)學(xué)計(jì)算方法進(jìn)行輔助報(bào)道的還有計(jì)算機(jī)輔助報(bào)道、精確新聞和計(jì)算新聞。1952年,美國(guó)CBS廣播公司借助當(dāng)時(shí)政府所有的大型計(jì)算機(jī)進(jìn)行美國(guó)總統(tǒng)大選報(bào)道,被認(rèn)為是計(jì)算機(jī)輔助報(bào)道的最早案例。此后數(shù)年,因?yàn)橛?jì)算機(jī)尚未普及,計(jì)算機(jī)輔助報(bào)道并未很快流行起來(lái)。到了20世紀(jì)60年代,Philip Meyer提出了精確新聞 (Precision Journalism)的概念,并擬寫(xiě)了 《精確新聞:新聞中社科研究方法的運(yùn)用》 (Precision Journalism:A Reporter's Introduction to Social Science Methods) 一書(shū),④Sylvain Parasie, Precision Journalism: A Reporter's Introduction to Social Science Methods, France:Paris Descartes University, 2012.幫助記者更好地掌握運(yùn)用社會(huì)科學(xué)方法進(jìn)行報(bào)道。其后,隨著計(jì)算機(jī)在各行各業(yè)的普及、運(yùn)用,及個(gè)人電腦的高速發(fā)展,計(jì)算機(jī)輔助報(bào)道 (CAR,或computer assisted reporting)逐漸興盛。1995年Brant Houston出版了專(zhuān)著 《計(jì)算機(jī)輔助報(bào)道》,至今已更新四版,是目前全美高校數(shù)據(jù)新聞教育中使用率最高的 一本書(shū),使用率為14%。①Charles Berret and Cheryl Phillips, Teaching Data and Computational Journalism, New York:Rosemont Press, 2016, p.39.
“數(shù)據(jù)新聞”(Data Journalism)一詞的誕生遠(yuǎn)晚于數(shù)學(xué)計(jì)算方法在新聞中的運(yùn)用。根據(jù)文獻(xiàn)顯示,該詞是由Every Block的創(chuàng)始人Adrian Holovaty于2006年提出。同年,Chicago Tribue開(kāi)設(shè)了專(zhuān)欄Chicago Crime②http: //crime.chicagotribune.com/.,用交互數(shù)據(jù)新聞的形式展示市民最為關(guān)心的城市安全問(wèn)題。該作品至今仍在更新。持續(xù)的數(shù)據(jù)幫助人們避免從單一事件的媒體報(bào)道中獲得片面化的見(jiàn)解。如下圖1所示,折線(xiàn)圖呈現(xiàn)了芝加哥從2001年至今的犯罪率變化。數(shù)據(jù)顯示總體犯罪率在逐漸下降。此外,該作品通過(guò)熱力圖展現(xiàn)不同區(qū)域犯罪量的差異,顏色越深代表犯罪量越大;還將槍擊案、兇殺案等主要案件數(shù)據(jù)以圓點(diǎn)映射在地圖上,鼠標(biāo)滑過(guò)即可顯示該點(diǎn)的案發(fā)時(shí)間、地點(diǎn)和受害人數(shù) (見(jiàn)圖2)。
圖2 “Chicago Crime”作品截圖
而在谷歌趨勢(shì) (Google Trends)能夠檢索到的記錄中,“數(shù)據(jù)新聞”一詞最早出現(xiàn)在2010年末。當(dāng)時(shí)正值 “互聯(lián)網(wǎng)之父”的Tim Berners-Lee敦促英國(guó)記者挖掘政府發(fā)布的最新海量數(shù)據(jù)。同年,數(shù)據(jù)新聞在對(duì)維基解密的報(bào)道中聲名鵲起。維基解密揭露了大量伊拉克戰(zhàn)爭(zhēng)及阿富汗戰(zhàn)爭(zhēng)的數(shù)據(jù)記錄。記者們常用的文字、圖片及音視頻等技術(shù)均無(wú)法在有限的篇幅實(shí)現(xiàn)對(duì)這些復(fù)雜信息的分析和呈現(xiàn)。英國(guó) 《衛(wèi)報(bào)》另辟蹊徑,于10月23日發(fā)布了一張名為 “Wikileaks Iraq War Logs:Every Death Mapped”①該作品網(wǎng)址, http: //www.theguardian.com/world/datablog/interactive/2010/oct/23/wikileaksiraq-deaths-map。的交互可視化地圖(見(jiàn)圖3)。
圖3 “Wikileaks Iraq War Logs:Every Death Mapped” 作品截圖
這張地圖將伊拉克戰(zhàn)爭(zhēng)中多達(dá)39.1萬(wàn)條左右的傷亡數(shù)據(jù)用紅色圓點(diǎn)映射于地圖之上。當(dāng)鼠標(biāo)點(diǎn)擊紅點(diǎn)后彈出窗口,呈現(xiàn)傷亡人數(shù)、時(shí)間、傷亡原因的詳細(xì)信息。這篇至今被視作經(jīng)典的作品成功地借助數(shù)據(jù)交互可視化敘事完成了對(duì)大體量、復(fù)雜數(shù)據(jù)進(jìn)行報(bào)道的任務(wù),也將數(shù)據(jù)新聞推向了新的篇章——以大數(shù)據(jù)分析見(jiàn)長(zhǎng)的計(jì)算新聞 (Computional Journalism)。
時(shí)至今日,在以美國(guó)和英國(guó)為代表的很多西方國(guó)家,從具有全國(guó)影響力的媒體,如 《紐約時(shí)報(bào)》 (New York Times)、美聯(lián)社 (Associated Press)、英國(guó) 《衛(wèi)報(bào)》(The Guardians)等,到一些超本地社區(qū)媒體,如Observer media group、Scripps等,都設(shè)立了不同規(guī)模的數(shù)據(jù)新聞部或數(shù)據(jù)編輯組。Google、Twitter等擁有數(shù)據(jù)資產(chǎn)和數(shù)據(jù)能力的科技公司也從傳統(tǒng)媒體挖來(lái)數(shù)據(jù)新聞?dòng)浾吆途庉嫞瑢?zhuān)門(mén)研究和發(fā)布自有數(shù)據(jù)。①例如曾供職于英國(guó)衛(wèi)報(bào)的數(shù)據(jù)編輯Simon Rogers先后于2013年和2015年被Twitter和Google聘請(qǐng)專(zhuān)門(mén)從事大數(shù)據(jù)趨勢(shì)分析的工作。
亞洲數(shù)據(jù)新聞的起步比歐美相對(duì)較晚。就日本而言,直到2011年,大地震和緊隨其后的核泄漏意外成為數(shù)據(jù)新聞迅速發(fā)展的助力。災(zāi)難語(yǔ)境下公眾對(duì)于數(shù)據(jù)開(kāi)放的呼聲遠(yuǎn)高于其他任何時(shí)候,但往往此時(shí)卻是政府?dāng)?shù)據(jù)公開(kāi)問(wèn)題百出的時(shí)候,數(shù)據(jù)的隱瞞、造假讓公眾對(duì)政府和專(zhuān)家的數(shù)據(jù)公布真實(shí)性存疑。而此時(shí)如果記者擁有獨(dú)立、成熟的數(shù)據(jù)搜集、處理和呈現(xiàn)能力,就能為公眾提供一個(gè)有別于政府、可信度更高的信息源,這既能夠幫助記者適應(yīng)媒介環(huán)境的不斷變化,也有助于記者合理使用自己的話(huà)語(yǔ)權(quán),承擔(dān)社會(huì)責(zé)任。
在中國(guó),早在2008年,就曾有一本叫作 《天津汽車(chē)》的雜志開(kāi)設(shè)了“數(shù)據(jù)新聞專(zhuān)欄”。從資料圖片來(lái)看 (見(jiàn)圖4),其形態(tài)是典型的文字加數(shù)據(jù)圖表的形式。中國(guó)媒體的數(shù)據(jù)新聞實(shí)踐可能實(shí)際上比這更早,只不過(guò)因?yàn)榧夹g(shù)條件等原因的限制,未能保存至今并被檢索到。
圖4 2008年3月 《天津汽車(chē)》的封面和 “數(shù)據(jù)新聞”專(zhuān)欄
但能夠確定的是,近年來(lái)隨著 “數(shù)據(jù)新聞”概念的普及,國(guó)內(nèi)各大媒體紛紛啟動(dòng)該領(lǐng)域的發(fā)展 (見(jiàn)圖5),重新掀起了 “數(shù)據(jù)新聞”的浪潮。這波浪潮發(fā)端于2011年,以搜狐新聞?dòng)?011年5月設(shè)立 “數(shù)字之道”專(zhuān)欄為標(biāo)志。一年之后,到2012年6月,由搜狐、網(wǎng)易、騰訊、新浪組成的中國(guó)四大門(mén)戶(hù)網(wǎng)站全部啟動(dòng)數(shù)據(jù)新聞的內(nèi)容布局。到2015年,這些數(shù)據(jù)新聞專(zhuān)欄的內(nèi)容和形式與設(shè)立之初相比并無(wú)顯著變化。
圖5 中國(guó)數(shù)據(jù)新聞媒體發(fā)展時(shí)間軸
2012年2月,財(cái)新傳媒成立數(shù)據(jù)可視化實(shí)驗(yàn)室,領(lǐng)先其他新媒體幾乎一年。其代表作 《青島中石化管道爆炸事故》獲得亞洲出版業(yè)協(xié)會(huì)(SOPA)“2014年度卓越新聞獎(jiǎng)”; 《星空彩繪諾貝爾》入圍英國(guó) “數(shù)據(jù)之美”大獎(jiǎng) (Information Is Beautiful Awards);2014年11月, 《周永康的人與財(cái)》獲騰訊傳媒大獎(jiǎng)首度設(shè)立的 “年度數(shù)據(jù)新聞”獎(jiǎng)。這些作品至今被視為業(yè)內(nèi)經(jīng)典。2013年新華網(wǎng)、人民網(wǎng)先后組建數(shù)據(jù)新聞團(tuán)隊(duì),其中新華網(wǎng)的數(shù)據(jù)新聞團(tuán)隊(duì)有18個(gè)人,在2015年底之前,是中國(guó)媒體專(zhuān)屬的規(guī)模最大的數(shù)據(jù)新聞團(tuán)隊(duì)。新華網(wǎng) 《數(shù)據(jù)新聞》專(zhuān)欄結(jié)合新華網(wǎng)融媒體未來(lái)研究院的技術(shù)研發(fā),將生物傳感器應(yīng)用于數(shù)據(jù)新聞,制作了 《戰(zhàn)馬襲心》觀劇體驗(yàn)報(bào)告。與新華網(wǎng)數(shù)據(jù)新聞團(tuán)隊(duì)在規(guī)模上幾乎相當(dāng)?shù)氖桥炫刃侣劦?“美術(shù)課”,成立于2014年7月。其交互信息可視化作品 《甲午輪回》獲得首屆中國(guó)數(shù)據(jù)新聞大賽三等獎(jiǎng)。進(jìn)入2015年,數(shù)據(jù)新聞團(tuán)隊(duì)幾乎成為新媒體的 “標(biāo)配”。無(wú)界和九派更將數(shù)據(jù)新聞提升至戰(zhàn)略布局的高度①來(lái)自對(duì)無(wú)界和九派兩家媒體相關(guān)負(fù)責(zé)人的訪(fǎng)談。。
傳統(tǒng)媒體中,較早開(kāi)始為數(shù)據(jù)新聞和數(shù)據(jù)可視化設(shè)立專(zhuān)欄的是 《第一財(cái)經(jīng)》和 《新京報(bào)》(均始于2013年)。其中 《新京報(bào)》的專(zhuān)欄到2015年底之前,從團(tuán)隊(duì)構(gòu)成到專(zhuān)欄內(nèi)容和形式均變化不大。但 《第一財(cái)經(jīng)》到2015年時(shí),不僅將 “城市新一線(xiàn)”從一個(gè)專(zhuān)欄孵化成旗下獨(dú)立的 “新一線(xiàn)城市研究室”,而且還設(shè)立了數(shù)據(jù)新聞客戶(hù)端 “DT財(cái)經(jīng)”。2014年上半年起,以中央電視臺(tái)、浙江衛(wèi)視、湖北衛(wèi)視、江蘇衛(wèi)視等為代表的電視臺(tái)都開(kāi)始陸續(xù)不定期推出獨(dú)家數(shù)據(jù)新聞專(zhuān)題報(bào)道。其中中央電視臺(tái)于2015年投入700多萬(wàn)元,推出7集專(zhuān)題 《數(shù)說(shuō)中國(guó)命運(yùn)共同體》。其制作投入和社會(huì)影響力均為常規(guī)數(shù)據(jù)新聞報(bào)道無(wú)法比擬,但中央電視臺(tái)至今并未組建專(zhuān)門(mén)的數(shù)據(jù)新聞團(tuán)隊(duì)及開(kāi)設(shè)穩(wěn)定的數(shù)據(jù)新聞專(zhuān)欄。
此外值得關(guān)注的是自媒體和獨(dú)立研究團(tuán)隊(duì)對(duì)中國(guó)數(shù)據(jù)新聞發(fā)展的參與。2013年10月,《南風(fēng)窗》以?xún)?nèi)部孵化項(xiàng)目的形式推出 “圖政工作室”,以微信號(hào) “一圖觀政”進(jìn)行時(shí)政數(shù)據(jù)新聞的發(fā)布。但據(jù)其創(chuàng)始人戴玉介紹,《南風(fēng)窗》并未對(duì)該項(xiàng)目投入資金和人力的實(shí)質(zhì)支持,因此在2015年戴玉離職后,“一圖觀政”成為一個(gè)脫離傳統(tǒng)媒體背景的自媒體。武漢大學(xué)鏑次元數(shù)據(jù)傳媒實(shí)驗(yàn)室是有較為穩(wěn)定數(shù)據(jù)新聞發(fā)布的獨(dú)立研究團(tuán)隊(duì)的代表。實(shí)驗(yàn)室成立于2015年1月,依托武漢大學(xué)跨學(xué)科的資源,成立了由新聞與傳播學(xué)院、信息管理學(xué)院、計(jì)算機(jī)科學(xué)學(xué)院、統(tǒng)計(jì)學(xué)院、城市設(shè)計(jì)學(xué)院等不同學(xué)院的教師和學(xué)生共同參與組成的數(shù)據(jù)新聞團(tuán)隊(duì)。團(tuán)隊(duì)關(guān)注社會(huì)熱點(diǎn)、探索業(yè)務(wù)創(chuàng)新,與澎湃美術(shù)課、騰訊新聞百科、長(zhǎng)江云、知識(shí)分子等多家媒體合作發(fā)布眾多具有較大影響力的數(shù)據(jù)新聞作品。除了數(shù)據(jù)新聞的生產(chǎn)實(shí)踐之外,鏑次元還通過(guò)微信公眾號(hào)和在線(xiàn)沙龍的方式,嘗試在數(shù)據(jù)新聞學(xué)界與業(yè)界及相關(guān)領(lǐng)域之間搭建跨界融合和對(duì)話(huà)的空間,積極參與推動(dòng)中國(guó)數(shù)據(jù)新聞的發(fā)展。
縱覽中國(guó)數(shù)據(jù)新聞發(fā)展的時(shí)間線(xiàn)可以看到,具有深厚技術(shù)和互聯(lián)網(wǎng)基因的門(mén)戶(hù)網(wǎng)站在數(shù)據(jù)新聞?lì)I(lǐng)域的布局最早,但就其規(guī)模和發(fā)展速度而言不及新媒體。中央電視臺(tái)作為傳統(tǒng)媒體的代表比四大門(mén)戶(hù)網(wǎng)站和擁有傳統(tǒng)媒體背景的新媒體都更晚開(kāi)始數(shù)據(jù)新聞的生產(chǎn)和傳播,但其資源和投入的能力卻異常顯著。此外,資本對(duì)數(shù)據(jù)新聞的介入在2015年開(kāi)始顯現(xiàn)。DT財(cái)經(jīng)、新一線(xiàn)城市研究室和無(wú)界傳媒均有阿里投資,九派新聞則有中潤(rùn)普達(dá)作為股東之一。
數(shù)據(jù)新聞對(duì)數(shù)據(jù)價(jià)值的挖掘和傳播是其獲得資本青睞的重要原因。然而水能載舟亦能覆舟,資本在為中國(guó)數(shù)據(jù)新聞發(fā)展帶來(lái)助力的同時(shí)也帶來(lái)了資本市場(chǎng)利益驅(qū)動(dòng)造成的不確定性,例如有的團(tuán)隊(duì)因資本撤出而無(wú)法繼續(xù),有的團(tuán)隊(duì)因受資本話(huà)語(yǔ)權(quán)的主導(dǎo)而在新聞生產(chǎn)的方向性上舉棋不定①應(yīng)受訪(fǎng)團(tuán)隊(duì)要求,此處隱去具體團(tuán)隊(duì)名稱(chēng)。。傳統(tǒng)媒體的數(shù)據(jù)新聞發(fā)展相對(duì)較緩的原因除了機(jī)制制約之外,也與傳統(tǒng)媒體從業(yè)者人員結(jié)構(gòu)性調(diào)整難度較大,及數(shù)據(jù)新聞在短期內(nèi)無(wú)法兌現(xiàn)盈利能力相關(guān)。但在不同類(lèi)型媒體中達(dá)成共識(shí)的是, “數(shù)據(jù)新聞是媒介創(chuàng)新的排頭兵”,能夠產(chǎn)生具有創(chuàng)新性和傳播力的高質(zhì)量新聞作品,為媒體贏得新聞獎(jiǎng)項(xiàng)和較高的專(zhuān)業(yè)聲譽(yù)與影響力。
以 “數(shù)據(jù)新聞”為關(guān)鍵詞在CNKI數(shù)據(jù)庫(kù)中進(jìn)行檢索,可以看到國(guó)內(nèi)相關(guān)研究的學(xué)術(shù)關(guān)注度自2012年起出現(xiàn)顯著增長(zhǎng)。(見(jiàn)圖6)
圖6 “數(shù)據(jù)新聞”學(xué)術(shù)關(guān)注度變化趨勢(shì)
已有研究主要集中于以下幾個(gè)方面:其一,數(shù)據(jù)新聞的內(nèi)涵和分類(lèi);其二,通過(guò)國(guó)內(nèi)外數(shù)據(jù)新聞實(shí)踐的案例分析探討數(shù)據(jù)新聞的交互性、可視化等特點(diǎn),及其對(duì)新聞業(yè)帶來(lái)的創(chuàng)新與挑戰(zhàn);其三,剖析數(shù)據(jù)新聞的問(wèn)題,并提出解決對(duì)策,包括人才短缺、資源受限、受眾參與、理論對(duì)話(huà)失衡等方面;其四,數(shù)據(jù)可視化與數(shù)據(jù)敘事;其五,數(shù)據(jù)新聞?dòng)J?。①陳昌鳳:《數(shù)據(jù)新聞及其結(jié)構(gòu)化:構(gòu)建圖式信息——以 〈華盛頓郵報(bào)〉的地圖新聞為例》,《新聞與寫(xiě)作》2013年第6期,第92~94頁(yè);方潔:《全球視野下的 “數(shù)據(jù)新聞”:理念與實(shí)踐》,《國(guó)際新聞界》2013年第6期;鐘瑛、李蘇: 《數(shù)據(jù)新聞的發(fā)展現(xiàn)狀、問(wèn)題及對(duì)策》,《新聞與寫(xiě)作》2015年第8期,第26~30頁(yè);章戈浩: 《作為開(kāi)放新聞的數(shù)據(jù)新聞——英國(guó) 〈衛(wèi)報(bào)〉的數(shù)據(jù)新聞實(shí)踐》, 《新聞?dòng)浾摺?013年第6期,第7~13頁(yè);劉義昆:《大數(shù)據(jù)時(shí)代的數(shù)據(jù)新聞生產(chǎn):現(xiàn)狀、影響與反思》,《現(xiàn)代傳播》2014年11期;郎勁松、楊海:《數(shù)據(jù)新聞:大數(shù)據(jù)時(shí)代新聞可視化傳播的創(chuàng)新路徑》,《現(xiàn)代傳播》2014年第3期,第32~36頁(yè);毛良斌、湯子帥、周昊曦:《數(shù)據(jù)新聞的盈利模式》, 《新聞與寫(xiě)作》2015年第11期,第29~33頁(yè)。
相關(guān)專(zhuān)著有三本,分別是喻國(guó)明等著的 《新聞傳播的大數(shù)據(jù)時(shí)代》,探討了大數(shù)據(jù)對(duì)新聞業(yè)態(tài)的重構(gòu)和大數(shù)據(jù)新聞的功能與價(jià)值;方潔編著的《數(shù)據(jù)新聞概論:操作理念與案例解析》,較為全面地介紹了數(shù)據(jù)新聞的基本特征與構(gòu)成要素,并結(jié)合國(guó)內(nèi)外的經(jīng)典案例系統(tǒng)地研究了中外數(shù)據(jù)新聞操作規(guī)律;劉義昆、董朝編著的 《數(shù)據(jù)新聞設(shè)計(jì)》,結(jié)合豐富案例對(duì)數(shù)據(jù)新聞的制作理念、表現(xiàn)形式、設(shè)計(jì)要素等進(jìn)行了系統(tǒng)介紹和闡釋。
國(guó)外數(shù)據(jù)新聞的研究比國(guó)內(nèi)起步更早,發(fā)展更快。2011年,由 《衛(wèi)報(bào)》、BBC、《紐約時(shí)報(bào)》、《華盛頓郵報(bào)》等一線(xiàn)媒體的資深記者協(xié)作完成的 《數(shù)據(jù)新聞手冊(cè)》問(wèn)世,該書(shū)作為數(shù)據(jù)新聞的開(kāi)山之作,對(duì)數(shù)據(jù)新聞概念、生產(chǎn)實(shí)踐情況進(jìn)行了較為系統(tǒng)的介紹。其后涌現(xiàn)出一批偏重實(shí)務(wù)操作的理念和技術(shù)的著作,如Data Journalism Heist和Scraping for Journalists主要介紹數(shù)據(jù)挖掘技術(shù)和方法;Data Literacy系統(tǒng)講解數(shù)據(jù)新聞?dòng)浾邞?yīng)具備的數(shù)據(jù)素養(yǎng)和相關(guān)技巧。最新出版的著作是John Mair、Tom Felle等編著的兩本論文集,Data Journalism:Mapping the Future和Data Journalism:Inside the Global Future。論文集收錄了眾多記者、技術(shù)專(zhuān)家、理論學(xué)者就數(shù)據(jù)新聞發(fā)展、數(shù)據(jù)新聞教育、不同國(guó)家和地區(qū)數(shù)據(jù)新聞生產(chǎn)現(xiàn)狀等相關(guān)問(wèn)題的思考。
在實(shí)踐研究方面,國(guó)外學(xué)者早期也以具有影響力和代表性的數(shù)據(jù)新聞媒體為研究對(duì)象,2014年之后,研究者的視野更加宏觀,對(duì)瑞典、挪威、比利時(shí)、英國(guó)和美國(guó)等國(guó)家及地區(qū)的數(shù)據(jù)新聞發(fā)展情況的研究逐漸出現(xiàn)①Ester Appelgren and Gunnar Nygren, “Data Journalism in Sweden”, Digital Journalism (2014),Vol.2, No.3, pp.394-405; Juliette De Maeyer et al., “Waiting for Data Journalism”, Digital Journalism (2015),Vol.3,No.3,pp.432-446; Megan Knight, “Data journalism in the UK:a preliminary analysis of form and content”, Journal of Media Practice (2015), Vol.16, No.1,pp.55-72; Katherine Fink and C.W.Anderson, “Data Journalism in the United States”,Journalism Studies (2015), Vol.16, No.4, pp.467-481.。其中,“Data Journalism in the UK”采用內(nèi)容分析的定量研究方法通過(guò)對(duì)英國(guó)主流媒體數(shù)據(jù)新聞選題、數(shù)據(jù)來(lái)源、呈現(xiàn)方式的分析,探討了數(shù)據(jù)新聞在英國(guó)的發(fā)展不均衡的行業(yè)現(xiàn)狀。 “Waiting for Data Journalism”和 “Data Journalism in the United States”運(yùn)用訪(fǎng)談法分別研究了數(shù)據(jù)新聞在比利時(shí)和美國(guó)的發(fā)展情況,指出了時(shí)間和資源的缺乏是阻礙這些國(guó)家和地區(qū)的數(shù)據(jù)新聞發(fā)展的重要原因。
國(guó)外學(xué)者對(duì)技術(shù)問(wèn)題關(guān)注度較高,并陸續(xù)提出新的方法和模型。其中,“Chances and Challenges of Computational Data Gathering and Analysis”②Niina Sormanen et al., “Chances and Challenges of Computational Data Gathering and Analysis”,Digital Journalism (2016), Vol.4, No.1, pp.55-74.介紹了一種用于在Facebook收集和加工大數(shù)據(jù)的新方法,闡釋了如何用這些技術(shù)去抓取和分析數(shù)據(jù)?!癚uantitative Analysis of Large Amounts of Journalistic Texts Using Topic Modelling”③Carina Jacobi et al., “Quantitative Analysis of Large Amounts of Journalistic Texts Using Topic Modelling”, Digital Journalism (2015).提出了一種主題模型的方法LDA,并闡述如何使用該方法;研究者不同的選擇如何影響研究結(jié)果;研究結(jié)果怎樣被合理地闡釋等問(wèn)題。
此外,數(shù)據(jù)倫理與數(shù)據(jù)的合法性問(wèn)題也是國(guó)外學(xué)者研究的重要領(lǐng)域?!癉ata-driven Journalism and the Public Good: ‘Computer-assisted-reporters’ and‘Programmer-journalists’in Chicago”④Sylvain Parasie and Eric Dagiral, “Data-driven Journalism and the Public Good: ‘Computerassisted-reporters’ and ‘Programmer-journalists’ in Chicago”, New Media & Society (2012),Vol.15, No.6, pp.853-871.結(jié)合訪(fǎng)談研究與內(nèi)容分析,探討了數(shù)據(jù)新聞與公共利益的關(guān)系。“Data-Driven Revelation”①Sylvain Parasie, “Data-Driven Revelation”, Digital Journalism (2015), Vol.3, No.3, pp.364-380.則采用深度訪(fǎng)談的研究方式分析了科技對(duì)新聞工作認(rèn)識(shí)論的影響,探討了在對(duì)數(shù)據(jù)的處理過(guò)程中,如何才能更少地依賴(lài)合理的假設(shè)的問(wèn)題。
綜合來(lái)看,國(guó)內(nèi)數(shù)據(jù)新聞研究較少采用實(shí)證研究方法,缺乏將數(shù)據(jù)新聞與現(xiàn)實(shí)社會(huì)語(yǔ)境的勾連,議題的廣度和深度與國(guó)外相比存在一定差距。例如,數(shù)據(jù)新聞的生產(chǎn)機(jī)制和生產(chǎn)場(chǎng)域、生產(chǎn)者的構(gòu)成和培養(yǎng)方式、生產(chǎn)資源的配備與更新、生產(chǎn)產(chǎn)品的傳播路徑和效果評(píng)價(jià)等領(lǐng)域有大量研究空白。中外比較研究雖關(guān)注了數(shù)據(jù)新聞個(gè)案在數(shù)據(jù)容量、主題架構(gòu)和可視化設(shè)計(jì)的差異,但以描述為主,并未深入探討其原因和傳播效果的差異。本研究將通過(guò)系統(tǒng)的實(shí)證調(diào)研和持續(xù)的歷時(shí)追蹤,探究中國(guó)數(shù)據(jù)新聞的現(xiàn)狀與發(fā)展,既為創(chuàng)新和發(fā)展中國(guó)新聞傳播學(xué)理論,也為數(shù)據(jù)新聞在中國(guó)的實(shí)踐與發(fā)展提供一些觀察和思考。
在對(duì)美國(guó)、英國(guó)、瑞典等西方國(guó)家的數(shù)據(jù)新聞發(fā)展研究中,研究者主要關(guān)注以下問(wèn)題:①數(shù)據(jù)新聞從業(yè)者如何界定數(shù)據(jù)新聞、自我職業(yè)定位是怎樣的?②數(shù)據(jù)新聞的生產(chǎn)機(jī)制是怎樣的?③數(shù)據(jù)新聞的產(chǎn)品是怎樣的 (包括形態(tài)分類(lèi)、數(shù)據(jù)來(lái)源等)?④數(shù)據(jù)新聞的發(fā)展面臨什么問(wèn)題?這四個(gè)問(wèn)題也形成了我們對(duì)中國(guó)數(shù)據(jù)新聞發(fā)展研究的基本框架。在此基礎(chǔ)上,結(jié)合中國(guó)媒體現(xiàn)狀和實(shí)證調(diào)研中的發(fā)現(xiàn),我們還對(duì)中國(guó)數(shù)據(jù)新聞生產(chǎn)機(jī)構(gòu)的主體及其團(tuán)隊(duì)構(gòu)成、數(shù)據(jù)新聞的盈利模式、數(shù)據(jù)新聞的用戶(hù)及其消費(fèi)這三個(gè)問(wèn)題進(jìn)行了初步探討。研究方法以半結(jié)構(gòu)化訪(fǎng)談、內(nèi)容分析和資料分析為主。具體如表1所示。
訪(fǎng)談從2015年12月底開(kāi)始,歷時(shí)一個(gè)月。共訪(fǎng)談15家媒體的18個(gè)數(shù)據(jù)新聞團(tuán)隊(duì)或相關(guān)部門(mén),受訪(fǎng)者共31位,錄音資料25小時(shí),詳見(jiàn)表2。選擇這些媒體的原因在于:其一,他們涵蓋了當(dāng)時(shí)國(guó)內(nèi)數(shù)據(jù)新聞生產(chǎn)機(jī)構(gòu)的不同類(lèi)型;其二,這些媒體都為數(shù)據(jù)新聞開(kāi)設(shè)了專(zhuān)欄或制作了專(zhuān)題;其三,他們制作的數(shù)據(jù)新聞具有一定的知名度和較高的用戶(hù)關(guān)注度。
表1 研究問(wèn)題和研究方法
表2 受訪(fǎng)的數(shù)據(jù)新聞團(tuán)隊(duì)
對(duì)數(shù)據(jù)新聞作品的內(nèi)容分析,首先選擇了6家代表性機(jī)構(gòu),包括1家傳統(tǒng)媒體:《新京報(bào)》;2家互聯(lián)網(wǎng)門(mén)戶(hù)網(wǎng)站:網(wǎng)易數(shù)讀、搜狐數(shù)字之道;3家新媒體:新華網(wǎng)、財(cái)新、澎湃。隨后采用構(gòu)造周的抽樣方法,在這6家媒體的數(shù)據(jù)新聞專(zhuān)欄從2015年1月至12月發(fā)表的所有作品中隨機(jī)抽出10個(gè)構(gòu)造周,共計(jì)121篇數(shù)據(jù)新聞作品。
對(duì)于數(shù)據(jù)新聞?dòng)脩?hù)的分析分為兩部分,分別是數(shù)據(jù)新聞的關(guān)注群體分析和數(shù)據(jù)新聞的閱讀群體分析。前者使用百度指數(shù)的數(shù)據(jù),后者基于今日頭條算數(shù)中心提供的數(shù)據(jù)。
不同媒體數(shù)據(jù)新聞團(tuán)隊(duì)的規(guī)模差異較大 (如下圖7所示)。在受訪(fǎng)團(tuán)隊(duì)中最常見(jiàn)是5人及以下 (占比38%),其次是6~10人 (占比31%)和11~20人 (占比23%)。超過(guò)20人的只有中央電視臺(tái)為 《數(shù)說(shuō)中國(guó)命運(yùn)共同體》臨時(shí)組建的團(tuán)隊(duì),參與人數(shù)超過(guò)80人。值得注意的是在日常穩(wěn)定的數(shù)據(jù)新聞團(tuán)隊(duì)中規(guī)模最大的三個(gè)均為新媒體,分別是新華網(wǎng)的數(shù)據(jù)新聞團(tuán)隊(duì)、澎湃的美術(shù)課團(tuán)隊(duì)和DT財(cái)經(jīng),團(tuán)隊(duì)人數(shù)均超過(guò)10人,其中新華網(wǎng)數(shù)據(jù)新聞團(tuán)隊(duì)規(guī)模最大,為18~20人。
在團(tuán)隊(duì)構(gòu)成上,各團(tuán)隊(duì)的主力軍都是記者/編輯和設(shè)計(jì)師。幾乎沒(méi)有一家媒體的數(shù)據(jù)新聞團(tuán)隊(duì)設(shè)立了專(zhuān)門(mén)的數(shù)據(jù)分析師崗位。數(shù)據(jù)分析的工作一般由記者/編輯承擔(dān)或通過(guò)外部合作完成。這使得數(shù)據(jù)新聞團(tuán)隊(duì)較難展開(kāi)深入、復(fù)雜的數(shù)據(jù)分析和數(shù)據(jù)挖掘項(xiàng)目,并且均未著手自有數(shù)據(jù)庫(kù)的建設(shè)。極少有數(shù)據(jù)新聞團(tuán)隊(duì)配備有專(zhuān)屬的工程師。即便是在具有IT技術(shù)優(yōu)勢(shì)的四大門(mén)戶(hù)網(wǎng)站,數(shù)據(jù)新聞團(tuán)隊(duì)也常常因?yàn)楣こ處煹娜狈Χ鵁o(wú)法充分滿(mǎn)足交互式數(shù)據(jù)新聞日常開(kāi)發(fā)的時(shí)效性需求。工程師的人力成本通常高出記者/編輯不少,而對(duì)于科技公司而言,新聞并不是其主要業(yè)務(wù)方向。這些原因使得數(shù)據(jù)新聞團(tuán)隊(duì)想要擁有專(zhuān)屬的工程師成為困難的事。比較特殊的是新華網(wǎng)數(shù)據(jù)新聞團(tuán)隊(duì)擁有4位專(zhuān)職工程師,主要負(fù)責(zé)交互產(chǎn)品的實(shí)現(xiàn)和網(wǎng)絡(luò)數(shù)據(jù)的爬取和清理。這樣的人力配置使得其數(shù)據(jù)交互產(chǎn)品的數(shù)量達(dá)到日常報(bào)道的1/3以上。此外,財(cái)新傳媒的數(shù)據(jù)可視化實(shí)驗(yàn)室,擁有4位工程師,其交互可視化數(shù)據(jù)新聞在業(yè)內(nèi)拔得頭籌,并多次獲得國(guó)內(nèi)外大獎(jiǎng)。但是財(cái)新的數(shù)據(jù)可視化實(shí)驗(yàn)室的工程師與數(shù)據(jù)新聞編輯也并未形成有編制、有穩(wěn)定組織架構(gòu)和對(duì)應(yīng)KPI考核的數(shù)據(jù)新聞團(tuán)隊(duì),而是虛擬的跨部門(mén)團(tuán)隊(duì),因此財(cái)新的交互可視化新聞雖有杰出的代表作,但尚未成為有穩(wěn)定刊發(fā)規(guī)律的日常報(bào)道形態(tài)。這些情況表明數(shù)據(jù)分析師和IT工程師的配備對(duì)于數(shù)據(jù)新聞團(tuán)隊(duì)的專(zhuān)業(yè)化發(fā)展及大型交互可視化數(shù)據(jù)新聞作品的產(chǎn)出頻率具有重要價(jià)值。
圖7 中國(guó)數(shù)據(jù)新聞團(tuán)隊(duì)規(guī)模 (2015年)
記者、編輯和視覺(jué)傳達(dá)雖然是各數(shù)據(jù)新聞團(tuán)隊(duì)的普遍構(gòu)成,但具體崗位設(shè)置依然存在差異。澎湃和新一線(xiàn)是其中崗位設(shè)置最多元化的代表。其中澎湃美術(shù)課整體16人,包括3位編輯,3~4位插畫(huà)師,2~3位動(dòng)畫(huà)師,4位平面設(shè)計(jì)和2位3D設(shè)計(jì)師,其視覺(jué)傳達(dá)的分工在所有媒體中最為細(xì)致 (如圖8所示)。新一線(xiàn)城市研究所團(tuán)隊(duì)有10人左右,包括全職記者3人,編輯2人,設(shè)計(jì)師2人,市場(chǎng)1位,實(shí)習(xí)記者4人,是為數(shù)不多的具有較強(qiáng)產(chǎn)品意識(shí)和市場(chǎng)意識(shí),并專(zhuān)設(shè)市場(chǎng)崗位的團(tuán)隊(duì) (如圖9所示)。最后,實(shí)習(xí)記者是目前不少數(shù)據(jù)新聞團(tuán)隊(duì)中不容忽視的力量,一般占團(tuán)隊(duì)總?cè)藬?shù)10%以上,甚至與專(zhuān)職記者數(shù)量相當(dāng)。
圖8 澎湃團(tuán)隊(duì)構(gòu)成
圖9 新一線(xiàn)城市研究所團(tuán)隊(duì)構(gòu)成
從業(yè)者對(duì)如何界定 “數(shù)據(jù)新聞”存在一定分歧。最主要的爭(zhēng)議在于“數(shù)據(jù)新聞”與 “數(shù)據(jù)可視化”的關(guān)系。
中國(guó)數(shù)據(jù)新聞從業(yè)者普遍認(rèn)為可視化的目的是將數(shù)據(jù)變成受眾更易理解和更加喜聞樂(lè)見(jiàn)的形式,但較少?gòu)臄?shù)據(jù)可視分析的角度理解數(shù)據(jù)可視化與數(shù)據(jù)分析之間的關(guān)系。對(duì)于 “什么樣的數(shù)據(jù)需要可視化”“什么樣的可視化更容易被理解”等問(wèn)題并無(wú)統(tǒng)一答案,也未設(shè)立成文的規(guī)則。數(shù)據(jù)可視化主要是在編輯與設(shè)計(jì)師溝通、協(xié)商的基礎(chǔ)上由設(shè)計(jì)師基于對(duì)內(nèi)容的理解、個(gè)人的專(zhuān)業(yè)素養(yǎng)和經(jīng)驗(yàn)來(lái)完成。
不同團(tuán)隊(duì)對(duì) “數(shù)據(jù)新聞”與 “數(shù)據(jù)可視化”關(guān)系的理解存在較大差異,同一團(tuán)隊(duì)內(nèi)部不同崗位工作人員的觀點(diǎn)也不盡相同。
僅就團(tuán)隊(duì)負(fù)責(zé)人的觀點(diǎn)而言,偏重?cái)?shù)據(jù)分析的團(tuán)隊(duì),例如新一線(xiàn)、無(wú)界數(shù)據(jù)種子、新華網(wǎng)數(shù)據(jù)新聞、網(wǎng)易數(shù)讀等團(tuán)隊(duì)更傾向于認(rèn)為數(shù)據(jù)新聞不一定需要可視化。如新華網(wǎng)數(shù)據(jù)新聞團(tuán)隊(duì)認(rèn)為,“數(shù)據(jù)可視化只是一種輔助手段來(lái)幫助大家了解新聞”。網(wǎng)易數(shù)讀編輯團(tuán)隊(duì)認(rèn)為 “數(shù)據(jù)新聞是從數(shù)據(jù)里面發(fā)現(xiàn)一種邏輯聯(lián)系,展示某種觀點(diǎn),是從數(shù)據(jù)里發(fā)現(xiàn)新聞線(xiàn)索。數(shù)據(jù)可視化可以是數(shù)據(jù)新聞的一個(gè)部分,但并不是一定需要”。
偏重可視化的團(tuán)隊(duì),如財(cái)新數(shù)據(jù)可視化實(shí)驗(yàn)室、澎湃美術(shù)課、搜狐數(shù)字之道等則更傾向于認(rèn)為可視化是數(shù)據(jù)新聞不可分割的部分,如財(cái)新數(shù)據(jù)新聞與可視化新聞實(shí)驗(yàn)室負(fù)責(zé)人黃志敏認(rèn)為 “新聞+數(shù)據(jù)可視化就是數(shù)據(jù)新聞”。澎湃美術(shù)課時(shí)任負(fù)責(zé)人趙佳峰認(rèn)為,“數(shù)據(jù)新聞更趨向于專(zhuān)業(yè)化的信息可視化,是把數(shù)據(jù)的解讀形式放在新聞的范疇領(lǐng)域里,用數(shù)據(jù)的形式講述新聞?!?/p>
還有一些團(tuán)隊(duì)的思路在兩者之間,如DT財(cái)經(jīng)主編王小喬認(rèn)為,“當(dāng)前中國(guó)數(shù)據(jù)新聞大多僅停留在可視化層面,而非真正從數(shù)據(jù)層面解構(gòu)新聞。數(shù)據(jù)一定是與可視化掛鉤,但數(shù)據(jù)新聞不能僅是可視化?!?/p>
此外,從業(yè)者對(duì)數(shù)據(jù)新聞所涉數(shù)據(jù)的體量與復(fù)雜度及數(shù)據(jù)分析深度與復(fù)雜度的觀點(diǎn)略有差異。在對(duì)數(shù)據(jù)源的選擇上,有的媒體強(qiáng)調(diào)數(shù)據(jù)來(lái)源的多樣性,如時(shí)任新華網(wǎng)多媒體產(chǎn)品中心副主任的馬軼群認(rèn)為,“數(shù)據(jù)新聞是新聞媒體機(jī)構(gòu)從不同渠道采集、獲取數(shù)據(jù)。通過(guò)分析軟件進(jìn)行過(guò)濾、分析、深度挖掘;將大數(shù)據(jù)加工為知識(shí)化的有效小數(shù)據(jù),并用可視化技術(shù)關(guān)聯(lián)數(shù)據(jù)反映的新問(wèn)題、新事物、新知識(shí),在用戶(hù)面前客觀呈現(xiàn),滿(mǎn)足受眾知情權(quán)或獲取知識(shí)需要的數(shù)據(jù)驅(qū)動(dòng)型的新聞報(bào)道?!庇械拿襟w傾向于使用大體量數(shù)據(jù)。例如,中央電視臺(tái) 《數(shù)說(shuō)中國(guó)命運(yùn)共同體》負(fù)責(zé)人張勤認(rèn)為,“數(shù)據(jù)新聞的內(nèi)核是新聞,數(shù)據(jù)新聞包括大數(shù)據(jù)新聞,在海量的數(shù)據(jù)中找到新聞的內(nèi)容、價(jià)值就是數(shù)據(jù)新聞?!彬v訊新聞也要求數(shù)據(jù)量達(dá)到一定的標(biāo)準(zhǔn),認(rèn)為 “通過(guò)研究要發(fā)現(xiàn)新的觀點(diǎn)、結(jié)論,而不是重復(fù)已知的真理。把專(zhuān)業(yè)的東西讓普通人更清晰易懂地獲得?!彪m然從業(yè)者一致認(rèn)為數(shù)據(jù)新聞不能僅是展現(xiàn)數(shù)據(jù),數(shù)據(jù)分析的過(guò)程不可或缺,但較多從業(yè)者對(duì)數(shù)據(jù)分析的認(rèn)知并不充分,主要表現(xiàn)在常將數(shù)據(jù)分析與數(shù)據(jù)挖掘的概念混用,或?qū)⒋髷?shù)據(jù)分析的價(jià)值判斷簡(jiǎn)單化。
目前國(guó)內(nèi)數(shù)據(jù)新聞團(tuán)隊(duì)的崗位構(gòu)成較為單一,從業(yè)者的職業(yè)身份認(rèn)知一般與所從事專(zhuān)業(yè)對(duì)應(yīng)。例如,設(shè)計(jì)人員自我認(rèn)知是設(shè)計(jì)師,工程師自我認(rèn)知是在媒體從業(yè)的工程師。這與德國(guó)、瑞士等國(guó)的情況非常類(lèi)似,數(shù)據(jù)新聞制作需要傳統(tǒng)新聞?dòng)浾吲c程序員通過(guò)合作彌補(bǔ)專(zhuān)業(yè)差異。不過(guò)有研究表明,在一些媒體,如美國(guó)的 《紐約時(shí)報(bào)》,已經(jīng)出現(xiàn)設(shè)計(jì)師或程序員把自己當(dāng)作真正的記者來(lái)工作的情況。①Wibke Weber and Hannes Rall, “Data Visualization in online Journalism and Its Implications for the Production Process,” 16th International Conference on Information Visualization, France, July 28, 2012.自由撰稿人戴維·安德頓 (David Anderton)亦表示:“數(shù)據(jù)新聞的出現(xiàn)打通了技術(shù)人員和寫(xiě)作者之間的差異,定位離群值和識(shí)別趨勢(shì)不再只有顯著的統(tǒng)計(jì)意義,還與解碼當(dāng)今的復(fù)雜世界息息相關(guān)?!?/p>
參照美國(guó)較為成熟的數(shù)據(jù)新聞團(tuán)隊(duì)構(gòu)成,并結(jié)合數(shù)據(jù)新聞的特點(diǎn)及其實(shí)際生產(chǎn)需要來(lái)看,一個(gè)可獨(dú)立制作、發(fā)布在線(xiàn)數(shù)據(jù)新聞的團(tuán)隊(duì)基本配置應(yīng)該包括數(shù)據(jù)記者或編輯、設(shè)計(jì)師、工程師。其中數(shù)據(jù)記者需要兼具采寫(xiě)編評(píng)和數(shù)據(jù)分析能力。2015年12月31日之前,中國(guó)媒體中擁有這樣配置的數(shù)據(jù)新聞團(tuán)隊(duì)只有新華網(wǎng)多媒體產(chǎn)品中心 (現(xiàn)更名為 “融媒體產(chǎn)品創(chuàng)新中心”)。因?yàn)橄∮?、難得,這樣的團(tuán)隊(duì)被業(yè)內(nèi)人士戲稱(chēng)為 “夢(mèng)之隊(duì)”。那么在多數(shù)媒體并不具備上述團(tuán)隊(duì)配置的情況下,眾多數(shù)據(jù)新聞作品是如何出爐的呢?我們?cè)谡{(diào)研中發(fā)現(xiàn)了6種生產(chǎn)模式。
其一,內(nèi)部獨(dú)立團(tuán)隊(duì)。新華網(wǎng)多媒體產(chǎn)品中心的 “數(shù)據(jù)新聞”是2015年底之前,國(guó)內(nèi)唯一一個(gè)媒體內(nèi)部設(shè)立的能夠獨(dú)立制作交互數(shù)據(jù)新聞的專(zhuān)門(mén)團(tuán)隊(duì)。團(tuán)隊(duì)17人左右,基本構(gòu)成包括5位編輯、7位設(shè)計(jì)師 (負(fù)責(zé)平面設(shè)計(jì)和動(dòng)畫(huà))、4位工程師和1位團(tuán)隊(duì)負(fù)責(zé)人。
其二,內(nèi)部協(xié)作制。代表媒體是財(cái)新、無(wú)界、澎湃和四大門(mén)戶(hù)的數(shù)據(jù)新聞團(tuán)隊(duì)等。例如,財(cái)新的交互可視化數(shù)據(jù)新聞是由 “財(cái)新數(shù)字說(shuō)”的記者與財(cái)新數(shù)據(jù)可視化實(shí)驗(yàn)室 (共10位工程師)中專(zhuān)為數(shù)據(jù)新聞生產(chǎn)配備的4位工程師協(xié)作完成。更為常見(jiàn)的媒體內(nèi)部協(xié)作方式是整個(gè)新聞中心/頻道或幾個(gè)欄目共用一個(gè)設(shè)計(jì)師團(tuán)隊(duì)和一個(gè)工程師團(tuán)隊(duì)。雖然數(shù)據(jù)可視化及其交互設(shè)計(jì)與技術(shù)實(shí)現(xiàn)對(duì)于多數(shù)設(shè)計(jì)師和工程師而言,意味著一些新的挑戰(zhàn),需要學(xué)習(xí)新的知識(shí),但是通常他們并不會(huì)因?yàn)樽鰯?shù)據(jù)新聞而獲得額外的與KPI考核掛鉤的激勵(lì)。
其三,內(nèi)部孵化制。例如,第一財(cái)經(jīng)孵化了 “新一線(xiàn)城市研究室”,給予團(tuán)隊(duì)資金支持和較大的自由空間。不僅以帶頭人沈從樂(lè)為代表的團(tuán)隊(duì)成員具備較高的自主學(xué)習(xí)興趣和熱情,能夠主動(dòng)改造傳統(tǒng)新聞?dòng)浾?、編輯知識(shí)結(jié)構(gòu),而且新一線(xiàn)在人力招聘和對(duì)外合作等方面享有相當(dāng)大的自主權(quán),使其對(duì)數(shù)據(jù)新聞生產(chǎn)過(guò)程的組織較為靈活。
其四,外包制。新華社新媒體中心有近一百人的規(guī)模,但據(jù)受訪(fǎng)者說(shuō),這是新華社最小的部門(mén)。因?yàn)樾枰骖櫺侣剟?chuàng)新的各樣工作,數(shù)據(jù)新聞只是其中很小的部分,主要通過(guò)與外部企業(yè)、研究機(jī)構(gòu)合作或外包完成。在2015年訪(fǎng)談時(shí),相關(guān)負(fù)責(zé)人提出計(jì)劃組建一支由4~8人組成的數(shù)據(jù)分析師團(tuán)隊(duì),而技術(shù)工作則主張繼續(xù)外包。原因在于他們認(rèn)為技術(shù)的變化日新月異,組建自有團(tuán)隊(duì)不僅成本高昂,而且其技術(shù)更新能力和工作抗壓能力都跟不上新聞生產(chǎn)的需要。
其五,項(xiàng)目制。2015年底之前,中央電視臺(tái)并未為數(shù)據(jù)新聞設(shè)立常態(tài)欄目,也并未配備進(jìn)行數(shù)據(jù)新聞常態(tài)化生產(chǎn)的團(tuán)隊(duì)和工作機(jī)制, “數(shù)說(shuō)兩會(huì)”“數(shù)說(shuō)春運(yùn)” “數(shù)說(shuō)中國(guó)命運(yùn)共同體”等代表作都是在特殊時(shí)間節(jié)點(diǎn),以特別報(bào)道的方式推出。雖然這些報(bào)道主要是根據(jù)選題需要以項(xiàng)目的方式組建臨時(shí)團(tuán)隊(duì),數(shù)據(jù)獲取和分析的工作也主要由外部合作的單位承擔(dān),但是央視的平臺(tái)優(yōu)勢(shì)和資源整合能力、團(tuán)隊(duì)的新聞專(zhuān)業(yè)素質(zhì)及電視的視覺(jué)傳播優(yōu)勢(shì)等最終轉(zhuǎn)化成為 “不鳴則已,一鳴驚人”的經(jīng)典數(shù)據(jù)新聞案例?!皵?shù)說(shuō)中國(guó)命運(yùn)共同體”獲得了2015年度中國(guó)新聞二等獎(jiǎng) (一等獎(jiǎng)空缺),這是數(shù)據(jù)新聞在國(guó)內(nèi)獲得的最高專(zhuān)業(yè)獎(jiǎng)項(xiàng)。
其六,媒體外部獨(dú)立團(tuán)隊(duì)。近年來(lái),一些高校和科研機(jī)構(gòu)也在逐步開(kāi)展數(shù)據(jù)新聞研究、教學(xué)與實(shí)踐。武漢大學(xué)鏑次元數(shù)據(jù)傳媒實(shí)驗(yàn)室基于武漢大學(xué)的跨學(xué)科資源,聯(lián)合新聞與傳播學(xué)院、信息管理學(xué)院、城市設(shè)計(jì)學(xué)院和計(jì)算機(jī)科學(xué)學(xué)院的教師和學(xué)生,形成跨學(xué)科的研發(fā)團(tuán)隊(duì)。該團(tuán)隊(duì)與媒體所屬數(shù)據(jù)新聞團(tuán)隊(duì)的相同之處在于作品的選題遵循新聞價(jià)值判斷和社會(huì)熱點(diǎn)規(guī)律,不同之處在于該團(tuán)隊(duì)沒(méi)有日常新聞生產(chǎn)和與之掛鉤的績(jī)效考核的壓力,在技術(shù)創(chuàng)新方面有更為自由的空間。其作品一般通過(guò)與媒體合作的方式發(fā)布。
在上述6種生產(chǎn)模式中,最為普遍的是 “內(nèi)部協(xié)作制”,其與 “內(nèi)部獨(dú)立團(tuán)隊(duì)”相比較而言,在媒體經(jīng)營(yíng)管理的角度,人力成本更低,風(fēng)險(xiǎn)更小,但在新聞生產(chǎn)的角度,協(xié)作成本更高,效率更低?!皟?nèi)部孵化制”最具代表性的是第一財(cái)經(jīng)。作為財(cái)經(jīng)類(lèi)專(zhuān)業(yè)媒體,第一財(cái)經(jīng)具有數(shù)據(jù)資源的積累和先天優(yōu)勢(shì),在資本的支持和推動(dòng)下,以產(chǎn)品思維和市場(chǎng)機(jī)制,靈活試錯(cuò)。這將可能是未來(lái)眾多新媒體借鑒的方式。畢竟,數(shù)據(jù)新聞所需要的團(tuán)隊(duì)架構(gòu)和生產(chǎn)流程改造在傳統(tǒng)媒體內(nèi)部實(shí)施的難度較高,而像央視的 “項(xiàng)目制”和新華社的 “外包制”都需要巨大的媒體影響力和資源整合能力,并且基本不考慮成本、收支等問(wèn)題,這是一般媒體、企業(yè)難以企及的。
上述不同生產(chǎn)模式具有幾乎類(lèi)似的數(shù)據(jù)新聞選題提出機(jī)制,除新華社是團(tuán)隊(duì)負(fù)責(zé)人個(gè)人決策外,一般都是由團(tuán)隊(duì)的記者和 (或)編輯自由創(chuàng)意提出①少數(shù)有新聞采編權(quán)的新媒體 (人民網(wǎng)、城市新一線(xiàn))是記者提出,沒(méi)有新聞采編權(quán)的網(wǎng)站是編輯提出。。但選題的決策人在不同團(tuán)隊(duì)存在差異。主要有四種:其一是編輯決策(如 “網(wǎng)易數(shù)讀”);其二是欄目主編或組長(zhǎng)決策 (如 “新浪圖解天下”);其三是頻道主編決策 (如 “搜狐圖解財(cái)經(jīng)”);其四是團(tuán)隊(duì)共同決策 (如“搜狐數(shù)字之道”和 “DT財(cái)經(jīng)”)。
日常數(shù)據(jù)新聞制作周期一般是一周1~3期。財(cái)新 “數(shù)字說(shuō)”、新華網(wǎng)“數(shù)據(jù)新聞”和無(wú)界 “數(shù)據(jù)種子”的數(shù)據(jù)新聞產(chǎn)出率最高,為每天1~3篇。其次是澎湃新聞 “美術(shù)課”,一般每周3~10篇不等。日常數(shù)據(jù)新聞的產(chǎn)出率與數(shù)據(jù)新聞選題決策的扁平化程度之間沒(méi)有明顯關(guān)系,但與生產(chǎn)模式和生產(chǎn)團(tuán)隊(duì)構(gòu)成顯著相關(guān)。上述數(shù)據(jù)新聞產(chǎn)出率最高的四個(gè)團(tuán)隊(duì)要么是 “內(nèi)部獨(dú)立團(tuán)隊(duì)”,要么是 “內(nèi)部協(xié)作制”。并且 “內(nèi)部協(xié)作制”的三個(gè)團(tuán)隊(duì)均為新媒體團(tuán)隊(duì),相比較四大門(mén)戶(hù)的數(shù)據(jù)新聞團(tuán)隊(duì)而言,它們具備更細(xì)分的團(tuán)隊(duì)構(gòu)成,并且更重視 “數(shù)據(jù)新聞”業(yè)務(wù)。
目前各團(tuán)隊(duì)均未為數(shù)據(jù)新聞團(tuán)隊(duì)建立專(zhuān)門(mén)的考評(píng)機(jī)制。新華社的數(shù)據(jù)新聞與其他新聞采用同一套評(píng)分系統(tǒng)。央視對(duì)作為特別節(jié)目的數(shù)據(jù)新聞系列報(bào)道雖然沒(méi)有績(jī)效考核,但實(shí)際上節(jié)目獲得的超常影響力和專(zhuān)業(yè)獎(jiǎng)項(xiàng)對(duì)制作團(tuán)隊(duì)的創(chuàng)作熱情和信心帶來(lái)了激勵(lì)。四大門(mén)戶(hù)和財(cái)新、澎湃等新媒體對(duì)數(shù)據(jù)新聞團(tuán)隊(duì)成員的考核都采用 “流量+影響力/口碑”的考評(píng)框架。不同媒體在這個(gè)框架內(nèi)變量的權(quán)重分布不盡相同。對(duì)流量的考核主要對(duì)記者/編輯實(shí)施,設(shè)計(jì)人員的績(jī)效一般與流量不掛鉤,而與作品難度和創(chuàng)新程度相關(guān)聯(lián)。截至本次調(diào)研結(jié)束之前,薪酬考核機(jī)制復(fù)雜程度處于兩個(gè)極端的是騰訊和DT財(cái)經(jīng),騰訊資訊部員工的薪酬會(huì)結(jié)合 “目標(biāo)達(dá)成、工作經(jīng)驗(yàn)、貢獻(xiàn)力度、進(jìn)度速度綜合考慮”,而DT財(cái)經(jīng)基本沒(méi)有考核,采用固定工資,并且基本沒(méi)有獎(jiǎng)勵(lì)機(jī)制。
以七個(gè)媒體的調(diào)研作品為例,2015年1~12月產(chǎn)出的數(shù)據(jù)新聞中,國(guó)內(nèi)政治新聞共121篇,是受到最多報(bào)道的新聞話(huà)題;排名第二位的為民生新聞,共112條;排名第三位的為金融新聞,共52條 (見(jiàn)表3)。
表3 樣本數(shù)據(jù)新聞話(huà)題分布
此次調(diào)研中,絕大多數(shù)的作品皆為靜態(tài)信息圖,這些作品皆為無(wú)交互靜態(tài)圖,并具備以下特點(diǎn):不具備總覽 (overview)、縮放 (zoom)、篩選(filter and detail on demand)、關(guān)聯(lián) (relate)、歷史記錄 (history) 等高級(jí)功能。而敘事邏輯多為線(xiàn)性 (linear),敘事的驅(qū)動(dòng)力也都來(lái)自作者 (author driven balance of narratives)而非讀者。在這些作品中,作者完全掌握故事和數(shù)據(jù)的走向與線(xiàn)索,讀者只是被動(dòng)地跟隨與消化。
而在數(shù)據(jù)運(yùn)用中,大部分的數(shù)據(jù)圖,共563例,運(yùn)用了復(fù)合型數(shù)據(jù)。量化數(shù)據(jù)也運(yùn)用得較多,共111例。質(zhì)化數(shù)據(jù)運(yùn)用得最少,共82例 (見(jiàn)表 4)。
表4 樣本數(shù)據(jù)新聞采用的數(shù)據(jù)形式
正因?yàn)橐陨系臄?shù)據(jù)模式,在所有作品中,表格形式的可視化使用得最多,共運(yùn)用182次。除此之外,柱狀圖與餅狀圖分別使用152次、136次,位居第二和第三 (見(jiàn)表5)。
表5 樣本數(shù)據(jù)新聞的數(shù)據(jù)可視化方法
總體來(lái)看,目前2015年的數(shù)據(jù)新聞作品以質(zhì)化與量化數(shù)據(jù)結(jié)合為多,大多為靜態(tài)信息圖,以作者思路為主導(dǎo),形式相對(duì)簡(jiǎn)單,以常見(jiàn)的表格、柱狀圖及餅狀圖為常用模板。
兩家傳統(tǒng)媒體的話(huà)題分布與總體大抵相同,國(guó)內(nèi)政治新聞共50篇,總數(shù)最多;第二位為民生新聞,共43篇。第三位為金融新聞,共12篇 (見(jiàn)表6)。而在數(shù)據(jù)形式方面,復(fù)合型數(shù)據(jù)仍占大多數(shù),共200例;質(zhì)化數(shù)據(jù)排第二,共40例;量化數(shù)據(jù)共20例,排名第三 (見(jiàn)表7)。
表6 傳統(tǒng)媒體數(shù)據(jù)新聞的話(huà)題分布
表7 傳統(tǒng)媒體數(shù)據(jù)新聞采用的數(shù)據(jù)類(lèi)型
同總體數(shù)據(jù)相似,傳統(tǒng)媒體運(yùn)用最多的可視化模式為表格、柱狀圖和餅狀圖,分別為73次、59次和46次 (見(jiàn)表8)。
表8 傳統(tǒng)媒體數(shù)據(jù)新聞的數(shù)據(jù)可視化方法
在新媒體文章中,數(shù)據(jù)新聞話(huà)題涉及最多的為金融新聞,共32篇;排名第二的為民生新聞,共26篇;其他話(huà)題新聞共24篇,排名第三 (見(jiàn)表9)。
表9 新媒體數(shù)據(jù)新聞的話(huà)題類(lèi)型
在數(shù)據(jù)形式方面,復(fù)合型數(shù)據(jù)仍占比最重,共160例;量化數(shù)據(jù)共62例,排名第二;使用最少的為質(zhì)化數(shù)據(jù),共26例 (見(jiàn)表10)。
表10 新媒體數(shù)據(jù)新聞采用的數(shù)據(jù)形式
在可視化方面,表格、餅狀圖和柱狀圖仍為使用最頻繁的圖形,使用次數(shù)為分別為45次、43次和37次 (見(jiàn)表11)。
表11 新媒體數(shù)據(jù)新聞的數(shù)據(jù)可視化方法
在新浪和騰訊兩家新聞門(mén)戶(hù)網(wǎng)站的數(shù)據(jù)新聞中,最常見(jiàn)的話(huà)題為國(guó)內(nèi)政治新聞,其次為民生新聞及國(guó)際政治新聞,與總體趨勢(shì)相符。值得注意的是,本次調(diào)研中,科技公司驅(qū)動(dòng)的媒體并未涉及教育類(lèi)話(huà)題 (見(jiàn)表12)。
表12 新聞門(mén)戶(hù)網(wǎng)站的數(shù)據(jù)新聞的話(huà)題分布
在數(shù)據(jù)運(yùn)用方面,復(fù)合型數(shù)據(jù)仍為主導(dǎo),量化數(shù)據(jù)緊隨其后。質(zhì)化數(shù)據(jù)為最少使用的數(shù)據(jù)類(lèi)型 (見(jiàn)表13)。
表13 新聞門(mén)戶(hù)網(wǎng)站的數(shù)據(jù)新聞的數(shù)據(jù)類(lèi)型
同其他媒體一樣,表格、柱狀圖和餅狀圖為最常用的可視化模板 (見(jiàn)表 14)。
表14 新聞門(mén)戶(hù)網(wǎng)站的數(shù)據(jù)新聞的數(shù)據(jù)可視化方法
由以上的分析,我們可以得出如下的比較和發(fā)現(xiàn)??傮w而言,中國(guó)2015年數(shù)據(jù)新聞的產(chǎn)品模式仍較單一,不同媒介的數(shù)據(jù)表現(xiàn)形式較統(tǒng)一,多以簡(jiǎn)單的靜態(tài)列表或表格形式呈現(xiàn)。數(shù)據(jù)源注明仍不規(guī)范,以質(zhì)化和量化數(shù)據(jù)混用為主 (見(jiàn)表15)。
表15 不同類(lèi)型媒體的數(shù)據(jù)新聞比較
數(shù)據(jù)新聞的生產(chǎn)需要在傳統(tǒng)新聞采寫(xiě)編評(píng)的基礎(chǔ)上增加數(shù)據(jù)采集、數(shù)據(jù)分析、數(shù)據(jù)可視化的過(guò)程,相應(yīng)地產(chǎn)生了更高的人力成本,甚至可能帶來(lái)復(fù)雜的人員調(diào)整和生產(chǎn)流程的再造。雖然在新聞媒體的組織架構(gòu)中普遍存在新聞業(yè)務(wù)部門(mén)和市場(chǎng)經(jīng)營(yíng)部門(mén)之間的防火墻,但生存和盈利是任何媒體都需要面對(duì)的現(xiàn)實(shí)。雖然在中國(guó)的媒體內(nèi)部尚未形成計(jì)算和評(píng)估投入與產(chǎn)出的嚴(yán)格制度,但是,如何衡量為數(shù)據(jù)新聞進(jìn)行的投入是值得的?數(shù)據(jù)新聞是否有商業(yè)模式?這些問(wèn)題也是不少媒體積極思考和探索的問(wèn)題。
對(duì)于數(shù)據(jù)新聞的價(jià)值判斷主要有四種觀點(diǎn)。
其一是更好的新聞傳播力。來(lái)自一些媒體實(shí)踐的經(jīng)驗(yàn)和數(shù)據(jù)表明,數(shù)據(jù)新聞具有值得肯定的傳播力。例如,DT財(cái)經(jīng)主編王小喬指出,其微信公眾號(hào)閱讀量Top10中有4~5篇與數(shù)據(jù)有關(guān),“主要是因?yàn)樾问叫路f,數(shù)據(jù)方式是能夠獲得讀者認(rèn)可的方式,轉(zhuǎn)發(fā)率很高,對(duì)品牌發(fā)展也有很大促力。”《新京報(bào)》 “圖個(gè)明白”統(tǒng)籌陳璐認(rèn)為,“通過(guò)數(shù)字和可視化確實(shí)可以比傳統(tǒng)媒體更好地滿(mǎn)足讀者需求,幫助他們更好地理解新聞,理解觀點(diǎn)”。新華社新媒體中心新媒體二部副主任何強(qiáng)則指出,可視化的新聞(包括數(shù)據(jù)可視化新聞)比文字新聞?dòng)懈玫膫鞑バЧ?,同比能增?0%~20%的傳播量。
其二是創(chuàng)新影響力。財(cái)新數(shù)據(jù)可視化實(shí)驗(yàn)室負(fù)責(zé)人黃志敏表示,“如果數(shù)據(jù)新聞做得好,回報(bào)也會(huì)很高”。他認(rèn)為數(shù)據(jù)新聞通過(guò)經(jīng)典作品和專(zhuān)業(yè)獎(jiǎng)項(xiàng)獲得的名聲對(duì)媒體非常有價(jià)值。新華社何強(qiáng)認(rèn)為,數(shù)據(jù)新聞能擴(kuò)大平臺(tái)影響力,而宣傳效果是其績(jī)效考核的重要指標(biāo)之一。
其三是人才培養(yǎng)。中央電視臺(tái) “數(shù)說(shuō)命運(yùn)共同體”負(fù)責(zé)人張勤認(rèn)為數(shù)據(jù)新聞的生產(chǎn) “首先要有一支專(zhuān)業(yè)隊(duì)伍,其次就是專(zhuān)業(yè)平臺(tái)”。新華網(wǎng)馬軼群認(rèn)為,“數(shù)據(jù)新聞儲(chǔ)備了各種人才,這些人才可以進(jìn)行一些其他的工作,產(chǎn)生一些收益。”
最后一種觀點(diǎn)認(rèn)為數(shù)據(jù)新聞完全沒(méi)有商業(yè)價(jià)值,但是有學(xué)術(shù)價(jià)值①來(lái)自 “一圖觀政”創(chuàng)辦人戴玉的觀點(diǎn)。?!耙粓D觀政”的負(fù)責(zé)人戴玉認(rèn)為,“雖然當(dāng)前做數(shù)據(jù)新聞幾乎入不敷出,但時(shí)間會(huì)大浪淘沙,數(shù)據(jù)新聞做下去會(huì)有前途?!?/p>
受訪(fǎng)的數(shù)據(jù)新聞團(tuán)隊(duì)普遍認(rèn)為數(shù)據(jù)新聞的本質(zhì)是新聞,不可直接交換商業(yè)利益,否則有違新聞專(zhuān)業(yè)主義精神和新聞倫理。但如下兩種將數(shù)據(jù)新聞的價(jià)值間接變現(xiàn)的方式,在不同范圍和程度上獲得了理解和接受。
其一是媒體的傳統(tǒng)商業(yè)模式——廣告。新華社何強(qiáng)主張利用 “產(chǎn)品思維”來(lái)操作數(shù)據(jù)新聞,從市場(chǎng)競(jìng)爭(zhēng)和受眾需求的角度分析,以達(dá)到培養(yǎng)影響力和用戶(hù),最終提高流量吸引廣告主的目的。人民網(wǎng)研究院相關(guān)負(fù)責(zé)人表示:“對(duì)一個(gè)網(wǎng)站來(lái)說(shuō),關(guān)注兩個(gè)方面,一個(gè)是權(quán)威性,有多少家媒體轉(zhuǎn)載,強(qiáng)調(diào)傳播的主導(dǎo)性;一個(gè)是影響力,報(bào)道的文章被多少人閱讀。這兩點(diǎn)做得很好,就能更好地談廣告和合作?!?/p>
通常贊助企業(yè)會(huì)采用冠名或作為數(shù)據(jù)來(lái)源的方式。前者常見(jiàn)于傳統(tǒng)企業(yè),例如伊利曾指定冠名澎湃美術(shù)課;而后者常見(jiàn)于大數(shù)據(jù)公司、互聯(lián)網(wǎng)企業(yè)。因數(shù)據(jù)新聞的生產(chǎn)有時(shí)需要企業(yè)來(lái)源的數(shù)據(jù),而且一些大數(shù)據(jù)公司和互聯(lián)網(wǎng)企業(yè)本身?yè)碛兄苯用嫦蜃陨碛脩?hù)的渠道,因而他們對(duì)于企業(yè)的廣告價(jià)值有時(shí)不如傳統(tǒng)企業(yè)。廣告模式是當(dāng)前數(shù)據(jù)新聞主要的商業(yè)模式。
其二是用數(shù)據(jù)新聞凝練出來(lái)的團(tuán)隊(duì)和經(jīng)驗(yàn),以媒體公信力作背書(shū),打包一定的廣告價(jià)值,面向企業(yè)或行業(yè),提供數(shù)據(jù)產(chǎn)品或數(shù)據(jù)咨詢(xún)服務(wù)。這一路徑是2015年12月之前,一些媒體已在構(gòu)想,但尚未常態(tài)化、品牌化、規(guī)?;瘜?shí)現(xiàn)的。
在專(zhuān)業(yè)生產(chǎn)者和研究者尚未對(duì) “數(shù)據(jù)新聞”的概念和形態(tài)建立統(tǒng)一認(rèn)知的現(xiàn)階段,嘗試去辨識(shí)和研究數(shù)據(jù)新聞的消費(fèi)者,是件異常艱難的事。
在本研究中,我們將數(shù)據(jù)新聞的消費(fèi)者界定為數(shù)據(jù)新聞的關(guān)注者和閱讀者,嘗試從以下三條路徑獲得與該群體相關(guān)的數(shù)據(jù),并通過(guò)對(duì)這些數(shù)據(jù)的研究獲得其群體畫(huà)像。
其一,媒體數(shù)據(jù)新聞專(zhuān)欄的閱讀者。
媒體數(shù)據(jù)新聞專(zhuān)欄的閱讀者數(shù)據(jù)可公開(kāi)抓取的主要是經(jīng)過(guò)篩選的讀者留言。這意味著那些僅閱讀不留言,或留言未顯示的讀者群體無(wú)法被記錄和觀察。其次,很多媒體對(duì)新聞的瀏覽量、閱讀深度、用戶(hù)分布等數(shù)據(jù)不予公開(kāi)。同時(shí),用戶(hù)數(shù)據(jù)研究在一些媒體內(nèi)部不成熟或存在信息壁壘,導(dǎo)致一些數(shù)據(jù)新聞團(tuán)隊(duì)對(duì)本欄目的讀者群體并不了解。還有的團(tuán)隊(duì)對(duì)自己的用戶(hù)是誰(shuí)、用戶(hù)對(duì)新聞作品的反饋等信息也不關(guān)心。此外,很多數(shù)據(jù)新聞在發(fā)表時(shí)并未歸屬于某一 “數(shù)據(jù)新聞”專(zhuān)欄,甚至并未打上 “數(shù)據(jù)新聞”的標(biāo)簽。這些原因?qū)е峦ㄟ^(guò)研究數(shù)據(jù)新聞專(zhuān)欄的閱讀者去抵達(dá)數(shù)據(jù)新聞?dòng)脩?hù)群體的努力基本失敗。
其二,搜索引擎中對(duì) “數(shù)據(jù)新聞”進(jìn)行關(guān)鍵詞檢索的人群,我們將之界定為數(shù)據(jù)新聞的關(guān)注人群。
本研究主要針對(duì)中國(guó)的數(shù)據(jù)新聞使用者,因此選擇百度指數(shù)作為數(shù)據(jù)來(lái)源。該指數(shù)能夠反映通過(guò)百度進(jìn)行 “數(shù)據(jù)新聞”關(guān)鍵詞檢索的人群的基本特征。雖然無(wú)法確定人們檢索行為的動(dòng)機(jī)和檢索之后的后續(xù)行動(dòng),但至少該數(shù)據(jù)在一定程度反映出了人們對(duì) “數(shù)據(jù)新聞”的興趣的變化。
2015年12月底,百度指數(shù)已經(jīng)創(chuàng)建了 “數(shù)據(jù)新聞”這一詞條,表明對(duì)該詞的檢索量已達(dá)一定規(guī)模。該指數(shù)顯示 (如圖10)2014年2月16日至3月8日,對(duì) “數(shù)據(jù)新聞”的檢索出現(xiàn)爆發(fā)式增長(zhǎng),除在2015年年關(guān)前后出現(xiàn)低谷外,整體呈現(xiàn)向上增長(zhǎng)趨勢(shì)。
圖10 “數(shù)據(jù)新聞”的百度搜索指數(shù)變化 (2013年1月至2015年12月)
百度指數(shù)中 “數(shù)據(jù)新聞”人群畫(huà)像數(shù)據(jù)的起始點(diǎn)是2014年2月①雖然百度指數(shù)中 “數(shù)據(jù)新聞”的 “人群屬性”界面顯示數(shù)據(jù)起點(diǎn)是2013年9月,但經(jīng)核查,2013年9月至2014年1月均無(wú)數(shù)據(jù)。,2014年8月和2015年12月數(shù)據(jù)空缺。地域分布數(shù)據(jù)②百度指數(shù)的 “區(qū)域分布數(shù)據(jù)”顯示的是關(guān)注該關(guān)鍵詞的用戶(hù)來(lái)自哪些區(qū)域。其算法說(shuō)明是:“根據(jù)百度用戶(hù)搜索數(shù)據(jù),采用數(shù)據(jù)挖掘發(fā)放,對(duì)關(guān)鍵詞的人群屬性進(jìn)行聚類(lèi)分析,給出用戶(hù)所屬的省份、城市,及城市級(jí)別的分布及排名”,參見(jiàn)百度指數(shù)官方網(wǎng)站http://index.baidu.com。顯示 (見(jiàn)圖11),2015年12月之前,“數(shù)據(jù)新聞”綜合搜索指數(shù)最高的城市是北京,其他依次是武漢、上海、廣州、天津、成都、杭州、南京、西安和濟(jì)南。
以月為時(shí)間單位,在百度指數(shù)中對(duì) “數(shù)據(jù)新聞”搜索熱度的地域排名進(jìn)行進(jìn)一步探索后發(fā)現(xiàn),在綜合排名中排在前四位的城市 (北京、武漢、上海、廣州)對(duì) “數(shù)據(jù)新聞”的搜索熱度相對(duì)平穩(wěn),從圖11中可看到,這四座城市的搜索熱度排行隨時(shí)間變化呈現(xiàn)出較為連續(xù)和平穩(wěn)的折線(xiàn)。其中北京地區(qū)的搜索熱度一直穩(wěn)居第一。
圖11 綜合排名前四位的城市搜索熱度排行隨時(shí)間變化
搜索熱度排名第2位概率最高的是武漢市,在2014年2月至2015年12月間 (有兩個(gè)月無(wú)數(shù)據(jù)),6次排位第2,占比40%。其他曾排位至第2名的城市分別是上海 (3次)、廣州 (3次)、重慶 (1次)、天津 (1次)和濟(jì)南 (1次)。
上海是除北京之外,對(duì) “數(shù)據(jù)新聞”搜索熱度最為穩(wěn)定的城市,排名主要保持在第2位至第4位 (僅有一次位列第5),其中位列第3的次數(shù)最多。上海也是所有城市中,對(duì) “數(shù)據(jù)新聞”搜索熱度排名第3位概率最高的城市,占比53% (8次)。其他曾排位至第3名的城市分別是武漢 (3次)、廣州 (1次)、成都 (1次)、濟(jì)南 (1次) 和鄂州 (1次)。
在搜索熱度綜合排行榜中排名后六位的城市 (天津、成都、杭州、南京、西安、濟(jì)南)對(duì) “數(shù)據(jù)新聞”的搜索熱度隨時(shí)間變化很大,在圖12中表現(xiàn)為連續(xù)性很低的陡峭線(xiàn)段。
圖12 綜合排名后六位的城市搜索熱度排行隨時(shí)間變化
除上述10座城市之外,還有29座其他城市曾經(jīng)出現(xiàn)在2014年2月至2015年12月對(duì) “數(shù)據(jù)新聞”搜索熱度排名前十位 (參見(jiàn)圖13),但在地理位置上分布極為分散。其中超過(guò)半數(shù) (52%)的城市只出現(xiàn)過(guò)一次,只有兩座城市的出現(xiàn)次數(shù)超過(guò)5次,分別是重慶和沈陽(yáng) (各出現(xiàn)6次)。
圖13 其他城市出現(xiàn)在搜索熱度排名前十位的次數(shù)
由上述數(shù)據(jù)可以看到,2014年初至2015年底,“數(shù)據(jù)新聞”的關(guān)注度和其關(guān)注群體所在的地域范圍逐漸擴(kuò)大,其中分布在北京、武漢、上海、廣州的群體已經(jīng)達(dá)到一定的規(guī)模,已產(chǎn)生相對(duì)穩(wěn)定而活躍的檢索行為。遺憾的是,百度指數(shù)并未顯示不同地區(qū)的 “數(shù)據(jù)新聞”搜索指數(shù)的絕對(duì)值,且暫無(wú) “人群屬性”①百度指數(shù)的 “人群屬性”數(shù)據(jù)顯示關(guān)注該關(guān)鍵詞的用戶(hù)的性別、年齡分布。算法說(shuō)明:根據(jù)百度用戶(hù)搜索數(shù)據(jù),采用數(shù)據(jù)挖掘方法,對(duì)關(guān)鍵詞的人群屬性進(jìn)行聚類(lèi)分析,給出用戶(hù)所屬的年齡及性別的分布及排名。參見(jiàn)百度指數(shù)官方網(wǎng)站http://index.baidu.com。數(shù)據(jù)。這使我們還有大量關(guān)于 “數(shù)據(jù)新聞”用戶(hù)檢索行為的問(wèn)題無(wú)法找到答案,對(duì)于該群體的理解依然停留在非常表面的階段。
其三,新聞聚合中被貼上 “數(shù)據(jù)新聞”標(biāo)簽的閱讀者。
“今日頭條”通過(guò)大數(shù)據(jù)和機(jī)器算法給用戶(hù)貼上標(biāo)簽,用于分析用戶(hù)的信息需求,以便實(shí)現(xiàn)智能化的精準(zhǔn)信息推送。一般一個(gè)用戶(hù)會(huì)被標(biāo)注數(shù)百個(gè)標(biāo)簽。這些標(biāo)簽不是人為標(biāo)注,而是根據(jù)用戶(hù)海量的閱讀、搜索等行為自動(dòng)生成。
“今日頭條算數(shù)中心”提供的數(shù)據(jù)顯示,“數(shù)據(jù)新聞”已經(jīng)作為關(guān)鍵詞自動(dòng)析出,表明針對(duì) “數(shù)據(jù)新聞”的閱讀行為已經(jīng)達(dá)到一定的頻度和規(guī)模,并成為一些用戶(hù)的可識(shí)別閱讀行為。數(shù)據(jù)新聞標(biāo)簽用戶(hù)最多使用的手機(jī)品牌與今日頭條全平臺(tái)用戶(hù)最多使用的手機(jī)品牌略有差異。在使用最多的前十名手機(jī)品牌中,兩者的重合率為80%,兩個(gè)群體最多使用的手機(jī)品牌都是 “蘋(píng)果”,今日頭條全平臺(tái)用戶(hù)中 “小米”的使用者多于 “華為”,而數(shù)據(jù)新聞標(biāo)簽用戶(hù)與之相反,使用 “華為”的人多過(guò)使用 “小米”的人。此外,今日頭條全平臺(tái)用戶(hù)使用量最大的十大手機(jī)品牌中,有兩個(gè)品牌沒(méi)有出現(xiàn)在數(shù)據(jù)新聞標(biāo)簽用戶(hù)使用量最大的十大手機(jī)品牌中,分別是 “OPPO”和 “金立”,反之?dāng)?shù)據(jù)新聞標(biāo)簽用戶(hù)十大手機(jī)品牌中特有的兩個(gè)品牌是 “史努比”和 “樂(lè)視”(見(jiàn)表16)。
表16 今日頭條全平臺(tái)用戶(hù)和數(shù)據(jù)新聞標(biāo)簽用戶(hù)使用手機(jī)品牌的差異
數(shù)據(jù)還顯示,擁有 “數(shù)據(jù)新聞”標(biāo)簽的用戶(hù)與今日頭條整體用戶(hù)的興趣類(lèi)別和興趣關(guān)鍵詞存在較大差異。如表17所示,在關(guān)注度最高的前10個(gè)興趣類(lèi)別中,兩者共同擁有的興趣類(lèi)別只有50%,分別是 “社會(huì)” “娛樂(lè)”“國(guó)際”“體育”和 “時(shí)政”。其中 “社會(huì)”和 “娛樂(lè)”,兩者關(guān)注度都很高的,均位于最感興趣的前三項(xiàng)興趣類(lèi)別中。兩者對(duì) “時(shí)政”的關(guān)注度相當(dāng),均位列第9。此外,數(shù)據(jù)新聞標(biāo)簽用戶(hù)對(duì) “體育”類(lèi)別的關(guān)注度高于總體用戶(hù),而對(duì) “國(guó)際”類(lèi)別的關(guān)注度低于總體用戶(hù)。
表17 今日頭條中數(shù)據(jù)新聞標(biāo)簽用戶(hù)與其總體用戶(hù)興趣標(biāo)簽和關(guān)鍵詞的區(qū)別
更大的差異表現(xiàn)在雙方不同的興趣類(lèi)別。數(shù)據(jù)新聞標(biāo)簽用戶(hù)最關(guān)注的“科技”和排在稍后的 “財(cái)經(jīng)”“數(shù)碼” “教育”和 “技術(shù)”均未出現(xiàn)在今日頭條總體用戶(hù)最關(guān)注的10大興趣類(lèi)別之內(nèi),在其中取而代之的是 “健康”“汽車(chē)”“軍事”“時(shí)尚”和 “歷史”。具體到 “興趣關(guān)鍵詞”,數(shù)據(jù)新聞標(biāo)簽用戶(hù)與今日頭條整體用戶(hù)最感興趣的十大關(guān)鍵詞的差異率是100%。前者的十大興趣關(guān)鍵詞主要屬于科技類(lèi),而后者的十大興趣關(guān)鍵詞主要屬于社會(huì)和娛樂(lè)類(lèi)。
根據(jù) “今日頭條算數(shù)中心”以 “數(shù)據(jù)新聞” “數(shù)據(jù)可視化” “數(shù)說(shuō)”“數(shù)讀”為關(guān)鍵詞①關(guān)鍵詞是在系統(tǒng)提供的相關(guān)關(guān)鍵詞的基礎(chǔ)上人工去掉了 “數(shù)據(jù)”和 “數(shù)知”兩個(gè)詞。前者產(chǎn)生的結(jié)果太過(guò)寬泛,而后者在今日頭條的系統(tǒng)中還非常冷僻,數(shù)據(jù)量過(guò)小。,對(duì)2015年全年該平臺(tái)產(chǎn)生的數(shù)據(jù)新聞發(fā)布和閱讀相關(guān)數(shù)據(jù)進(jìn)行檢索和計(jì)算,結(jié)果顯示,2015年數(shù)據(jù)新聞相關(guān)文章數(shù)量和關(guān)注熱度均呈增長(zhǎng)迅速 (如圖14、圖15所示)。1月的數(shù)據(jù)新聞文章數(shù)為105篇,而12月為798篇,比1月增長(zhǎng)了660%。數(shù)據(jù)新聞的今日頭條熱度指數(shù)在2015年1月是14101,而12月是67326,比1月增長(zhǎng)了377%。其間,在2015年4月,數(shù)據(jù)新聞的今日頭條熱度指數(shù)一度達(dá)到88210,為年度峰值。
圖14 今日頭條的數(shù)據(jù)新聞文章數(shù)變化 (2015年)
圖15 今日頭條的數(shù)據(jù)新聞熱度指數(shù)變化 (2015年)
在數(shù)據(jù)新聞數(shù)量和熱度指數(shù)雙料上漲的趨勢(shì)中,其有效閱讀率較為穩(wěn)定。今日頭條將停留時(shí)間超過(guò)10秒的閱讀行為定義為 “有效閱讀”。2015年,數(shù)據(jù)新聞在今日頭條的有效閱讀率①有效閱讀率=有效閱讀數(shù)/總閱讀數(shù)×100%。保持在68%至76% (見(jiàn)圖16)。
圖16 今日頭條的數(shù)據(jù)新聞?dòng)行ч喿x率的變化 (2015年)
不同主題類(lèi)別數(shù)據(jù)新聞的年度總閱讀量存在較大差異。如圖17所示,閱讀量最大的是時(shí)政類(lèi),其后閱讀量依次遞減的是汽車(chē)類(lèi)、體育類(lèi)、科技類(lèi)、社會(huì)類(lèi)、教育類(lèi)、財(cái)經(jīng)類(lèi)、房產(chǎn)類(lèi)、旅游類(lèi)、娛樂(lè)類(lèi)。排在第一位的時(shí)政類(lèi)的閱讀量是排名第十位娛樂(lè)類(lèi)閱讀量的8.6倍。不同主題類(lèi)別數(shù)據(jù)新聞的閱讀量排序與前述數(shù)據(jù)新聞標(biāo)簽人群的興趣類(lèi)別排序存在一定差異。其原因可能與不同主題數(shù)據(jù)新聞的數(shù)量存在差異相關(guān)。
圖17 今日頭條不同主題類(lèi)別數(shù)據(jù)新聞的閱讀量差異 (2015年)
根據(jù) “總閱讀量”排名,2015年今日頭條中Top20的數(shù)據(jù)新聞來(lái)源如圖18所示。對(duì)這些來(lái)源的機(jī)構(gòu)主體性質(zhì)和提供內(nèi)容的話(huà)題領(lǐng)域進(jìn)行進(jìn)一步分析后發(fā)現(xiàn),這20個(gè)來(lái)源中,55%來(lái)自媒體,5%來(lái)自研究機(jī)構(gòu),其余均來(lái)自非媒體類(lèi)企業(yè),包括30%來(lái)自數(shù)據(jù)科技公司,5%來(lái)自教育公司,5%來(lái)自媒體咨詢(xún)公司 (見(jiàn)圖19)。一方面表明媒體作為專(zhuān)業(yè)的新聞采編與發(fā)布機(jī)構(gòu)在數(shù)據(jù)新聞?lì)I(lǐng)域占據(jù)相對(duì)的優(yōu)勢(shì),另一方面表明與數(shù)據(jù)相關(guān)的企業(yè)借勢(shì)“數(shù)據(jù)新聞”的概念亦在該領(lǐng)域具備較大影響力①因?yàn)樵诒狙芯恐胁⑽磳?duì)Top20中的機(jī)構(gòu)做逐一訪(fǎng)談,對(duì)于數(shù)據(jù)相關(guān)企業(yè)來(lái)源的信息在今日頭條的數(shù)據(jù)新聞標(biāo)簽信息中閱讀量較高的情況,不能確定是否是企業(yè)有意識(shí)的行為。如果答案是肯定的,還有必要進(jìn)一步研究其行為的具體策略和后果。。Top20中排名第一位的“麥可思研究”就是一家專(zhuān)注于教育領(lǐng)域的數(shù)據(jù)公司。在總閱讀量Top20的媒體中,新媒體占比67%。其中財(cái)新數(shù)據(jù)可視化實(shí)驗(yàn)室來(lái)源的數(shù)據(jù)新聞總閱讀量最高。傳統(tǒng)媒體僅占33%??傮w來(lái)看,Top20的數(shù)據(jù)新聞來(lái)源所涉及的話(huà)題領(lǐng)域較為分散 (見(jiàn)圖20)。除了有4家綜合媒體以跨領(lǐng)域的話(huà)題占據(jù)20%的份額之外,其他各類(lèi)話(huà)題占比均不超過(guò)10%。
圖18 2015年今日頭條中TOP20的數(shù)據(jù)新聞來(lái)源
圖19 今日頭條TOP20數(shù)據(jù)新聞來(lái)源的主體構(gòu)成 (2015)
圖20 今日頭條TOP20數(shù)據(jù)新聞來(lái)源的話(huà)題領(lǐng)域構(gòu)成 (2015年)
今日頭條算數(shù)中心提供的數(shù)據(jù)還顯示,數(shù)據(jù)新聞閱讀數(shù)在不同性別、年齡和地域的用戶(hù)群體中存在一定差異。男性用戶(hù)中數(shù)據(jù)新聞閱讀數(shù)占比 (性別占比×1000①性別占比×1000=某年齡段用戶(hù)產(chǎn)生的數(shù)據(jù)新聞閱讀數(shù)/該性別用戶(hù)在同時(shí)間產(chǎn)生的總閱讀量×1000。=2.40%) 高于女性用戶(hù)群體 (性別占比×1000=1.07%)。數(shù)據(jù)新聞在31~40歲年齡階段的群體中的閱讀數(shù)占比最高 (年齡占比×1000②年齡占比×1000=某年齡段用戶(hù)產(chǎn)生的數(shù)據(jù)新聞閱讀數(shù)/該年齡段在同時(shí)間產(chǎn)生的總閱讀量×1000。=2.34%)。除此之外,18歲以上其他年齡階段人群的數(shù)據(jù)新聞閱讀數(shù)占比差別不大 (平均年齡占比×1000=1.77%) (見(jiàn)圖21)。在地域分布上來(lái)看(見(jiàn)圖22)③青海、西藏、香港、澳門(mén)、臺(tái)灣的數(shù)據(jù)今日頭條未提供。,北京地區(qū)的數(shù)據(jù)新聞閱讀數(shù)在該地區(qū)總體閱讀數(shù)中所占比例在全國(guó)最高 (省份占比×1000④省份占比×1000=某省份用戶(hù)產(chǎn)生的數(shù)據(jù)新聞閱讀數(shù)/該省份用戶(hù)在同時(shí)間產(chǎn)生的總閱讀量×1000。=3.56%),其后依次是湖北省 (2.86%)、四川省 (2.20%)、 廣東省 (2.12%)、 上海 (1.99%)、 重慶 (1.98%)、 福建省(1.93%)、 江西省 (1.86%)、 浙江省 (1.86%)、 寧夏 (1.86%)。
圖21 今日頭條數(shù)據(jù)新聞閱讀數(shù)年齡占比
將這一排名與同一時(shí)間段百度指數(shù)提供的數(shù)據(jù)新聞搜索指數(shù)排名對(duì)照來(lái)看 (表18),盡管有一些排序上的差異,但是兩個(gè)排名中有60%的省份(及直轄市、自治區(qū))是一致的,特別是北京和湖北,在兩個(gè)排名中的排序完全一樣。這可能表明對(duì)數(shù)據(jù)新聞檢索行為活躍的地區(qū)可能也有更多數(shù)據(jù)新聞的閱讀者。但由于百度指數(shù)和今日頭條提供的數(shù)據(jù)并不指向同一用戶(hù)群體,因而在本研究中暫時(shí)無(wú)法對(duì)這一猜想做進(jìn)一步的證實(shí)。
表18 今日頭條與百度指數(shù)數(shù)據(jù)對(duì)比
雖然百度指數(shù)反映的是通過(guò)百度進(jìn)行檢索的行為,今日頭條作為新聞聚合閱讀器也不能提供單條新聞的全網(wǎng)閱讀數(shù)據(jù)①除了獨(dú)家版權(quán)、獨(dú)家發(fā)布、禁止轉(zhuǎn)載并能夠做到絕對(duì)的版權(quán)保護(hù)的新聞發(fā)布平臺(tái)之外,幾乎沒(méi)有任何新聞客戶(hù)端、新聞聚合器或其他網(wǎng)站能夠獲得單條新聞的全網(wǎng)閱讀數(shù)據(jù)。,而是記錄從該平臺(tái)產(chǎn)生的流量。它們的數(shù)據(jù)都與各自的產(chǎn)品功能直接相關(guān),在各具特色的同時(shí)也都存在一定局限性。但百度和今日頭條的數(shù)據(jù)以用戶(hù)真實(shí)發(fā)生的行為大數(shù)據(jù)為基礎(chǔ),依然為我們理解數(shù)據(jù)新聞的用戶(hù)群體提供了寶貴的線(xiàn)索。
騰訊新聞資訊部產(chǎn)品主編奚流在接受訪(fǎng)談時(shí)提到,數(shù)據(jù)新聞可能帶來(lái)一系列隱憂(yōu):
在數(shù)據(jù)新聞,特別是大數(shù)據(jù)新聞時(shí)代真正到來(lái)前,媒體還要解決四個(gè)問(wèn)題,包括:數(shù)據(jù)來(lái)源問(wèn)題、大數(shù)據(jù)思維運(yùn)用問(wèn)題、表達(dá)形式問(wèn)題和媒體合作問(wèn)題。解決這些隱憂(yōu)需要大數(shù)據(jù)新聞制作者和受眾一同努力,從而為社會(huì)帶來(lái)更多的傳播效益。
這一來(lái)自新聞從業(yè)者的反思鮮明地指出了當(dāng)前數(shù)據(jù)新聞面臨的一些主要困境。雖然數(shù)據(jù)新聞是當(dāng)前媒體新聞創(chuàng)新的排頭兵,越來(lái)越多的媒體開(kāi)始嘗試和投入,同時(shí),有一些先行的實(shí)踐者已經(jīng)離開(kāi)這個(gè)領(lǐng)域,認(rèn)為數(shù)據(jù)新聞的熱度已過(guò)。但事實(shí)上,中國(guó)的數(shù)據(jù)新聞依然非常不成熟,也缺乏行業(yè)規(guī)范①方潔:《數(shù)據(jù)新聞:一個(gè)亟待確立專(zhuān)業(yè)規(guī)范的領(lǐng)域——基于國(guó)內(nèi)五個(gè)數(shù)據(jù)新聞欄目的定量研究》,《國(guó)際新聞界》2015年第12期。。如果我們仔細(xì)考察當(dāng)前數(shù)據(jù)新聞的整個(gè)生產(chǎn)過(guò)程,可以看到基本的生產(chǎn)三要素——生產(chǎn)者、生產(chǎn)工具和生產(chǎn)對(duì)象都存在亟待解決的問(wèn)題。
第一,如前所述,中國(guó)數(shù)據(jù)新聞團(tuán)隊(duì)的人員構(gòu)成較少能夠完全符合獨(dú)立生產(chǎn)數(shù)據(jù)新聞的需要。除了影響數(shù)據(jù)新聞生產(chǎn)效率之外,更為重要的是缺乏數(shù)據(jù)新聞生產(chǎn)的核心人才——數(shù)據(jù)分析師。缺少數(shù)據(jù)分析師意味著缺乏向數(shù)據(jù)正確提問(wèn)、深入提問(wèn)、系統(tǒng)提問(wèn)的能力。數(shù)據(jù)素養(yǎng)的不足將可能帶來(lái)數(shù)據(jù)思維、數(shù)據(jù)倫理相關(guān)的一系列問(wèn)題。譬如,在日常工作層面,可能從業(yè)者會(huì)缺乏數(shù)據(jù)新聞選題的想象力和數(shù)據(jù)分析科學(xué)性的判斷能力;可能對(duì)數(shù)據(jù)倫理風(fēng)險(xiǎn)缺乏認(rèn)知、防范和糾錯(cuò)能力;還可能對(duì)第三方數(shù)據(jù)源過(guò)于依賴(lài),并缺乏判斷力。在團(tuán)隊(duì)長(zhǎng)遠(yuǎn)發(fā)展的層面,數(shù)據(jù)素養(yǎng)的不足可能導(dǎo)致不能充分認(rèn)識(shí)數(shù)據(jù)價(jià)值,對(duì)自身的數(shù)據(jù)能力建設(shè)缺乏長(zhǎng)遠(yuǎn)規(guī)劃,對(duì)已有數(shù)據(jù)不留存、不積累、不管理。
第二,雖然市面上已經(jīng)有數(shù)據(jù)爬取、數(shù)據(jù)清洗、數(shù)據(jù)分析、數(shù)據(jù)可視化的各種相關(guān)工具,但能夠熟練使用所有這些工具的數(shù)據(jù)新聞從業(yè)者依然不多。主要原因是,首先,除少數(shù)新興媒體或用人機(jī)制較為靈活并愿意在數(shù)據(jù)新聞團(tuán)隊(duì)建設(shè)進(jìn)行大量投入的媒體能夠系統(tǒng)性引進(jìn)數(shù)據(jù)新聞專(zhuān)業(yè)人才之外,更多的媒體需要從業(yè)者自我學(xué)習(xí)或接受技能培訓(xùn),從而滿(mǎn)足數(shù)據(jù)新聞工作的需要。但目前由一些高?;驒C(jī)構(gòu)提供的相關(guān)培訓(xùn)規(guī)模有限,能夠輻射的人群不多。通常每次能夠參加培訓(xùn)的人數(shù)只有報(bào)名人數(shù)的4%~10%。并且相關(guān)培訓(xùn)均為基礎(chǔ)培訓(xùn)。最長(zhǎng)7天,最短3天,只能入門(mén),并未提供連續(xù)、深入、系統(tǒng)學(xué)習(xí)的機(jī)會(huì)和機(jī)制。其次,這些不同的工具中的絕大多數(shù)原本是為各自領(lǐng)域的專(zhuān)業(yè)用戶(hù)設(shè)計(jì),而并非為數(shù)據(jù)新聞從業(yè)者量身打造。隔行如隔山,很多在原專(zhuān)業(yè)領(lǐng)域被認(rèn)為非常易用、簡(jiǎn)單的功能和操作邏輯對(duì)數(shù)據(jù)新聞從業(yè)者依然是很難的。最后,雖然有一些數(shù)據(jù)新聞?dòng)浾邔?duì)數(shù)據(jù)分析和/或代碼編程的學(xué)習(xí)充滿(mǎn)熱情和興趣,甚至出于對(duì)數(shù)據(jù)新聞的熱愛(ài)而自主轉(zhuǎn)型,但在調(diào)研中依然有大量從業(yè)者表達(dá)了數(shù)據(jù)新聞給他們帶來(lái)的壓迫感。他們將之描述為 “白領(lǐng)恐懼癥”:
原來(lái)只要專(zhuān)注于挖掘真相,寫(xiě)出優(yōu)質(zhì)的新聞消息或故事。進(jìn)入多媒體時(shí)代,要我們學(xué)攝影攝像、發(fā)微博,現(xiàn)在數(shù)據(jù)新聞?dòng)忠獙W(xué)數(shù)據(jù)分析、學(xué)代碼。感覺(jué)上一個(gè)還沒(méi)有學(xué)好,新的又來(lái)了。什么時(shí)候是個(gè)頭?
知識(shí)和技能更新帶來(lái)的壓力已經(jīng)讓一些從業(yè)者深感困惑,無(wú)所適從。他們因而更加抗拒學(xué)習(xí),并迷失其中,無(wú)法判斷什么是適合及必要的學(xué)習(xí)方案。
第三,中國(guó)數(shù)據(jù)新聞從業(yè)者面臨的普遍難題之一是數(shù)據(jù)的獲取。目前使用的數(shù)據(jù)源主要包括:中國(guó)政府的開(kāi)放數(shù)據(jù)①中國(guó)政府的開(kāi)放數(shù)據(jù)包括國(guó)家統(tǒng)計(jì)局?jǐn)?shù)據(jù)、地方政府開(kāi)放數(shù)據(jù)平臺(tái)等。、海外機(jī)構(gòu)或政府的開(kāi)放數(shù)據(jù)②海外機(jī)構(gòu)或政府的開(kāi)放數(shù)據(jù)數(shù)據(jù)來(lái)源如:聯(lián)合國(guó)、世界銀行、美國(guó)政府 (www.data.gov)等。、公開(kāi)但非開(kāi)放數(shù)據(jù)的網(wǎng)絡(luò)抓取、來(lái)自企業(yè)/研究機(jī)構(gòu)/非營(yíng)利機(jī)構(gòu)/專(zhuān)家學(xué)者的數(shù)據(jù)、自有數(shù)據(jù) (包括自身用戶(hù)數(shù)據(jù)、自有數(shù)據(jù)庫(kù)和自主調(diào)研數(shù)據(jù)等)、引用其他媒體數(shù)據(jù)。不同數(shù)據(jù)新聞團(tuán)隊(duì)依據(jù)自身所在平臺(tái)和欄目的定位與特點(diǎn)在數(shù)據(jù)來(lái)源的選擇上各有偏好。例如,財(cái)新黃晨介紹財(cái)新對(duì)數(shù)據(jù)來(lái)源的采信程度從高到低排列依次是: “政府官方數(shù)據(jù),權(quán)威組織機(jī)構(gòu)數(shù)據(jù),行業(yè)協(xié)會(huì)、資質(zhì)較高的調(diào)研機(jī)構(gòu)數(shù)據(jù)、財(cái)經(jīng)類(lèi)的股市數(shù)據(jù),大數(shù)據(jù)公司/科技公司的數(shù)據(jù),調(diào)查數(shù)據(jù),媒體二手?jǐn)?shù)據(jù)”。
與財(cái)新類(lèi)似的還有新華網(wǎng)、澎湃、《新京報(bào)》等,基本遵循的是 “政府官方為先、科研機(jī)構(gòu)其次、企業(yè)數(shù)據(jù)第三”的順序。但是也有一些媒體完全不同。例如,網(wǎng)易數(shù)讀關(guān)注國(guó)際選題較多,因此其數(shù)據(jù)來(lái)源主要是國(guó)際機(jī)構(gòu),其次是各種研究智庫(kù)。城市新一線(xiàn)研究室主要關(guān)注城市問(wèn)題,其數(shù)據(jù)來(lái)源主要是城市數(shù)據(jù)庫(kù)、互聯(lián)網(wǎng)數(shù)據(jù)庫(kù)、自主研究和抓取的數(shù)據(jù)。騰訊、搜狐作為互聯(lián)網(wǎng)新聞門(mén)戶(hù),本身具備較強(qiáng)的數(shù)據(jù)產(chǎn)出能力,因此它們都會(huì)使用內(nèi)部數(shù)據(jù)。DT財(cái)經(jīng)因?yàn)槭前⒗锿顿Y,在內(nèi)容上又偏重大財(cái)經(jīng)領(lǐng)域,因此在數(shù)據(jù)來(lái)源中首先是阿里、滴滴等企業(yè)數(shù)據(jù),其次是相關(guān)研究領(lǐng)域的研究機(jī)構(gòu)數(shù)據(jù)。
雖然可用的數(shù)據(jù)來(lái)源看起來(lái)很豐富,但在具體使用的過(guò)程中會(huì)面臨許多現(xiàn)實(shí)困難。其一,數(shù)據(jù)質(zhì)量參差不齊。數(shù)據(jù)質(zhì)優(yōu)的基本標(biāo)準(zhǔn)應(yīng)該是數(shù)據(jù)干凈、可下載、格式可計(jì)算 (以xls/csv/json格式為優(yōu))。但很多數(shù)據(jù)來(lái)源提供的數(shù)據(jù)并不能滿(mǎn)足上述標(biāo)準(zhǔn),因而需要消耗記者大量的時(shí)間進(jìn)行數(shù)據(jù)的抓取、核查和清洗。根據(jù)我們的研究,中國(guó)政府官方數(shù)據(jù)最優(yōu)質(zhì)的數(shù)據(jù)來(lái)源是中國(guó)國(guó)家統(tǒng)計(jì)局,其他來(lái)源中很多數(shù)據(jù)存在數(shù)據(jù)格式是圖片或者PDF,不可機(jī)讀,或者數(shù)據(jù)表格中數(shù)據(jù)過(guò)于簡(jiǎn)單,數(shù)據(jù)量很小或缺乏數(shù)值,甚至存在錯(cuò)誤。其二,數(shù)據(jù)獲取困難。雖然政府已經(jīng)提供了公開(kāi)數(shù)據(jù)的申請(qǐng)渠道,但根據(jù)同業(yè)者交流的反饋,基本沒(méi)有通過(guò)公開(kāi)申請(qǐng)渠道成功獲取數(shù)據(jù)的案例。其三,與企業(yè)或機(jī)構(gòu)的數(shù)據(jù)合作存在隱患。雖然企業(yè)或機(jī)構(gòu)可以提供優(yōu)質(zhì)數(shù)據(jù),但一般大型數(shù)據(jù)公司不可能提供數(shù)據(jù)接口,而會(huì)采用根據(jù)媒體需求提取數(shù)據(jù)的方式,媒體對(duì)此環(huán)節(jié)基本不可控。少數(shù)可以直接提供接口的數(shù)據(jù)公司或機(jī)構(gòu)又需要從業(yè)者具備更強(qiáng)的數(shù)據(jù)接口開(kāi)發(fā)和大體量數(shù)據(jù)集的分析能力,對(duì)從業(yè)者提出了更高的技術(shù)要求。最為重要的是數(shù)據(jù)新聞?dòng)浾咝枰獙?duì)企業(yè)或機(jī)構(gòu)提供數(shù)據(jù)的動(dòng)機(jī)保持理性的判斷,并盡可能多地參與數(shù)據(jù)獲取的過(guò)程,還需要對(duì)數(shù)據(jù)對(duì)應(yīng)的領(lǐng)域進(jìn)行深入的學(xué)習(xí)和研究,以便盡量確保獲取數(shù)據(jù)和解讀數(shù)據(jù)的科學(xué)性、合理性和客觀性。其四,與個(gè)人的數(shù)據(jù)合作存在的問(wèn)題在于,一般對(duì)于來(lái)自權(quán)威專(zhuān)家的研究數(shù)據(jù),新聞?dòng)浾咻^少產(chǎn)生懷疑或核查的動(dòng)機(jī)與行動(dòng),即便核查,難度和成本也很大。但實(shí)際上,任何研究都有局限性,如果不注意和充分理解這種局限性,則可能出現(xiàn)數(shù)據(jù)草率指代等問(wèn)題,得出錯(cuò)誤結(jié)論的情況。其五,較多媒體缺乏規(guī)范的數(shù)據(jù)來(lái)源注釋?zhuān)瑢?dǎo)致在媒體反復(fù)轉(zhuǎn)引的過(guò)程中,數(shù)據(jù)難以進(jìn)行追根溯源的核查。加之媒體日常工作中,時(shí)效性的壓力非常大,這項(xiàng)工作往往被忽視。
中國(guó)的數(shù)據(jù)新聞?wù)谥刂乩щy中不斷成長(zhǎng)。有觀點(diǎn)認(rèn)為,這一過(guò)程是由貌似松散的行動(dòng)者們形成的獨(dú)特網(wǎng)絡(luò)共同推動(dòng)。①錢(qián)進(jìn)、周俊:《從出現(xiàn)到擴(kuò)散:社會(huì)實(shí)踐視角下的數(shù)據(jù)新聞》,《新聞?dòng)浾摺?015年第2期。那么數(shù)據(jù)新聞將會(huì)被推向何方呢?財(cái)新時(shí)任數(shù)據(jù)新聞主編黃晨認(rèn)為:
數(shù)據(jù)新聞的概念可能被沉浸式報(bào)道、多媒體報(bào)道的概念代替,因?yàn)檫@樣數(shù)據(jù)新聞可能會(huì)被更多地接受,應(yīng)用得更廣泛。對(duì)于一線(xiàn)的新聞機(jī)構(gòu)來(lái)說(shuō),什么樣的方式最能帶來(lái)流量就是最好的,叫什么其實(shí)并不重要。
本研究認(rèn)為,不排除數(shù)據(jù)新聞的概念發(fā)生衍化的可能性,但如果我們將其本質(zhì),即 “基于數(shù)據(jù)科學(xué)的知識(shí)和技術(shù),通過(guò)或結(jié)合數(shù)據(jù)分析,對(duì)事實(shí)進(jìn)行新聞報(bào)道”,視作一種新聞報(bào)道的方法論,那么數(shù)據(jù)新聞不僅不會(huì)很快時(shí)過(guò)境遷,而且還將在未來(lái)的新聞實(shí)踐的發(fā)展中不斷向普及化、日常化的方向發(fā)展。正如學(xué)術(shù)研究方法中有質(zhì)化研究和量化研究,在哪種方法論更優(yōu)的多年?duì)幷摵?,人們發(fā)現(xiàn),它們各有優(yōu)劣,因而想要形成對(duì)某一問(wèn)題的系統(tǒng)研究,常常需要綜合使用不同的方法。數(shù)據(jù)新聞的制作方法與過(guò)去通過(guò)采訪(fǎng)、體驗(yàn)、觀察、資料研究等方式獲取和制作新聞的方法就類(lèi)似量化研究與質(zhì)化研究的關(guān)系。兩者在未來(lái)的新聞生產(chǎn)中將互相補(bǔ)充,不可或缺。特別是隨著數(shù)據(jù)時(shí)代的到來(lái),當(dāng)越來(lái)越多的信息被數(shù)據(jù)化,當(dāng)越來(lái)越多的數(shù)據(jù)被發(fā)布,不懂得制作數(shù)據(jù)新聞就意味著無(wú)視大量信源。斯坦福大學(xué)教授杰夫·麥吉(Geoff McGee)曾在 《大數(shù)據(jù)時(shí)代的新聞業(yè)》(Journalism in the Age of Data)中指出,數(shù)據(jù)爆炸使得人們的生活每天都被紛繁浩雜的數(shù)據(jù)包圍,而媒體的職責(zé)就在于為讀者解析這些數(shù)據(jù)。來(lái)自 《東京新聞》的功松波 (Isao Matsunami) 在 《數(shù)據(jù)新聞手冊(cè)》 (The Data Journalism Handbook) 中提到數(shù)據(jù)新聞能夠?yàn)楣娞峁?duì)官方資料的獨(dú)立闡釋。來(lái)自全球不同地區(qū)的研究者、同業(yè)者對(duì)數(shù)據(jù)新聞對(duì)數(shù)據(jù)時(shí)代信息的解釋能力基本達(dá)成共識(shí)。實(shí)際上在西方國(guó)家,一些學(xué)者和記者已經(jīng)在數(shù)據(jù)新聞?lì)I(lǐng)域研究、實(shí)踐了三十多年。伊利諾伊大學(xué)教授Brant Houston認(rèn)為未來(lái)數(shù)據(jù)新聞將會(huì)走向更高級(jí)的算法領(lǐng)域,“諸如聚類(lèi) (clustering)、主題模型 (topic modeling)等高級(jí)算法,已經(jīng)被應(yīng)用到自然語(yǔ)言處理 (NLP)技術(shù)中了。面對(duì)龐大的文本數(shù)據(jù)集,這些高級(jí)算法可以幫我們發(fā)現(xiàn)其中的主題或特征”①Adiel Kaplan,《數(shù)據(jù)新聞走向何方? “故事為核,跨界合作”》,2016-10-11,http://cn.gijn.org/2016 /10 /11 /%E6%8A%A5%E9%81%93%E4%BA%9A%E6%B4%B2-%E6%95%B0%E6%8D%AE%E6%96%B0%E9%97%BB%E8%B5%B0%E5%90%91%E4%BD%95%E6%96%B9%EF%BC%9F%E6%95%85%E4%BA%8B%E4%B8%BA%E6%A0%B8%EF%BC%8C%E8%B7%A8%E7%95%8C/)。。站在國(guó)際化的視野中,比較來(lái)看,中國(guó)數(shù)據(jù)新聞可以成長(zhǎng)的空間應(yīng)該不止未來(lái)三十年。
中國(guó)媒體發(fā)展研究報(bào)告2015年0期