孫詩雨
摘 要 隨著互聯(lián)網(wǎng)和云計算等技術(shù)的發(fā)展,大數(shù)據(jù)時代也隨之到來,但目前由于人們對大數(shù)據(jù)的認知不清導(dǎo)致了其對大數(shù)據(jù)的盲目崇拜,一味陷入大數(shù)據(jù)的漩渦之中,對大數(shù)據(jù)沒有做到理性審視。本文從大數(shù)據(jù)概念的探討,大數(shù)據(jù)的價值分析、大數(shù)據(jù)處理流程中的短板以及大數(shù)據(jù)之于新聞傳播的影響4個方面來分析大數(shù)據(jù),肯定了其價值,指出了其不足,以期人們能全面認識大數(shù)據(jù),從而更好地利用大數(shù)據(jù),讓大數(shù)據(jù)發(fā)揮出更大的價值。
關(guān)鍵詞 大數(shù)據(jù);價值;短板;新聞傳播;技術(shù)
中圖分類號 TP3 文獻標識碼 A 文章編號 1674-6708(2017)189-0077-04
近兩年來,大數(shù)據(jù)的浪潮愈演愈烈,“大數(shù)據(jù)”這個名詞也在各種場合被人們頻繁提起。在2017年兩會中,就有許多政協(xié)委員和人大代表提到了大數(shù)據(jù),并呼吁要利用好大數(shù)據(jù)來推動社會發(fā)展,像全國人大代表、浪潮集團董事長孫丕恕就在一次50分鐘的訪談中94次提到“大數(shù)據(jù)”。
不難發(fā)現(xiàn),當今社會,大數(shù)據(jù)技術(shù)有著眾多的追隨者,我們儼然處于大數(shù)據(jù)時代下的狂歡之中。所以,理性審視大數(shù)據(jù)顯得尤為重要。
目前關(guān)于大數(shù)據(jù),筆者認為主要有兩方面的問題,即迷惘與迷信。所謂迷惘,即不知什么是真正的大數(shù)據(jù);大數(shù)據(jù)的價值空間在哪,特別是對新聞傳播的價值;國家大力提倡和業(yè)界回應(yīng)間是否對應(yīng)等。所謂迷信,一是體現(xiàn)為學(xué)術(shù)研究凡事都扯上大數(shù)據(jù),這一點從中國知網(wǎng)上關(guān)于“大數(shù)據(jù)”的論文基本涉及各個領(lǐng)域(教育、醫(yī)療、電力等)就能體現(xiàn)出來;二是各地方政府和職能機關(guān)也動輒以大數(shù)據(jù)為制定政策的依據(jù)和出發(fā)點。
1 “大數(shù)據(jù)”概念還沒有公認的界定
其實,“大數(shù)據(jù)”這個概念由來已久。不過大數(shù)據(jù)真正受到各行各業(yè)的關(guān)注是在2011年6月麥肯錫公司發(fā)布關(guān)于“大數(shù)據(jù)”的報告之后,麥肯錫稱:“數(shù)據(jù),已經(jīng)滲透到當今每一個行業(yè)和業(yè)務(wù)職能領(lǐng)域,成為重要的生產(chǎn)因素。人們對于海量數(shù)據(jù)的挖掘和運用,預(yù)示著新一波生產(chǎn)率增長和消費者盈余浪潮的到來?!敝袊鴮Υ髷?shù)據(jù)的關(guān)注也是從2011開始的,另外,近幾年中國開始召開論壇會議像大數(shù)據(jù)技術(shù)與產(chǎn)業(yè)應(yīng)用大會等也讓“大數(shù)據(jù)熱”持續(xù)升溫。
不過,在當下,人們對大數(shù)據(jù)的態(tài)度卻陷入一種盲目崇拜的漩渦之中,很多人在對大數(shù)據(jù)認知模糊的時候就成了它的狂熱粉絲。其實到目前為止,大數(shù)據(jù)還沒有一個統(tǒng)一的定義。大數(shù)據(jù)的鼻祖舍恩伯格在解釋大數(shù)據(jù)時也沒有給出一個確切的描述,“大數(shù)據(jù)是人們獲得新的認知、創(chuàng)造新的價值的源泉;大數(shù)據(jù)還是改變市場、組織機構(gòu),以及政府與公民關(guān)系的方法?!盵1]這是他在書中的一段詮釋,具有人文色彩和社會意義,因此,對于大數(shù)據(jù)概念的界定要看研究者從哪個角度來研究它而定。正是大數(shù)據(jù)概念的這種不確定性,使得人們對其充滿了想象,進而把它神化。
目前國內(nèi)外的專家學(xué)者對大數(shù)據(jù)的準確定義給出的結(jié)論不一。在舍恩伯格提出大數(shù)據(jù)的概念之后,關(guān)于大數(shù)據(jù)概念的研究層出不窮,國內(nèi)外的專家學(xué)者、科研機構(gòu)甚至是企業(yè)家們都對大數(shù)據(jù)表達了一定的見解。中國學(xué)者王岑嵐和尤建新將現(xiàn)在國內(nèi)外已有的大數(shù)據(jù)的定義分為四類,基本涵蓋了國內(nèi)外學(xué)者以及機構(gòu)對大數(shù)據(jù)概念的論述,分別是屬性定義、來源定義、比較定義以及構(gòu)架定義。屬性定義以Gartner機構(gòu)為代表,主要是從大數(shù)據(jù)特征的角度來解釋大數(shù)據(jù)的概念,最后慢慢發(fā)展成為目前公認的大數(shù)據(jù)的“4V(數(shù)據(jù)容量大(Volume)、數(shù)據(jù)類型繁多(Variety)、商業(yè)價值高(Value)、處理速度快(Velocity))”特點,不過這幾年國內(nèi)外的專家學(xué)者又提出了可視性(Visualization)、合法性(Validity)、真實(Veracity)等新的特征,現(xiàn)在這些新提法也正在探討之中;來源定義是從人、機、物三個維度來談的;比較定義很好理解,即通過和傳統(tǒng)數(shù)據(jù)的比較來解析大數(shù)據(jù)的定義;構(gòu)架定義是把大數(shù)據(jù)分為大數(shù)據(jù)科學(xué)和大數(shù)據(jù)構(gòu)架從而進行闡釋的。雖然作者在這篇文章中提煉出了大數(shù)據(jù)概念的共通之處,即“大數(shù)據(jù)是指人類能夠獲取的完整的、動態(tài)的、事實的數(shù)據(jù)流,具有容量高,速度快,結(jié)構(gòu)復(fù)雜的特點,只有在充分合理利用的情況下才有可能發(fā)揮其高價值和準確性的特點。”[2]但是,筆者認為把這段話當做是大數(shù)據(jù)的定義還是遠遠不夠的。
大數(shù)據(jù)和傳統(tǒng)意義上的數(shù)據(jù)相比,多了一個“大”字,但是這個“大”字的界定是沒有具體的統(tǒng)一的指標的,很多學(xué)者也表示大數(shù)據(jù)這種數(shù)據(jù)集“沒有最好只有更好”,所以大數(shù)據(jù)是沒有衡量標準的。雖然從簡單意義上來看,大數(shù)據(jù)是指所有的數(shù)據(jù),這也是很多人對大數(shù)據(jù)的理解;但是在當下,大數(shù)據(jù)的內(nèi)容并不能包含所有的數(shù)據(jù),它無法達到信息飽和,只能說它的終極目標是無窮化。所以,在我看來,大數(shù)據(jù)與傳統(tǒng)意義上的數(shù)據(jù)的本質(zhì)上是沒有差別的,它們都屬于數(shù)據(jù)信息,都需要對獲取來的數(shù)據(jù)進行“加工”實現(xiàn)數(shù)據(jù)的“增值”。
大數(shù)據(jù)的挖掘、獲取和處理是需要特殊的技術(shù)支持的,云計算就是其中一種重要的技術(shù),它和大數(shù)據(jù)的關(guān)系密不可分。但是目前對云計算的解釋也有很多種,所以這就讓人們對大數(shù)據(jù)的概念更加捉摸不透,在不知不覺中給大數(shù)據(jù)戴上了神秘的面紗。
2 大數(shù)據(jù)的價值:應(yīng)然與實然的差距
雖然,大數(shù)據(jù)的概念具有模糊性,但是其價值仍舊能夠凸顯出來。上文提到的“4V”特點就彰顯了大數(shù)據(jù)存在的價值。大數(shù)據(jù)提高了人們記錄和采集相關(guān)信息的能力,將海量數(shù)據(jù)進行關(guān)聯(lián)分析,從而輔助我們在各個領(lǐng)域做出決策,有利于人們發(fā)現(xiàn)事物的規(guī)律,進行趨勢預(yù)測,所以其價值有目共睹。
清華大學(xué)信息技術(shù)研究院的研究員薛一波指出,“大數(shù)據(jù)的科學(xué)價值和社會價值主要體現(xiàn)在兩個方面:一方面,大數(shù)據(jù)不僅可以發(fā)現(xiàn)事物的顯式規(guī)律,而且可以挖掘事物的隱式規(guī)律和潛在價值;另一方面,大數(shù)據(jù)可以轉(zhuǎn)化為經(jīng)濟價值的源泉,撼動世界的各個方面?!盵3]他在文中沒有著重分析“科學(xué)價值”和“社會價值”的內(nèi)涵,但筆者認為這兩個提法可以用來分析大數(shù)據(jù)所帶來的價值。
人們對科學(xué)價值的關(guān)注度很低,因為它周期長,基本都處于潛在價值的范圍之內(nèi),但是科學(xué)價值是大數(shù)據(jù)價值非常重要的一環(huán),它主要通過對大數(shù)據(jù)及其技術(shù)的研究所產(chǎn)生來實現(xiàn)的,大數(shù)據(jù)研究的熱潮激勵基礎(chǔ)研究的科研人員更加關(guān)注“數(shù)據(jù)科學(xué)”問題,這有望使得大數(shù)據(jù)的技術(shù)越來越純熟,更好地發(fā)揮大數(shù)據(jù)預(yù)測的核心價值,讓大數(shù)據(jù)更好地為人所用。
至于社會價值,筆者是基于廣義的社會價值進行分析的,包括政治價值、經(jīng)濟價值、文化價值等各種社會構(gòu)成元素的價值。其中,經(jīng)濟價值目前體現(xiàn)得最明顯,為人所津津樂道,“4V”特點中也直接提到了大數(shù)據(jù)商業(yè)價值高,它能創(chuàng)造巨大的利潤,有利于細分市場和精準營銷,滿足更多的顧客的需求。其次就是大數(shù)據(jù)給社會生活帶來的便利,在治安、交通、醫(yī)療等生活領(lǐng)域,大數(shù)據(jù)都發(fā)揮著重要的作用。以交通為例,大數(shù)據(jù)可通過對公交地鐵刷卡、停車收費站、視頻攝像頭等信息的收集,分析預(yù)測出行交通規(guī)律,指導(dǎo)公交線路的設(shè)計、調(diào)整車輛派遣密度,進行車流指揮控制,及時做到梳理擁堵,合理緩解城市交通負擔。在2017年3月27日,高德地圖發(fā)布了《2017年清明節(jié)出行預(yù)測報告》,就是運用了大數(shù)據(jù)預(yù)測,為人們提供了假期出行福利。
然而在當下的中國,大數(shù)據(jù)的價值并沒有充分發(fā)揮,究其原因,主要包括制度限制、心理障礙以及技術(shù)問題這3個方面。技術(shù)問題包含在下一部分“大數(shù)據(jù)處理流程中的短板”中,在此就不做贅述,以下分析前兩個問題。
一是制度限制。近幾年對大數(shù)據(jù)的研究層出不窮,國家也十分鼓勵關(guān)于大數(shù)據(jù)的研究項目,這一點從國家社科基金年度項目的立項名單中就可以看出來:2014年國家社科基金年度項目有2776項立項,其中27項戴了“大數(shù)據(jù)”的帽子。占比0.97%。2015年國家社科基金年度項目有2752項立項,其中43項戴了“大數(shù)據(jù)”的帽子。占比1.56%。2016年國家社科基金年度項目有2857項立項,其中58項戴了“大數(shù)據(jù)”的帽子。占比2.03%。這些數(shù)據(jù)反映了關(guān)于大數(shù)據(jù)的研究越來越得到國家和政府的重視,國家對此投入的成本也是逐年
增加。
此外,我國已有21個省份出臺了大數(shù)據(jù)規(guī)劃政策;遼寧沈陽、甘肅蘭州等多個省市成立了大數(shù)據(jù)管理局;各省市引導(dǎo)建設(shè)大數(shù)據(jù)產(chǎn)業(yè)聯(lián)盟20余個[4]。從中同樣可以看出,國家和政府對大數(shù)據(jù)的投資很大,而且投入的成本越來越高。
一些發(fā)達的西方國家相較中國,起步早,發(fā)展迅速且完備,就以美國為例,美國政府將大數(shù)據(jù)視為強化美國競爭力的關(guān)鍵因素之一,把大數(shù)據(jù)研究和生產(chǎn)計劃提高到國家戰(zhàn)略層面。除此之外,美國政府積極推動數(shù)據(jù)公開,所以美國的大數(shù)據(jù)產(chǎn)業(yè)已經(jīng)創(chuàng)造了巨大的價值。
而在中國,大數(shù)據(jù)主要是用于政府管理和社會科學(xué)的研究,以此作為制定決策的基本要素之一。但政府掌握著大量核心數(shù)據(jù),并且數(shù)據(jù)利用率較低,由于制度的限制,如以不公開為立法取向的法律(《政府信息公開條例》的法律效力低于《保守國家秘密法》《檔案法》等以信息保密為立法取向的法律)、政府職權(quán)的條塊分割等,使得占數(shù)據(jù)總量95%以上的非結(jié)構(gòu)化數(shù)據(jù)被束之高閣;一些平臺和社會力量擁有大量的數(shù)據(jù),無法將之應(yīng)用到更大的領(lǐng)域發(fā)揮更大的價值;一些企業(yè)擁有專業(yè)數(shù)據(jù)分析應(yīng)用技術(shù),卻只能望“數(shù)據(jù)鉆石礦”興嘆。這也就造成了在中國大數(shù)據(jù)的研究投資高成效小的局面。
當然,這里面就包含了第二個原因——心理障礙。由于政府數(shù)據(jù)以及與之相關(guān)的諸多應(yīng)用可能會涉及到公民隱私、國家安全等重要領(lǐng)域,所以政府為了保證數(shù)據(jù)安全,采取了不公開的做法。另外,企業(yè)和個人為了防止出現(xiàn)侵權(quán)行為的出現(xiàn)對數(shù)據(jù)公開的訴求也不高。這些就形成了心理的屏障,也就阻礙了數(shù)據(jù)的公開,進而使大部分大數(shù)據(jù)的價值很難發(fā)揮。
雖然近幾年國家領(lǐng)導(dǎo)人多次強調(diào)要推動大數(shù)據(jù)公開,推進實施大數(shù)據(jù)戰(zhàn)略,但是在真正落實的時候仍舊會受這3方面原因的影響。
總之,大數(shù)據(jù)本身的價值是值得肯定的,它不僅僅是單純的數(shù)字,而是涵蓋了更多的記錄內(nèi)容,尤其是在互聯(lián)網(wǎng)技術(shù)高速發(fā)展的今天。傳統(tǒng)的數(shù)據(jù)在獲取和處理分析上都需要花費大量的人力物力,而且效率不高,所以以技術(shù)為支撐的大數(shù)據(jù)能夠帶來更多的便利,也讓人們能夠更加關(guān)注數(shù)據(jù)分析和統(tǒng)計學(xué)。它給我們的生活也帶來了很多的便利,各行各業(yè)慢慢開始使用大數(shù)據(jù)來為他們服務(wù),所以我們需要重視對大數(shù)據(jù)的技術(shù)研究和應(yīng)用,讓大數(shù)據(jù)為我們所用,提供更多的服務(wù)和便利,創(chuàng)造更多的財富。
3 大數(shù)據(jù)處理流程中的短板
對于大數(shù)據(jù)的處理流程,目前信息領(lǐng)域最權(quán)威的觀點是將其分為4個步驟,即采集、導(dǎo)入/預(yù)處理、統(tǒng)計/分析和挖掘。為了便于分析大數(shù)據(jù)處理流程中的短板,筆者又將這4個步驟概括為兩大環(huán)節(jié):采集端和分析端。
首先是在采集端,大數(shù)據(jù)采集的是人們在互聯(lián)網(wǎng)上留下的痕跡,這些痕跡信息在現(xiàn)代信息技術(shù)支撐下生成,規(guī)模大,又實時更新,因此被一些人認為比傳統(tǒng)的統(tǒng)計數(shù)據(jù)更加全面、及時、透明,所以有學(xué)者將真實性作為大數(shù)據(jù)的第五個特點。我對此持懷疑態(tài)度。當下,大數(shù)據(jù)造假的現(xiàn)象由于難于監(jiān)管而廣泛存在,例如刷單、灌水等等,這種人為地在后臺做手腳,制造虛假數(shù)據(jù)的行為損害了網(wǎng)絡(luò)誠信,以此為基礎(chǔ)采集到的數(shù)據(jù)何以保證真實性,以不盡真實的數(shù)據(jù)分析得出的結(jié)論又有何說服力。此外,某些信息(或行為)在網(wǎng)上留下足夠的痕跡,但在現(xiàn)實中卻無跡可尋。比如合肥近來房價高企,開發(fā)商為應(yīng)對限價,明里暗里出售號頭,即所謂號頭費。網(wǎng)民意見紛紛,但官方一直稱查無實據(jù)。
大數(shù)據(jù)為了掌握更多的數(shù)據(jù),放松了容錯的標準,允許不精確數(shù)據(jù)的存在,這就使得獲取到的大數(shù)據(jù)的錯誤率是比較高的,雖然說這種不精確性可以讓大數(shù)據(jù)產(chǎn)生大量新型數(shù)據(jù),但它同時也會造成數(shù)據(jù)獲取上的不合理。
除了真實性的問題之外,由于目前大數(shù)據(jù)還是有邊界的,它并不覆蓋全體,而仍舊是一個子集,它到底覆蓋了哪些主體,沒有對主體身份的驗證例如線下數(shù)據(jù)的校驗,很有可能會出現(xiàn)偏差,所以對于獲取到的大數(shù)據(jù)的代表性和均衡性就難以考證,尤其是針對某一具體問題采集大數(shù)據(jù)的時候,無法判斷所采取的數(shù)據(jù)是否有代表性,這一點傳統(tǒng)意義上的數(shù)據(jù)反而優(yōu)于大數(shù)據(jù)。2016年美國大選期間,網(wǎng)上民調(diào)顯示,希拉里的支持率一直高于特朗普,且基本是大幅領(lǐng)先,但最后的選舉結(jié)果卻讓預(yù)測希拉里勝出的人瞠目結(jié)舌。退一步說,即使大數(shù)據(jù)能夠采集到普遍意義上的數(shù)據(jù)信息,那針對具體問題的調(diào)查研究也只能停留在宏觀的層面,而要想深入研究一個問題,還是需要采取傳統(tǒng)的調(diào)查方法,進行個案研究,從微觀層面深入研究,將微觀與宏觀、典型性與普遍性相結(jié)合。
另外,正如上文所說,我國目前大量線下數(shù)據(jù)掌握在政府手中,這也就造成了大數(shù)據(jù)在獲取上的不足,所以大數(shù)據(jù)在應(yīng)用時的價值和意義并沒有達到良好的狀態(tài),不過,在部分大數(shù)據(jù)應(yīng)用的情況下,其也產(chǎn)生了一些不利影響。因為大數(shù)據(jù)被很多人神化,所以他們對大數(shù)據(jù)抱有敬畏之心,人們在了解了大數(shù)據(jù)分析的結(jié)果后會趨向于大數(shù)據(jù)的分析結(jié)果,這就會造成人們觀點和行為的同質(zhì)化,形成了“沉默的螺旋”。從這個角度看,數(shù)據(jù)控制著人,左右著人們的思想觀念、生活習慣和行為等方面,這在無形中又形成了一種“數(shù)據(jù)綁架”,一定程度上限制了人們的言論自由[5]。更進一步說,在數(shù)據(jù)的不斷獲取中,其準確性就會越來越低。
現(xiàn)在很多學(xué)者批判大數(shù)據(jù)的一點就是大數(shù)據(jù)對隱私安全的威脅,人們在網(wǎng)上留下的痕跡,注冊的信息等都處于“數(shù)據(jù)監(jiān)控”之中,一旦信息泄露,就會造成個人隱私權(quán)的侵犯,更嚴重的話可能會危害國家和社會。當下社會,一些商家利用數(shù)據(jù)信息進行營銷詐騙的現(xiàn)象常有發(fā)生,所以大數(shù)據(jù)在獲取時要注重對數(shù)據(jù)信息的保護。
然后是在分析端,大數(shù)據(jù)的分析技術(shù)是體現(xiàn)大數(shù)據(jù)價值的核心部分,從目前的分析技術(shù)來看,存在的不足主要表現(xiàn)在大數(shù)據(jù)分析的結(jié)果與人的思想和觀點之間的偏差。
筆者以民意為例,大數(shù)據(jù)能否準確反映民意是一個值得考證的問題。特朗普勝選后,瑞士的德語周刊《雜志》對其勝選背后的秘密給出的解釋就是“大數(shù)據(jù)”,并指出在特朗普競選過程中扮演關(guān)鍵角色的大數(shù)據(jù)技術(shù)是“心理測驗”,但“心理測驗”法在選民身上實行起來有不少障礙。其中的障礙與筆者在上文所談到的數(shù)據(jù)來源以及可靠性的問題有關(guān),除此之外,就是數(shù)據(jù)分析時的問題,特朗普團隊需要完備的選民登記資料,將社交網(wǎng)絡(luò)用戶與具備選民資格的公民身份對接,資料的不完備和對接工作的復(fù)雜性都成為了數(shù)據(jù)分析時的阻礙。而且特朗普勝選的原因其實很復(fù)雜,不僅僅是大數(shù)據(jù)的原因[6]。
此外,論文查重系統(tǒng)在大數(shù)據(jù)時代到來以后,雖然收納了更加海量的論文,但是查重的技術(shù)仍舊還是查詢文字的重合率,這就造成了一個問題,大數(shù)據(jù)的分析技術(shù)能否對觀點進行查重。舉一個簡單的例子,假如一篇論文引用了多篇論文的內(nèi)容,但是最后得出了一個全然不同的觀點,這在論文查重系統(tǒng)中會被定為抄襲。然而在線下生活中,這就類似于在前人已有研究的基礎(chǔ)上繼續(xù)研究,有了新的發(fā)現(xiàn),得出了新的結(jié)論,不應(yīng)該歸為抄襲的隊列中。大數(shù)據(jù)處理分析技術(shù)的這種局限性就導(dǎo)致了與觀點之間的沖突。
雖然大數(shù)據(jù)是動態(tài)可變的,但是其是否是最新的數(shù)據(jù)也是無法確定的。另外,人的思維隨著時間的變化也有可能會發(fā)生變化,而且他們不可能把自己的觀點實時反映在互聯(lián)網(wǎng)上,所以大數(shù)據(jù)分析所產(chǎn)生的結(jié)果與實際生活中人們的思維可能會出現(xiàn)不一致。
即使大數(shù)據(jù)能夠?qū)崟r反映人的思維,在分析大數(shù)據(jù)時仍舊會暴露出新的問題。在社會科學(xué)領(lǐng)域內(nèi),大數(shù)據(jù)分析的結(jié)果無法得出一個統(tǒng)一的結(jié)論。這與自然科學(xué)不同,在自然科學(xué)中,結(jié)論與實驗過程是一一對應(yīng)的,不會出現(xiàn)其他的結(jié)論。社會科學(xué)雖然也是一門科學(xué),但是對其的解讀可以有很多種,只要“言之有理即可”,正如《大數(shù)據(jù)時代:生活、工作與思維的大變革》中所說的那樣,“大數(shù)據(jù)提供的不是最終答案,只是參考
答案?!?/p>
除了大數(shù)據(jù)難以解決數(shù)據(jù)與觀點之間的沖突外,大數(shù)據(jù)在處理海量數(shù)據(jù)時刪除重復(fù)數(shù)據(jù)的技術(shù)也不完善,目前的方法仍舊停留在把海量數(shù)據(jù)導(dǎo)入到數(shù)據(jù)庫,然后運用計算機命令進行刪除,但是導(dǎo)入海量數(shù)據(jù)耗費的時間成本是巨大的。此外還有海量數(shù)據(jù)的存儲和管理技術(shù)、虛擬化技術(shù)、分布式處理技術(shù)等仍需要進一步完善。
4 大數(shù)據(jù)之于新聞傳播的影響
大數(shù)據(jù)時代下,UGC模式、媒介融合的快速發(fā)展,使得大數(shù)據(jù)對新聞傳播的影響也是十分深刻的。上文已經(jīng)提到,在大數(shù)據(jù)的技術(shù)背景下,目前各行各業(yè)都在運用大數(shù)據(jù)來為自己服務(wù),新聞行業(yè)也不例外;加之大數(shù)據(jù)的處理環(huán)節(jié)與新聞的制作環(huán)節(jié)是相類似的,它們都需要采集、分析、篩選和整合,所以他們之間的契合度很高。大數(shù)據(jù)形成的數(shù)據(jù)庫為新聞傳播提供更多的信息,改變了新聞傳播的方式,進而促生了一種新型報道形態(tài)——數(shù)據(jù)新聞。這種新聞類型以公開的數(shù)據(jù)為基礎(chǔ),最大的特點就是可視化以及通過挖掘大數(shù)據(jù)做出預(yù)測。目前,由于大數(shù)據(jù)時代下的數(shù)據(jù)新聞更富有個性化、趣味性和技術(shù)性,且具有多種形式和多重維度,越來越多的受眾青睞于這種新興的新聞類型。如2015年央視播出的“一帶一路特別報道”《數(shù)說命運共同體》,就是數(shù)據(jù)新聞的典型案例,其中綜合運用了圖表、地圖、動畫、真實紀錄片等多種形式,展現(xiàn)出詳實清晰的數(shù)據(jù)信息,讓受眾對“一帶一路”充滿期待與自信,吸引了更多的人關(guān)注與支持“一帶一路”的發(fā)展。
但數(shù)據(jù)新聞的發(fā)展仍不完善,它同樣存在著上述大數(shù)據(jù)處理流程中的問題。首先真實性是新聞的第一生命,但目前大數(shù)據(jù)采集信息的真實性仍有待考量。其次就是隱私問題,這涉及到了新聞倫理問題,大數(shù)據(jù)讓我們每個人都越來越透明,加之以新聞媒體的傳播效應(yīng),很容易讓人的權(quán)利受到侵犯。最后是內(nèi)容和形式的辯證關(guān)系問題。相比一般的新聞報道,數(shù)據(jù)新聞具有客觀、可信、深度、廣度、可讀優(yōu)勢,但是其自身有著技術(shù)要求高、成本高、報道選題受限的弊端,所以其應(yīng)用不可能普遍化。新聞工作者不能讓數(shù)據(jù)或技術(shù)處于新聞傳播的主體地位,這樣會陷入“技術(shù)中心論”的漩渦,美國前國防部部長麥克納馬拉故事值得我們引以為戒。另外,對大數(shù)據(jù)的關(guān)注也滲透到了新聞教學(xué)的領(lǐng)域,現(xiàn)在很多高校已開設(shè)了“數(shù)據(jù)新聞寫作”的課程。由于沒有機會前往相關(guān)高校調(diào)研課程情況,但筆者認為,對新技術(shù)的學(xué)習是很有必要的,不過基礎(chǔ)的新聞寫作仍舊是高校新聞教學(xué)的主體部分,要始終把“內(nèi)容為王”放在第一位,對數(shù)據(jù)新聞要循序漸進地研究和
探索。
5 結(jié)論
大數(shù)據(jù)的發(fā)展是社會發(fā)展的大趨勢,是一種技術(shù)進步,體現(xiàn)了人們互聯(lián)網(wǎng)思維的發(fā)展。目前,大數(shù)據(jù)在信息領(lǐng)域、經(jīng)濟領(lǐng)域、社會服務(wù)與管理領(lǐng)域的價值促進了社會的發(fā)展,創(chuàng)造了很多物質(zhì)和精神上的財富。而且,它還有很大的發(fā)展空間。但我們不應(yīng)神化大數(shù)據(jù),覺得技術(shù)能夠統(tǒng)治一切,也不應(yīng)對數(shù)據(jù)過分依賴,成為數(shù)據(jù)的奴隸。不管是政府還是個人,都要理性對待大數(shù)據(jù),政府要在衡量價值后投資大數(shù)據(jù)研究,并要適當公開數(shù)據(jù);作為個人,不能盲目追捧和依賴大數(shù)據(jù),要有自己的判斷和認識,只有思維和技術(shù)都在發(fā)展的情況下,才能讓大數(shù)據(jù)的漏洞得以修補,從而彰顯大數(shù)據(jù)的價值,讓大數(shù)據(jù)真正地為我們所用。
參考文獻
[1]舍恩伯格,庫克耶.大數(shù)據(jù)時代:生活、工作與思維的大變革[M].杭州:浙江人民出版社,2013.
[2]王岑嵐,尤建新.大數(shù)據(jù)定義及其產(chǎn)品特征:基于文獻的研究[J].上海管理科學(xué),2016,38(3):25-29.
[3]薛一波.大數(shù)據(jù)的前世、今生與未來[J].中興通訊技術(shù),2014,20(3):43.
[4]中國大數(shù)據(jù)產(chǎn)業(yè)生態(tài)地圖,2016:19-21.
[5]曹衛(wèi)東.開放社會及其數(shù)據(jù)敵人[J].讀書,2014(1):
73-80.
[6]夏逸平.大數(shù)據(jù)時代還需要民意測驗嗎?[N].文匯報,2017-02-24(14).