陳敏學
大數(shù)據(jù)與新媒體傳播
陳敏學
現(xiàn)如今,數(shù)據(jù)量的大規(guī)模增長以及對數(shù)據(jù)越來越廣泛的應用,都在表示著大數(shù)據(jù)的時代已經到來。大數(shù)據(jù)對我們生活的影響是在不斷擴大并且不斷深入的,在生活的方方面面都能體會到大數(shù)據(jù)的影響。媒體作為信息的收集者與傳播者,無時無刻不在與信息打交道。但是就目前來看,媒體對于大數(shù)據(jù)的應用遠遠不足,媒體行業(yè)仍然在探討如何更好地利用大數(shù)據(jù)以提升整個行業(yè)的水平。大數(shù)據(jù)的應用是必然的,作為媒體,要不斷創(chuàng)新思維,改變固有觀念,迎接大數(shù)據(jù)時代的挑戰(zhàn),發(fā)展自我;同時也不應在大數(shù)據(jù)的信息時代迷失自我,在信息爆炸的時代更應該提升專業(yè)化水平,堅守媒體的本質和精神。
大數(shù)據(jù);媒體;個性化;互動;社會責任
[作者]陳敏學,復旦大學新聞學院。
近年來,隨著信息技術的不斷發(fā)展,數(shù)據(jù)量呈現(xiàn)爆發(fā)式增長,大數(shù)據(jù)的概念逐漸被越來越多的人所接受,其影響也滲入社會的方方面面。國際數(shù)據(jù)公司(IDC)預計,到2020年,50%的商業(yè)分析都將通過依托于認知計算技術的規(guī)范分析進行,并且在分析中,對分析有高價值的數(shù)據(jù)將翻倍,傳遞給決策者的數(shù)據(jù)將有60%具有可操作性。同時,IDC《中國大數(shù)據(jù)技術與服務市場2013—2017年預測與分析》研究報告顯示,中國的大數(shù)據(jù)技術和服務市場將以年復合增長率38.7%的速度從2013年1億6550萬美元增長至2017年8億5010萬美元。在中國,大數(shù)據(jù)首先更多地被應用于擁有成熟的IT系統(tǒng)并且積累了足夠多數(shù)據(jù)的或者以顧客為導向隨時應對市場變化的部門。之后,更多的行業(yè)和部門開始對大數(shù)據(jù)進行理性運用,電信和銀行根據(jù)需求進行了基于Hadoop的應用,政府和醫(yī)療也已經開始了他們的大數(shù)據(jù)計劃。
大數(shù)據(jù)、云計算等前沿技術的蓬勃發(fā)展,對于社會發(fā)展的意義重大。大數(shù)據(jù)不斷深入發(fā)展的趨勢不能阻擋,雖然“大數(shù)據(jù)”一詞在很多領域引起非常多的關注,但媒體很少提及大數(shù)據(jù)對自身的影響。如2014年2月,《紐約時報》發(fā)表了一篇名為《大數(shù)據(jù)時代》(The Age of Big Data)的文章,文中列舉了很多案例說明大數(shù)據(jù)對社會多個部門產生的影響,卻沒談及在當今形勢下,新聞業(yè)乃至整個傳媒業(yè)會受到怎樣的影響[1]。毫無疑問,新聞行業(yè)不能將自身置于大數(shù)據(jù)時代之外,若不能很好地適應大數(shù)據(jù)的發(fā)展,不能將傳統(tǒng)新聞報道與大數(shù)據(jù)相結合,隨時會被整個時代所淘汰。傳統(tǒng)的新聞行業(yè)有自身的局限性,如何更好地適應大數(shù)據(jù)的發(fā)展,是需要探討的問題。
(一)大數(shù)據(jù)概念
在2008年《自然》期刊中,提到了現(xiàn)代科學面臨最艱巨的挑戰(zhàn)之一,就是如何應對正在產生的信息洪流。一千萬億字節(jié)就已經是很大的容量,但是事實上的需要遠超于此,這些數(shù)據(jù)都是“大數(shù)據(jù)”的資本[2]。在這里,多次提到了“大數(shù)據(jù)”的概念。“大數(shù)據(jù)”的概念首先強調了“大”,表示了系統(tǒng)需要管理的數(shù)據(jù)規(guī)模極大,相對于之前的CPU和儲存技術而言,這些規(guī)模過大的數(shù)據(jù)處理需要特別對待。從歷史發(fā)展來看,超大規(guī)模在提出時表示的是GB級別的數(shù)據(jù),海量數(shù)據(jù)提出時表示的是TB級別的數(shù)據(jù),而大數(shù)據(jù)則是指PB(1015)及以上級別的數(shù)據(jù)[3]。
Gartner研究公司認為,“大數(shù)據(jù)是需要利用合理成本的新處理模式進行處理才能使其擁有者具有更強的洞察力和決策力的海量、髙增長率和多樣化的信息資產”。在這里,強調更多的是大數(shù)據(jù)的“資產性”作用。
(二)大數(shù)據(jù)基本特征
在此之前,數(shù)據(jù)的產生與收集一直存在,但是大數(shù)據(jù)有獨有的特征。隨著互聯(lián)網、物聯(lián)網和云計算技術的迅猛發(fā)展,數(shù)據(jù)的數(shù)量不僅以指數(shù)形式遞增,而且數(shù)據(jù)的結構越來越趨于復雜化。相對于以往普通“數(shù)據(jù)”,“大數(shù)據(jù)”具有更深層次的內涵。根據(jù)IBM商業(yè)價值研究院全球企業(yè)咨詢服務部執(zhí)行報告《分析:大數(shù)據(jù)在現(xiàn)實世界中的應用》,大數(shù)據(jù)具有四個主要特征,即數(shù)量(volume)、多樣性(variety)、速度(velocity)以及精確性(veracity),簡稱為“4V”。“數(shù)量”主要是指數(shù)據(jù)規(guī)模迅速增長,數(shù)據(jù)量從TB上升至PB級;“多樣性”指向數(shù)據(jù)的多種形式,結構化與非結構化相結合,從單一的文本形式轉變?yōu)槎嗝襟w形式;“速度”強調數(shù)據(jù)的運動,要求分析流數(shù)據(jù),數(shù)據(jù)運動的速度極快,這便要求在不到一秒內做出決策;“精確性”有兩個層面的意義,一是原生數(shù)據(jù)的內生性和不精確性,二是在數(shù)據(jù)的管理上,可靠性和可預測性使大數(shù)據(jù)的分析結果有精確性。
(三)大數(shù)據(jù)發(fā)展現(xiàn)狀
在國外尤其是西方發(fā)達國家,大數(shù)據(jù)的利用已經十分廣泛且成熟。政治和經濟領域中,很多決策基于數(shù)據(jù)分析而得出。在學術領域,美國麻省理工大學計算機科學與人工智能實驗室建立了大數(shù)據(jù)科學技術中心。該技術中心主要致力于加速科學與醫(yī)藥發(fā)明、企業(yè)與行業(yè)計算,并著重推動在新的數(shù)據(jù)密集型應用領域的最終用戶體驗的設計創(chuàng)新。在產業(yè)領域,國外許多著名企業(yè)和組織都將大數(shù)據(jù)作為主要業(yè)務,如IBM、EMC、微軟、戴爾、惠普等國際知名廠商都提出了各自的大數(shù)據(jù)解決方案或應用[4]。
國內的大數(shù)據(jù)產業(yè)也緊跟世界潮流不斷發(fā)展。國內大數(shù)據(jù)已經應用在金融、電信、政務、醫(yī)療、文化等行業(yè),并逐步擴展到其他行業(yè)擴展。如金融領域,螞蟻金服大數(shù)據(jù)應用于螞蟻信用,綜合考慮個人用戶的信用,構筑信用消費生態(tài);交通運輸領域,中國家庭中GPS的廣泛使用;體育領域中專業(yè)球隊的比賽也利用大數(shù)據(jù)進行分析,為球隊制定可靠、有效的戰(zhàn)術、戰(zhàn)略提供有力的數(shù)據(jù)參考。
不論是國外還是國內,大數(shù)據(jù)的發(fā)展是十分迅速的,不僅是大數(shù)據(jù)的信息量,更是大數(shù)據(jù)的應用量,并且大數(shù)據(jù)的應用范圍一直在不斷擴大。
(一)應用現(xiàn)狀與困境
著名的O'Reilly公司斷言:數(shù)據(jù)是下一個英特爾,像“英特爾內置”一樣,未來屬于將數(shù)據(jù)轉換成產品的公司和人們。有效的組織和使用大數(shù)據(jù)能夠推動社會經濟和科學研究的巨大發(fā)展,并帶來前所未有的機遇。歐美等經濟發(fā)達國家的一些出版?zhèn)髅狡髽I(yè)在大數(shù)據(jù)技術的應用上已走在前列,這些企業(yè)充分利用大數(shù)據(jù)技術挖掘企業(yè)的核心價值資源,建立新的商業(yè)模式。目前,國外出版?zhèn)髅狡髽I(yè)有關大數(shù)據(jù)應用主要集中在產品策劃、產品營銷、智能分析和可視化、數(shù)字化教育等方面[5]。
以產品營銷為例,對媒體而言,廣告主是直接的服務對象。而今用戶大量的在線行為數(shù)據(jù)觸手可及,有針對地投放廣告成為可能,媒體就可以滿足廣告主對精準營銷的需求。如美國衛(wèi)星電視運營商DirectTV通過部署測試可尋址電視廣告,使其營收中有10%的收入是可尋址廣告帶來。通過可尋址廣告系統(tǒng),廣告主可以自主選定他們感興趣的家庭類型,同時DirectTV會委托第三方數(shù)據(jù)提供商在其注冊用戶中尋找符合要求的家庭[6]。根據(jù)第三方提供的數(shù)據(jù),從各個維度各個層面推斷用戶購買產品的意向,從而為廣告主推薦最為優(yōu)化的用戶。如此一來,通過對大量信息的收集,優(yōu)化其產品營銷使廣告主的投放更具有針對性,以一種和用戶進行互動的形式,達到商業(yè)利益上的雙贏。
同時,媒體應用可視化技術,對大數(shù)據(jù)進行分析應用,提升其信息傳播的能力。大數(shù)據(jù)可視分析是指“在大數(shù)據(jù)自動分析挖掘方法的同時,利用支持信息可視化的用戶界面以及支持分析過程的人機交互方式與技術,有效融合計算機的計算能力和人的認知能力,以獲得對于大規(guī)模復雜數(shù)據(jù)集的洞察力”[7]。媒體向大眾傳遞信息,可視化的展示尤為重要。通過可視化處理,大數(shù)據(jù)可以以一種更為生動有趣的形式傳遞到大眾,提升了媒體信息傳遞的水平。
但由于媒體業(yè)在大數(shù)據(jù)的時代缺乏立足的根基,被技術公司遠遠落在后面。根基的先天不足加上發(fā)展開始時間晚,屬于媒體業(yè)的想象空間并不多,大數(shù)據(jù)對媒體的價值非常有限。大多數(shù)媒體機構在大數(shù)據(jù)領域并不具備顛覆創(chuàng)新和業(yè)務轉型的條件,原因是多層次的。首先最為本質的問題就是媒體業(yè)所掌握的數(shù)據(jù)資源有限,接下來關鍵的問題是,媒體業(yè)缺乏處理大數(shù)據(jù)的能力。媒體業(yè)自身生產的數(shù)據(jù)本身就十分有限,對于有限內容的數(shù)字化程度也不夠。以紙媒為例,在新媒體的沖擊下,傳統(tǒng)媒體特別是紙質媒體所受的沖擊首當其沖。國內的《新聞晚報》《上海壹周》等,國外的《紐約太陽報》、紙質版的《獨立報》等也紛紛???,甚至有媒體人稱“紙媒已死!”傳統(tǒng)以版面為對象的生產方式,在開展新媒體業(yè)務時難以適應,需重新轉化編碼。而在內容數(shù)據(jù)庫的建設方面,很多媒體甚至處于“零”的狀態(tài)[8]。媒體業(yè)在大數(shù)據(jù)環(huán)境下該如何生存和發(fā)展,這是今天媒體人亟須解決的難題。
除了要解決技術方面存在的困難,媒體作為社會的“守夜人”,應該時刻注意內容至上。誠然,在大數(shù)據(jù)技術的支撐下,媒體可以根據(jù)用戶受眾的需求,推送其感興趣的新聞內容,更具針對性。如“今日頭條”能夠分析出一些用戶在不同的城市有規(guī)律的往返與切換,從而識別出潛在的目標受眾,把相應的信息推薦給他們。2016年春運期間,中國鐵路總公司與其下屬的18個鐵路局在“今日頭條”上發(fā)布臨客增開信息,單條資訊的閱讀量達到了50萬。但是,如果完全以用戶為依據(jù)不加以專業(yè)引導,新聞會形成碎片,不利于完整性新聞的傳播,更不利于媒體發(fā)揮輿論監(jiān)督的“守夜人”作用。
(二)媒體在大數(shù)據(jù)時代的發(fā)展展望
首先在數(shù)據(jù)的獲取方面,大數(shù)據(jù)應用獲得成功的兩個重要因素一是數(shù)據(jù)源的代表性;二是價值、良好的供給與需求的合作以及有廣泛影響力的平臺。數(shù)據(jù)搜集是數(shù)據(jù)新聞生產流程的第一個環(huán)節(jié),也是最重要的一環(huán),直接影響后續(xù)階段的可信性和有效性。隨著數(shù)據(jù)分析和數(shù)據(jù)挖掘技術的發(fā)展,數(shù)據(jù)新聞分析的數(shù)據(jù)量級遠超傳統(tǒng)新聞圖表的數(shù)據(jù)規(guī)模[9]。媒體在處理傳統(tǒng)新聞圖表的數(shù)據(jù)時已捉襟見肘,在選取、管理及處理的過程中均有明顯的滯后性[10],這就需要媒體運用更多的手段來處理新時代下的數(shù)據(jù)。同時,數(shù)據(jù)的共享性還需要更進一步的提升,媒體所獲得的數(shù)據(jù)對于其提升遠遠不足,這就需要全社會共同的努力,將數(shù)據(jù)資源進一步社會化。
20世紀40年代美國學者提出的“社會責任論”是目前世界四個主導性新聞理論之一,其中一點便是將新聞界提供的信息流、思想流和感情流送達每一位社會成員,這是對新聞完整性的要求,以保證每個公民平等地分享信息。大數(shù)據(jù)分析下的個性化新聞在一定程度上會造成信息的碎片化,新聞的發(fā)布或許會根據(jù)數(shù)據(jù)分析因人而異。但是大數(shù)據(jù)的發(fā)展是不可阻擋的,并且大數(shù)據(jù)帶來的發(fā)展機遇不可忽視,媒體處理好個性化與專業(yè)化的問題就顯得尤為關鍵。媒體充當著社會記錄者與信息傳播者的角色,并將自身定位成社會解讀者和分析預測者。深度解讀和去偽存真本是媒體的重要職責。在大數(shù)據(jù)的環(huán)境下,媒體在大數(shù)據(jù)全面深刻的洞察功能和豐富的挖掘能力作用下,滿足受眾需求的同時,以專業(yè)的理論和強大的社會責任感處理整合信息,既不盲目跟風,亦不因噎廢食,媒體的傳播力、公信力和影響力將得到大大的提升。
大數(shù)據(jù)時代的產生得益于計算機與互聯(lián)網等技術的迅猛發(fā)展及在各個領域的廣泛應用。大數(shù)據(jù)對各行各業(yè)來說,既是機遇也是挑戰(zhàn)。大數(shù)據(jù)這一概念從出現(xiàn)到現(xiàn)在,經過近幾年的發(fā)展,已經在應用方面不斷深入和發(fā)展。數(shù)據(jù)的量在不斷地擴大,大數(shù)據(jù)的儲存處理技術也在不斷發(fā)展。反過來,從傳統(tǒng)的數(shù)據(jù)儲存發(fā)展到現(xiàn)如今的Hadoop等一系列海量數(shù)據(jù)儲存技術,讓數(shù)據(jù)的量得以不斷擴大,大數(shù)據(jù)的應用也因此更具科學性。作為時代發(fā)展的趨勢,如果能很好地應用大數(shù)據(jù),無疑會給自身帶來更大的發(fā)展。媒體行業(yè)也是如此。對于媒體行業(yè)來說,大數(shù)據(jù)仍然較為陌生,如何更好地利用大數(shù)據(jù),仍然是值得媒體行業(yè)探討的話題。以開放的思想和嚴謹?shù)膶I(yè)知識迎接大數(shù)據(jù)時代,是媒體行業(yè)在大數(shù)據(jù)時代的發(fā)展方向。
[1]官建文,劉揚,劉振興.大數(shù)據(jù)時代對于傳媒業(yè)意味著什么?[J].新聞戰(zhàn)線,2013(2):18-22.
[2]Big data:Science in the petabyte era[J].2008,455:1-136.
[3]于艷華,宋美娜.大數(shù)據(jù)[J].中興通訊技術,2013(1):57-60.
[4]李學龍,龔海剛.大數(shù)據(jù)系統(tǒng)綜述[J].中國科學:信息科學,2015(45):1-44.
[5]吳仁群.大數(shù)據(jù)在出版?zhèn)髅狡髽I(yè)中的應用[J].科技與出版,2016(1):24-26.
[6]黃升民,吳殿義.大數(shù)據(jù)在媒體運營中的應用及思考[J].山西大學學報(哲學社會科學版),2015(2):73-78.
[7]任磊,杜一,馬帥,張小龍,戴國忠.大數(shù)據(jù)可視分析綜述[J].軟件學報,2014(9):1909-1936.
[8]王武彬.大數(shù)據(jù)浪潮中的傳媒業(yè)——兼談大數(shù)據(jù)討論的若干誤區(qū)[J].新聞記者,2013(6):28-31.
[9]徐銳,萬宏蕾.數(shù)據(jù)新聞:大數(shù)據(jù)時代新聞生產的核心競爭力[J].編輯之友,2013(12):71-74.
[10]吳文平,陳沁蓉.以大數(shù)據(jù)為支點推動轉型[J].新聞戰(zhàn)線,2014(1):53-55.