□杜 偉
“大數(shù)據(jù)”建立在互聯(lián)網(wǎng)技術(shù)基礎上,指的是信息量巨大的統(tǒng)計及技術(shù)操作。簡單來說,“大數(shù)據(jù)”其實就是海量資料巨量資料,這些巨量資料來源于世界各地隨時產(chǎn)生的數(shù)據(jù)。
在“大數(shù)據(jù)”時代,任何微小的數(shù)據(jù)都可能產(chǎn)生不可思議的價值?!按髷?shù)據(jù)”有4個特點,為別為:Volume(大量)、Variety(多樣)、Velocity(高速)、Value(價值),一般被稱之為4V。
大數(shù)據(jù)的特征首先就體現(xiàn)為“大”。隨著時間的推移,存儲單位從過去的GB到TB,乃至現(xiàn)在的PB、EB級別。隨著信息技術(shù)的高速發(fā)展,數(shù)據(jù)開始爆發(fā)式增長。社交網(wǎng)絡(微博、推特、臉書)、移動網(wǎng)絡、智能工具、服務工具等,都成為數(shù)據(jù)的來源。迫切需要智能的算法、強大的數(shù)據(jù)處理平臺和新的數(shù)據(jù)處理技術(shù),來統(tǒng)計、分析、預測和實時處理如此大規(guī)模的數(shù)據(jù)。
廣泛的數(shù)據(jù)來源,決定了大數(shù)據(jù)形式的多樣性。任何形式的數(shù)據(jù)都可以產(chǎn)生作用,目前應用最廣泛的就是推薦系統(tǒng)。日志數(shù)據(jù)是結(jié)構(gòu)化明顯的數(shù)據(jù),還有一些數(shù)據(jù)結(jié)構(gòu)化不明顯,例如圖片、音頻、視頻等,這些數(shù)據(jù)因果關系弱,就需要人工對其進行標注。
大數(shù)據(jù)的產(chǎn)生非常迅速,主要通過互聯(lián)網(wǎng)傳輸。生活中每個人都離不開互聯(lián)網(wǎng),也就是說每個人每天都在向大數(shù)據(jù)提供大量的資料,并且這些數(shù)據(jù)是需要及時處理的。大數(shù)據(jù)對處理速度有非常嚴格的要求,服務器中大量的資源都用于處理和計算數(shù)據(jù),很多平臺都需要做到實時分析。數(shù)據(jù)無時無刻不在產(chǎn)生,誰的速度更快,誰就有優(yōu)勢。
這也是大數(shù)據(jù)的核心特征。現(xiàn)實世界所產(chǎn)生的數(shù)據(jù)中,有價值的數(shù)據(jù)所占比例很小。相比于傳統(tǒng)的小數(shù)據(jù),大數(shù)據(jù)最大的價值在于通過從大量不相關的各種類型的數(shù)據(jù)中,挖掘出對未來趨勢與模式預測分析有價值的數(shù)據(jù),并通過機器學習方法、人工智能方法或數(shù)據(jù)挖掘方法深度分析,發(fā)現(xiàn)新規(guī)律和新知識,并運用于新聞等各個領域。
“大數(shù)據(jù)”時代的到來,改變了人們?nèi)粘5纳詈凸ぷ鞣绞剑瑢ζ髽I(yè)經(jīng)營、媒體傳播及政府管理有重要意義。應該如何去對“大數(shù)據(jù)”加以分析和運用值得我們思考。
在“大數(shù)據(jù)”時代下,人們可以迅速得到實時發(fā)生的信息,能夠?qū)ξ磥砜赡馨l(fā)生的事進行預測并對突發(fā)事件進行有效防范。對新聞媒體而言,運用好“大數(shù)據(jù)”也很重要。它有助于新聞媒體工作人員迅速獲取信息,第一時間將信息傳播出去。
世界上的任何事物都是具有兩面性的,“大數(shù)據(jù)”也不例外。
“大數(shù)據(jù)”的積極作用在于:如果能夠科學、合理地使用“大數(shù)據(jù)”,那么就能推動社會科學和經(jīng)濟的發(fā)展。然而,實現(xiàn)這一目標和任務并不容易,需要廣大新聞工作者的共同努力。顯然,現(xiàn)在很多大眾媒體或社交媒體都應用了“大數(shù)據(jù)“技術(shù)??茖W地發(fā)展“大數(shù)據(jù)”產(chǎn)業(yè),實現(xiàn)“大數(shù)據(jù)”的積極作用,將會為人們的生活和工作帶來巨大益處。
當然,“大數(shù)據(jù)”也有一定的消極影響,實際上“大數(shù)據(jù)”并不是萬能的,如果過度地依賴“大數(shù)據(jù)”技術(shù)而忽略其他信息技術(shù)的話,將造成傳播信息方式單一。要想有所建樹,就一定要保持理智,對“大數(shù)據(jù)”進行理性分析,使它能夠為新聞行業(yè)服務,提高工作效率。一定要冷靜對待“大數(shù)據(jù)”,需從技術(shù)、法律等多方面降低新技術(shù)產(chǎn)生的負面效應。
此外,數(shù)據(jù)安全利用和隱私保護是目前大數(shù)據(jù)商業(yè)化的一大挑戰(zhàn),我們必須重視這個問題,進一步加強和規(guī)范科學數(shù)據(jù)管理,保障科學數(shù)據(jù)安全,提高開放共享水平。
現(xiàn)在的新聞信息可以說是海量的,更新速度極快,新聞媒體對這些新聞信息的獲取基本上是通過“大數(shù)據(jù)”技術(shù),這些技術(shù)確保新聞工作者可以源源不斷地接收新聞信息,并有效進行分析、判斷。新聞媒體對這些龐大的新聞信息一定要學會整理和取舍。新聞信息不斷產(chǎn)生,如何在繁雜的新聞信息中找尋到新聞媒體需要的信息值得我們思考。一起事件是否能成為新聞、值不值得報道,依據(jù)的不僅僅是“大數(shù)據(jù)”,更重要的是要根據(jù)新聞價值作出判斷,這就需要新聞工作者提高新聞判斷力。
此外,記者若想對一起新聞事件進行完整的報道,就需要對這起事件從不同角度展開調(diào)查,全面分析才能形成一個完整的故事,這同樣也要依據(jù)“大數(shù)據(jù)”技術(shù)。數(shù)據(jù)庫可以幫助記者搜索與此新聞事件相關聯(lián)的背景等數(shù)據(jù)信息。當然,一個優(yōu)秀的新聞報道是不能僅僅依靠“大數(shù)據(jù)”技術(shù)的,新聞媒體可以對關鍵新聞點進行深入思考并寫出獨家評論,這才是競爭制勝的法寶。
綜上所述,如今“大數(shù)據(jù)”已經(jīng)被廣泛應用到人們的日常生活、工作中,雖然“大數(shù)據(jù)”技術(shù)的發(fā)展還不夠完善,數(shù)據(jù)庫也不完整,新聞行業(yè)對“大數(shù)據(jù)”技術(shù)成功運用的實際案例也不多,但是從長遠的角度來看,要是新聞行業(yè)及其他行業(yè)都能夠科學、合理地運用“大數(shù)據(jù)”技術(shù),并對它進行創(chuàng)新,那么有朝一日,“大數(shù)據(jù)”技術(shù)肯定能夠使人類社會發(fā)生翻天覆地的變化。因此,討論新聞媒體如何駕馭好“大數(shù)據(jù)”具有十分重要的現(xiàn)實意義。