李知兵
(作 者單位:安徽廣播電視臺)
大數(shù)據(jù)技術(shù)在網(wǎng)絡(luò)廣播電視臺應(yīng)用初探——以大數(shù)據(jù)新聞為例
李知兵
(作 者單位:安徽廣播電視臺)
當(dāng)前,大數(shù)據(jù)已從概念階段上升到應(yīng)用階段,并給傳統(tǒng)行業(yè)帶來了新的契機(jī)。國家對媒體轉(zhuǎn)型及媒體融合高度重視并提出了要求。網(wǎng)絡(luò)廣播電視臺作為新媒體領(lǐng)域的正規(guī)軍,更需順應(yīng)潮流,積極探索新的傳播規(guī)律和傳播手段。本文以大數(shù)據(jù)新聞生產(chǎn)為例,介紹了大數(shù)據(jù)的具體應(yīng)用。
大數(shù)據(jù);網(wǎng)絡(luò)廣播電視臺;數(shù)據(jù)新聞
“大數(shù)據(jù)”一詞最早由2008年9月《科學(xué)》(Science)雜志中一篇文章開始廣泛傳播,引起足夠重視的事件是在2011年5月的EMC World 2011會議上,EMC公司拋出大數(shù)據(jù)(Big Data)概念[1]。大數(shù)據(jù)作為新一代信息技術(shù)近期被寫入“十三五規(guī)劃”,意味著已上升到國家戰(zhàn)略層面。大數(shù)據(jù)的特點(diǎn)是體量大(大到甚至無法用“超大規(guī)?!薄ⅰ昂A俊钡绒o藻來描述),結(jié)構(gòu)多樣(結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化混雜)、存取和處理速度快(已無法用常規(guī)軟件工具處理,而采用新型計(jì)算架構(gòu)和智能算法等新技術(shù))、應(yīng)用價值高(商業(yè)智能的基礎(chǔ))。大數(shù)據(jù)已逐漸滲透到傳統(tǒng)行業(yè)多個領(lǐng)域,并給傳統(tǒng)行業(yè)帶來了新的契機(jī),其中傳媒業(yè)也不例外。習(xí)近平總書記高度重視傳統(tǒng)媒體和新興媒體融合發(fā)展,近年來在不同場合與新媒體親密接觸,強(qiáng)調(diào)要研究把握現(xiàn)代新聞傳播規(guī)律和新興媒體發(fā)展規(guī)律,強(qiáng)化互聯(lián)網(wǎng)思維和一體化發(fā)展理念,要利用新技術(shù)新應(yīng)用創(chuàng)新媒體傳播方式。網(wǎng)絡(luò)廣播電視臺(下簡稱“網(wǎng)絡(luò)臺”)作為廣電領(lǐng)域新興媒體代表,有責(zé)任有義務(wù)積極響應(yīng)國家媒體融合發(fā)展號召,努力研究新的傳播規(guī)律,探索新的傳播方式。
考慮到目前廣電行業(yè)體制、資金、人力等現(xiàn)實(shí)因素的制約,大數(shù)據(jù)基礎(chǔ)平臺搭建還需分步實(shí)施,因此本文涉及到應(yīng)用均是借助第三方平臺實(shí)現(xiàn)。
數(shù)據(jù)新聞(Data Journalism),又稱數(shù)據(jù)驅(qū)動新聞,既是基于數(shù)據(jù)挖掘與分析思維的新聞報(bào)道,也是數(shù)據(jù)驅(qū)動型的調(diào)查性報(bào)道或深度報(bào)道。2010年8月,首屆“國際數(shù)據(jù)新聞”圓桌會議在荷蘭阿姆斯特丹舉行,對這個概念做出了如下界定:“‘?dāng)?shù)據(jù)新聞’是一種工作流程,包括下述基本步驟:通過反復(fù)抓取、篩選和重組來深度挖掘數(shù)據(jù),聚焦專門信息以過濾數(shù)據(jù),可視化地呈現(xiàn)數(shù)據(jù)并合成新聞故事?!盵2]在我國,近兩年,數(shù)據(jù)新聞形式在央視新聞、人民網(wǎng)、新華網(wǎng)及四大門戶網(wǎng)站均紛紛出現(xiàn)。例如,央視新聞頻道的“據(jù)說春運(yùn)”“兩會大數(shù)據(jù)”等新聞專題,騰訊網(wǎng)的新聞百科頻道的“數(shù)據(jù)控”專題。除上述以外,較早研究和使用數(shù)據(jù)新聞的媒體還有財(cái)新網(wǎng),其“數(shù)字說”欄目定期推出優(yōu)質(zhì)的數(shù)據(jù)新聞產(chǎn)品,在業(yè)內(nèi)口碑較好,并多次獲得國內(nèi)外大獎。
3.1確定新聞選題
確定新聞選題是首要完成的步驟。選題確定意味著目標(biāo)明確,這樣就可以開展后續(xù)工作。這里建議成立專門的數(shù)據(jù)新聞項(xiàng)目小組,因?yàn)檎麄€新聞生產(chǎn)過程不可能由一兩個人來完成,即便能完成,質(zhì)量也不高。項(xiàng)目小組分工也要具體明確。數(shù)據(jù)新聞項(xiàng)目組通常至少包含如下三類人員:記者編輯、美術(shù)設(shè)計(jì)師和程序員。其中,記者編輯負(fù)責(zé)文案起草,美術(shù)設(shè)計(jì)師負(fù)責(zé)設(shè)計(jì),程序員負(fù)責(zé)前端程序?qū)崿F(xiàn)。本文以“反腐”題材為例,闡述一個完整的數(shù)據(jù)新聞生產(chǎn)過程。
3.2海量信息采集與標(biāo)注
基本邏輯為從海量互聯(lián)網(wǎng)信息(15 000家媒體和政府網(wǎng)站的10多億篇資訊報(bào)道)中,進(jìn)行大數(shù)據(jù)平臺采集工作,通過對“反腐”等關(guān)鍵詞標(biāo)注篩選,得到約260萬篇反腐類新聞報(bào)道,繼續(xù)針對人名標(biāo)注篩選,得到90多萬條新聞報(bào)道,再對涉腐人員標(biāo)注篩選,得到相關(guān)新聞報(bào)道8 914條。
3.3結(jié)構(gòu)化建模與確立維度
建立結(jié)構(gòu)化模型,確立維度,形成模板,利用海量大數(shù)據(jù)抽取技術(shù),將非結(jié)構(gòu)化文本信息,得到各維度信息。這個過程總結(jié)起來實(shí)質(zhì)上是標(biāo)簽化。如圖1所示。
圖1 結(jié)構(gòu)化建模與信息抽取
3.4多維度信息匯總分析
將第三步得到的多維度信息進(jìn)行匯總分析,分析思路是針對若干個維度標(biāo)簽組合,可以得到一些用戶感興趣的數(shù)據(jù),這些數(shù)據(jù)是深層次的,無法通過一兩個案例就能得到的,這也是大數(shù)據(jù)應(yīng)用價值體現(xiàn)。例如,本例中,我們可以輕松得到基于時間軸的全國反腐形勢分析、涉腐人員構(gòu)成分析、腐敗類型分析等。
3.5可視化報(bào)告呈現(xiàn)
通過前面四個步驟,完成了數(shù)據(jù)新聞生產(chǎn)的80%以上工作,但是如果僅到此為止,還不能算作一個數(shù)據(jù)新聞產(chǎn)品,最多算個半成品,因?yàn)槲覀兊玫降膬H僅是一張張枯燥的表格。如果將這些數(shù)字表格呈現(xiàn)給用戶,一般不會受歡迎,因此還需要可視化報(bào)告呈現(xiàn)這一環(huán)節(jié)。這一環(huán)節(jié)和大數(shù)據(jù)已沒有關(guān)系,但是同樣不可忽視,因?yàn)楹玫恼故拘Ч麜砗玫挠脩趔w驗(yàn),好的用戶體驗(yàn)又會帶來收視(點(diǎn)擊)效果。目前,可視化操作主要用到圖形和動畫制作。動畫制作可以傳統(tǒng)的flash方式,也可以使用HTML5方式,且考慮到多終端適配,HTML5方式更容易被關(guān)注。HTML5是一門新興網(wǎng)頁標(biāo)記語言,因具有語法簡單、適配性能好、開發(fā)成本低等特點(diǎn),廣受移動開發(fā)者青睞,是開發(fā)Web APP的首選工具。要實(shí)現(xiàn)豐富的動畫效果,除了掌握HTML5以外,還要熟練掌握CSS3和JavaScript技術(shù)。具體要何種形式呈現(xiàn),需要設(shè)計(jì)人員和前端程序人員配合才能完成。例如,本例中,為了清晰表達(dá)“全國反腐形勢分析”這一數(shù)據(jù)新聞,設(shè)計(jì)人員可以設(shè)計(jì)用“中國地圖+熱點(diǎn)區(qū)域”動畫展示,前端程序人員則需要用HTML5+CSS3+JavaScript布局程序,比如用到HTML5的Canvas畫布對象及熱點(diǎn)鏈接,用CSS3和JavaScript實(shí)現(xiàn)動畫效果和數(shù)據(jù)傳遞。
此外,可視化還可以借助網(wǎng)絡(luò)上免費(fèi)第三方工具,如百度echarts(http:// echarts.baidu.com/),詞云工具h(yuǎn)ttp:// www.tagxudo.com,http://www.picdata.cn。
網(wǎng)絡(luò)臺對大數(shù)據(jù)新聞生產(chǎn)的研究仍處于初級階段,存在的主要問題集中表現(xiàn)在以下幾方面:一是大數(shù)據(jù)基礎(chǔ)平臺尚未搭建,仍需借助第三方平臺開展;二是如何進(jìn)行新聞選題,及報(bào)道的深度和維度不好把控;三是H5復(fù)合型技術(shù)人才缺失。總之,大數(shù)據(jù)新聞的關(guān)鍵已不在數(shù)據(jù)本身,而在于用數(shù)據(jù)講故事的能力及提供個性化新聞服務(wù)的能力。隨著移動互聯(lián)網(wǎng)及智能計(jì)算的進(jìn)一步發(fā)展,相信大數(shù)據(jù)新聞的春天一定會到來。
[1]郭平.當(dāng)云計(jì)算遇見大數(shù)據(jù)[J].計(jì)算機(jī)世界,2001,5(23).
[2]喻國明.從精確新聞到大數(shù)據(jù)新聞:關(guān)于大數(shù)據(jù)新聞的前世今生[J].青年記者,2014(12).