吳新麗 李云飛 高金
摘 ?要:大數(shù)據(jù)的運用已由簡單的數(shù)據(jù)積累過渡到深度開發(fā)利用數(shù)據(jù)的嶄新階段,隨著新冠肺炎疫情的持續(xù)發(fā)酵,為打好這場保衛(wèi)人民健康安全的防疫之戰(zhàn),新華網(wǎng)依托自身技術(shù)優(yōu)勢,快速推出“睿思戰(zhàn)‘疫——大數(shù)據(jù)洞察新冠肺炎疫情動態(tài)”大數(shù)據(jù)服務(wù)和《抗擊疫情·睿思這么看》系列報道,對疫情下的熱點話題進行深度挖掘和數(shù)據(jù)可視化分析。從網(wǎng)民視角出發(fā),用理性數(shù)據(jù)分析紓解網(wǎng)民情緒,引導(dǎo)網(wǎng)民正確看待疫情和疫情防控。
關(guān)鍵詞:新華睿思;新冠肺炎;數(shù)據(jù)可視化;大數(shù)據(jù);媒體融合
中圖分類號:G237 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文獻標識碼:A
本文著錄格式:吳新麗,李云飛,高金.睿思戰(zhàn)“疫”——媒體大數(shù)據(jù)創(chuàng)新實踐[J].中國傳媒科技,2020,03(03):11-14.
當前,大數(shù)據(jù)和人工智能等前沿技術(shù)的創(chuàng)新和運用已成為推動媒體融合發(fā)展的重要引擎之一,大數(shù)據(jù)的運用已由簡單的數(shù)據(jù)積累過渡到深度開發(fā)利用數(shù)據(jù)的嶄新階段。在新一輪媒體變革和技術(shù)革命中,新華網(wǎng)踐行“數(shù)字中國”國家大數(shù)據(jù)戰(zhàn)略,以技術(shù)為引領(lǐng),主動出擊,重點布局,將人工智能、大數(shù)據(jù)等新技術(shù)融入業(yè)務(wù)各環(huán)節(jié)中,積極探索數(shù)據(jù)驅(qū)動型媒體創(chuàng)新方向,著力自主研發(fā)并推廣應(yīng)用“新華睿思數(shù)據(jù)大數(shù)據(jù)產(chǎn)品矩陣”,助力新華網(wǎng)數(shù)字內(nèi)容生態(tài)體系建設(shè)。
1.新華睿思大數(shù)據(jù)技術(shù)創(chuàng)新與應(yīng)用
在DT時代,數(shù)據(jù)作為基礎(chǔ)資源,是利用大數(shù)據(jù)、人工智能技術(shù)推動媒體融合發(fā)展的重要前提。新華網(wǎng)自2017年開始建設(shè)新華睿思數(shù)據(jù)資源池,資源池覆蓋當前互聯(lián)網(wǎng)上各類公開數(shù)據(jù),累計存儲數(shù)據(jù)量超過620億條,正在以日均1億條數(shù)據(jù)體量的速度增長。新華睿思數(shù)據(jù)資源池已成為新華網(wǎng)在數(shù)字內(nèi)容生態(tài)發(fā)展建設(shè)工作中的重要數(shù)據(jù)礦產(chǎn)。
在技術(shù)深耕方面,重點發(fā)力數(shù)據(jù)挖掘分析領(lǐng)域,打造新一代睿思智能分析技術(shù)體系,潛心研究并實現(xiàn)多項人工智能算法引擎創(chuàng)新,包括信息分類預(yù)測、熱點智能識別、情感極性預(yù)測、跨信源傳播追溯、事件演化分析、網(wǎng)民情緒感知、中文熱詞提取等數(shù)款數(shù)據(jù)挖掘分析引擎,申請多項大數(shù)據(jù)和AI領(lǐng)域技術(shù)發(fā)明專利,讓技術(shù)賦能內(nèi)容生產(chǎn)全流程。
隨著新冠肺炎疫情的持續(xù)發(fā)酵,為打好這場保衛(wèi)人民健康安全的防疫之戰(zhàn),新華網(wǎng)大數(shù)據(jù)中心依托自身技術(shù)優(yōu)勢,快速推出“睿思戰(zhàn)‘疫——大數(shù)據(jù)洞察新冠肺炎疫情動態(tài)”大數(shù)據(jù)服務(wù)和《抗擊疫情·睿思這么看》系列報道,用大數(shù)據(jù)和人工智能技術(shù)助力疫情防控。
2.大數(shù)據(jù)在“疫情”背景下的創(chuàng)新應(yīng)用——睿思戰(zhàn)“疫”
“睿思戰(zhàn)‘疫——大數(shù)據(jù)洞察新冠肺炎疫情動態(tài)”信息服務(wù)實時采集并呈現(xiàn)疫情相關(guān)信息,為社會公眾提供多維度的大數(shù)據(jù)信息服務(wù)。睿思戰(zhàn)“疫”信息服務(wù)包括五部分:
2.1全國疫情數(shù)據(jù)可視化分析服務(wù)
基于新華睿思獨有的網(wǎng)民情緒感知分析模型、事件演化分析模型以及情感極性預(yù)測模型等文本挖掘分析模型,在智能匯聚互聯(lián)網(wǎng)上全國疫情相關(guān)信息的基礎(chǔ)上,從關(guān)注趨勢變化、熱議詞云、網(wǎng)民情緒、熱點話題等多角度、可視化呈現(xiàn)媒體和網(wǎng)民對全國疫情的關(guān)注情況。
全國疫情詞云分析:在統(tǒng)計學(xué)習(xí)基礎(chǔ)上,融合中心詞特征權(quán)重、中心詞位置關(guān)系、主題分布和搜索規(guī)則等多種加權(quán)計算策略,從海量新聞、微博、微信等最新疫情信息動態(tài)中智能提取最熱關(guān)鍵詞并以詞云的方式呈現(xiàn)給用戶。
網(wǎng)民情緒分析:采用TensorFlow的Keras深度學(xué)習(xí)框架,通過雙向長短期記憶層、注意力機制等神經(jīng)網(wǎng)絡(luò)模型,從海量的互聯(lián)網(wǎng)數(shù)據(jù)中學(xué)習(xí)網(wǎng)民情緒特征,從語義層面解析在全國抗疫過程中網(wǎng)民行為承載的真實情緒,以雷達圖的形式直觀呈現(xiàn)網(wǎng)民情緒的波動變化。
熱點話題TOP3:采用Spark core+KMeans++大數(shù)據(jù)聚類技術(shù),優(yōu)化全局最優(yōu)K值選擇算法,降低算法局部最優(yōu)概率,實現(xiàn)對新聞資訊、微信公眾號文章以及長微博等長文本類疫情信息的智能熱點挖掘,為用戶推送疫情最熱議題。
2.2基于信息自動分類算法的信息推薦服務(wù)
信息分類預(yù)測引擎基于淺層神經(jīng)網(wǎng)絡(luò)分類技術(shù),創(chuàng)新融合大數(shù)據(jù)和多層Softmax& Huffman樹的深度學(xué)習(xí)算法對長文本信息進行智能類別劃分,結(jié)合公眾關(guān)心的疫情多方面動態(tài),提供權(quán)威發(fā)布、疫情速報、藥物研發(fā)、防控科普等十大信息專欄,通過提供實時可靠的疫情信息,全方位幫助公眾了解疫情發(fā)展動態(tài)和最新抗疫進展。
2.3基于地理位置信息的屬地疫情動態(tài)服務(wù)
結(jié)合全國不同地區(qū)公眾對疫情信息的個性化需求,根據(jù)用戶所在地理位置,自動定位所在省份,分析該省份的疫情發(fā)展趨勢和最新疫情動態(tài),幫助用戶從海量疫情資訊中快速獲取屬地疫情信息。
2.4區(qū)域風(fēng)險查詢服務(wù)
與聯(lián)通大數(shù)據(jù)共同打造區(qū)域風(fēng)險查詢服務(wù),支持全國各城市社區(qū)級疫情風(fēng)險免費查詢,為公眾提供自身所在周邊社區(qū)疫情風(fēng)險級別查詢以及所在區(qū)縣疫情風(fēng)險指數(shù)查詢服務(wù)。
2.5城市動態(tài)查詢服務(wù)
聯(lián)通大數(shù)據(jù)聯(lián)手打造城市動態(tài)查詢服務(wù),免費提供340余座城市的實時動態(tài)。通過城市返程率、出行強度、流動人口感知等信息服務(wù),為城市管理部門應(yīng)對防疫壓力帶來幫助,同時也為公眾返程出行提供數(shù)據(jù)參考。
3.大數(shù)據(jù)賦能媒體內(nèi)容生產(chǎn)——《抗擊疫情·睿思這么看》
大數(shù)據(jù)新聞是基于大數(shù)據(jù)技術(shù)和思維發(fā)展而產(chǎn)生的全新報道模式。數(shù)據(jù)驅(qū)動新聞生產(chǎn),代表了未來新聞發(fā)展的一種趨勢,這種生產(chǎn)模式隨著大數(shù)據(jù)技術(shù)的發(fā)展和成熟,以及與新媒體傳播環(huán)境的融合,正在進入規(guī)?;a(chǎn)時代。
新華網(wǎng)大數(shù)據(jù)中心從2019年開始嘗試大數(shù)據(jù)可視化新聞生產(chǎn),以新華睿思大數(shù)據(jù)平臺為依托推出《睿思一刻》欄目,運行近一年成果斐然,展現(xiàn)了大數(shù)據(jù)在新聞領(lǐng)域的長線、全線優(yōu)勢。新冠肺炎疫情發(fā)生后,立足于國家重點新聞媒體的責(zé)任和使命,再次傾力打造《抗擊疫情·睿思這么看》系列報道,對疫情下的熱點話題進行深度挖掘和數(shù)據(jù)可視化分析。從網(wǎng)民視角出發(fā),用理性數(shù)據(jù)分析紓解網(wǎng)民情緒,引導(dǎo)網(wǎng)民正確看待疫情和疫情防控。
系列報道在1月28日與讀者見面,在新華網(wǎng)客戶端首屏、PC端首頁、微博、微信同步更新,截至3月9日已累計發(fā)布26期,系列報道單篇閱讀量最高突破1000萬次,在同類報道中遙遙領(lǐng)先,為新冠肺炎疫情報道添以“數(shù)據(jù)溫情”。
3.1基于全網(wǎng)公開數(shù)據(jù),展現(xiàn)真實的全民戰(zhàn)“疫”,成為信息汪洋中網(wǎng)民信賴的“權(quán)威信源”
《抗擊疫情·睿思這么看》系列報道基于客觀數(shù)據(jù)采集和分析,將選題策劃由經(jīng)驗驅(qū)動和情感驅(qū)動轉(zhuǎn)變?yōu)閿?shù)據(jù)驅(qū)動,在實現(xiàn)選題策劃數(shù)據(jù)化、智能化的同時,也真正實現(xiàn)了貼近“民心”、反映“民聲”。系列報道中“抗擊疫情,網(wǎng)民在關(guān)注”版塊,為讀者呈現(xiàn)每日疫情相關(guān)的權(quán)威信息匯總。
此外,抗擊疫情中,社交媒體異常活躍,致使各種未經(jīng)證實的信息混雜網(wǎng)絡(luò),擾亂輿論場秩序,為疫情防控工作的開展造成了混亂和阻礙,公眾也在信息汪洋中無所適從。《抗擊疫情·睿思這么看》系列報道利用“網(wǎng)民關(guān)注度模型”,對公開網(wǎng)絡(luò)數(shù)據(jù)進行多維度分析,將網(wǎng)民最關(guān)心、最迫切、最擔(dān)憂的問題和國家聯(lián)防聯(lián)控形勢相結(jié)合,提供豐富、客觀的數(shù)據(jù)基礎(chǔ)、事實真相和觀點分析,在社會動員、凝聚共識、穩(wěn)定大局、團結(jié)鼓勁方面發(fā)揮著重要作用,成為網(wǎng)民信賴的“權(quán)威信源”。
3.2重視用戶體驗,提供廣度、速度和深度兼?zhèn)涞娜诤闲侣劮?wù)
《抗擊疫情·睿思這么看》系列報道重視用戶體驗和閱讀習(xí)慣,在便捷性、使用感、互動感、閱讀感、可視化、數(shù)據(jù)化等多個方面強化升級用戶交互式體驗。
從發(fā)布平臺上,《抗擊疫情·睿思這么看》系列報道在每天晚上9:00前后的手機閱讀高峰時段在新華網(wǎng)客戶端首屏發(fā)布,利用雙技術(shù)平臺(新聞資訊APP+大數(shù)據(jù)技術(shù)平臺)優(yōu)勢,實現(xiàn)交互式體驗“跳躍”升級。同時,作為新華網(wǎng)“新冠肺炎疫情”重點策劃報道在新華網(wǎng)PC端、官方微博@新華網(wǎng)和官方微信同時段推送,全面提升信息送達率。
從報道形態(tài)上,大數(shù)據(jù)可視化新聞的報道形態(tài)更加靈活,以全時性數(shù)據(jù)為支撐、以動態(tài)圖像設(shè)計為手段,呈現(xiàn)事件及話題的傳播趨勢、話題演變、網(wǎng)民情緒演化,新聞不僅在視覺效果中動起來,更在內(nèi)容上動起來。
從報道深度上,大數(shù)據(jù)技術(shù)在選題策劃、數(shù)據(jù)采集、數(shù)據(jù)挖掘、數(shù)據(jù)分析階段實現(xiàn)全鏈的智能化新聞內(nèi)容生產(chǎn),大大提升了原創(chuàng)內(nèi)容生產(chǎn)的效率,降低人力占有率,甚至完成了依靠人力無法實現(xiàn)的新聞初加工,全面推動了媒體生產(chǎn)效能的提升,為新聞服務(wù)兼具廣度、速度和深度提供了可能性。同時,應(yīng)對“新冠肺炎疫情”報道中不斷涌現(xiàn)的話題和熱點,大數(shù)據(jù)解讀給讀者呈現(xiàn)了全新的思維方式和方向。
3.3在政策解讀和社會動員中,肩負起新聞媒體的社會責(zé)任,傳播抗“疫”正能量
這是一場醫(yī)療戰(zhàn),更是一場信息戰(zhàn),親赴一線的不只有廣大醫(yī)療工作者,還有傳遞疫情聲音的媒體工作者。疫情發(fā)展至今,主流媒體勇?lián)姑?,始終走在“抗疫防疫”第一線?!犊箵粢咔椤ゎK歼@么看》系列報道從不同角度,宣傳黨中央重大決策部署和各地有力措施,講述防疫抗疫中的先進事跡和動人故事,作為重點新聞網(wǎng)站抗疫報道的一塊磚石,迅速轉(zhuǎn)入抗疫防疫報道“戰(zhàn)時”狀態(tài),認真履行新聞媒體的社會責(zé)任。
系列報道以大數(shù)據(jù)技術(shù)創(chuàng)新助力全媒體生態(tài)和內(nèi)容產(chǎn)業(yè)鏈,使主流媒體的聲音更具時代特征:強信心、暖人心、聚民心,有特色、有亮點、有依據(jù)。這種新聞模型也迅速得到輿論回應(yīng),為抗疫宣傳工作提供全面精準的“一手”信息反饋,這種數(shù)據(jù)服務(wù)、新聞報道與民生關(guān)切的“多向回應(yīng)”是大數(shù)據(jù)優(yōu)勢的集中體現(xiàn)。
3.4自有數(shù)據(jù)庫不斷豐富,反哺聯(lián)防聯(lián)控、精準施策等領(lǐng)域研究
目前《抗擊疫情·睿思這么看》系列報道中所積累的數(shù)據(jù)資源和研判語料,已經(jīng)成為相關(guān)社會問題、經(jīng)濟問題研究的重要數(shù)據(jù)庫,數(shù)據(jù)成果一方面推動技術(shù)平臺針對性、精準度的發(fā)展,另一方面也為聯(lián)防聯(lián)控、精準施策提供了數(shù)據(jù)參考和成效校驗。目前系列報道已正式推出“睿思數(shù)據(jù)觀”欄目,對不斷積累的數(shù)據(jù)資源進行進一步的挖掘和研判。
結(jié)語
疫情是個“自帶流量”的話題。而當疫情遇到社交媒體高度活躍的2020,真假信息的威力都將被無限放大。從傳播的角度,中國輿論場正在面臨一場不亞于“新冠肺炎疫情”的“信息疫情”,但正是這場疫情,讓我們看到了主流媒體價值和公信力的強勢回歸。以新華睿思為代表的主流媒體大數(shù)據(jù)平臺將作為這場防疫抗疫戰(zhàn)斗中的“彈藥武器”,以技術(shù)手段和產(chǎn)業(yè)應(yīng)用全面加持疫情防控和新聞宣傳工作。疫情是對中國政府治理體系和治理能力現(xiàn)代化的一場大考,也是對主流媒體能否在其中履行自己新聞使命的一場大考??箵粢咔椋襟w在行動,大數(shù)據(jù)在行動,新華睿思在行動。
[1]劉思揚.鞏固內(nèi)容創(chuàng)新優(yōu)勢 建設(shè)新型主流媒體[J].傳媒,2020(2):13-14.
[2]彭蘭.智媒趨勢下內(nèi)容生產(chǎn)中的人機關(guān)系[J].上海交通大學(xué)學(xué)報(哲學(xué)社會科學(xué)版),2020,28(1):31-40.
作者簡介:吳新麗(1980-),女,河北人,新華網(wǎng)股份有限公司副總工程師兼大數(shù)據(jù)中心總經(jīng)理,研究方向:互聯(lián)網(wǎng)數(shù)據(jù)采集、自然語言處理及數(shù)據(jù)挖掘、輿情大數(shù)據(jù)、媒體大數(shù)據(jù)等領(lǐng)域大數(shù)據(jù)應(yīng)用;李云飛(1988-),女,山西人,新華網(wǎng)股份有限公司大數(shù)據(jù)中心產(chǎn)品總監(jiān),研究方向:輿情大數(shù)據(jù)、媒體大數(shù)據(jù)等領(lǐng)域大數(shù)據(jù)應(yīng)用;高金(1988-),女, 山東人,新華網(wǎng)股份有限公司大數(shù)據(jù)中心分析總監(jiān),研究方向:大數(shù)據(jù)分析、智庫服務(wù)。