文/戴文雄
針對于傳統(tǒng)媒體,如果想要實現(xiàn)真正的“媒體融合”,首先需要將傳統(tǒng)媒體與互聯(lián)網(wǎng)、手機等智能新媒體結(jié)合在一起,將不同的信息產(chǎn)品通過不同平臺傳遞給讀者。另外,應(yīng)該對互聯(lián)網(wǎng)、手機等新興媒體中的信息優(yōu)勢進行充分利用,將大數(shù)據(jù)的作用充分發(fā)揮出來,通過對數(shù)據(jù)的采集、分析等過程,為傳統(tǒng)媒體提供更好的服務(wù)工作,最終實現(xiàn)傳統(tǒng)媒體的流程再造。
想要實現(xiàn)大數(shù)據(jù)平臺的建設(shè)和發(fā)展,相關(guān)部門首先要做的就是數(shù)據(jù)采集。如果對數(shù)據(jù)的來源進行分類,可分為集團內(nèi)數(shù)據(jù)和集團外數(shù)據(jù);如果從數(shù)據(jù)格式上劃分,包括結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)數(shù)據(jù)。在平臺建設(shè)初期,相關(guān)工作人員需要根據(jù)平臺的最終建設(shè)目標,對需要采集的數(shù)據(jù)進行合理規(guī)劃,并根據(jù)數(shù)據(jù)的具體類型,選擇數(shù)據(jù)的采集方法。針對集團內(nèi)數(shù)據(jù),可以通過接口或文件畸形數(shù)據(jù)導入,并通過數(shù)據(jù)庫等裝置實現(xiàn)數(shù)據(jù)之間的對接。由于集團外部的網(wǎng)絡(luò)數(shù)據(jù)量較大,在大數(shù)據(jù)采集過程中,可對網(wǎng)絡(luò)爬蟲或公開的API進行合理利用,從而將網(wǎng)站中的相關(guān)文本、音頻等信息成功采集。
當數(shù)據(jù)采集工作完成之后,由于數(shù)據(jù)的來源和格式等存在不同性,再加上數(shù)量眾多,導致數(shù)據(jù)結(jié)構(gòu)十分復雜。因此,在大數(shù)據(jù)實際應(yīng)用之前,需要對其開展預處理工作,按照最終數(shù)據(jù)的使用要求,建設(shè)出一套或者多套數(shù)據(jù)選擇標準,并按照相應(yīng)標準對數(shù)據(jù)進行處理,之后在輸送到讀者面前。在大數(shù)據(jù)預處理過程中,主要包括的步驟有數(shù)據(jù)抽取、數(shù)據(jù)清洗等。在數(shù)據(jù)采集過程中所獲取的大數(shù)據(jù)可能具備結(jié)構(gòu)多樣化等特點經(jīng)過數(shù)據(jù)抽取過程,可能會幫助人們將原本復雜的數(shù)據(jù)轉(zhuǎn)變成單一或者容易處理的結(jié)構(gòu)類型,以此來達到對數(shù)據(jù)快速處理目的。在大數(shù)據(jù)使用之中,并不是所有數(shù)據(jù)均對人們有利用價值,有些數(shù)據(jù)信息更是讀者所不關(guān)心的,還有的數(shù)據(jù)存在明顯錯誤。因此,在數(shù)據(jù)預處理過程中,工作人員需要對數(shù)據(jù)進行仔細過濾,將無用或錯誤的信息驅(qū)除出去,從而實現(xiàn)數(shù)據(jù)預處理效果的有效提升[1]。
在數(shù)據(jù)預處理工作完成之后,工作人員需要將采集到的數(shù)據(jù)進行存儲,以此來實現(xiàn)數(shù)據(jù)的統(tǒng)一管理。一般來說,人們常用Hadoop主體架構(gòu)來解決大規(guī)模的數(shù)據(jù)存儲問題。該架構(gòu)由Apache基金會研究開發(fā)出來,屬于分布式系統(tǒng)的基礎(chǔ)架構(gòu)。在使用過程中,用戶即使對分布式底層細節(jié)了解不夠詳細,也可以實現(xiàn)分布式程序的深層次開發(fā),通過對集群的威力應(yīng)用,最終實現(xiàn)數(shù)據(jù)的高效存儲。Hadoop還可以在分布式系統(tǒng)中建立文件庫,該軟件被稱為HDFS。HDFS在使用過程中具有較高的容錯率,可以將其利用在價格低廉的硬件裝置上,以此來實現(xiàn)數(shù)據(jù)傳輸效率的有效提升,適合在大數(shù)據(jù)環(huán)境下進行應(yīng)用。利用該種架構(gòu)對大數(shù)據(jù)平臺進行搭建,可實現(xiàn)對周期成本的有效降低。而在大數(shù)據(jù)存儲管理平臺建立的同時,還需要對同步平臺安全體系的建設(shè)進行充分考慮。工作人員可通過對數(shù)據(jù)的銷毀、加密等,促使大數(shù)據(jù)在存儲過程中保持完整,將整個存儲平臺的安全性有效提升。
在大數(shù)據(jù)分析過程中,可將其分成兩部分進行探討。其中,底層為基礎(chǔ)分析層,在這之上是業(yè)務(wù)分析層?;A(chǔ)分析層的重要作用是為業(yè)務(wù)分析層提供分析基礎(chǔ)和服務(wù),而業(yè)務(wù)分析層在工作過程中主要是根據(jù)用戶的不同需求,對分析對象進行準確定立,并在后續(xù)整合基礎(chǔ)分析服務(wù),為用戶提供更為專業(yè)的分析結(jié)果。在實際分析工作進行時,工作人員可以根據(jù)已經(jīng)建立好的多維語義,為每個標簽建立一個關(guān)鍵詞云庫,并根據(jù)以往使用的特定算法,對每篇新聞報道進行深層分析,并自動做好分類工作,將其輸送到固定的標簽之下。在自動分類過程中,分類結(jié)果可能在一開始可能存在問題,需要經(jīng)過長時間的學習和訓練才能漸漸適應(yīng)。除此之外,相關(guān)工作人員還要做好分類和糾錯工作,對分類算法和關(guān)鍵詞云庫進行適時更新,最終實現(xiàn)自動分類結(jié)果的合理優(yōu)化[2]。
為了更好的促使媒體融合,各個媒體單位和部門做了大量的研究和實踐工作。以成都地區(qū)為例,當?shù)孛襟w以成都地區(qū)300萬戶家庭的全量當做數(shù)據(jù)基礎(chǔ),利用IPTV大數(shù)據(jù)分析系統(tǒng),對收視率、收視份額等進行了全面統(tǒng)計和分析,時間甚至精確到秒,為各級廣播電視的節(jié)目優(yōu)化和媒體融合發(fā)展提供了有利條件。與此同時,由于對觀眾需求有了一個大致的了解,為廣告主的精準營銷提供了數(shù)據(jù)支持,通過IPTV大數(shù)據(jù)分析系統(tǒng),以及傳統(tǒng)媒體的權(quán)威性,再加上新媒體的傳播速度,廣告的影響力大大提升,為提升各個企業(yè)在市場中的知名度奠定了基礎(chǔ)。
智能選稿系統(tǒng)在業(yè)內(nèi)被稱為智能“爬蟲”,可對互聯(lián)網(wǎng)中的新聞進行有效抓取,并通過大數(shù)據(jù)模型對熱點新聞事件進行深入分析,為新聞內(nèi)容的產(chǎn)生和傳遞提供了有利條件。一般來說,新聞稿初選幾乎全部由機器來完成,并進行一鍵轉(zhuǎn)載,相關(guān)記者等人員可以根據(jù)關(guān)鍵詞的搜索,對熱點人物、專題等綜合信息進行獲取,從而為素材編輯提供數(shù)據(jù)支撐,還可以為新聞宣傳和媒體報道提供網(wǎng)絡(luò)傳播分析。這種選稿系統(tǒng)的出現(xiàn),不但體現(xiàn)出了大數(shù)據(jù)的強大作用,還能在一定程度上提升媒體融合之下的新聞內(nèi)容產(chǎn)生效率,促使新聞更加符合人們的關(guān)注點,最終實現(xiàn)新聞行業(yè)的全面發(fā)展。
大數(shù)據(jù)平臺在媒體融合之中的應(yīng)用,主要體現(xiàn)在融媒體的數(shù)據(jù)分析過程之中。在日常媒體工作過程中,工作人員會在融媒體之中植入統(tǒng)一的數(shù)據(jù)“探針”,建立一個穩(wěn)定有序的數(shù)據(jù)分析和采集系統(tǒng),該系統(tǒng)的工作流程主要包括內(nèi)容采集、生產(chǎn)、審核、發(fā)布。全過程都涉及到了大數(shù)據(jù)的分析,還涉及到很多政治服務(wù)、行業(yè)應(yīng)用等全產(chǎn)品大數(shù)據(jù)分析體系。通過這種大數(shù)據(jù)平臺的應(yīng)用,在促使媒體融合之外,還能實現(xiàn)各種產(chǎn)品之間的用戶互通,并實現(xiàn)用戶共享和內(nèi)容共享,增加新媒體產(chǎn)品矩陣的創(chuàng)新性和共享性,還可以將大數(shù)據(jù)平臺的應(yīng)用作用有效發(fā)揮出來[3]。
根據(jù)媒體融合過程中的內(nèi)容產(chǎn)生機制和原理。首先,工作人員需要將全平臺與新媒體網(wǎng)絡(luò)之間的通路進行打通,在保證數(shù)據(jù)安全的前提下實現(xiàn)融合與共享。其次,需要按照內(nèi)容匯集、資源共享等具體流程,對大數(shù)據(jù)平臺的應(yīng)用進行全面指揮,以此來實現(xiàn)對熱點事件的全面融合性報道。在融合大數(shù)據(jù)使用過程中,需要對融合狀態(tài)下的全流程、全環(huán)節(jié)提供有效支撐。例如,在新聞內(nèi)容的匯聚端口,人們需要根據(jù)智能選稿系統(tǒng),對網(wǎng)絡(luò)中的熱點數(shù)據(jù)進行抓取,再通過融合編輯和資源共享,將記者的工作情況、稿件來源等進行掌握,而在此過程中,大數(shù)據(jù)平臺的可視化將會發(fā)揮出重要作用,對實時信息進行全面掌握。最后,在全媒體大數(shù)據(jù)演播室建造過程中,需要實現(xiàn)大數(shù)據(jù)平臺和虛擬前景系統(tǒng)的有效對接,促使各類演播室均具備可視化功能,以此來增加媒體融合之下用戶的體驗感。
綜上所述,在大數(shù)據(jù)時代下,人們應(yīng)該對傳統(tǒng)媒體與新媒體之間的融合進行重視,并以互聯(lián)網(wǎng)技術(shù)為依托,慢慢順應(yīng)大數(shù)據(jù)為整個新聞行業(yè)帶來的改變,努力克服各種困難。除此之外,傳統(tǒng)媒體還要對各方優(yōu)勢進行借助,對大數(shù)據(jù)運營平臺進行建立,為時代的進步以及信息傳遞提供基礎(chǔ),并在實現(xiàn)發(fā)展目標的同時,維持大數(shù)據(jù)的平穩(wěn)與健康。
[1]梅劍平.大數(shù)據(jù)助力媒體融合——央視大數(shù)據(jù)平臺技術(shù)與實踐[J].現(xiàn)代電視技術(shù),2017(05):100-104.
[2]李川.打造廣電融媒大數(shù)據(jù)中心助推城市臺媒體融合轉(zhuǎn)型升級[J].現(xiàn)代電視技術(shù),2017(05):105-109.
[3]殷俊,柳青.論大數(shù)據(jù)模式對媒體融合的推進作用[J].西南民族大學學報(人文社科版),2017,38(05):161-165.