文/肖 勇
在新聞媒體領(lǐng)域,東軟集團具有20余年的國際知名媒體的開發(fā)經(jīng)驗,與歐美一些媒體解決方案供應(yīng)商建立了長期的合作和技術(shù)交流關(guān)系。在國內(nèi)東軟集團曾為人民日報社、新華社、中央電視臺、中國日報社、北京日報報業(yè)集團、新華日報報業(yè)集團、北京電視臺等中央級和省部級報社、出版社和廣電用戶開發(fā)系統(tǒng)、提供服務(wù)。很多技術(shù)(產(chǎn)品)在推動媒體融合發(fā)展中也起到了重要的作用。
科學(xué)技術(shù)是第一生產(chǎn)力?,F(xiàn)代科技的加速發(fā)展,推動新聞傳播從“鉛與火”“光與電”走到了“數(shù)與網(wǎng)”,推動了傳統(tǒng)媒體和新興媒體的融合發(fā)展。
東軟集團作為中國領(lǐng)先的IT解決方案與服務(wù)供應(yīng)商,面向全球市場提供IT驅(qū)動的創(chuàng)新型解決方案與服務(wù),致力于推動社會的發(fā)展與變革,為個人創(chuàng)造新的生活方式,為社會創(chuàng)造價值。東軟集團在為不同業(yè)務(wù)領(lǐng)域提供服務(wù)的同時,利用了大量的先進的技術(shù),積累了從傳統(tǒng)應(yīng)用到移動互聯(lián)網(wǎng)應(yīng)用,再到云應(yīng)用的一系列平臺產(chǎn)品。
比如,在大數(shù)據(jù)應(yīng)用領(lǐng)域,東軟集團具有從數(shù)據(jù)采集、傳輸、清洗、轉(zhuǎn)換,再到數(shù)據(jù)存儲、分析,可視化展現(xiàn)、數(shù)據(jù)服務(wù)的完成產(chǎn)品體系(如圖1)。
圖1 東軟大數(shù)據(jù)系列產(chǎn)品
在新聞媒體領(lǐng)域,東軟集團具有20余年的國際知名媒體的開發(fā)經(jīng)驗,與歐美一些媒體解決方案供應(yīng)商建立了長期的合作和技術(shù)交流關(guān)系。在國內(nèi)東軟集團曾為人民日報社、新華社、中央電視臺、中國日報社、北京日報報業(yè)集團、新華日報報業(yè)集團、北京電視臺等中央級和省部級報社、出版社和廣電用戶開發(fā)系統(tǒng)、提供服務(wù)。很多技術(shù)(產(chǎn)品)在推動媒體融合發(fā)展中也起到了重要的作用。
在新聞媒體機構(gòu),經(jīng)常會涉及對大量數(shù)據(jù)內(nèi)容的存儲、交互。在實際使用過程中會遇到以下兩種問題:一是系統(tǒng)升級時需要把大量舊系統(tǒng)的數(shù)據(jù)導(dǎo)入到新系統(tǒng)。一方面,要一次性地把舊系統(tǒng)的存量數(shù)據(jù)導(dǎo)入到新系統(tǒng);另一方面,為了方便用戶使用舊系統(tǒng)和新系統(tǒng)的增量數(shù)據(jù)也需要進行新舊系統(tǒng)的數(shù)據(jù)交換。比如,報社開發(fā)了一個新的網(wǎng)站或者客戶端的時候,為了避免既有客戶流失,新舊系統(tǒng)需要并行運行一段時間。這樣就需要兩個系統(tǒng)的數(shù)據(jù)進行增量交互;二是一個機構(gòu)往往由多個開發(fā)系統(tǒng)構(gòu)成,不同的系統(tǒng)是由不同的廠商開發(fā)完成。采用了不同的數(shù)據(jù)庫架構(gòu)和數(shù)據(jù)存儲方式,很多情況下造成了信息孤島。為了打通各個系統(tǒng)的聯(lián)系,通常會建立數(shù)據(jù)中心,通過各個系統(tǒng)提供的數(shù)據(jù)接口對不同系統(tǒng)的既有和增量數(shù)據(jù)進行匯總集成。但是這個過程需要原系統(tǒng)的開發(fā)廠商對外提供大量的數(shù)據(jù)接口,數(shù)據(jù)中心需要進行內(nèi)容的讀取、過濾、轉(zhuǎn)換和存儲,需要有大量的開發(fā)工作。
為了解決上面兩個問題,東軟集團提出了Data Exchange平臺產(chǎn)品。Data Exchange是一款可以快捷打造數(shù)據(jù)中心(倉庫)、數(shù)據(jù)遷移、數(shù)據(jù)同步、數(shù)據(jù)交換等領(lǐng)域的數(shù)據(jù)集成解決方案平臺類產(chǎn)品。
Data Exchange主要將各個業(yè)務(wù)系統(tǒng)的數(shù)據(jù)進行抽取,轉(zhuǎn)換然后存儲到數(shù)據(jù)中心或者交互到其他系統(tǒng)。Data Exchange所有的操作處理都是圖形化的,可以支持?jǐn)?shù)據(jù)遷移的流程定義、支持多種數(shù)據(jù)庫及文件系統(tǒng);實現(xiàn)系統(tǒng)內(nèi)自動識別與處理故障,減少人工參與快速部署新功能與缺陷的快速修復(fù),降低人工升級維護成本指定任務(wù)計劃;可以圖形化的數(shù)據(jù)抽取、轉(zhuǎn)換(清洗),快速訂制各個業(yè)務(wù)系統(tǒng)的入庫任務(wù);可以實現(xiàn)統(tǒng)一管理、調(diào)度,實現(xiàn)全局總控與系統(tǒng)自動化運轉(zhuǎn);支持時間戳、標(biāo)志位、數(shù)據(jù)快照等增量方案,增加數(shù)據(jù)同步的高效性(如圖2)。
圖2 Data Exchange操作系統(tǒng)示意圖
Data Exchange在《貴陽日報》《半島晨報》《中國能源報》《中國汽車報》《新華日報》《南方財經(jīng)》等眾多媒體單位已經(jīng)有了很多的成功案例和實施經(jīng)驗。比如,Data Exchange幫助《貴陽日報》等新聞媒體單位打造了新媒體數(shù)據(jù)中心。對其不同的業(yè)務(wù)平臺提供不同類型的資源信息、產(chǎn)品信息、客戶信息等進行集中管理,實現(xiàn)了媒體資源和各項目的數(shù)據(jù)交換服務(wù)。通過Data Exchange的使用,成功地解決了新華日報報業(yè)集團交匯點客戶端1.0向2.0的升級過程中的數(shù)據(jù)遷移和交互的問題(如圖3)。
圖3 交匯點客戶端1.0向2.0升級過程中的數(shù)據(jù)遷移
隨著報社“中央廚房”系統(tǒng)建設(shè)的深入,報道指揮系統(tǒng)作為中央廚房系統(tǒng)的中樞神經(jīng)的作用越來越明顯。
報社領(lǐng)導(dǎo)和編輯之間需要建立高效、可靠、安全的隨時隨地的信息傳送通道;需要建立統(tǒng)一、有效、安全、實用的移動報道指揮平臺和突發(fā)、重大新聞和重點報道的快速通道。指揮者需要對新聞生產(chǎn)的新聞熱點、線索、策劃、采集、編輯、發(fā)布、傳播效果、影響力進行全面、整體的了解,對新聞生產(chǎn)進行有效的管控(如圖4)。
圖4 東軟平臺產(chǎn)品體系
報道指揮系統(tǒng)的建設(shè)不能僅局限在報社內(nèi)部的指揮、調(diào)度、管控和信息的大屏展示上,更應(yīng)該強調(diào)移動指揮。只有充分重視報道指揮的建設(shè)重點,才能真正發(fā)揮報道指揮的作用。但是隨之而來的一個問題就是如果一旦設(shè)備遺失或者用戶誤安裝了一些木馬程序就會造成重要信息的遺失。
Sa Ca EMM平臺是一款東軟集團自主研發(fā)的、擁有軟件產(chǎn)品著作權(quán)和登記證書的移動管理平臺。面向移動化過程中帶來的移動安全隱患和管理困難提供了全方位多層的管控手段,幫助企業(yè)降低風(fēng)險,提高效益。平臺將對接入系統(tǒng)的移動資源進行統(tǒng)一管理和安全管控。通過移動應(yīng)用管理(MAM),移動設(shè)備管理(MDM),移動內(nèi)容管理(MCM),實現(xiàn)針對移動資源整體的安全管控。通過對設(shè)備定期信息采集、實時遠(yuǎn)程控制等實現(xiàn)對設(shè)備進行全生命周期管理;通過配置不同安全策略,對不同違規(guī)行為、時間空間、目標(biāo)群體實現(xiàn)多維度的安全管理;通過應(yīng)用與個人應(yīng)用完全隔離、集成訪問權(quán)限認(rèn)證、限制非法訪問、提供數(shù)據(jù)安全傳輸隧道和安全接口實現(xiàn)企業(yè)應(yīng)用容器的安全隔離;可以實現(xiàn)設(shè)備定位、鎖定、遠(yuǎn)程信息擦除、回復(fù)出廠設(shè)置等,打造實時、高效、集中、協(xié)同、安全的信息化平臺,為媒體構(gòu)建一個更加安全、更加便捷、自由隨行的移動業(yè)務(wù)管理環(huán)境(如圖5)。
圖5 Sa Ca EMM平臺
新媒體的發(fā)展需要符合互聯(lián)網(wǎng)傳播特征、利于用戶互動的產(chǎn)品組合,深入了解用戶特征,從千人一面向千人千面轉(zhuǎn)變。使用戶看到的、聽到的都是自己想看想聽的內(nèi)容,真正實現(xiàn)客戶智能行為分析,整合用戶關(guān)注信息,進行個性化、精準(zhǔn)化推薦;為用戶提供個性化資訊內(nèi)容,以提高用戶使用的黏性,使媒體的終端訪問量顯著提升。
用戶行為分析的實現(xiàn)主要有兩種模式:一種是基于JS腳本的網(wǎng)站用戶行為分析統(tǒng)計。網(wǎng)站分析需要在網(wǎng)站的html代碼中嵌入一段腳本(Java Script等)用于統(tǒng)計用戶的瀏覽等行為。這種方法的優(yōu)點是技術(shù)難度低,只需嵌入腳本代碼,無需配置服務(wù)器;能夠快速獲取點擊、響應(yīng)等數(shù)據(jù)并方便展現(xiàn),數(shù)據(jù)的準(zhǔn)確度較高。缺點主要是無法統(tǒng)計網(wǎng)絡(luò)爬蟲的信息。當(dāng)前主流的網(wǎng)站流量分析系統(tǒng)絕大部分采用此種方法收集數(shù)據(jù);另一種是基于SDK的統(tǒng)計終端應(yīng)用分析的方式主要是較為流行的基于SDK的分析統(tǒng)計方式。這種方式是在應(yīng)用中嵌入一段SDK代碼,SDK代碼規(guī)定了用戶行為收集的規(guī)范,用戶的啟動和使用行為通過SDK記錄在應(yīng)用中,當(dāng)發(fā)送條件(啟動APP或切出APP超過一定時間返回后)被觸發(fā)后,這些日志被發(fā)送到服務(wù)器來進行分析和挖掘。此方式的優(yōu)點是安裝使用簡單,用戶行為統(tǒng)計更加準(zhǔn)確。
東軟Sa Ca Real Rec系統(tǒng)利用大數(shù)據(jù)處理、分布式并行計算、流數(shù)據(jù)處理、自然語言處理和機器學(xué)習(xí)等技術(shù),基于云計算技術(shù),發(fā)現(xiàn)引擎,提供精細(xì)化分析、個性化推薦。產(chǎn)品的核心由知識圖譜、興趣圖譜、社交圖譜和引擎組成,支撐用戶行為分析、個性化推薦等應(yīng)用場景(如圖6)。
CBox項目提供了用戶行為數(shù)據(jù)采集、核心數(shù)據(jù)存儲、推薦引擎、推薦接口服務(wù)等模塊,助力CBox項目實現(xiàn)實時個性化視頻推薦、廣告精準(zhǔn)營銷、運營策略擬制等,為平臺優(yōu)化提供了有價值的決策支持。
圖6 東軟Sa Ca Real Rec系統(tǒng)
北京電視臺以自有平臺數(shù)據(jù)及互聯(lián)網(wǎng)數(shù)據(jù)為基礎(chǔ),建設(shè)用戶行為分析、內(nèi)容推薦、決策分析等系統(tǒng),通過可視化數(shù)據(jù)展現(xiàn)方式將數(shù)據(jù)靈活、迅速地展現(xiàn)給領(lǐng)導(dǎo)和業(yè)務(wù)部門輔助生產(chǎn)和經(jīng)營,最大化的提升數(shù)據(jù)使用效率,采集用戶在多終端的點播行為數(shù)據(jù),包括瀏覽、快進、回訪等細(xì)粒度的操控數(shù)據(jù)并結(jié)合BTV內(nèi)部的視頻元數(shù)據(jù)信息,進行關(guān)聯(lián)行為挖掘及語義分析,從而提供精細(xì)的推薦內(nèi)容。
傳統(tǒng)以文字為主的呈現(xiàn)方式,在對一些大數(shù)據(jù)新聞進行報道解說時,顯現(xiàn)出乏力,難以一步到位。這種迫切需要能夠化繁為簡的報道形式的時代大背景下,數(shù)據(jù)新聞可視化應(yīng)運而生,將新聞事件轉(zhuǎn)化成圖形、文字、圖像等元素的結(jié)合來可視化展現(xiàn)報道。數(shù)據(jù)新聞可視化可以讓廣大讀者在最短時間內(nèi)精確把握新聞報道的核心內(nèi)容,獲取想要的關(guān)鍵信息。可視化作品以其簡潔明了的圖形方式,讓讀者快捷、輕松地了解新聞事件,閱讀新聞已成為了“悅讀新聞”。直觀、形象的數(shù)據(jù)新聞,貼近大眾生活,改變了人類閱讀、獲取、使用信息的方式。
東軟Sa Ca Data Viz改變了傳統(tǒng)以文字報道為主的新聞表達方式。用可視化的圖表形式呈現(xiàn)數(shù)據(jù)新聞,能清晰地傳達信息、深刻地揭示數(shù)據(jù)背后內(nèi)涵和意義。高級數(shù)據(jù)可視化圖表具有交互元素,網(wǎng)站和新媒體的新聞受眾通過點擊數(shù)據(jù)圖表,與圖表充分互動,可獲知更多信息,發(fā)現(xiàn)數(shù)據(jù)背后的問題和規(guī)律。提供簡單易用的數(shù)據(jù)可視化編輯加工平臺,大大提高數(shù)據(jù)新聞制作的效率(如圖7)。
圖7 東軟Sa Ca Data系統(tǒng)
媒體單位經(jīng)常會使用第三方推送平臺提供的推送功能向最終用戶推送信息,但往往會出現(xiàn)信息推送延遲,推送到達率低的問題。
通過東軟Sa Ca Cloud Push可以打造低成本、統(tǒng)一、可靠的推送平臺, 實現(xiàn)使帶有時效性的新聞、咨詢、廣告等信息的高效推送。
Sa Ca Cloud Push能夠向當(dāng)今流行的Android和iOS平臺推送消息,包括基于這些平臺的手機、電視以及汽車終端等設(shè)備。支持文本通知、自定義消息、圖片信息等;支持實時推送、定時推送、離線消息等多種推送模式;對于推送目標(biāo)的選擇,客戶可以通過Cloud Push的接口靈活選擇,以適用不同的推送場景;支持廣播推送、組播推送、單播推送等多種推送模式。
近年來,人工智能技術(shù)的迅猛發(fā)展,特別是深度學(xué)習(xí)技術(shù)出現(xiàn)以后,讓人工智能在很多方面能夠接近甚至超越人類的感知能力和水平,在圖像識別、語音識別等方面都產(chǎn)生了突破性進展。傳媒行業(yè)不管是在數(shù)據(jù)積累上、還是從工作模式上,都賦予了人工智能技術(shù)大顯身手的廣度和深度。
新聞稿件的文字校對,是新聞生產(chǎn)發(fā)布過程中必不可少的重要環(huán)節(jié),是保障發(fā)稿安全、維護新聞嚴(yán)謹(jǐn)性的關(guān)鍵防線,各大新聞機構(gòu)都有自己的審核流程,但是在最后發(fā)布之前,務(wù)必都要經(jīng)過校對環(huán)節(jié)。校對工作人員需要耐心細(xì)致、工作過程中不能有一絲疏忽,特別是涉及領(lǐng)導(dǎo)人的稿件,更要逐字篩查。校對軟件的出現(xiàn),一定程度上幫助了新聞工作者。隨著技術(shù)的進步,文字校對軟件也應(yīng)該變得更加聰明和便捷。
傳統(tǒng)檢校系統(tǒng)主要基于計算機的存儲和基本運算能力,通過長期積累大量的錯詞庫,對稿件的文字內(nèi)容進行逐字、逐詞匹配,凡是與錯詞庫中內(nèi)容相匹配的,就被系統(tǒng)認(rèn)定為文字錯誤,并提示給使用者。
智能檢校系統(tǒng)主要傳統(tǒng)檢校系統(tǒng)的不足和弱點,采用人工智能技術(shù)來實現(xiàn)整句級別的文字檢查,能夠根據(jù)句子整體表達的語境識別其中的不合理搭配問題。其主要原理是通過大量學(xué)習(xí)正確語料,讓計算機系統(tǒng)自主分析歸納語言的習(xí)慣用法、模式等,使得機器對句子形成一定的理解和判斷能力,從而實現(xiàn)在一個句子的維度上,對字、詞進行分析判斷,識別其中的異常、不合理內(nèi)容,達到檢查校對的目的。
媒體單位都有自己的機房和復(fù)雜的硬件、網(wǎng)絡(luò)環(huán)境。特別是最近幾年隨著虛擬化技術(shù)的發(fā)展,媒體單位面向云計算領(lǐng)域的通用云管理環(huán)境,在動態(tài)數(shù)據(jù)中心構(gòu)建及運維過程中需要全方位、多層次的監(jiān)控及管理能力,基于云環(huán)境實現(xiàn)應(yīng)用的快速部署及資源的彈性供應(yīng),通過簡化管理極大地降低成本、提高效益。具體的用場景包括數(shù)據(jù)中心資源集中監(jiān)管、分布式數(shù)據(jù)中心統(tǒng)一監(jiān)管、數(shù)據(jù)中心綠色能耗管理、數(shù)據(jù)中心智能運維管理、資源自助服務(wù)交付以及應(yīng)用動態(tài)交付與彈性支撐,
東軟Sa Ca Aclome產(chǎn)品通過集中式的資源管理模式統(tǒng)一監(jiān)管虛擬化數(shù)據(jù)中心的計算、存儲和網(wǎng)絡(luò)資源,并通過自助式門戶以隨需即取的方式提供用戶申請、配置和使用,并提供圖形化方式方便用戶進行快速應(yīng)用部署。產(chǎn)品以“簡化云應(yīng)用的管理,支持云應(yīng)用的動態(tài)交付”為定位,以云應(yīng)用管理為核心,本著“安全、更可靠;靈活、易擴展;開放、可定制;易用、高體驗”的產(chǎn)品研發(fā)理念,旨在助力媒體實現(xiàn)云應(yīng)用全方位管理以及云計算的真正落地(如圖8)。
圖8 東軟Sa Ca Aclome產(chǎn)品
此外,媒體還使用了大量新興技術(shù)提高生產(chǎn)效率。比如,虛擬化技術(shù)、微服務(wù)技術(shù)、即時通訊技術(shù)、云存儲技術(shù)、H5技術(shù)、AR/VR技術(shù)、機器人寫稿技術(shù)、語音識別技術(shù)、新聞發(fā)現(xiàn)技術(shù)等。技術(shù)對于媒體融合的發(fā)展起到了巨大的作用,但不可否認(rèn)一點,技術(shù)是為業(yè)務(wù)服務(wù)的。技術(shù)如果要發(fā)揮更大的作用,需要業(yè)務(wù)的整合,需要體制的支撐。相信通過技術(shù)、業(yè)務(wù)和體制的完美融合,一定會推動中國的媒體事業(yè)站上一個更高的臺階,更好地為用戶服務(wù)。