楊東 滕健
摘? 要:目前加快推進傳統(tǒng)媒體向全媒體的轉型迫在眉睫。全媒體需要從內(nèi)容生產(chǎn)、傳播形式、發(fā)布渠道等多方面進行轉變提升,這就需要借助大數(shù)據(jù)和人工智能技術,實現(xiàn)從數(shù)字化到智能化升級。而支撐升級過程的關鍵是實現(xiàn)數(shù)據(jù)能力和AI能力的統(tǒng)一管理和協(xié)同應用。由此,基于大數(shù)據(jù)技術的全媒體中臺應運而生。
關鍵詞:全媒體;數(shù)據(jù)中臺;大數(shù)據(jù);智能化;數(shù)據(jù)智能? ? ? ? ? ? ? ? ? ? ? 中圖分類號:G206? ? ? ? ? ? ?文獻標識碼:A
本文著錄格式:楊東,滕健.基于大數(shù)據(jù)技術的全媒體中臺實踐[J].中國傳媒科技,2020(9):19-20.
1. 全媒體中臺建設的必要性
未來,中臺的建設將是企業(yè)機構信息化和智能化的發(fā)展方向。全球權威的技術研究和分析公司Gartner發(fā)布的《Hype Cycle for ICT in China, 2020》(2020年中國ICT技術成熟度曲線報告)中,將中臺定義為新增技術熱點。Gartner認為,數(shù)據(jù)中臺是一種組織戰(zhàn)略,能夠有效賦能前臺業(yè)務,從一致的視角,利用后臺產(chǎn)生的數(shù)據(jù),輔助決策。[1]而在建設中只有結合行業(yè)特點,打造垂直領域的中臺,才能發(fā)揮中臺的價值。
互聯(lián)網(wǎng)時代,媒體機構的競爭越來越激烈,新的業(yè)務場景不斷涌現(xiàn),只有以用戶為中心,快速響應用戶需求,不斷迭代和試錯,才能讓媒體在競爭當中處于領先。在傳統(tǒng)的前臺-后臺架構中,各個項目相對獨立,許多項目都在重復建設同樣的功能模塊,既讓項目本身越來越臃腫,同時也讓開發(fā)效率越來越低,而中臺恰恰可以很好地解決這些問題。同時,通過全媒體中臺的建設,可以為前臺應用提供媒體生產(chǎn)輔助、媒體運營輔助、媒體發(fā)布端應用、媒體智庫等能力支撐。其中,媒體生產(chǎn)和媒體運營是媒體機構最重要的兩個部分,全媒體中臺可以很好地對這兩部分業(yè)務進行支撐。媒體生產(chǎn)輔助應用包括新聞線索發(fā)現(xiàn)、媒體選題策劃、智能專題庫、媒體實體庫和BI分析報告等生產(chǎn)輔助能力。媒體運營輔助應用包括媒體傳播分析、媒體影響力分析、媒體客戶端行為分析、用戶全息畫像和用戶個性化推薦等運營輔助能力。
2.全媒體中臺的建設方法論
中國媒體融合發(fā)展報告(2020)中指出,媒體融合發(fā)展不僅是傳播手段的改進、傳播方式的轉變、傳播平臺的遷移,而且是傳播生態(tài)、媒體格局、產(chǎn)業(yè)發(fā)展的全面升級和質變。[2]因此,如果只是基于技術角度考慮,而在具體的落地過程中沒有相應的組織環(huán)境匹配,那么中臺就僅僅是一個空殼,不會給媒體機構帶來任何實際價值和效益,甚至還會阻礙媒體機構的發(fā)展。所以,全媒體中臺必須是一個集數(shù)據(jù)采集、融合、治理、組織管理、智能分析為一體,將數(shù)據(jù)以服務方式提供給前臺應用,以提升業(yè)務運行效率、持續(xù)促進業(yè)務創(chuàng)新為目標的整體平臺。
全媒體中臺在建設的不同階段,其側重點也不同。通過長期實踐,百分點總結出全媒體中臺建設需要包含四大體系,即組織體系、管理體系、執(zhí)行體系、技術體系。組織體系從領導層自上而下推動數(shù)據(jù)治理,明確人員組織和責任分工;管理體系針對數(shù)據(jù)標準、數(shù)據(jù)模型的生成、變更、維護和刪除等過程進行規(guī)范的流程管理;執(zhí)行體系促進所有人員遵照規(guī)范的管理流程,運用數(shù)據(jù)治理工具和技術手段,持續(xù)保障良好的數(shù)據(jù)質量;技術體系通過數(shù)據(jù)標準、數(shù)據(jù)質量、元數(shù)據(jù)管理、主數(shù)據(jù)管理等技術和工具,及時發(fā)現(xiàn)、解決及監(jiān)控預防系統(tǒng)的數(shù)據(jù)問題。[3]數(shù)據(jù)智能類技術提供商一般只能做到技術體系的梳理,其他三個部分還需要企業(yè)機構內(nèi)部來驅動完善,主要包括確定中臺團隊人選和對垂直業(yè)務線進行變更。
3.全媒體中臺的建設路徑
媒體業(yè)務系統(tǒng)可以分為資源后臺、全媒體中臺和業(yè)務前臺,其中全媒體中臺是媒體機構的核心競爭力,其由四部分組成,包括:大數(shù)據(jù)中心資產(chǎn)平臺、大數(shù)據(jù)中心能力平臺、資源發(fā)布與展示平臺、資源服務共享平臺。數(shù)據(jù)中臺可定義為一個集數(shù)據(jù)采集、融合、治理、組織管理、智能分析為一體,將數(shù)據(jù)以服務方式提供給前臺應用,以提升業(yè)務運行效率、持續(xù)促進業(yè)務創(chuàng)新為目標的整體平臺。[4]
3.1大數(shù)據(jù)中心資產(chǎn)平臺
大數(shù)據(jù)中心資產(chǎn)平臺主要是為了構建媒體數(shù)據(jù)資產(chǎn)的管控能力,提供數(shù)據(jù)治理、數(shù)據(jù)管理、數(shù)據(jù)挖掘能力,最終構建媒體機構的數(shù)據(jù)資產(chǎn),生成適用于媒體業(yè)務的主題庫,輔助新聞生產(chǎn)、媒體運營和輿情分析等業(yè)務場景。
平臺從構建過程上,可劃分為資源匯聚、數(shù)據(jù)處理、數(shù)據(jù)治理、數(shù)據(jù)資產(chǎn)、數(shù)據(jù)服務五個過程域。
數(shù)據(jù)資源匯聚是在現(xiàn)有數(shù)據(jù)服務平臺基礎上,通過多種接入方式,將報道資源匯聚整合到統(tǒng)一數(shù)據(jù)庫,建立共享常態(tài)。匯聚過程需要針對目前業(yè)務系統(tǒng)的規(guī)劃實現(xiàn)匯聚處理,并對數(shù)據(jù)進行統(tǒng)一的存儲規(guī)劃。
數(shù)據(jù)處理主要是對接入數(shù)據(jù)進行勘探和預處理。數(shù)據(jù)勘探的目的是了解各業(yè)務系統(tǒng)的數(shù)據(jù)現(xiàn)狀、數(shù)據(jù)庫表之間的關系、數(shù)據(jù)字段的業(yè)務含義,找到最佳的數(shù)據(jù)治理實施路徑,建立適應媒體機構自己的數(shù)據(jù)標準并推動落地。數(shù)據(jù)預處理主要是進行數(shù)據(jù)的安全性檢查與完整性校驗,并進行初步數(shù)據(jù)清洗預處理,保證數(shù)據(jù)的可靠性,接入數(shù)據(jù)必須按照平臺要求的數(shù)據(jù)格式進行規(guī)范統(tǒng)一后入庫。
數(shù)據(jù)治理是大數(shù)據(jù)中心資產(chǎn)平臺建設過程中基礎且重要的環(huán)節(jié),數(shù)據(jù)治理包括三個核心要素:數(shù)據(jù)標準管理、數(shù)據(jù)質量稽核、元數(shù)據(jù)管理。(1)數(shù)據(jù)標準管理一般基于國標數(shù)據(jù)元與編碼標準建設,包括數(shù)據(jù)接入標準、命名標準、數(shù)據(jù)格式標準、數(shù)據(jù)安全標準、資源管理標簽等多個方面。(2)數(shù)據(jù)質量稽核,通過數(shù)據(jù)質量管理工具從數(shù)據(jù)的完整性、一致性、唯一性等多個層面實現(xiàn)對數(shù)據(jù)的全面稽核和預警做到事前質量檢查、事中運行監(jiān)控、事后歸納總結,結合平臺提供的全方位評估能力提高數(shù)據(jù)質量。(3)元數(shù)據(jù)管理將數(shù)據(jù)資產(chǎn)用清晰直觀的方式進行呈現(xiàn),讓數(shù)據(jù)資產(chǎn)真正被讀懂、能利用,通過血緣分析和影響性分析,可以直觀地了解到數(shù)據(jù)的來源、數(shù)據(jù)之間的關系、數(shù)據(jù)流向、數(shù)據(jù)被引用次數(shù)等重要信息,便于直觀地把握數(shù)據(jù)資產(chǎn)狀況。
數(shù)據(jù)資產(chǎn)是把接入的數(shù)據(jù)基于業(yè)務現(xiàn)狀及未來規(guī)劃進行數(shù)據(jù)資產(chǎn)劃分,構建符合媒體業(yè)務需求的數(shù)據(jù)倉庫。媒體數(shù)據(jù)資產(chǎn)由業(yè)務庫和主題庫兩個部分組成,業(yè)務庫是基于業(yè)務系統(tǒng)構建的,為前臺業(yè)務提供諸如專題庫、語料庫、實體庫、知識庫等業(yè)務為導向的數(shù)據(jù)資產(chǎn)。而主題庫是為了應對快速建庫需求,通過簡單的檢索篩選,形成滿足業(yè)務需求的主題庫,降低了數(shù)據(jù)開發(fā)成本。
3.2大數(shù)據(jù)中心能力平臺
大數(shù)據(jù)中心能力平臺提供認知智能和業(yè)務智能兩種類型的AI能力。其中,認知智能主要是基于機器學習、深度學習及遷移學習等人工智能技術,提供自然語言處理、圖片識別、OCR識別和視頻分析等基礎能力。業(yè)務智能以認知智能為基礎,對基礎能力進行組織封裝,對數(shù)據(jù)層面提供數(shù)據(jù)的深層次加工,對業(yè)務層面提供業(yè)務的深層次分析,業(yè)務智能包含一系列業(yè)務上通用的基礎服務能力,包括智能推薦、用戶畫像、內(nèi)容標注標引、專題分析、內(nèi)容審校和智能專題等。通過大數(shù)據(jù)中心能力平臺的構建,實現(xiàn)人工智能技術的系統(tǒng)化、中臺化改造,提升媒體機構智能處理能力,有助于實現(xiàn)能力復用,降低開發(fā)成本,實現(xiàn)產(chǎn)品創(chuàng)新。
3.3資源發(fā)布與展示平臺
資源發(fā)布與展示平臺是整個全媒體中臺的門面,媒體機構,可以將數(shù)據(jù)和能力統(tǒng)一封裝后集中展示,是服務于相關用戶的共享資源統(tǒng)一門戶,實現(xiàn)共享資源的統(tǒng)一呈現(xiàn),以及資源的檢索、定位和詳細信息展示,同時提供靈活的權限管理,打造“一門式”服務平臺。
3.4資源服務共享子平臺
當媒體機構有效整合分散異構的信息資源,消除“信息孤島”桎梏,形成自己的數(shù)據(jù)資產(chǎn)和AI能力后,接下來就需要將這些能力對外提供服務,實現(xiàn)他們的價值,資源服務共享的需求也就應運而生了。
目前企業(yè)機構資源共享主要面臨三個問題。一是數(shù)據(jù)需求方因為數(shù)據(jù)格式不統(tǒng)一、數(shù)據(jù)提取效率低等而無法直接獲取數(shù)據(jù);二是數(shù)據(jù)所有方由于開發(fā)效率低、數(shù)據(jù)授權管理體系不完善、數(shù)據(jù)服務提供方式不夠快捷、調(diào)用關系復雜等問題也無法高效地管理;三是數(shù)據(jù)需求方與數(shù)據(jù)所有方無法實現(xiàn)無縫數(shù)據(jù)互聯(lián)互通,且提供數(shù)據(jù)服務方式單一,無法滿足多場景共享需求。
一個優(yōu)秀的資源共享服務平臺需要具備以下特性:
(1)提供統(tǒng)一的信息資源目錄。需構建符合媒體行業(yè)標準的信息資源目錄管理體系,統(tǒng)一資源標準,滿足資源目錄編制、審核、維護等業(yè)務的需求。
(2)共享服務流程。高效支撐供需方數(shù)據(jù)共享服務,支持數(shù)據(jù)庫、文件、API 服務的共享服務數(shù)據(jù)流管控。
(3)數(shù)據(jù)開放服務。支持API創(chuàng)建、發(fā)布、下線、審核的全生命周期管理。無需懂接口代碼,業(yè)務人員也可完成接口創(chuàng)建,省去大量開發(fā)工作量,提高效率,降低成本。
(4)多維安全體系管控。支持跨網(wǎng)數(shù)據(jù)交換,可以跨網(wǎng)段、跨防火墻訪問,提供相同或不同網(wǎng)絡間的數(shù)據(jù)交換、數(shù)據(jù)服務,保證傳輸層的安全性。支持接口的數(shù)據(jù)加密、脫敏與壓縮,保證數(shù)據(jù)的安全及高效傳輸。
通過資源服務共享,對于數(shù)據(jù)應用或者服務的需求,通過簡單可視化配置的方式就可以實現(xiàn)API的創(chuàng)建、發(fā)布、版本管理、文檔管理等,降低日常運維成本。
結語
總結來看,當媒體機構具有一定的數(shù)據(jù)基礎和業(yè)務規(guī)模,即自身數(shù)據(jù)多樣、業(yè)務規(guī)模不斷擴大、業(yè)務相互獨立,就需要全媒體中臺幫助其解決效率、成本和質量的問題。而全媒體中臺的建設需要自上而下,需要進行詳盡的前期規(guī)劃設計,必須符合各媒體機構的實際情況,且不可全盤照搬,要結合實際情況進行取舍調(diào)整,才能達到價值最大化,驅動媒體的數(shù)智化轉型。
[1]Kevin Ji,Roger Sheng,Milly Xiang. Hype Cycle for ICT in China,2020[EB/OL]. Gartner Research 2020.7.21. https://www.gartner.com/en/documents/3987781
[2]溫源.《中國媒體融合發(fā)展報告(2020)》發(fā)布[EB/OL].光明日報客戶端.2020-09-09.https://wap.gmdaily.cn/article/9cf70a5b3f794bd2bf8e1e23c3852b56.
[3]百分點大數(shù)據(jù)技術.數(shù)據(jù)中臺組織架構調(diào)整的“最優(yōu)解”[EB/OL]. InfoQ .2020-03-08 .https://www.infoq.cn/article/7XzFlLs0XJOfNAxTOMJh/
[4]蘇萌,賈喜順,杜曉夢等 .《數(shù)據(jù)中臺技術相關進展及發(fā)展趨勢》[J]. 數(shù)據(jù)與計算發(fā)展前沿,2019,1(05): 116-126.
作者簡介:楊東(1981-),男,河北,融媒信創(chuàng)事業(yè)部總經(jīng)理;滕?。?979-),男,遼寧,融媒信創(chuàng)事業(yè)部咨詢顧問。