為通過“新基建”驅動智慧社會發(fā)展,我們采取云基、網(wǎng)聯(lián)、數(shù)智三步走策略,實現(xiàn)數(shù)據(jù)服務產(chǎn)業(yè)化、技術服務產(chǎn)業(yè)化、平臺應用產(chǎn)業(yè)化。
—聯(lián)通系統(tǒng)集成公司CTO楊海明
大數(shù)據(jù)最開始是從小數(shù)據(jù)、抽樣數(shù)據(jù)的概念發(fā)展起來的。我認為大數(shù)據(jù)是將所有的數(shù)據(jù)整合到一起形成的一條完整的數(shù)據(jù)鏈。我們經(jīng)歷了小數(shù)據(jù)、大數(shù)據(jù)、關鍵數(shù)據(jù)三個階段,現(xiàn)在著眼于“如何基于關鍵數(shù)據(jù)構建新基建里的數(shù)據(jù)中心”這一課題。而我們談及的數(shù)字化轉型則包括政府數(shù)字化轉型、產(chǎn)業(yè)數(shù)字化轉型、大眾需求轉型三點。其中產(chǎn)業(yè)數(shù)字化轉型的流程是:基于頭部行業(yè)的企業(yè)需求建立數(shù)據(jù)平臺,最終應用于整個行業(yè),帶動整個行業(yè)數(shù)據(jù)應用的發(fā)展,建立新的技術體系。
在區(qū)塊鏈、5G等技術的影響下,我們了解到的大數(shù)據(jù)的內(nèi)涵發(fā)生了變化。在大數(shù)據(jù)應用時,我們認識到大數(shù)據(jù)在不同行業(yè)的應用特點愈加明顯。大數(shù)據(jù)的整體思路是聚數(shù)據(jù)、建平臺、攻技術、定標準。從前的大數(shù)據(jù)行業(yè)聚焦于數(shù)據(jù)底層的建構,如平臺搭建、數(shù)據(jù)處理等方面。而現(xiàn)在我們逐漸認識到數(shù)據(jù)具有強烈的行業(yè)屬性,從某一行業(yè)采集的數(shù)據(jù)最終一定會應用于該行業(yè)。
基于行業(yè)導向,我們更加注重新技術的研發(fā)。隨著新技術的發(fā)展,數(shù)據(jù)的入口將不僅僅分散在網(wǎng)站、移動端,還分布在物和人的交互點。新技術帶來的變化本質(zhì)上是有關人的交互方式的變化。在交互方式發(fā)生變化的情況下,新的數(shù)據(jù)應用場景將會出現(xiàn),如何運用這些數(shù)據(jù)驅動整個智慧社會的發(fā)展成為了關鍵點。
在數(shù)據(jù)應用方面,大多數(shù)的數(shù)據(jù)應用都需要一個“腦”,這個“腦”包含了大數(shù)據(jù)、云計算等新穎的概念。這個“腦”和我們?nèi)祟惖拇竽X一樣需要成長,我們需要用數(shù)據(jù)來培育“腦”,再通過“腦”將數(shù)據(jù)應用于行業(yè)。
下面我想談一下數(shù)據(jù)運營。過去,數(shù)據(jù)運營的概念是建設平臺,簽合同,做項目。而如今,我們對數(shù)據(jù)運營的認知、客戶的需求都在持續(xù)變化。如BI曾經(jīng)的職能是負責在業(yè)務端進行技術轉換,幫助非專業(yè)人士理解代碼?,F(xiàn)在大數(shù)據(jù)領域都聚焦于無代碼概念,我們提供工具來幫助團隊完成相應的應用框架搭建后,需求方不需要精通代碼開發(fā)就能夠進行應用的迭代。在這種需求下,從基礎的總體需求分析能力到大數(shù)據(jù)服務方向的運營能力的演變變成了關鍵點。
基于大數(shù)據(jù)應用場景發(fā)生的變化,我們梳理出了構建這個時代的數(shù)字新基建的八個能力:可視化開發(fā)、數(shù)據(jù)科學研發(fā)、智慧數(shù)據(jù)應用、數(shù)據(jù)安全、數(shù)據(jù)資源目錄、數(shù)據(jù)匯聚、資產(chǎn)管理、集群治理。這八個能力不包括數(shù)據(jù)抓取、數(shù)據(jù)中臺,一方面是由于數(shù)據(jù)源是多樣的,每個數(shù)據(jù)源有自己的行業(yè)特征,數(shù)據(jù)抓取無法統(tǒng)一這些行業(yè)特征。而另一方面,我們在應用中發(fā)現(xiàn)數(shù)據(jù)中臺本身在分裂、分拆,不同的數(shù)據(jù),通過不同的清洗方式,需要用不同的數(shù)據(jù)治理方法進行治理。過去我們在實施一個智慧城市項目時,只需要建立一個智慧城市的中臺,但在建設過程中我們發(fā)現(xiàn)智慧城市的需求不斷擴大,這些需求如便民服務、應急管理、數(shù)字政府等也需要在數(shù)據(jù)中臺上實現(xiàn),并且是用一個統(tǒng)一的數(shù)據(jù)中臺來完成這些需求,實際上相當于把微觀的需求濃縮到數(shù)據(jù)中臺里面統(tǒng)一完成,這樣反而增加了中臺的工作量。
在數(shù)據(jù)集的應用方面,不同的數(shù)據(jù)集可能會產(chǎn)生不同的數(shù)據(jù)庫應用。我們在對數(shù)據(jù)庫進行掃描時,發(fā)現(xiàn)很多數(shù)據(jù)庫的作者在闡述數(shù)據(jù)庫能夠解決的問題的同時,還在往邊緣擴展,試圖證明他們的數(shù)據(jù)庫還能應用于其他領域,但特定的數(shù)據(jù)需要特定數(shù)據(jù)處理方式,這個時候我們需要統(tǒng)一集群治理的能力來限定每一個數(shù)據(jù)庫的應用范圍。
下面我們談一談數(shù)據(jù)的匯聚。以5G為例,5G有很多形式,如可以建立私網(wǎng),因此,5G產(chǎn)生的數(shù)據(jù)非常復雜,匯集數(shù)據(jù)比較困難。在資源庫方面,從應用的角度來看,我們并不關心數(shù)據(jù)是什么,以政府項目為例,政府內(nèi)部有數(shù)據(jù)資源目錄。匯集的數(shù)據(jù)要如何共享,如何使用,儲存下來的數(shù)據(jù)要如何才能產(chǎn)生效果,這些都要以服務目錄形式展現(xiàn)出來。在資產(chǎn)方面,數(shù)據(jù)逐漸有了趨同于資產(chǎn)的趨勢。區(qū)塊鏈行業(yè)未興起時,我們進行數(shù)據(jù)交換時缺乏統(tǒng)一的標準。如果把數(shù)據(jù)看作是資產(chǎn)來進行處理,我們可能會加速數(shù)據(jù)庫的擴展,因為兩個數(shù)據(jù)集之間的碰撞,往往能取得最優(yōu)的效果。
然后就是數(shù)據(jù)應用方面的問題,數(shù)據(jù)處理得出的結果需要展現(xiàn)出它的價值。數(shù)據(jù)很貴,不在于買數(shù)據(jù)貴,而在于數(shù)據(jù)儲存技術很貴。為了讓行業(yè)內(nèi)的人員都能了解到數(shù)據(jù)的價值,數(shù)據(jù)的可視化成為了關鍵。從業(yè)人員了解數(shù)據(jù)的價值,但是做決策的人可能不懂數(shù)據(jù)邏輯,我們需要把數(shù)據(jù)展示出來,也就是要高效維護數(shù)據(jù)平臺、發(fā)展人機互動、提高可視化水平、促進正向理解,讓非專業(yè)人士、非IT專業(yè)人士也能理解數(shù)據(jù)的價值。數(shù)據(jù)可視化可以通過交互來實現(xiàn)。交互方式還在不斷地變化,從開始的交互屏幕到觸摸屏,到現(xiàn)在已經(jīng)可以通過語音、圖像的方式進行交互,未來將會有更多種類的交互方式出現(xiàn)。
最后我們談一下數(shù)據(jù)安全。政府比較重視數(shù)據(jù)的安全性,因此,數(shù)據(jù)的開放需要有一定限度,更需要合理的監(jiān)管。
(根據(jù)演講內(nèi)容整理,未經(jīng)本人審核)